DigitalUM :: Browsing by Subject "Wikidata"

Browsing by Subject "Wikidata"

Now showing 1 - 13 of 13

Open Access
Big data literario de raíz bibliotecaria: reflexiones sobre infraestructuras de anotación, catalogación, descubrimiento y recomendación de ficción narrativa
(EPI SCP, 2021) Saorín, Tomás; Información y Documentación
Se describe la relación entre el campo de los estudios literarios basados en datos de la corriente distant reading y las humanidades digitales, y la actividad de las bibliotecas y otras entidades del sector del libro en el ecosistema de la recomendación y el descubrimiento de lecturas. Se presentan proyectos de catalogación y descripción enriquecida de la ficción literaria, como OCLC FictionFinder y Kirjasampo, en el marco de los metadatos transmedia y abiertos, entendidos en relación con las prácticas de plataformas de consumo de contenidos digitales como Netflix o Amazon Prime Video, junto a otras prácticas de anotación y edición de textos literarios. Finalmente se plantea la oportunidad de desarrollo de laboratorios bibliotecarios digitales apoyados en infraestructuras de datos abiertas como Wikidata para la descripción enriquecida de ficciones narrativas de todas las épocas de forma colaborativa, para posibilitar proyectos y servicios de descubrimiento de lecturas relacionadas
Open Access
Un canon literario universal basado en datos enciclopédicos multilingües: propuesta de un método de medición de obras literarias usando datos cuantitativos obtenidos de Wikidata y Wikipedia
(CISC, 2023-07-07) Pastor Sánchez, Juan Antonio; Saorín, Tomás; Baños Moreno, María José; Información y Documentación
La investigación descrita en este artículo tiene como objetivo verificar la viabilidad de usar Wikidata y Wikipedia como fuente para identificar un canon literario universal. Para ello, primero se sitúan ambos proyectos de la fundación Wikimedia en el contexto de los datos sobre obras literarias. La metodología utilizada se basa en la construcción de un conjunto de datos a partir de datos específicos sobre obras literarias recuperados de Wikidata y de las ediciones de Wikipedia en todos los idiomas. Se analiza la profundidad de descripción de los ítems de obras literarias en Wikidata y su presencia y nivel de elaboración de los correspondientes artículos en Wikipedia. Mediante K-means se identifican tres clústeres de obras literarias a partir de los cuales se identifican un conjunto de obras que pueden conformar un canon literario universal. Se propone una métrica denominada Wiki3DRank que permite seleccionar y ordenar las obras literarias analizadas. El estudio aborda también algunos aspectos de la distribución por idiomas, así como un análisis específico de las asimetrías en su distribución temporal entre obras clásicas y obras contemporáneas. El artículo incluye una sección de discusión con reflexiones sobre los resultados obtenidos y concluye proponiendo Wikidata y Wikipedia como una fuente complementaria valiosa para la elaboración de cánones literarios tanto globales como de idiomas específicos.
Open Access
Da web semântica à web sintética: dados, grafos e IA generativa
(2026-06-16) Pastor Sánchez, Juan Antonio; Información y Documentación
Conferência que analisa a evolução da Web Semântica para a chamada Web Sintética, caracterizada pelo uso de inteligência artificial generativa para fornecer respostas diretas em linguagem natural. São examinados os fundamentos dos grandes modelos de linguagem (LLMs), suas limitações em termos de rastreabilidade, atualização e confiabilidade do conhecimento, bem como o papel que os dados estruturados e os grafos de conhecimento podem desempenhar para mitigá-las. São apresentados os princípios da Web Semântica, das ontologias, do RDF, OWL e SPARQL como base para a representação explícita do conhecimento, assim como as arquiteturas RAG e GraphRAG para integrar informações estruturadas aos processos de geração de respostas. Por meio de exemplos baseados no Wikidata, demonstra-se como os LLMs podem gerar consultas SPARQL, recuperar conhecimento verificável e contribuir para o enriquecimento de grafos por meio da identificação de novas relações e entidades. Por fim, propõe-se uma arquitetura híbrida que combina IA generativa, recuperação de informação, validação semântica e supervisão humana, destacando tanto suas oportunidades quanto seus riscos e desafios.
Open Access
De la web semántica a la web sintética: datos, grafos e IA generativa
(2026-06-16) Pastor Sánchez, Juan Antonio; Información y Documentación
Conferencia que analiza la evolución desde la Web Semántica hacia la denominada Web Sintética, caracterizada por el uso de inteligencia artificial generativa para proporcionar respuestas directas en lenguaje natural. Se examinan los fundamentos de los grandes modelos de lenguaje (LLM), sus limitaciones en términos de trazabilidad, actualización y fiabilidad del conocimiento, y el papel que pueden desempeñar los datos estructurados y los grafos de conocimiento para mitigarlas. Se presentan los principios de la Web Semántica, las ontologías, RDF, OWL y SPARQL como base para la representación explícita del conocimiento, así como las arquitecturas RAG y GraphRAG para integrar información estructurada en los procesos de generación de respuestas. Mediante ejemplos basados en Wikidata se muestra cómo los LLM pueden generar consultas SPARQL, recuperar conocimiento verificable y contribuir al enriquecimiento de grafos mediante la identificación de nuevas relaciones y entidades. Finalmente, se propone una arquitectura híbrida que combina IA generativa, recuperación de información, validación semántica y supervisión humana, destacando tanto sus oportunidades como sus riesgos y desafíos.
Open Access
Derivative Relationships and Bibliographic Families Among Creative Works: A Systematic Study of Their Application by the Wikidata Community from the FRBR and BIBFRAME Perspective
(Dublin Core Metadata Initiative (DCMI), 2025-12-24) Saorín, Tomás; Pastor Sánchez, Juan Antonio; Ovalle Perandones, Maria Antonia; Información y Documentación; Facultades de la UMU::Facultad de Comunicación y Documentación
This paper examines how the concept of bibliographic families and derivative relationships, foundational to modern bibliographic models like FRBR and BIBFRAME, manifest within Wikidata's community-driven knowledge base. Through systematic analysis of over 2,2 million creative works across audiovisual, musical, literary, and video game domains, we explore the emergent patterns of relationships between works. Our findings reveal that while traditional WEMI relationships represent only 2% of the identified connections, a rich ecosystem of other relationship types dominates the descriptive landscape. The research provides insights into how nonprofessional contributors intuitively approach complex bibliographic relationships, suggesting opportunities for more flexible, user-centered bibliographic models that better accommodate contemporary transmedia content ecosystems
Open Access
Exploración de ranking y selección de obras creativas a partir de datos enciclopédicos de Wikipedia y Wikidata: resultados sobre obras literarias y otros objetos culturales
(LINHD UNED, 2024-06-12) Saorín, Tomás; Pastor Sánchez, Juan Antonio; Información y Documentación
¿Podemos encontrar una forma confortable de medir la importancia de una obra cultural – o de un objeto de conocimiento enciclopédico – y aplicarlo en el terreno de la recomendación cultural? Nuestra investigación se centra en validar la realización de rankings de relevancia frente a los de popularidad, tratando de operativizar un método de cálculo transparente y con aplicación a la conversación y la mediación cultural. Las listas y los ranking son un fenómeno en sí mismos, y tenerlos por objeto de investigación puede enriquecer el discurso sobre cómo se construyen y cómo se usan. Por otra parte, estamos estudiando la aplicación de nuestras métricas para comparar diversas propuestas de canon literario, como los 1001 libros que hay que leer antes de morir, de Peter Boxall.
Open Access
La doppia faccia delle relazioni transmediali: percorsi intrecciati tra le pubblicazioni e i contenuti degli universi di finzione
(2025-12-04) Saorín, Tomás; Información y Documentación; Facultades de la UMU::Facultad de Comunicación y Documentación
Presentación sobre las relaciones y conexiones entre obras creativas (cine, libros, música y videojuegos) basada en el análisis de los datos de 2 millones registrados en Wikidata, relativos a publicaciones, relaciones derivativas y elementos constitutivos de los universos de ficción. Presentación realiazda en el marco de Il seminario del progetto Transmedia Library Shelf Experience. promosso dal Dipartimento di Studi storici dell’Università di Torino, in collaborazione con il Polo del '900, in Dicembre 2025. La giornata riunie esperti di diversi ambiti disciplinari, professionisti del settore bibliotecario, studenti e neolaureati del corso di laurea magistrale in Scienze del libro, del documento, del patrimonio culturale, con l’obiettivo di condividere riflessioni, esperienze e prospettive a oltre un anno dalla prima sperimentazione del pre-prototipo.
Restricted
Observando la curación colaborativa de conocimiento estructurado en Wikidata
(2024-12-04) Pastor Sánchez, Juan Antonio; Saorín, Tomás; Información y Documentación
Se revisan aspectos concretos relevantes para entender el funcionamiento de Wikidata desde la perspectiva de la organización colaborativa del conocimiento. La curación colectiva presenta retos sobre modelado y calidad de los datos. Wikidata tiene la capacidad de incorporar taxonomías y vocabularios controlados, pero se identifican prácticas problemáticas en el uso clases/subclases e instancias. También se describen las dificultades para establecer esquemas de metadatos, y en la realización de descripciones consistentes de elementos, y el uso como base de datos bibliográfica, así como un panorama de las paradojas que crea el licenciamiento en dominio y su uso como conjunto de datos para enriquecimiento de las aplicaciones de nueva generación de inteligencia artificial.
Open Access
Uso de Wikidata y Wikipedia para la generación asistida de un vocabulario estructurado multilingüe sobre la pandemia de Covid-19.
(Profesional de la Información, 2020-09-13) Saorín, Tomás; Pastor Sánchez, Juan Antonio; María-José Baños-Moreno; Información y Documentación
Se propone un método para la construcción ágil y dinámica de vocabularios controlados, especialmente para los medios de comunicación, utilizando Wikidata y Wikipedia como fuentes de información terminológica. El método se aplica a la construcción de un vocabulario sobre la pandemia de Covid-19. Para ello se propone la explotación de la estructura de items y propiedades de Wikidata y de los enlaces salientes y entradas de los artículos de Wikipedia. Mediante un proceso de definición de reglas de expansión de relaciones de Wikidata se ha diseñado un algoritmo en el que se parte de un conjunto de items iniciales y en sucesivas iteraciones y revisión de resultados se recopilan las declaraciones relevantes a la temática del vocabulario. El algoritmo se ha implementado en una aplicación cuyo código y resultados de recopilación del vocabulario sobre la pandemia de Covid-19 se ha publicado en un repositorio abierto. Esto permite utilizar el algoritmo tanto para verificar los resultados usando las mismas u otras reglas de expansión como para su aplicación a la recopilación de vocabularios de otras temáticas. En los resultados también se analizan los elementos recopilados en cada iteración, la propuesta de validación mediante los enlaces entrantes y salientes de los artículos, dejando como futuros trabajos la aplicación de SKOS para la representación interoperable de los vocabularios obtenidos mediante este método.
Open Access
Wiki3DRank: a model for measuring the relevance of knowledge objects using quantitative data from Wikidata and Wikipedia
(Red Ibersid, 2024-06-14) Pastor Sánchez, Juan Antonio; Saorín, Tomás; Baños Moreno, María José; Información y Documentación
This research introduces the Wiki3DRank, a model combining real-time extracted quantitative data from Wikidata and Wikipedia to obtain a ranking of knowledge objects through a quantitative value that measures the relevance of one object compared to others in a specific domain. The model is based on the distribution of knowledge objects in a vector space, whose components are based on three main variables: the number of statements on Wikidata about an item, the number of articles in different Wikipedia editions, and the length in number of words of these articles. These variables are associated with the level of description of the Wikidata items, the dissemination of the referred knowledge objects in Wikipedia editions in different languages, and the degree of editorial elaboration of the corresponding Wikipedia articles. To demonstrate the viability of the model, a series of use cases across various domains are analyzed: books, movies, cathedrals, earthquakes, rivers, and chemical elements. From the results obtained, it is possible to conclude that Wiki3DRank is a tool that allows measure the relevance of knowledge objects in the context of a knowledge domain. The operation of an open-source tool that enables the online calculation of Wiki3DRank is presented. The results suggest that the proposed model can be applied to different contexts and domains and that it`s ease to expand it by adding elements of weighting and extending the model with new components based on other characteristics of the encyclopedic data of the knowledge objects, while the base vector calculation system is maintained. ----------------------------
Open Access
Wiki3DRank: un modelo para medir la relevancia de objetos de conocimiento mediante datos cuantitativos de Wikidata y Wikipedia
(Red Ibersid, 2024-06-14) Pastor Sánchez, Juan Antonio; Saorín, Tomás; Baños Moreno, María José; Información y Documentación
Se presenta el modelo Wiki3DRank, que combina da-tos cuantitativos extraídos en tiempo real de Wikidata y Wikipedia para obtener un ranking de objetos de co-nocimiento a través de un valor cuantitativo que mida la relevancia de un objeto frente a otros en undetermi-nado dominio. El modelo se basa en la distribución de los objetos de conocimiento en un espacio vectorial cu-yas componentes se basan en tres variables principa-les: número de declaraciones en Wikidata sobre un ítem, número de artículos en las diferentes ediciones de Wikipedia y extensión en número de palabras de dichos artículos. Estas variables se asocian al nivel de descripción de los ítems de Wikidata, la difusión de los objetos de conocimiento asociados a los mismos en las ediciones de Wikipedia de diferentes idiomas y el grado de elaboración editorial de los correspondientes artículos de Wikipedia. Para demostrar la viabilidad del modelo se analizan una serie de casos de uso sobre diversos dominios: libros, películas, catedrales, terre-motos, ríosy elementos químicos. A partir de los resul-tados obtenidos es posible concluir que Wiki3DRank es una herramienta que permite medir la relevancia de objetos de conocimientos en el contexto de un dominio de conocimiento. Se muestra el funcionamiento de una herramienta de código abierto que permite el cálculo en línea de Wiki3DRank. Los resultados obtenidos su-gieren que el modelo propuesto puede aplicarse para diferentes contextos y dominios, que pueden introdu-cirse elementos de ponderación y es posible extender el modelo mediante la introducción de nuevos compo-nentes basados en otras características de los datos enciclopédicos de los objetos de conocimiento, al mismo tiempo que se mantiene el sistema de cálculo vectorial de base. -------------------------------------------
Open Access
Wikidata y DBpedia: viaje al centro de la web de datos
(EPI SCP, 2018-04-26) Saorín, Tomás; Pastor Sánchez, Juan Antonio; Información y Documentación
A partir de Wikipedia, como fuente de conocimiento organizado en forma de artículos enciclopédicos, editada mediante la colaboración masiva online, se han desarrollado dos proyectos de carácter semántico: DBpedia y Wikidata. Se analizan las diferencias y similitudes entre ambos modelos de datos y modelo de producción, y se especula sobre la posible evolución y coexistencia de ambos a partir de sus puntos fuertes. Su fortaleza como grafo abierto de conocimiento multidominio aporta un gran valor a la extensión de la web de datos, al actuar como punto de interconexión entre diferentes dominio
Open Access
Wikidata: una plataforma para la organización y recuperación del conocimiento
(2025-10-01) Pastor Sánchez, Juan Antonio; Información y Documentación
Se introduce y analiza Wikidata como un proyecto central en la construcción de grafos de conocimiento abiertos y colaborativos. Se plantea como objetivo explicar qué es Wikidata, cómo se organizan sus datos, de qué manera puede enriquecerse con nuevas aportaciones y cómo es posible acceder a ellos para su reutilización. En primer lugar, se describe la estructura de Wikidata, que se basa en ítems identificados mediante códigos únicos (Q), declaraciones compuestas por propiedades (P) y valores, así como en elementos complementarios como calificadores, referencias y rankings. Este modelo permite organizar el conocimiento de manera semántica, garantizando precisión, verificabilidad y multilingüismo. Se aborda la semántica de los datos, destacando el papel de estándares como RDF, URIs y SPARQL. Se explica cómo las tripletas sujeto-predicado-objeto estructuran la información en grafos RDF y cómo SPARQL permite realizar consultas avanzadas, comparables al uso de SQL en bases de datos relacionales. Asimismo, se aborda la importancia de los grafos de conocimiento en aplicaciones de inteligencia artificial, búsqueda en internet y asistentes digitales. Se analizan también los problemas de Wikidata, entre ellos la incompletitud, errores en la elección de propiedades, incoherencias, vandalismo y limitaciones en la recuperación masiva de datos. No obstante, se enfatiza la relevancia de la edición colaborativa, las referencias verificables y el uso de herramientas como QuickStatements para la carga y curación de datos. Finalmente, se destaca el potencial de Wikidata Query Service (WDQS) para la consulta y visualización de información, donde se realiza una ejemplificación de consultas SPARQL, mostrando las posibilidades prácticas de recuperación y explotación de datos. Esto convierte a Wikidata en una infraestructura clave para la investigación, la educación y el desarrollo de servicios digitales basados en datos abiertos.

Browsing by Subject "Wikidata"

Results Per Page

Sort Options