Browsing by Subject "Wikidata"
Now showing 1 - 9 of 9
Results Per Page
Sort Options
- PublicationOpen AccessBig data literario de raíz bibliotecaria: reflexiones sobre infraestructuras de anotación, catalogación, descubrimiento y recomendación de ficción narrativa(EPI SCP, 2021) Saorín Pérez, Tomás; Información y DocumentaciónSe describe la relación entre el campo de los estudios literarios basados en datos de la corriente distant reading y las humanidades digitales, y la actividad de las bibliotecas y otras entidades del sector del libro en el ecosistema de la recomendación y el descubrimiento de lecturas. Se presentan proyectos de catalogación y descripción enriquecida de la ficción literaria, como OCLC FictionFinder y Kirjasampo, en el marco de los metadatos transmedia y abiertos, entendidos en relación con las prácticas de plataformas de consumo de contenidos digitales como Netflix o Amazon Prime Video, junto a otras prácticas de anotación y edición de textos literarios. Finalmente se plantea la oportunidad de desarrollo de laboratorios bibliotecarios digitales apoyados en infraestructuras de datos abiertas como Wikidata para la descripción enriquecida de ficciones narrativas de todas las épocas de forma colaborativa, para posibilitar proyectos y servicios de descubrimiento de lecturas relacionadas
- PublicationOpen AccessUn canon literario universal basado en datos enciclopédicos multilingües: propuesta de un método de medición de obras literarias usando datos cuantitativos obtenidos de Wikidata y Wikipedia(CISC, 2023-07-07) Pastor Sánchez, Juan Antonio; Saorín Pérez, Tomás; Baños Moreno, María José; Información y DocumentaciónLa investigación descrita en este artículo tiene como objetivo verificar la viabilidad de usar Wikidata y Wikipedia como fuente para identificar un canon literario universal. Para ello, primero se sitúan ambos proyectos de la fundación Wikimedia en el contexto de los datos sobre obras literarias. La metodología utilizada se basa en la construcción de un conjunto de datos a partir de datos específicos sobre obras literarias recuperados de Wikidata y de las ediciones de Wikipedia en todos los idiomas. Se analiza la profundidad de descripción de los ítems de obras literarias en Wikidata y su presencia y nivel de elaboración de los correspondientes artículos en Wikipedia. Mediante K-means se identifican tres clústeres de obras literarias a partir de los cuales se identifican un conjunto de obras que pueden conformar un canon literario universal. Se propone una métrica denominada Wiki3DRank que permite seleccionar y ordenar las obras literarias analizadas. El estudio aborda también algunos aspectos de la distribución por idiomas, así como un análisis específico de las asimetrías en su distribución temporal entre obras clásicas y obras contemporáneas. El artículo incluye una sección de discusión con reflexiones sobre los resultados obtenidos y concluye proponiendo Wikidata y Wikipedia como una fuente complementaria valiosa para la elaboración de cánones literarios tanto globales como de idiomas específicos.
- PublicationOpen AccessExploración de ranking y selección de obras creativas a partir de datos enciclopédicos de Wikipedia y Wikidata: resultados sobre obras literarias y otros objetos culturales(LINHD UNED, 2024-06-12) Saorín Pérez, Tomás; Pastor Sánchez, Juan Antonio; Información y Documentación¿Podemos encontrar una forma confortable de medir la importancia de una obra cultural – o de un objeto de conocimiento enciclopédico – y aplicarlo en el terreno de la recomendación cultural? Nuestra investigación se centra en validar la realización de rankings de relevancia frente a los de popularidad, tratando de operativizar un método de cálculo transparente y con aplicación a la conversación y la mediación cultural. Las listas y los ranking son un fenómeno en sí mismos, y tenerlos por objeto de investigación puede enriquecer el discurso sobre cómo se construyen y cómo se usan. Por otra parte, estamos estudiando la aplicación de nuestras métricas para comparar diversas propuestas de canon literario, como los 1001 libros que hay que leer antes de morir, de Peter Boxall.
- PublicationEmbargoObservando la curación colaborativa de conocimiento estructurado en Wikidata(2024-12-04) Pastor Sánchez, Juan Antonio; Saorín, Tomás; Información y DocumentaciónSe revisan aspectos concretos relevantes para entender el funcionamiento de Wikidata desde la perspectiva de la organización colaborativa del conocimiento. La curación colectiva presenta retos sobre modelado y calidad de los datos. Wikidata tiene la capacidad de incorporar taxonomías y vocabularios controlados, pero se identifican prácticas problemáticas en el uso clases/subclases e instancias. También se describen las dificultades para establecer esquemas de metadatos, y en la realización de descripciones consistentes de elementos, y el uso como base de datos bibliográfica, así como un panorama de las paradojas que crea el licenciamiento en dominio y su uso como conjunto de datos para enriquecimiento de las aplicaciones de nueva generación de inteligencia artificial.
- PublicationOpen AccessUso de Wikidata y Wikipedia para la generación asistida de un vocabulario estructurado multilingüe sobre la pandemia de Covid-19.(Profesional de la Información, 2020-09-13) Saorín Pérez, Tomás; Pastor Sánchez, Juan Antonio; Baños Moreno, María José; Información y DocumentaciónSe propone un método para la construcción ágil y dinámica de vocabularios controlados, especialmente para los medios de comunicación, utilizando Wikidata y Wikipedia como fuentes de información terminológica. El método se aplica a la construcción de un vocabulario sobre la pandemia de Covid-19. Para ello se propone la explotación de la estructura de items y propiedades de Wikidata y de los enlaces salientes y entradas de los artículos de Wikipedia. Mediante un proceso de definición de reglas de expansión de relaciones de Wikidata se ha diseñado un algoritmo en el que se parte de un conjunto de items iniciales y en sucesivas iteraciones y revisión de resultados se recopilan las declaraciones relevantes a la temática del vocabulario. El algoritmo se ha implementado en una aplicación cuyo código y resultados de recopilación del vocabulario sobre la pandemia de Covid-19 se ha publicado en un repositorio abierto. Esto permite utilizar el algoritmo tanto para verificar los resultados usando las mismas u otras reglas de expansión como para su aplicación a la recopilación de vocabularios de otras temáticas. En los resultados también se analizan los elementos recopilados en cada iteración, la propuesta de validación mediante los enlaces entrantes y salientes de los artículos, dejando como futuros trabajos la aplicación de SKOS para la representación interoperable de los vocabularios obtenidos mediante este método.
- PublicationOpen AccessWiki3DRank: a model for measuring the relevance of knowledge objects using quantitative data from Wikidata and Wikipedia(Red Ibersid, 2024-06-14) Pastor Sánchez, Juan Antonio; Saorín Pérez, Tomás; Baños Moreno, María José; Información y DocumentaciónThis research introduces the Wiki3DRank, a model combining real-time extracted quantitative data from Wikidata and Wikipedia to obtain a ranking of knowledge objects through a quantitative value that measures the relevance of one object compared to others in a specific domain. The model is based on the distribution of knowledge objects in a vector space, whose components are based on three main variables: the number of statements on Wikidata about an item, the number of articles in different Wikipedia editions, and the length in number of words of these articles. These variables are associated with the level of description of the Wikidata items, the dissemination of the referred knowledge objects in Wikipedia editions in different languages, and the degree of editorial elaboration of the corresponding Wikipedia articles. To demonstrate the viability of the model, a series of use cases across various domains are analyzed: books, movies, cathedrals, earthquakes, rivers, and chemical elements. From the results obtained, it is possible to conclude that Wiki3DRank is a tool that allows measure the relevance of knowledge objects in the context of a knowledge domain. The operation of an open-source tool that enables the online calculation of Wiki3DRank is presented. The results suggest that the proposed model can be applied to different contexts and domains and that it`s ease to expand it by adding elements of weighting and extending the model with new components based on other characteristics of the encyclopedic data of the knowledge objects, while the base vector calculation system is maintained. ----------------------------
- PublicationOpen AccessWiki3DRank: un modelo para medir la relevancia de objetos de conocimiento mediante datos cuantitativos de Wikidata y Wikipedia(Red Ibersid, 2024-06-14) Pastor Sánchez, Juan Antonio; Saorín Pérez, Tomás; Baños Moreno, María José; Información y DocumentaciónSe presenta el modelo Wiki3DRank, que combina da-tos cuantitativos extraídos en tiempo real de Wikidata y Wikipedia para obtener un ranking de objetos de co-nocimiento a través de un valor cuantitativo que mida la relevancia de un objeto frente a otros en undetermi-nado dominio. El modelo se basa en la distribución de los objetos de conocimiento en un espacio vectorial cu-yas componentes se basan en tres variables principa-les: número de declaraciones en Wikidata sobre un ítem, número de artículos en las diferentes ediciones de Wikipedia y extensión en número de palabras de dichos artículos. Estas variables se asocian al nivel de descripción de los ítems de Wikidata, la difusión de los objetos de conocimiento asociados a los mismos en las ediciones de Wikipedia de diferentes idiomas y el grado de elaboración editorial de los correspondientes artículos de Wikipedia. Para demostrar la viabilidad del modelo se analizan una serie de casos de uso sobre diversos dominios: libros, películas, catedrales, terre-motos, ríosy elementos químicos. A partir de los resul-tados obtenidos es posible concluir que Wiki3DRank es una herramienta que permite medir la relevancia de objetos de conocimientos en el contexto de un dominio de conocimiento. Se muestra el funcionamiento de una herramienta de código abierto que permite el cálculo en línea de Wiki3DRank. Los resultados obtenidos su-gieren que el modelo propuesto puede aplicarse para diferentes contextos y dominios, que pueden introdu-cirse elementos de ponderación y es posible extender el modelo mediante la introducción de nuevos compo-nentes basados en otras características de los datos enciclopédicos de los objetos de conocimiento, al mismo tiempo que se mantiene el sistema de cálculo vectorial de base. -------------------------------------------
- PublicationOpen AccessWikidata y DBpedia: viaje al centro de la web de datos(EPI SCP, 2018-04-26) Pastor Sánchez, Juan Antonio; Saorín Pérez, Tomás; Información y DocumentaciónA partir de Wikipedia, como fuente de conocimiento organizado en forma de artículos enciclopédicos, editada mediante la colaboración masiva online, se han desarrollado dos proyectos de carácter semántico: DBpedia y Wikidata. Se analizan las diferencias y similitudes entre ambos modelos de datos y modelo de producción, y se especula sobre la posible evolución y coexistencia de ambos a partir de sus puntos fuertes. Su fortaleza como grafo abierto de conocimiento multidominio aporta un gran valor a la extensión de la web de datos, al actuar como punto de interconexión entre diferentes dominio
- PublicationOpen AccessWikidata: una plataforma para la organización y recuperación del conocimiento(2025-10-01) Pastor Sánchez, Juan Antonio; Información y DocumentaciónSe introduce y analiza Wikidata como un proyecto central en la construcción de grafos de conocimiento abiertos y colaborativos. Se plantea como objetivo explicar qué es Wikidata, cómo se organizan sus datos, de qué manera puede enriquecerse con nuevas aportaciones y cómo es posible acceder a ellos para su reutilización. En primer lugar, se describe la estructura de Wikidata, que se basa en ítems identificados mediante códigos únicos (Q), declaraciones compuestas por propiedades (P) y valores, así como en elementos complementarios como calificadores, referencias y rankings. Este modelo permite organizar el conocimiento de manera semántica, garantizando precisión, verificabilidad y multilingüismo. Se aborda la semántica de los datos, destacando el papel de estándares como RDF, URIs y SPARQL. Se explica cómo las tripletas sujeto-predicado-objeto estructuran la información en grafos RDF y cómo SPARQL permite realizar consultas avanzadas, comparables al uso de SQL en bases de datos relacionales. Asimismo, se aborda la importancia de los grafos de conocimiento en aplicaciones de inteligencia artificial, búsqueda en internet y asistentes digitales. Se analizan también los problemas de Wikidata, entre ellos la incompletitud, errores en la elección de propiedades, incoherencias, vandalismo y limitaciones en la recuperación masiva de datos. No obstante, se enfatiza la relevancia de la edición colaborativa, las referencias verificables y el uso de herramientas como QuickStatements para la carga y curación de datos. Finalmente, se destaca el potencial de Wikidata Query Service (WDQS) para la consulta y visualización de información, donde se realiza una ejemplificación de consultas SPARQL, mostrando las posibilidades prácticas de recuperación y explotación de datos. Esto convierte a Wikidata en una infraestructura clave para la investigación, la educación y el desarrollo de servicios digitales basados en datos abiertos.