Por favor, use este identificador para citar o enlazar este ítem:
http://hdl.handle.net/10201/149464


Título: | Análisis de metadatos de noticias para la extracción de información del código fuente. El software METADADOSHTML |
Otros títulos: | Analysis of news metadata for the extraction of information from the source code. METADATOSHTML software |
Fecha de publicación: | 1-mar-2017 |
Editorial: | University of Boros |
Cita bibliográfica: | Information Research, 22(1), 2017 |
ISSN: | 1368-1613 |
Materias relacionadas: | CDU::0 - Generalidades.::02 - Biblioteconomía. Documentación |
Palabras clave: | Metadatos MetadadadosHTML Noticias |
Resumen: | Introducción. Los objetivos de este trabajo son determinar qué esquemas se utilizan para título, resumen, palabras clave, autoría y periódico en prensa; conocer qué pautas siguen los periódicos en la implementación de dichos esquemas; y averiguar cómo esto afecta a la extracción de información. Metodología. Para ello, se define una muestra de diarios y se analiza su código fuente, identificando esquemas utilizados y patrones de uso. Esto permite extraer valores de dato utilizando la aplicación MetadadosHTML. Resultados. Se han detectado esquemas estándar, ad hoc y propios de los periódicos. Se han hallado diversas prácticas, como valores agrupados en una misma línea de código o por separado; ruido en un valor y errores al referir los nombres de los atributos de esquemas estándar. Estos problemas afectan a la extracción de datos basada en esquemas de metadatos y metadatos en MetadadosHTML Conclusiones. Es necesario avanzar en el uso de esquemas estándar, como Dublin Core o schema.org, favoreciendo la implantación de estos (u otros) en los códigos fuente de noticias. También resulta imprescindible la adopción de buenas prácticas al explicitar datos y valores de datos. Sólo así es posible evolucionar en la interoperabilidad entre sistemas y en la recuperación y reutilización de información. |
Autor/es principal/es: | Baños Moreno, María José Felipe R., Eduardo Pastor-Sánchez, Juan Antonio Lima, Gercina Martínez Béjar, Rodrigo |
URI: | http://hdl.handle.net/10201/149464 |
Tipo de documento: | info:eu-repo/semantics/article |
Derechos: | info:eu-repo/semantics/openAccess Atribución 4.0 Internacional |
Descripción: | © the authors, 2016. This document is the published version of a published work that appeared in final form in Information Research This document is made available under the CC-BY-NC-ND 4.0 license http://creativecommons.org/licenses/by-nc-nd/4.0 |
Aparece en las colecciones: | Artículos |
Ficheros en este ítem:
Fichero | Descripción | Tamaño | Formato | |
---|---|---|---|---|
articulo.pdf | 1,48 MB | Adobe PDF | ![]() Visualizar/Abrir |
Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons