Publication: Inventario de palabras clave temáticas para la clasificación automática de noticias de televisión
Loading...
Date
2011
Authors
Rodríguez Bravo, Ángel ; Mas Manchón, Lluís
item.page.secondaryauthor
item.page.director
Publisher
Murcia, Universidad de Murcia, Servicio de Publicaciones
publication.page.editor
publication.page.department
DOI
item.page.type
info:eu-repo/semantics/article
Description
Abstract
En el marco de un proyecto financiado por el CAC (Consell de
l’Audiovisual de Catalunya), se realizó una aproximación comunicológica al
problema de la selección de palabras clave para la clasificación temática de noticias
de televisión a partir de sistemas de reconocimiento automático. Aplicamos análisis
del discurso (entorno al concepto “tema”), teoría de la noticia y técnicas
lexicométricas y de recuperación de la información, para definir un Protocolo
Integral de Selección de Palabras clave. Del trabajo de 4 investigadores con este
protocolo sobre una muestra transcrita de 698 noticias ha resultado un lexicon de
1000 palabras clave distribuidas en 15 temas, contrastado mediante el estadístico
Lambda de Wilks.
ABSTRACT: In the framework of a research project funded by CAC, a communication approach was taken to the problem of keywords selection for the themes indexing of TV news by word spotting. This is, we apply discourse theories (concept of “themes”), news theory and lexicometry and information retrieval techniques, for the definition of a complex Protocol of Keywords Selection. The work of 4 researchers with this protocol on a 698 transcript news sample resulted in a lexicon of 1000 keywords distributed in 15 themes, which is contrasted statistically with Lambda of Wilks.
ABSTRACT: In the framework of a research project funded by CAC, a communication approach was taken to the problem of keywords selection for the themes indexing of TV news by word spotting. This is, we apply discourse theories (concept of “themes”), news theory and lexicometry and information retrieval techniques, for the definition of a complex Protocol of Keywords Selection. The work of 4 researchers with this protocol on a 698 transcript news sample resulted in a lexicon of 1000 keywords distributed in 15 themes, which is contrasted statistically with Lambda of Wilks.
publication.page.subject
Citation
item.page.embargo
Collections
Ir a Estadísticas
Sin licencia Creative Commons.