Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10201/3769

Registro completo de metadatos
Campo DCValorLengua/Idioma
dc.contributor.authorMoreiro González, José Antonio-
dc.contributor.otherFacultad de Comunicación y Documentaciónen_EN
dc.date.accessioned2009-03-26T08:23:07Z-
dc.date.available2009-03-26T08:23:07Z-
dc.date.issued2002-
dc.identifier.issn1575-2437-
dc.identifier.urihttp://hdl.handle.net/10201/3769-
dc.description.abstractReflexión sintética para revisar las propuestas más relevantes que, siguiendo la teoría matemática de la comunicación de Shannon y Weaver, hayan afectado a los procedimientos del análisis automático del contenido documental. Partiendo del empleo de la teoría matemática en Ciencia de la Información se explican sus aplicaciones metodológicas en nuestra especialidad, en especial respecto a las técnicas de recuperación de la información. Para después describir los modelos matemáticos aplicados al análisis automático del contenido: leyes de Zipf y Goffman, antidiccionarios para índices permutados, Indización Estadística de Términos por Frecuencias, algoritmos n-grams y de stemming, así como los referidos a los métodos de agrupación y clasificación como clusters por valor de discriminación y por relevancia de los términos como son los métodos de agrupación basados en Grafos Teóricos, los basados en Centros de masas, el algoritmo K-vecinos o Kmedias, el K-vecinos axial o incremental, y el algoritmo ISODATA. Para luego exponer los clasificadores cienciométricos como el método de Chen y finalmente los métodos con sistemas de aprendizaje.en_EN
dc.description.abstractABSTRACT: This paper analyzes the most important proposals following the Shannon and Weaver's Mathematic Theory of Communication that have influenced in proceedings of automatic content analysis. It's explained the methodological applications of this theory in our discipline, especially about information retrieval. After this, describes the mathematical models applied to automatic content analysis: Laws of Zipf and Goffman, anti-dictionaries to permuted indexes, Statistical Indexation of terms by frequencies, n-grams and stemming algorisms. Also studies the methods of relation and classification like clusters by value of discrimination and by relevance of terms: for example, methods of relations based in Graph Theory, mass core, the K-means or incremental K-means, and the ISODATA algorism. Finally, explains the scientometrics indicators as Chen's coowording and methods with learning systems.-
dc.formatapplication/pdfes
dc.format.extentp. 273-286en_EN
dc.languagespaen_EN
dc.publisherMurcia, Universidad de Murcia, Servicio de Publicacionesen_EN
dc.relation.ispartofAnales de documentación, vol. 5, 2002en_EN
dc.rightsinfo:eu-repo/semantics/openAccesses
dc.subjectAnálisis de contenido textualen_EN
dc.subjectMétodos estadísticosen_EN
dc.subjectMétodos probabilísticosen_EN
dc.subjectTextual content analysis-
dc.subjectStatistical methods-
dc.subject.otherCDU::0 - Generalidades.::02 - Biblioteconomía. Documentaciónen_EN
dc.titleAplicaciones al análisis automático del contenido provenientes de la teoría matemática de la informaciónen_EN
dc.typeinfo:eu-repo/semantics/articleen_EN
Aparece en las colecciones:Vol. 05 (2002)

Ficheros en este ítem:
Fichero Descripción TamañoFormato 
AD5 (2002) p 273-286.pdf211 kBAdobe PDFVista previa
Visualizar/Abrir


Los ítems de Digitum están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.