Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10201/121374

Título: Integroly : sistema automático de población de un grafo de conocimiento a partir de datos sociales masivos en el dominio de marketing político
Fecha de publicación: 15-jun-2022
Fecha de defensa / creación: 13-jun-2022
Editorial: Universidad de Murcia
Materias relacionadas: CDU::0 - Generalidades.::00 - Ciencia y conocimiento. Investigación. Cultura. Humanidades.::004 - Ciencia y tecnología de los ordenadores. Informática.
Palabras clave: Programas y sistemas de programación
Semántica
Informática
Resumen: Las campañas políticas modernas se sustentan en estrategias formuladas en base a lo que se ha dado en conocer como marketing político. El marketing político abarca desde la definición del producto político, a través de un minucioso análisis de las necesidades del electorado, hasta el desarrollo de campañas y la gestión de la comunicación política. La inteligencia de mercado, esto es, entender las demandas reales del mercado político, supondrá la primera etapa en este complejo proceso. Uno de los principales problemas de la inteligencia de mercado político es el procesamiento de la diversidad de las fuentes de datos como son las encuestas, redes sociales, páginas Web, entre otras más. Las redes sociales se han convertido en una de las principales plataformas de conversación y canales para compartir experiencias y opiniones. Sin embargo, el monitoreo, la extracción, el procesamiento, el almacenamiento y el análisis de los datos masivos sociales en el ámbito político es una tarea complicada por su heterogeneidad propia de la estructura de la fuente de datos. A pesar de los retos, estas tareas son muy importantes para lograr encontrar las demandas de los potenciales votantes, y con ello, crear una estrategia y toma de decisiones ligada a las mismas. Las tecnologías de la Web semántica, y en particular, las ontologías, permiten generar una base de conocimiento homogéneo, compartido y reutilizado, con un formato legible por la máquina y enriquecido para apoyar el descubrimiento, la integración, la representación y la gestión del conocimiento. En los últimos años, las ontologías y los grafos de conocimiento (KG) han demostrado ser eficaces para propiciar una solución de integración de datos y ayudando con la complejidad de encontrar relaciones significativas dentro de los datos heterogéneos. Este trabajo se enfoca en dos principales contribuciones, la primera, generar un modelo ontológico basado en el dominio de marketing político, y la segunda, en una propuesta de sistema para la población automática de un grafo de conocimiento a partir de datos masivos sociales en el dominio del marketing político. Nuestra propuesta de modelo ontológico se realizó basado en los criterios y necesidades del marketing político. La construcción de la ontología fue a través de metodología estándar Ontology 101, donde se definió el dominio y alcance, se consideró la reutilización de ontologías existentes, se enumeraron los términos importantes para la ontología, hasta la definición de clases, propiedades, relaciones e instancias base. La ontología se bautizó como PMont (Political Marketing Ontology) la cual responde preguntas clave del marketing político. La PMont permitió la integración de la información disponible sobre el electorado y candidatos a través de distintas fuentes de datos. La segunda aportación de este trabajo de investigación es una solución automatizada basada en textos en castellano a través de técnicas de Machine Learning y Procesamiento del Lenguaje Natural, recolección datos significativos de fuentes de medios digitales semiestructurados y no estructurados, procesamiento datos masivos y finalmente la población de un grafo de conocimiento previamente definido por un modelo ontológico del dominio de marketing político. La propuesta de sistema de automatización cuenta con las siguientes fases o componentes: (i) conectividad a fuentes y almacenamiento de datos, (ii) procedimiento de extracción de información, (iii) proceso de población y validación de la ontología, y finalmente, (iv) el grafo de conocimiento resultante. Como resultado de esta tesis doctoral se tiene un grafo de conocimiento poblado con información validada, precisa, consistente y confiable. El grafo de conocimiento fue evaluado a través de 18 requisitos de calidad sobre las dimensiones de accesibilidad, contextualidad, intrínseca y representatividad, de los cuales nos brinda una base de conocimiento óptima para la inteligencia de mercado del marketing político.
Modern political campaigns are based on strategies formulated in what has become known as political marketing. Political marketing ranges from the definition of the political product, through a detailed analysis of the needs of the electorate, to the development of campaigns and the management of political communication. Market intelligence is understanding the real demands of the political market, will be the first stage on this complex process. One of the main problems of political market intelligence is the processing of the diversity of data sources such as surveys, social networking sites, Web pages, databases of political institutions, among others. Social networks sites have become one of the main conversation platforms and channels for sharing experiences and opinions. They encourage public discourse and, in particular, are increasingly used for political issues, such as citizen participation, proselytism or political debate. However, the monitoring, extraction, processing, storage and analysis of social big data in the political sphere is a complicated task due to the heterogeneity of the data source structure. Despite the challenges and complications, these tasks are very important to meet the short, medium and long-term demands of potential voters, and thereby create a strategy and decision-making linked to them. Semantic Web technologies, and in particular, ontologies, allow the generation of a homogeneous knowledge base, shared and reused, with a machine-readable format and enriched to support the discovery, integration, representation and management of knowledge. In recent years, ontologies and Knowledge Graphs (KGs) have proven to be effective in enabling a data integration solution and helping with the complexity of finding meaningful relationships within heterogeneous data. This work focuses on two main contributions, the first, to generate an ontological model based on the domain of political marketing, and the second, in a framework proposal for automatic Knowledge Graph population from social big data in the political marketing domain. Our ontological model proposal was made based on the criteria and needs of political marketing on political campaigns. The construction of the ontology was through the standard Ontology 101 methodology, where the domain and scope of the ontology were defined, the reuse of existing ontologies was considered, the important terms for the ontology were listed, up to the definition of classes, properties, relationships and base instances. The ontology was named PMont (Political Marketing Ontology) which answers key questions of political marketing. The PMont allowed the integration of the information available on the electorate and candidates through different data sources. The second contribution of this research work is an automated system based on texts in Spanish through Machine Learning (ML) and Natural Language Processing (NLP) techniques, collecting significant data from semi-structured and unstructured digital media sources, processing big data and finally the population of a Knowledge Graph previously defined by an ontological model of the political marketing domain. The automation system proposal has the following phases or components: (i) source connection and data collection, (ii) information extraction, (iii) ontology population and validation process, and finally, (iv) the Knowledge Graph. While the process is carried out automatically, the instances added to the Knowledge Graph are annotated so that human experts can supervise the results of the automated population in an optional later stage. As a result of this doctoral thesis, we have a Knowledge Graph populated with validated, precise, consistent, and reliable information. The Knowledge Graph was evaluated through 18 quality requirements on the dimensions of accessibility, contextuality, intrinsic and representativeness, of which it provides us with an optimal knowledge base for political marketing market intelligence.
Autor/es principal/es: Guedea Noriega, Héctor Hiram
Director/es: García Sánchez, Francisco
Facultad/Departamentos/Servicios: Escuela Internacional de Doctorado
Forma parte de: Proyecto de investigación
URI: http://hdl.handle.net/10201/121374
Tipo de documento: info:eu-repo/semantics/doctoralThesis
Número páginas / Extensión: 144
Derechos: info:eu-repo/semantics/openAccess
Attribution-NonCommercial-NoDerivatives 4.0 Internacional
Aparece en las colecciones:Ingeniería

Ficheros en este ítem:
Fichero Descripción TamañoFormato 
Guedea Noriega, Héctor Hiram_TD_subsanado.cleaned.pdf4,39 MBAdobe PDFVista previa
Visualizar/Abrir


Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons Creative Commons