Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10201/157596

Título: Combinación de modelado y razonamiento espacio-temporal con tecnologías de grafos aplicado a epidemiología de infecciones nosocomiales e infecciones multirresistentes
Fecha de publicación: 21-jul-2025
Fecha de defensa / creación: 18-jul-2025
Editorial: Universidad de Murcia
Materias relacionadas: CDU::0 - Generalidades.::00 - Ciencia y conocimiento. Investigación. Cultura. Humanidades.::004 - Ciencia y tecnología de los ordenadores. Informática.
Palabras clave: Inteligencia artificial
Informática
Epidemiología
Resumen: Esta tesis doctoral tiene como objetivo demostrar que el uso combinado de técnicas de modelado y razonamiento espacio-temporal con tecnologías basadas en grafos son efectivas para el análisis epidemiológico de infecciones nosocomiales. Las infecciones nosocomiales, especialmente aquellas causadas por bacterias multirresistentes, representan un problema de salud pública global, debido a su rápida propagación y alto índice de mortalidad. En este contexto, planteamos como objetivo principal el diseño y formalización en forma de grafos de un modelo de datos y operacional que sirva de base para futuras investigaciones relacionadas con el análisis epidemiológico espacial y temporal basado en los movimientos y contactos entre pacientes dentro del hospital. Este modelo busca servir de base para tareas epidemiológicas fundamentales como la detección de brotes, de cadenas de transmisión entre pacientes y de potenciales fuentes de contagio (ya sean ubicaciones físicas o áreas dentro del hospital, o servicios o unidades del en los que se organiza el personal sanitario). Hemos desarrollado la investigación como se detalla a continuación. En primer lugar, realizamos un análisis exhaustivo del estado del arte sobre el uso de redes en modelos computacionales aplicados a la propagación de brotes epidémicos, identificando tendencias en escalas espaciales y temporales, tipos de redes utilizadas y fuentes de datos. Posteriormente, proponemos un modelo de datos espacio-temporal que incluye una dimensión espacial jerárquica (estructura física del hospital y organización del personal) y una dimensión temporal basada en los eventos clínicos registrados en el Sistema de Información Hospitalario (SIH) o Historia Clínica Electrónica del paciente (HCE). A partir de este modelo, hemos diseñado y formalizado seis consultas que representan tareas epidemiológicas fundamentales en la vigilancia y detección de brotes nosocomiales. En cuanto a la formalización del modelo y las consultas, hemos evaluado dos tecnologías orientadas a grafos: grafos de propiedades y grafos de conocimiento (formatos RDF y RDF*). Concretamente, hemos evaluado el rendimiento (tiempo ejecución y consumo de memoria principal) de dos bases de datos orientadas a grafos representativas de estas tecnologías: Neo4j y GraphDB. Los resultados muestran diferencias significativas en términos de eficiencia y expresividad según la tecnología empleada, destacando la escalabilidad de GraphDB y la utilidad de RDF* (y su lenguaje de consulta, SPARQL*) en la implementación de relaciones con propiedades y en las ventajas que ofrece el ser estándares. Finalmente, a partir del modelo y consultas propuestas, diseñamos y validamos un nuevo método denominado StESPT (Spatio-Temporal Epidemiological Similarity based on Patient Trajectories), orientado al descubrimiento de grupos de pacientes infectados espacial y temporalmente conectados. Este método consiste en cinco pasos: obtención de los pacientes infectados potenciales de un brote y transformación de sus estancias hospitalarias en trayectorias, cálculo de la similitud espacio-temporal epidemiológica entre puntos y entre trayectorias, y aplicación de técnicas de clustering para identificar posibles brotes y rutas de contagio. Validamos el modelo, consultas y método propuestos utilizando datos clínicos sintéticos. En las conclusiones destacamos que la combinación de tecnologías de grafos y razonamiento espacio-temporal aporta una representación flexible, expresiva y eficiente para el análisis de infecciones nosocomiales causadas por bacterias en entornos hospitalarios. Este enfoque facilita tareas como la búsqueda de casos índice, la reconstrucción de brotes y el descubrimiento de patrones ocultos, contribuyendo así a la toma de decisiones clínicas y al diseño de estrategias preventivas. Además, la tesis ha sido desarrollada bajo principios de ciencia abierta, garantizando la reproducibilidad de los experimentos mediante la publicación de código y datos en repositorios públicos
This doctoral thesis aims to demonstrate that spatiotemporal modelling and reasoning techniques combined with graph-based technologies are effective for the epidemiological analysis of nosocomial infections. Nosocomial infections, particularly those caused by multidrug-resistant bacteria, represent a global public health issue due to their rapid spread and high mortality rate. In this context, the main objective is the design and formalisation, in the form of graphs, of a data and operational model that serves as a foundation for future research related to spatio-temporal epidemiological analysis based on patient movements and contacts within the hospital. This model is intended to support fundamental epidemiological tasks such as outbreak detection, identification of transmission chains between patients, and recognition of potential sources of infection (whether physical locations or areas within the hospital or the services or units in which healthcare staff are organised). The research has been developed in detail below. Firstly, a comprehensive analysis of the state of the art regarding the use of networks in computational models applied to the spread of epidemic outbreaks is conducted, identifying trends in spatial and temporal scales, types of networks used, and data sources. Subsequently, a spatio-temporal data model is proposed, which includes a hierarchical spatial dimension (the physical structure of the hospital and the organisation of the staff) and a temporal dimension based on clinical events recorded in the Hospital Information System (HIS) or the patient's Electronic Health Record (EHR). Based on this model, six queries representing fundamental epidemiological tasks for the surveillance and detection of nosocomial outbreaks have been designed and formalised. Regarding the formalisation of the model and the queries, two graph-oriented technologies have been evaluated: property graphs and knowledge graphs (RDF and RDF* formats). Specifically, the performance (execution time and primary memory consumption) of two graph-oriented databases representative of these technologies—Neo4j and GraphDB—has been assessed. The results show significant differences in terms of efficiency and expressiveness depending on the technology used, highlighting the scalability of GraphDB and the usefulness of RDF* (and its query language, SPARQL*) in the implementation of property-based relationships and in the advantages offered by being standard-compliant. Finally, based on the proposed model and queries, a new method called StESPT (Spatio-Temporal Epidemiological Similarity based on Patient Trajectories) is designed and validated, aimed at discovering groups of infected patients who are spatially and temporally connected. This method consists of five steps: obtaining the potentially infected patients of an outbreak and transforming their hospital stays into trajectories, calculating the spatio-temporal epidemiological similarity between points and between trajectories, and applying clustering techniques to identify outbreaks and transmission routes. The validation of the proposed model, queries, and method is conducted using synthetic clinical data. The conclusions highlight that the combination of graph technologies and spatio-temporal reasoning provides a flexible, expressive, and efficient representation for analysing nosocomial infections caused by bacteria in hospital environments. This approach facilitates tasks such as index case search, outbreak reconstruction, and discovering hidden patterns, thus contributing to clinical decision-making and the design of preventive strategies. Additionally, the thesis has been developed under open science principles, ensuring the reproducibility of experiments through the publication of code and data in public repositories.
Autor/es principal/es: Pujante Otálora, Lorena
Director/es: Campos Martínez, Manuel
Juárez Herrero, José Manuel
Facultad/Servicios: Escuela Internacional de Doctorado
Forma parte de: Proyecto de investigación:
URI: http://hdl.handle.net/10201/157596
Tipo de documento: info:eu-repo/semantics/doctoralThesis
Número páginas / Extensión: 197
Derechos: info:eu-repo/semantics/openAccess
Attribution-NonCommercial-NoDerivatives 4.0 Internacional
Aparece en las colecciones:Ingeniería

Ficheros en este ítem:
Fichero Descripción TamañoFormato 
Pujante-Otálora-Lorena_TD_2025.pdf16,5 MBAdobe PDFVisualizar/Abrir


Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons Creative Commons