Material docente
Ir a Estadísticas
Permanent URI for this collection
Browse
Recent Submissions
- PublicationOpen AccessSyntactic analysis with Natural Language Processing using large language modelsFrancisco José Cortés Delgado; Eduardo Martínez Graciá; Rafael Valencia García; Ingeniería de la Información y las Comunicaciones; Facultad de InformáticaThis document presents an approach for automatic constituency parsing of Spanish sentences based on fine-tuning Large Language Models like Bloom or GPT2 using the seq2seq approach. Furthermore, it aims to ensure the widespread accessibility of this system. To achieve this, we use the AmazonWeb Services platform for hosting and distribution. The successful completion of this project will benefit MiSintaxis [18] application, thus providing quality education to its thousands of users worldwide. In this project, we initially delve into the history of Spanish grammar studies, exploring its components and the methodologies employed in teaching it at the elementary and secondary education levels. This analysis serves as a foundational understanding, informing the subsequent stages of our research and development. Subsequently, we present a review of the state-of-the-art developments in Natural Language Modeling and Parsing. We traverse the history of Neural Networks and their application in the realm of Natural Language Modeling, discussing the evolution of various architectures that laid the foundation for the advent of Transformers. We meticulously explore the intricacies of Transformer architecture, focusing on the critical elements that propelled the success of Large Language Models. In addition, we introduce the Hugging Face ecosystem, a notable platform that fosters the accessibility and usability of these advanced models. We also shed light on traditional parsing algorithms, delineating their role and significance in the broader context of language parsing. Using an automatic process, we converted the Spanish AnCora corpus using our grammar notation based on the recommendations of the Nueva gramática BÁSICA de la lengua española [15]. This process resulted in a Spanish corpus comprising 500,000 words spread across 17,300 sentences, thus encompassing the entirety of AnCora. We fine tuned Hugging Face models bloom-560m, bloom-1b1, gpt2-base-bne and gpt2-larg-bne with this customized corpus and compared them using the F1 metric over the test dataset from the Ancora corpus, obtaining the following scores: 0.8141 for gpt2-larg-bne, 0.7939 for bloom- 560m, 0.7790 for bloom-1b1, 0.7234 for gpt2-base-bne. With a simplified test dataset that we called the Argos dataset, we obtain the following F1 scores: 0.9123 for bloom-1b1, 0.8642 for bloom-560m, 0.8321 for gpt2-larg-bne, 0.8190 for gpt2-base-bne. Finally, we present Amazon Web Services and how to deploy a large language
- PublicationOpen AccessRecomendaciones para la presentación del Trabajo Fin de Grado (TFG). Versión 0.1Ruiz Martínez, Antonio; Ingeniería de la Información y las Comunicaciones; Facultad de Informática
- PublicationOpen AccessDescolonizando el Museo Nacional de Colombia : análisis del impacto de la autocrítica que proyecta el museo en su Sala 1 “La historia del Museo y el Museo en la Historia”(Universidad de Murcia, Facultad de Educación, 2025-06-06) Hernández Navas, Sonia Marcela; Giorgi, Arianna; Marín Torres, María Teresa; Sin departamento asociado; Facultad de EducaciónEste estudio analiza el impacto del guion museográfico de la Sala 1 del Museo Nacional de Colombia en sus visitantes, considerando la influencia de los estudios decoloniales en la museología contemporánea. Se midió la percepción de los objetos y cartelas en una muestra estratificada por edad para comparar diferencias entre visitantes jóvenes y mayores. La investigación surgió por el interés en cómo la decolonialidad ha influido en museos a nivel mundial y su aplicación en el contexto colombiano. Para alcanzar el objetivo, se revisaron discusiones académicas, lo que permitió definir categorías de análisis y formular un instrumento de recolección de información. También se revisó el guion museográfico en su aspecto investigativo y en la propuesta de objetos y cartelas. Se encuestaron ciento sesenta y ocho personas mediante un método cuantitativo no experimental descriptivo con preguntas cerradas. Los resultados indicaron que los visitantes perciben un esfuerzo del museo por incluir la plurietnicidad nacional en su narrativa histórica. Sin embargo, también identifican que, históricamente, el museo ha contribuido a la exclusión de comunidades indígenas y afrocolombianas, lo que genera reflexiones críticas sobre su papel en la representación de la diversidad cultural. Se concluye que el guion de la Sala genera el impacto esperado, pero podría ser más explícito en su autocrítica. Incluir cartelas que evidencien cómo promovió ideas coloniales permitiría al museo alinearse con el discurso histórico que se difunde en la educación actual. Esto respondería mejor a las expectativas de nuevas generaciones, más receptivas a cuestionar la colonialidad y sus efectos en la identidad nacional.
- PublicationOpen AccessCuaderno del alumno. Tema 2Peñalver-García, Dolores María; Métodos de Investigación y Diagnóstico en Educación
- PublicationEmbargoInvestigación y análisis de datos para la realización de TFG, TFM Y TESIS DOCTORALFuensanta Hernández Pina; Javier J. Maquilón Sánchez; José D. Cuesta Sáez de Tejada; Tomás Izquierdo Rus; Métodos de Investigación y Diagnóstico en Educación; Facultades de la UMU