Repository logo
  • English
  • Čeština
  • Deutsch
  • Español
  • Français
  • Gàidhlig
  • Latviešu
  • Magyar
  • Nederlands
  • Português
  • Português do Brasil
  • Suomi
  • Svenska
  • Türkçe
  • Қазақ
  • বাংলা
  • हिंदी
  • Ελληνικά
  • Log In
    New user? Click here to register.
Repository logo

Repositorio Institucional de la Universidad de Murcia

Repository logoRepository logo
  • Communities & Collections
  • All of DSpace
  • menu.section.collectors
  • menu.section.acerca
  • English
  • Čeština
  • Deutsch
  • Español
  • Français
  • Gàidhlig
  • Latviešu
  • Magyar
  • Nederlands
  • Português
  • Português do Brasil
  • Suomi
  • Svenska
  • Türkçe
  • Қазақ
  • বাংলা
  • हिंदी
  • Ελληνικά
  • Log In
    New user? Click here to register.
  1. Home
  2. Browse by Subject

Browsing by Subject "Lingüística computacional"

Now showing 1 - 10 of 10
Results Per Page
Sort Options
  • Loading...
    Thumbnail Image
    Publication
    Open Access
    A statistical approach to term extraction
    (Murcia, Universidad de Murcia, Servicio de Publicaciones, 2011) Nazar, Rogelio
  • Loading...
    Thumbnail Image
    Publication
    Open Access
    Análisis de contenido y lingüística computacional: su rapidez, confiabilidad y perspectivas
    (Murcia: Universidad de Murcia, Editum, 2014-10) Lía Chávez, Brenda; Martín Yamamoto, Jorge
    El análisis de contenido es una técnica que convierte las respuestas abiertas de entrevistas en categorías. Este proceso es de gran utilidad dado que define las categorías de un estudio sobre la base de la percepción de la muestra, evitando la imposición de categorías creadas por el investigador. Sin embargo, este tipo de análisis conlleva un alto costo de tiempo, recursos y personal especializado. Programas como el ATLAS.ti o el NVivo no constituyen una solución eficaz ni eficiente. Los nuevos programas basados en lingüística computacional ofrecen un escenario diferente, dado que el programa “entiende e interpreta” las categorías. Para comprobar su eficacia y eficiencia se compara un análisis de contenido hecho por expertos con el análisis utilizando el programa SPSS Text Analytics for Surveys (TA). Se concluye que bajo la supervisión de un investigador especializado, siguiendo ciertos pasos de afinamiento de la extracción, el TA permite un ahorro de tiempo importante, una mayor confiabilidad y abre las posibilidades para análisis cualitativos con muestras grandes.
  • Loading...
    Thumbnail Image
    Publication
    Open Access
    Análisis y tipificación de errores lingüísticos para una propuesta de mejora de informes médicos en español
    (Universidad de Murcia, 2022-06-21) López Hernández, Jésica; Ángela Almela Sánchez-Lafuente; Fernando Molina Molina; Rafael Valencia García; Escuela Internacional de Doctorado
    El objetivo principal de esta investigación es la detección, análisis y clasificación de errores lingüísticos presentes en informes médicos en español. Los sistemas de corrección automática más actuales y potentes, como las arquitecturas basadas en redes neuronales, requieren grandes conjuntos de datos de entrenamiento para un rendimiento óptimo. Por tanto, debido a la ausencia de corpus de dominio biomédico disponibles, en el procesamiento del lenguaje natural ha ganado importancia la recopilación y generación artificial de errores para el entrenamiento de los sistemas. El desarrollo de una tipología de errores a partir del estudio empírico de un corpus de informes médicos va a permitir añadir nuevos patrones a la generación de errores de forma más exhaustiva y, con ello, la creación de modelos más robustos para el procesamiento de datos en medicina. Para la detección y clasificación de errores se ha analizado un corpus formado por informes médicos reales pertenecientes a cuatro especialidades (urgencias, UCI, cirugía general y psiquiatría), con más de dos millones de tokens. El enfoque metodológico desarrollado ha incluido distintas técnicas de detección y corrección automática, entre las que se encuentran la implementación de un modelo lingüístico basado en n-gramas, la representación vectorial de las palabras del corpus a partir de Word2Vec y el etiquetado gramatical del corpus. Se ha desarrollado una herramienta de cómputo y clasificación de errores, y se ha realizado un análisis cuantitativo y cualitativo de los resultados obtenidos. Los resultados han permitido identificar semejanzas y diferencias entre estas especialidades y han reflejado que la especialidad cuyos informes médicos presentan una mayor tasa de errores es urgencias. La mayoría de las palabras con errores están a distancia de edición 1 de la palabra correcta correspondiente, gran parte de los errores detectados se concentran en un número específico de caracteres y el tipo de error más cometido con una alta incidencia es el de omisión. Muchos de los errores presentan patrones de reproducción consistentes que es posible sistematizar, como la sustitución de caracteres con similitudes fonéticas, los errores provocados por desconocimiento de la norma ortográfica actual y los errores derivados del uso del teclado. En síntesis, esta tesis doctoral pretende ser una contribución al estudio de errores lingüísticos en informes médicos para aportar una base de conocimiento lingüístico a los métodos de detección y corrección existentes para este dominio.
  • Loading...
    Thumbnail Image
    Publication
    Open Access
    La codificación de la información morfológica en los lexicones computacionales
    (Murcia: Universidad de Murcia, Editum, 2003) Marín, Rafael; Miramón, David; Martínez, Begoña
  • Loading...
    Thumbnail Image
    Publication
    Open Access
    Las construcciones expresivas desde una perspectiva cognitiva, multimodal e interlingüística: la emoción de alivio
    (Universidad de Murcia, 2023-10-27) Casanova Martínez, Fernando; Mompeán González, José Antonio; Ramos Caro, Marina; Escuela Internacional de Doctorado
    Esta tesis doctoral investiga el papel fundamental de las interjecciones y elementos afines en la comunicación humana, cuestionando su anterior consideración como fenómenos no lingüísticos en las gramáticas tradicionales. Los enfoques contemporáneos, como la Lingüística Cognitiva y la Gramática de Construcciones, ofrecen un marco integrador que vincula diversas disciplinas lingüísticas y la multimodalidad. Este marco conduce a introducir en esta tesis el término construcciones expresivas para englobar estos elementos y explorar su conexión con las emociones. Se subraya la necesidad de seguir investigando en este campo para mejorar la codificación de las expresiones verbales y no verbales, en particular en lo relativo a la emoción de alivio, contribuyendo a una comprensión más profunda de este complejo aspecto de la comunicación humana. Los objetivos de la tesis consisten en corroborar el papel de las construcciones expresivas en el lenguaje y ampliar la investigación sobre la expresión multimodal de la emoción de alivio, abarcando tanto las modalidades verbales como las no verbales. Para lograrlo, se desarrolla una metodología basada en corpus multimodales. Se establecen dos corpus multimodales ad hoc que comprenden cómics y vídeos, lo que permite explorar la naturaleza multimodal de las construcciones expresivas de alivio. Los estudios empíricos iniciales utilizan los cómics como recurso para investigar la representación visual y oral de las construcciones expresivas del alivio en varias lenguas, como el español, el francés, el inglés y el japonés. Además, se examina la traducción multimodal de estas construcciones del inglés y el francés al español y se explora su relevancia específica en la comunicación de los personajes con afasia. Además, en los estudios empíricos se utiliza el corpus multimodal NewsScape para extraer los vídeos con los que analizar las características multimodales de la expresión inglesa thank God (‘gracias a Dios’), asociada a la emoción de alivio. Se emplean herramientas de análisis como Praat para el estudio fonético-fonológico, Rapid Annotator para la anotación sistemática y manual de expresiones faciales y corporales y OpenPose para la detección automática de los gestos relacionados con la construcción thank God. A partir de estas innovadoras herramientas de lingüística computacional, se propone una metodología para el estudio multimodal de las construcciones que tiene en cuenta tanto sus propiedades lingüísticas como su producción gestual. Los resultados de la investigación demuestran que las construcciones expresivas son fundamentales para la comunicación humana. A partir del análisis de los corpus multimodales, se muestran varias construcciones expresivas prototípicas para transmitir la emoción del alivio. La comunicación verbal exhibe rasgos fonético-fonológicos e icónicos distintivos tanto a nivel vocálico como consonántico. Igualmente, la comunicación no verbal presenta gestos corporales específicos, como colocar una mano en el pecho o la frente, que tienen un origen metafórico. Además, cabe destacar el uso de morfemas o pictogramas que simbolizan la exhalación de aire por la boca. Las expresiones faciales se caracterizan por tener los ojos abiertos mirando al interlocutor o a un objeto, las cejas levantadas y los labios separados. Aunque existen variaciones entre los idiomas, la representación de estas expresiones muestra un alto grado de similitud. Las construcciones expresivas son esenciales para la expresión y comunicación humanas, permitiendo manifestar emociones o actitudes. Este estudio evidencia que la emoción de alivio presenta características específicas compartidas en los idiomas investigados, señalando aspectos multimodales y cognitivos comunes que trascienden las fronteras culturales. Los avances en el machine learning ofrecen oportunidades prometedoras para el análisis exhaustivo de datos y metodologías que superan los modelos estadísticos lineales, ya que la relación entre los componentes verbales y gestuales no parece ser lineal. En conclusión, esta investigación muestra el papel crucial de las construcciones expresivas en la comunicación humana y revela la naturaleza intercultural y multimodal de la emoción de alivio.
  • Loading...
    Thumbnail Image
    Publication
    Open Access
    Corpus Applications in Forensic Computational Linguistics - LAEL Webinar
    (2020-09-22) Almela, Angela; Filología Inglesa
  • Loading...
    Thumbnail Image
    Publication
    Open Access
    El español como lengua extranjera en aplicaciones adaptativas y multimedia: el caso de Duolingo
    (Universidad de Murcia, 2022-01-12) Palomares Marín, María del Mar; Sánchez Martín, Francisco Javier; Sánchez Orense, Marta; Escuela Internacional de Doctorado
    Esta tesis doctoral explora el campo de las aplicaciones de aprendizaje de lenguas, y, especialmente la aplicación Duolingo, desde la perspectiva tecnológica y la lingüística con dos objetivos principales. Por un lado, estudiamos el funcionamiento en estas aplicaciones y cómo se facilita el aprendizaje y la adaptación desde su propia arquitectura y diseño. Por otro lado, nos centramos en el análisis de la competencia gramatical en el curso de español de Duolingo donde intentamos verificar la alineación al MCER de sus contenidos. Esta doble perspectiva engloba una multitud de campos científicos que se refleja en los marcos teóricos donde encontramos una base multidisciplinar que va a permitir un adecuado análisis y valoración de los resultados. Desde el enfoque tecnológico, se estudian los mecanismos de adaptación y personalización del aprendizaje, lo que lleva a revisar la construcción de los modelos de estudiante y el papel de la inteligencia artificial en las aplicaciones. La aplicación de la IA al aprendizaje de lenguas está centrada en la construcción de modelos de estudiante que posibilitan la personalización y adaptación en tiempo real al usuario, así como ofrecer un feedback riguroso del proceso de aprendizaje. Todo ello con un propósito bien definido: construir aplicaciones que pueden simular a un tutor humano. Destacamos, además, la implementación de algoritmos de repetición espaciada para influir en nuestra memoria. Otro aspecto de la investigación se centra también en el diseño y los elementos de la interfaz que reducen la carga cognitiva, facilitan el uso, motivan e inciden en el aprendizaje y la memoria. Son referentes teóricos para el análisis los principios multimedia de Mayer (2005) y Plass y Jones (2005), los principios de usabilidad de Nielsen (1994) y consideraciones sobre diseño como los principios visuales de la Gestalt, el diseño adaptativo, las directrices del aprendizaje móvil para el diseño, la experiencia de usuario (Kolenda, 2021) o la teoría de la auto-determinación para estudiar los elementos gamificados. De forma breve se concluye que los elementos de la interfaz de usuario en Duolingo favorecen el aprendizaje de la lengua, ya que reducen la carga cognitiva, estimulan las necesidades psicológicas de la autonomía y la competencia, al tiempo que cumplen de forma mayoritaria los principios multimedia y de usabilidad. Se deriva del análisis de los usos de técnicas de IA que Duolingo construye su modelo de estudiante gracias a algoritmos de ML y utiliza la repetición espaciada para facilitar la adquisición de la lengua. Además, el PLN se utiliza, entre otras, para procesar el input oral del usuario y para generar las voces de los cursos. Desde el enfoque lingüístico, partimos de las consideraciones sobre la validez de los marcos de referencia. El MCER se convierte, así, en elemento central que guía el estudio de la competencia lingüística en su aspecto gramatical. El inventario gramatical del Plan Curricular del Instituto Cervantes es el instrumento de análisis para cumplir el segundo objetivo. En definitiva, se analizan dos cursos de español de diferentes años y se realiza una comparativa. Los resultados permiten concluir que la alineación del componente gramatical al MCER es satisfactoria en los niveles A1, A2 y B1. La contribución de esta segunda investigación contribuye a desarrollar la competencia de autonomía en el aprendizaje informal y se aporta claridad sobre qué se aprende en cursos no mediados por un tutor humano. Para concluir, esperamos contribuir a una mejor comprensión de las aplicaciones de enseñanza de lenguas para permitir sus usuarios juzgar las aplicaciones en función de su potencial, avances y limitaciones, así como hacer un uso consciente de la aplicación como herramienta de aprendizaje autónomo.
  • Loading...
    Thumbnail Image
    Publication
    Open Access
    New approaches, methods, and tools for the quantitative study of Legal English
    (Universidad de Murcia, 2025-06-10) Granados Meroño, Daniel; Cantos Gómez, Pascual; Almela Sánchez-Lafuente, Ángela; Escuela Internacional de Doctorado; Escuela Internacional de Doctorado
    Esta tesis doctoral presenta una propuesta innovadora para el estudio del inglés jurídico, integrando enfoques interdisciplinares desde la lingüística de corpus, los estudios del discurso, la traducción jurídica y la tecnología de la argumentación. Partiendo de una revisión crítica de la literatura especializada, el trabajo identifica una falta de convergencia entre los estudios cualitativos tradicionales —centrados en el análisis de géneros y traducción— y las metodologías cuantitativas más recientes —como el análisis multidimensional (MDA) y la minería de argumentos—. En este contexto, se plantea como objetivo general el desarrollo de nuevas aproximaciones, métodos y herramientas para el estudio del inglés jurídico que favorezcan una comprensión más profunda, sistemática y empíricamente contrastada de sus géneros, estructuras y estrategias argumentativas. La metodología seguida combina el diseño y análisis de corpus con técnicas estadísticas avanzadas y procedimientos de anotación manual y automática de esquemas argumentativos. Como parte fundamental de este enfoque empírico, se ha compilado un nuevo corpus, el British Statute Law Corpus (BSLC), compuesto por más de 10 millones de palabras procedentes de leyes promulgadas por los distintos parlamentos británicos. Esta compilación responde a la necesidad de contar con un corpus representativo del lenguaje legislativo británico contemporáneo, que complemente al ya existente British Law Report Corpus (BLRC), centrado en la jurisprudencia de los años 2000-2010. Una vez obtenidos los datos, se aplicó el análisis multidimensional (MDA) según el marco teórico y metodológico de Biber (1988), con el fin de identificar las dimensiones subyacentes del discurso jurídico británico. La comparación entre legislación (BSLC) y jurisprudencia (BLRC) permitió observar diferencias significativas en seis dimensiones textuales, entre las que destacan la orientación hacia el receptor (guiado frente a no guiado), el grado de implicación subjetiva, la orientación persuasiva del texto y el grado de abstracción de la información. Estos resultados confirman en parte los hallazgos previos de estudios cualitativos sobre los géneros jurídicos, pero también revelan nuevas perspectivas que solo pueden obtenerse mediante enfoques cuantitativos. En una segunda fase del estudio, se utilizaron las dimensiones originales de Biber para situar los géneros jurídicos británicos en un espacio textual común junto a otros géneros especializados y generales, mediante la herramienta Multidimensional Analysis Tagger (MAT). Esto permitió identificar el lugar que ocupa el inglés jurídico dentro del continuo de registros del inglés contemporáneo, evidenciando su carácter altamente informativo, no narrativo y dependiente del contexto institucional. Finalmente, en colaboración con el Centre for Argumentation Technology de la Universidad de Dundee, se diseñó y aplicó una guía de anotación manual para esquemas de argumentación jurídica basada en el modelo de Walton. Un corpus reducido de sentencias fue anotado manualmente, y sus características lingüísticas fueron analizadas mediante la biblioteca NLTK. Posteriormente, se realizaron correlaciones de Pearson entre los esquemas argumentativos identificados y las variables lingüísticas, obteniendo resultados preliminares que sugieren patrones recurrentes entre ciertos recursos lingüísticos (como los marcadores discursivos y los verbos modales) y tipos específicos de esquemas argumentativos. En conjunto, esta tesis contribuye significativamente al estudio del inglés jurídico al ofrecer una visión empírica, cuantitativa y multimétodo que permite contrastar, refinar y ampliar los conocimientos previos. Además, proporciona recursos metodológicos (corpus, guías de anotación, herramientas estadísticas) de gran utilidad para futuras investigaciones en lingüística aplicada, traducción jurídica y tecnologías del lenguaje. La combinación de corpus lingüístico, análisis estadístico y anotación argumentativa demuestra ser una vía prometedora para entender mejor los mecanismos retóricos y estructurales del discurso jurídico en inglés.
  • Loading...
    Thumbnail Image
    Publication
    Metadata only
    ¿Qué es la lingüística computacional? : (teoría y práctica) /Ramón Almela Pérez.
    (Murcia : Universidad,, 1979) Almela Pérez, Ramón
  • Loading...
    Thumbnail Image
    Publication
    Open Access
    The Meaning of Genetics
    (Murcia : Universidad de Murcia, Servicio de Publicaciones, 2003) Hamilton, Craig; Nerlich, Brigitte; Adolphs, Svenja

DSpace software copyright © 2002-2025 LYRASIS

  • Cookie settings
  • Accessibility
  • Send Feedback