Please use this identifier to cite or link to this item: http://hdl.handle.net/10201/29889

Title: Estudio de los rasgos lingüísticos de la mentira en el medio escrito: un análisis contrastivo inglés-español = Featuring deception in written language : a contrastive study of english and spanish
Issue Date: 23-Jan-2013
Date of creation: 21-Dec-2012
Related subjects: 17 - Ética. Filosofía práctica
81 - Lingüística y lenguas
Keywords: Mentira
Lingüística
Abstract: El objetivo principal de esta tesis doctoral es el análisis de las características lingüísticas de la mentira en el lenguaje escrito en inglés y en español, para lo cual se ha llevado a cabo un análisis contrastivo entre ambas lenguas. Se han realizado diversos experimentos de clasificación automática sobre dos corpora ad-hoc para testar la clasificación de los textos según su valor de verdad. En el primer experimento se han aplicado técnicas de aprendizaje automático y se han comparado los resultados con un modelo Bag-of-Words, obteniendo una tasa de éxito máxima de 78,5% para inglés y de 84,5% para español. El segundo experimento ha incluido dos técnicas estadísticas: análisis discriminante y regresión logística binaria, siendo los resultados de clasificación igualmente satisfactorios. Además de ello, se ha confirmado el papel fundamental en la configuración de la mentira escrita de parámetros tales como la longitud del texto, referencias propias, entendimiento y exclusiones. Palabras clave: lingüística computacional, detección de la mentira, análisis contrastivo, clasificación automática. The main aim of this PhD thesis is to analyse the linguistic cues to deception in written language both in English and Spanish, performing a contrastive analysis between both languages. For this purpose, several automatic classification experiments have been performed on two ad-hoc corpora in both languages, in order to check whether the texts could be successfully classified on the basis of their truth value. In the first set of experiments, a machine learning technique has been applied on the data and compared to a Bag-of-Words model, obtaining a maximum rate of 78.5% for English and 84.5% for Spanish. The second experiment involved statistical techniques, namely discriminant function analysis and binary logistic regression, and the results obtained proved remarkably successful too. In addition, they confirm the leading role in deception detection of parameters such as text length, self-references, insight and exclusive words. Keywords: computational linguistics, deception detection, contrastive analysis, automatic classification.
Primary author: Almela Sánchez-Lafuente, Ángela
Director: Valencia García, Rafael
Cantos Gómez, Pascual
Faculty / Departments / Services: Departamentos y Servicios::Departamentos de la UMU::Traducción e Interpretación
Published in: Proyecto de investigación:
URI: http://hdl.handle.net/10201/29889
Document type: info:eu-repo/semantics/doctoralThesis
Number of pages / Extensions: 254
Rights: info:eu-repo/semantics/embargoedAccess
Appears in Collections:Artes y Humanidades

Files in This Item:
File Description SizeFormat 
TESIS_def.pdf2,61 MBAdobe PDFThumbnail
View/Open


This item is licensed under a Creative Commons License Creative Commons