Desarrollo de un modelo para detectar la similitud semántica entre textos de diferente tamaño para el idioma inglés

Date
2015-11
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
“Una de las tareas en el procesamiento de lenguaje natural es encontrar la similitud semántica que existe entre diferentes textos, siendo que para ello se aplican modelos de similitud usando características que comparten ambos textos; sin embargo esta tarea se complica cuando estos presentan diferentes longitudes haciendo que sea necesario aplicar formas o métodos con los que sea posible evaluarlos aún con diferente tamaño. En este trabajo se presenta el desarrollo de un modelo de expansión de palabras usando contenido extraído de la web para posteriormente aplicar un modelo de similitud semántica basado en características. Para ello se hace uso de herramientas que facilitan el procesado de información textual como son Python, AWK o Wordnet. Además de hacer uso de software de aprendizaje automático para la clasificación de los datos, siendo en este caso Weka. Los resultados obtenidos en este trabajo muestran una mejora significativa en comparación a los reportados en el Semeval 2014, sin embargo siguen sin ser relevantes debido a que no se alcanza a clasificar correctamente más de la mitad de los datos”.
Description
Keywords
Citation
Document Viewer
Select a file to preview:
Can't see the file? Try reloading