Desarrollo de un modelo para detectar la similitud semántica entre textos de diferente tamaño para el idioma inglés

López Rosas, Dante; LOPEZ ROSAS, DANTE; 853173

Desarrollo de un modelo para detectar la similitud semántica entre textos de diferente tamaño para el idioma inglés

Files

701415TL.pdf (1.4 MB)

Date

2015-11

Authors

López Rosas, Dante

Abstract

“Una de las tareas en el procesamiento de lenguaje natural es encontrar la similitud semántica que existe entre diferentes textos, siendo que para ello se aplican modelos de similitud usando características que comparten ambos textos; sin embargo esta tarea se complica cuando estos presentan diferentes longitudes haciendo que sea necesario aplicar formas o métodos con los que sea posible evaluarlos aún con diferente tamaño. En este trabajo se presenta el desarrollo de un modelo de expansión de palabras usando contenido extraído de la web para posteriormente aplicar un modelo de similitud semántica basado en características. Para ello se hace uso de herramientas que facilitan el procesado de información textual como son Python, AWK o Wordnet. Además de hacer uso de software de aprendizaje automático para la clasificación de los datos, siendo en este caso Weka. Los resultados obtenidos en este trabajo muestran una mejora significativa en comparación a los reportados en el Semeval 2014, sin embargo siguen sin ser relevantes debido a que no se alcanza a clasificar correctamente más de la mitad de los datos”.

URI

https://hdl.handle.net/20.500.12371/8903

Collections

Tesis de Licenciatura

Full item page

Document Viewer

Select a file to preview:

Can't see the file? Try reloading