Desarrollo de un modelo para encontrar la similitud semántica multilingüe

Date
2015
Journal Title
Journal ISSN
Volume Title
Publisher
Benemérita Universidad Autónoma de Puebla
Abstract
"La similitud ha sido objeto de estudio durante muchos años dentro del área del Procesamiento del Lenguaje Natural, esto debido a su amplio rango de aplicaciones, por ejemplo: máquinas de traducción, construcción automática de resúmenes, atribución de autoría, pruebas de lectura comprensivas, recuperación de información y muchas otras que necesitan medir el grado de similitud entre dos textos dados. El objetivo principal de este trabajo de tesis consiste en desarrollar un modelo capaz de detectar el grado de similitud semántica entre un par de sentencias. Para dar solución a este problema se proponen dos modelos, el primero basado en aprendizaje supervisado y un segundo modelo basado en el aprendizaje no supervisado. Estos modelos se implementaron mediante el lenguaje Python, además se utilizaron las herramientas Clips Pattern, NetworkX, WordNet y OpenThesaurus-es. El primer modelo utiliza 16 características para entrenar un clasificador, ya sea máquina de soporte vectorial, Naive Bayes, este modelo obtuvo como mejores resultados un 35.16% de precisión para el idioma ingles y un 64.61% para el idioma español. El segundo modelo se basa en la reconstrucción de una de las sentencias por medio de la otra precisión del 37.86% para el idioma inglés y 70.76% para el idioma español".
Description
Keywords
Citation
Document Viewer
Select a file to preview:
Can't see the file? Try reloading