Desarrollo de un modelo para encontrar la similitud semántica multilingüe
dc.audience | generalPublic | es_MX |
dc.contributor | Vilariño Ayala, Darnes | |
dc.contributor | Tovar Vidal, Mireya | |
dc.contributor.advisor | VILARIÑO AYALA, DARNES; 216751 | |
dc.contributor.author | Aguilar Benítez, Emanuel | |
dc.date.accessioned | 2020-05-14T18:07:14Z | |
dc.date.available | 2020-05-14T18:07:14Z | |
dc.date.issued | 2015 | |
dc.description.abstract | "La similitud ha sido objeto de estudio durante muchos años dentro del área del Procesamiento del Lenguaje Natural, esto debido a su amplio rango de aplicaciones, por ejemplo: máquinas de traducción, construcción automática de resúmenes, atribución de autoría, pruebas de lectura comprensivas, recuperación de información y muchas otras que necesitan medir el grado de similitud entre dos textos dados. El objetivo principal de este trabajo de tesis consiste en desarrollar un modelo capaz de detectar el grado de similitud semántica entre un par de sentencias. Para dar solución a este problema se proponen dos modelos, el primero basado en aprendizaje supervisado y un segundo modelo basado en el aprendizaje no supervisado. Estos modelos se implementaron mediante el lenguaje Python, además se utilizaron las herramientas Clips Pattern, NetworkX, WordNet y OpenThesaurus-es. El primer modelo utiliza 16 características para entrenar un clasificador, ya sea máquina de soporte vectorial, Naive Bayes, este modelo obtuvo como mejores resultados un 35.16% de precisión para el idioma ingles y un 64.61% para el idioma español. El segundo modelo se basa en la reconstrucción de una de las sentencias por medio de la otra precisión del 37.86% para el idioma inglés y 70.76% para el idioma español". | es_MX |
dc.folio | 338315TL | es_MX |
dc.format | es_MX | |
dc.identificator | 7 | es_MX |
dc.identifier.uri | https://hdl.handle.net/20.500.12371/6129 | |
dc.language.iso | spa | es_MX |
dc.matricula.creator | 200916593 | es_MX |
dc.publisher | Benemérita Universidad Autónoma de Puebla | es_MX |
dc.rights.acces | openAccess | es_MX |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/4.0 | es_MX |
dc.subject.classification | INGENIERÍA Y TECNOLOGÍA | es_MX |
dc.subject.dbgunam | Python (Lenguaje de programación para computadora) | es_MX |
dc.subject.lcc | Lingüística computacional | es_MX |
dc.subject.lcc | Máquinas de soporte vectorial | es_MX |
dc.subject.lcc | Semántica--Procesamiento de datos | es_MX |
dc.subject.lcc | Procesamiento de lenguaje natural (Computación) | es_MX |
dc.subject.lcc | Web semántica | es_MX |
dc.thesis.career | Licenciatura en Ingeniería en Ciencias de la Computación | es_MX |
dc.thesis.degreediscipline | Área de Ingeniería y Ciencias Exactas | es_MX |
dc.thesis.degreegrantor | Facultad de Ciencias de la Computación | es_MX |
dc.thesis.degreetoobtain | Ingeniero (a) en Ciencias de la Computación | es_MX |
dc.title | Desarrollo de un modelo para encontrar la similitud semántica multilingüe | es_MX |
dc.type | Tesis de licenciatura | es_MX |
dc.type.conacyt | bachelorThesis | es_MX |
dc.type.degree | Licenciatura | es_MX |