Desarrollo de un modelo para encontrar la similitud semántica multilingüe

dc.audiencegeneralPublices_MX
dc.contributorVilariño Ayala, Darnes
dc.contributorTovar Vidal, Mireya
dc.contributor.advisorVILARIÑO AYALA, DARNES; 216751
dc.contributor.authorAguilar Benítez, Emanuel
dc.date.accessioned2020-05-14T18:07:14Z
dc.date.available2020-05-14T18:07:14Z
dc.date.issued2015
dc.description.abstract"La similitud ha sido objeto de estudio durante muchos años dentro del área del Procesamiento del Lenguaje Natural, esto debido a su amplio rango de aplicaciones, por ejemplo: máquinas de traducción, construcción automática de resúmenes, atribución de autoría, pruebas de lectura comprensivas, recuperación de información y muchas otras que necesitan medir el grado de similitud entre dos textos dados. El objetivo principal de este trabajo de tesis consiste en desarrollar un modelo capaz de detectar el grado de similitud semántica entre un par de sentencias. Para dar solución a este problema se proponen dos modelos, el primero basado en aprendizaje supervisado y un segundo modelo basado en el aprendizaje no supervisado. Estos modelos se implementaron mediante el lenguaje Python, además se utilizaron las herramientas Clips Pattern, NetworkX, WordNet y OpenThesaurus-es. El primer modelo utiliza 16 características para entrenar un clasificador, ya sea máquina de soporte vectorial, Naive Bayes, este modelo obtuvo como mejores resultados un 35.16% de precisión para el idioma ingles y un 64.61% para el idioma español. El segundo modelo se basa en la reconstrucción de una de las sentencias por medio de la otra precisión del 37.86% para el idioma inglés y 70.76% para el idioma español".es_MX
dc.folio338315TLes_MX
dc.formatpdfes_MX
dc.identificator7es_MX
dc.identifier.urihttps://hdl.handle.net/20.500.12371/6129
dc.language.isospaes_MX
dc.matricula.creator200916593es_MX
dc.publisherBenemérita Universidad Autónoma de Pueblaes_MX
dc.rights.accesopenAccesses_MX
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0es_MX
dc.subject.classificationINGENIERÍA Y TECNOLOGÍAes_MX
dc.subject.dbgunamPython (Lenguaje de programación para computadora)es_MX
dc.subject.lccLingüística computacionales_MX
dc.subject.lccMáquinas de soporte vectoriales_MX
dc.subject.lccSemántica--Procesamiento de datoses_MX
dc.subject.lccProcesamiento de lenguaje natural (Computación)es_MX
dc.subject.lccWeb semánticaes_MX
dc.thesis.careerLicenciatura en Ingeniería en Ciencias de la Computaciónes_MX
dc.thesis.degreedisciplineÁrea de Ingeniería y Ciencias Exactases_MX
dc.thesis.degreegrantorFacultad de Ciencias de la Computaciónes_MX
dc.thesis.degreetoobtainIngeniero (a) en Ciencias de la Computaciónes_MX
dc.titleDesarrollo de un modelo para encontrar la similitud semántica multilingüees_MX
dc.typeTesis de licenciaturaes_MX
dc.type.conacytbachelorThesises_MX
dc.type.degreeLicenciaturaes_MX
Files
Original bundle
Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
338315TL.pdf
Size:
1.65 MB
Format:
Adobe Portable Document Format
Description:
License bundle
Now showing 1 - 1 of 1
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed upon to submission
Description: