Desarrollo de un modelo para encontrar la similitud semántica multilingüe

Aguilar Benítez, Emanuel

Desarrollo de un modelo para encontrar la similitud semántica multilingüe

dc.audience	generalPublic	es_MX
dc.contributor	Vilariño Ayala, Darnes
dc.contributor	Tovar Vidal, Mireya
dc.contributor.advisor	VILARIÑO AYALA, DARNES; 216751
dc.contributor.author	Aguilar Benítez, Emanuel
dc.date.accessioned	2020-05-14T18:07:14Z
dc.date.available	2020-05-14T18:07:14Z
dc.date.issued	2015
dc.description.abstract	"La similitud ha sido objeto de estudio durante muchos años dentro del área del Procesamiento del Lenguaje Natural, esto debido a su amplio rango de aplicaciones, por ejemplo: máquinas de traducción, construcción automática de resúmenes, atribución de autoría, pruebas de lectura comprensivas, recuperación de información y muchas otras que necesitan medir el grado de similitud entre dos textos dados. El objetivo principal de este trabajo de tesis consiste en desarrollar un modelo capaz de detectar el grado de similitud semántica entre un par de sentencias. Para dar solución a este problema se proponen dos modelos, el primero basado en aprendizaje supervisado y un segundo modelo basado en el aprendizaje no supervisado. Estos modelos se implementaron mediante el lenguaje Python, además se utilizaron las herramientas Clips Pattern, NetworkX, WordNet y OpenThesaurus-es. El primer modelo utiliza 16 características para entrenar un clasificador, ya sea máquina de soporte vectorial, Naive Bayes, este modelo obtuvo como mejores resultados un 35.16% de precisión para el idioma ingles y un 64.61% para el idioma español. El segundo modelo se basa en la reconstrucción de una de las sentencias por medio de la otra precisión del 37.86% para el idioma inglés y 70.76% para el idioma español".	es_MX
dc.folio	338315TL	es_MX
dc.format	pdf	es_MX
dc.identificator	7	es_MX
dc.identifier.uri	https://hdl.handle.net/20.500.12371/6129
dc.language.iso	spa	es_MX
dc.matricula.creator	200916593	es_MX
dc.publisher	Benemérita Universidad Autónoma de Puebla	es_MX
dc.rights.acces	openAccess	es_MX
dc.rights.uri	http://creativecommons.org/licenses/by-nc-nd/4.0	es_MX
dc.subject.classification	INGENIERÍA Y TECNOLOGÍA	es_MX
dc.subject.dbgunam	Python (Lenguaje de programación para computadora)	es_MX
dc.subject.lcc	Lingüística computacional	es_MX
dc.subject.lcc	Máquinas de soporte vectorial	es_MX
dc.subject.lcc	Semántica--Procesamiento de datos	es_MX
dc.subject.lcc	Procesamiento de lenguaje natural (Computación)	es_MX
dc.subject.lcc	Web semántica	es_MX
dc.thesis.career	Licenciatura en Ingeniería en Ciencias de la Computación	es_MX
dc.thesis.degreediscipline	Área de Ingeniería y Ciencias Exactas	es_MX
dc.thesis.degreegrantor	Facultad de Ciencias de la Computación	es_MX
dc.thesis.degreetoobtain	Ingeniero (a) en Ciencias de la Computación	es_MX
dc.title	Desarrollo de un modelo para encontrar la similitud semántica multilingüe	es_MX
dc.type	Tesis de licenciatura	es_MX
dc.type.conacyt	bachelorThesis	es_MX
dc.type.degree	Licenciatura	es_MX