Técnicas para la normalización de vocabularios en textos cortos
dc.audience | generalPublic | es_MX |
dc.contributor | Pinto Avendaño, David Eduardo | |
dc.contributor | Vilariño Ayala, Darnes | |
dc.contributor.advisor | PINTO AVENDAÑO, DAVID EDUARDO; 275110 | |
dc.contributor.advisor | VILARIÑO AYALA, DARNES; 216751 | |
dc.contributor.author | Rosales Leyva, Narce Francisco | |
dc.creator | ROSALES LEYVA, NARCE FRANCISCO; 482821 | |
dc.date.accessioned | 2020-10-19T19:05:56Z | |
dc.date.available | 2020-10-19T19:05:56Z | |
dc.date.issued | 2015-02 | |
dc.description.abstract | “Esta tesis comprende el estudio desarrollo de un modelo para la normalización de vocabularios en textos cortos. Se refiere a tomar un mensaje mal escrito, o que contenga palabras fuera de nuestro idioma, en este caso el español, y poder transcribirlo a un mensaje lo más correctamente escrito. Este trabajo comprende de cuatro etapas básicas. En la primera es hacer un estudio exhaustivo de las principales técnicas empleadas para normalizar textos. En la segunda se muestra la creación de un sistema el cual permitió la creación de un corpus de mensajes SMS, el cual sirvió como corpus de pruebas. La tercera, se hace un análisis de los mensajes cortos, los diferentes aspectos lingüísticos que engloban a dicho mensaje y por ende los caracterizan. Por último se hace una serie de propuestas de resolver el problema de normalizado, para esto se va explicando en forma de cascada, hasta llegar a la propuesta final. Donde se contempla desde la elección del conjunto candidato, filtros para reducirlo o considerar más que coincidan con dicha palabra, posteriormente a la elección de la candidata ideal, donde se observa que hay ambigüedad y se procede a la aplicación de una técnica sintáctica”. | es_MX |
dc.folio | 74415T | es_MX |
dc.format | es_MX | |
dc.identificator | 7 | es_MX |
dc.identifier.uri | https://hdl.handle.net/20.500.12371/8495 | |
dc.language.iso | spa | es_MX |
dc.matricula.creator | 212470574 | es_MX |
dc.publisher | Benemérita Universidad Autónoma de Puebla | es_MX |
dc.rights.acces | openAccess | es_MX |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/4.0 | es_MX |
dc.subject.classification | INGENIERÍA Y TECNOLOGÍA | es_MX |
dc.subject.lcc | Redes sociales en línea | es_MX |
dc.subject.lcc | Mensajes de texto (Sistemas de telefonía celular) | es_MX |
dc.subject.lcc | Procesamiento electrónico de datos--Abreviacion | es_MX |
dc.subject.lcc | Normalizacion del lenguaje | es_MX |
dc.subject.lcc | Procesamiento de textos (Computación) | es_MX |
dc.subject.lcc | Software para computadora--Desarrollo | es_MX |
dc.thesis.career | Maestría en Ciencias de la Computación | es_MX |
dc.thesis.degreediscipline | Área de Ingeniería y Ciencias Exactas | es_MX |
dc.thesis.degreegrantor | Facultad de Ciencias de la Computación | es_MX |
dc.thesis.degreetoobtain | Maestro en Ciencias de la Computación | es_MX |
dc.title | Técnicas para la normalización de vocabularios en textos cortos | es_MX |
dc.type | Tesis de maestría | es_MX |
dc.type.conacyt | masterThesis | es_MX |
dc.type.degree | Maestría | es_MX |