Técnicas para la normalización de vocabularios en textos cortos
Files
Date
2015-02
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Benemérita Universidad Autónoma de Puebla
Abstract
“Esta tesis comprende el estudio desarrollo de un modelo para la normalización de vocabularios en textos cortos. Se refiere a tomar un mensaje mal escrito, o que contenga palabras fuera de nuestro idioma, en este caso el español, y poder transcribirlo a un mensaje lo más correctamente escrito. Este trabajo comprende de cuatro etapas básicas. En la primera es hacer un estudio exhaustivo de las principales técnicas empleadas para normalizar textos. En la segunda se muestra la creación de un sistema el cual permitió la creación de un corpus de mensajes SMS, el cual sirvió como corpus de pruebas. La tercera, se hace un análisis de los mensajes cortos, los diferentes aspectos lingüísticos que engloban a dicho mensaje y por ende los caracterizan. Por último se hace una serie de propuestas de resolver el problema de normalizado, para esto se va explicando en forma de cascada, hasta llegar a la propuesta final. Donde se contempla desde la elección del conjunto candidato, filtros para reducirlo o considerar más que coincidan con dicha palabra, posteriormente a la elección de la candidata ideal, donde se observa que hay ambigüedad y se procede a la aplicación de una técnica sintáctica”.
Description
Keywords
Citation
Collections
Document Viewer
Select a file to preview:
Can't see the file? Try reloading