Pinto Avendaño, David EduardoVilariño Ayala, DarnesPINTO AVENDAÑO, DAVID EDUARDO; 275110VILARIÑO AYALA, DARNES; 216751Rosales Leyva, Narce Francisco2020-10-192020-10-192015-02https://hdl.handle.net/20.500.12371/8495“Esta tesis comprende el estudio desarrollo de un modelo para la normalización de vocabularios en textos cortos. Se refiere a tomar un mensaje mal escrito, o que contenga palabras fuera de nuestro idioma, en este caso el español, y poder transcribirlo a un mensaje lo más correctamente escrito. Este trabajo comprende de cuatro etapas básicas. En la primera es hacer un estudio exhaustivo de las principales técnicas empleadas para normalizar textos. En la segunda se muestra la creación de un sistema el cual permitió la creación de un corpus de mensajes SMS, el cual sirvió como corpus de pruebas. La tercera, se hace un análisis de los mensajes cortos, los diferentes aspectos lingüísticos que engloban a dicho mensaje y por ende los caracterizan. Por último se hace una serie de propuestas de resolver el problema de normalizado, para esto se va explicando en forma de cascada, hasta llegar a la propuesta final. Donde se contempla desde la elección del conjunto candidato, filtros para reducirlo o considerar más que coincidan con dicha palabra, posteriormente a la elección de la candidata ideal, donde se observa que hay ambigüedad y se procede a la aplicación de una técnica sintáctica”.pdfspaINGENIERÍA Y TECNOLOGÍARedes sociales en líneaMensajes de texto (Sistemas de telefonía celular)Procesamiento electrónico de datos--AbreviacionNormalizacion del lenguajeProcesamiento de textos (Computación)Software para computadora--DesarrolloTécnicas para la normalización de vocabularios en textos cortosTesis de maestríaopenAccess