Extracción y manejo de terminología a partir de un corpus lingüístico de textos especializados
Date
2023-01
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Benemérita Universidad Autónoma de Puebla
Abstract
"El desarrollo de sistemas de recuperación de la información refleja una rápida progresión que se aleja de los enfoques manuales de adquisición, indexación y búsqueda basados en bibliotecas información a métodos cada vez más automatizados. Para este proyecto se cuenta con un corpus de obras literarias, otro de leyes universitarias y uno más pequeño de chistes. Por lo que era necesario el desarrollo de herramientas computacionales que permitan extraer y manejar terminología a partir de estos corpus lingüísticos; Por ello se desarrollaron dos herramientas. La primera es un buscador que permite realizar consultas sobre un ´índice que contiene todos los documentos, para llevar a cabo el objetivo primero se aplicó un pre procesamiento sobre todos los documentos; posteriormente, fueron indexados. Las consultas se llevan a cabo a través del índice por medio de un buscador en formato web con un modelo cliente-servidor: en el lado del cliente el usuario puede ejecutar una consulta que será enviada al servidor, este ejecutará las operaciones correspondientes para poder retornar los resultados obtenidos al cliente".
Description
Keywords
Citation
Collections
Document Viewer
Select a file to preview:
Can't see the file? Try reloading