PyText: una librería para la minería de textos basada en Python

Date
2016-11
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
“Hoy día nuestra sociedad genera grandes cantidades de información que unido al aumento de las capacidades de almacenamiento, han hecho que todo tipo de organizaciones puedan disponer de una gran cantidad y variedad de datos relativos a su actividad diaria. Esta información ofrece a la empresa una visión perspectiva (qué se está haciendo y cómo se está haciendo) y prospectiva (cómo puede evolucionar la organización en un futuro a corto‐medio plazo) y es por ello por lo que tiene una función vital en el proceso de toma de decisiones. Sin embargo gran cantidad de información obtenida en las bases de datos no se encuentra bien estructurada resultando difícil de explotar desde el punto de vista estadístico por lo que para su utilización es necesario un proceso de tratamiento y análisis exhaustivo de los datos allí recogidos que llamamos a menudo minería de datos. La minería de textos o text mining puede ser definido [1] como “la aplicación de algoritmos y métodos de los campos del aprendizaje automático y la estadística sobre los textos con el objetivo de encontrar patrones útiles”. Text mining es una herramienta empírica que tiene la capacidad de identificar nueva información o patrones significativos que no son evidentes a partir de una colección de documentos”.
Description
Keywords
Citation
Document Viewer
Select a file to preview:
Can't see the file? Try reloading