Sistema para la obtención de tópicos mediante el modelo probabilístico Latent Dirichlet Allocation (LDA)
Date
2017-08
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
"Este trabajo de tesis consiste en la aplicación de un algoritmo propuesto por Blei (Blei & Jordan, 2002) para la obtención de tópicos de un corpus en español llamado Wikicorpus (Reese, Boleda, Cuadros, Padró, & Rigau, 2010) el cual consiste en aproximadamente 250000 documentos de los cuales en total suman aproximadamente 250 millones de palabras. Los tópicos nos darán una idea más o menos clara de los temas que se tratan en los documentos, trabajo realmente difícil de elaborar si no se considera la ayuda de un ordenador".
Description
Keywords
Citation
Collections
Document Viewer
Select a file to preview:
Can't see the file? Try reloading