Determinación del número de centroides en el algoritmo Improved-FPAC para el agrupamiento de documentos de texto
| dc.audience | generalPublic | |
| dc.contributor | Vilariño Ayala, Darnes | |
| dc.contributor | Martínez Trinidad, José Francisco | |
| dc.contributor.advisor | Vilariño Ayala, Darnes; 0000-0002-3539-2783 | |
| dc.contributor.advisor | Martínez Trinidad, José Francisco; 0000-0001-7973-9075 | |
| dc.contributor.author | Magallón Juan-Qui, Inti Sandino | |
| dc.creator | Magallón Juan-Qui, Inti Sandino; 0000-0002-6799-1086 | |
| dc.date.accessioned | 2026-06-08T18:54:10Z | |
| dc.date.available | 2026-06-08T18:54:10Z | |
| dc.date.issued | 2025-12 | |
| dc.description.abstract | “En esta tesis abordamos el problema de cómo mejorar la calidad del agrupamiento de documentos de texto usando el algoritmo Improved-FPAC. Es importante des tacar la necesidad de categorizar documentos de texto de manera eficiente para facilitar la toma de decisiones y la búsqueda de información en grandes volúmenes de datos. Los algoritmos tradicionales, como K-Means, a menudo no representan adecuadamente la estructura de los datos, ya que utilizan un solo centroide por gru po, lo que puede ser insuficiente en situaciones reales. Para solucionar esto, nuestro trabajo propone un método para determinar el número de centroides por cluster con siderando las características específicas del corpus, el número de documentos y el vocabulario, previo a realizar el agrupamiento de documentos y un algoritmo que evalúa en cada iteración el número de centroides para cada grupo para Improved FPAC. Tanto el método como el algoritmo propuesto se validan experimentalmente y muestran mejoras significativas en la calidad de los agrupamientos sin aumentar demasiado el tiempo de ejecución. Estas alternativas se adaptan mejor a las particularidades de cada conjunto de datos, superando las limitaciones de los valores fijos de centroides utilizados en estudios previos. La investigación presenta una me jora importante al algoritmo Improved-FPAC, ofreciendo una forma más adaptativa y eficiente de determinar el número de centroides, lo que resulta en una mejor calidad en el agrupamiento de documentos de texto”. | |
| dc.folio | 20251128132252-9896-T | |
| dc.format | ||
| dc.identificator | 7 | |
| dc.identifier.uri | https://hdl.handle.net/20.500.12371/32832 | |
| dc.language.iso | spa | |
| dc.matricula.creator | 221570141 | |
| dc.publisher | Benemérita Universidad Autónoma de Puebla | |
| dc.rights.acces | openAccess | |
| dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/4.0 | |
| dc.subject.classification | INGENIERÍA Y TECNOLOGÍA | |
| dc.subject.lcc | Recursos de información (general)--Búsqueda y hallazgo de información--Sistemas de filtrado de información--Obras generales | |
| dc.subject.lcc | Agrupación de documentos--Investigación | |
| dc.subject.lcc | Recuperación de información--Procesamiento de datos | |
| dc.subject.lcc | Algoritmos | |
| dc.thesis.career | Doctorado en Ingeniería del Lenguaje y del Conocimiento | |
| dc.thesis.degreediscipline | Área de Ingeniería y Ciencias Exactas | |
| dc.thesis.degreegrantor | Facultad de Ciencias de la Computación | |
| dc.thesis.degreetoobtain | Doctor en Ingeniería del Lenguaje y del Conocimiento | |
| dc.title | Determinación del número de centroides en el algoritmo Improved-FPAC para el agrupamiento de documentos de texto | |
| dc.type | Tesis de doctorado | |
| dc.type.conacyt | doctoralThesis | |
| dc.type.degree | Doctorado |
Files
Original bundle
1 - 2 of 2
Loading...
- Name:
- 20251128132252-9896-T.pdf
- Size:
- 615.08 KB
- Format:
- Adobe Portable Document Format
- Name:
- 20251128132252-9896-CARTA.pdf
- Size:
- 524.37 KB
- Format:
- Adobe Portable Document Format