Determinación del número de centroides en el algoritmo Improved-FPAC para el agrupamiento de documentos de texto

dc.audiencegeneralPublic
dc.contributorVilariño Ayala, Darnes
dc.contributorMartínez Trinidad, José Francisco
dc.contributor.advisorVilariño Ayala, Darnes; 0000-0002-3539-2783
dc.contributor.advisorMartínez Trinidad, José Francisco; 0000-0001-7973-9075
dc.contributor.authorMagallón Juan-Qui, Inti Sandino
dc.creatorMagallón Juan-Qui, Inti Sandino; 0000-0002-6799-1086
dc.date.accessioned2026-06-08T18:54:10Z
dc.date.available2026-06-08T18:54:10Z
dc.date.issued2025-12
dc.description.abstract“En esta tesis abordamos el problema de cómo mejorar la calidad del agrupamiento de documentos de texto usando el algoritmo Improved-FPAC. Es importante des tacar la necesidad de categorizar documentos de texto de manera eficiente para facilitar la toma de decisiones y la búsqueda de información en grandes volúmenes de datos. Los algoritmos tradicionales, como K-Means, a menudo no representan adecuadamente la estructura de los datos, ya que utilizan un solo centroide por gru po, lo que puede ser insuficiente en situaciones reales. Para solucionar esto, nuestro trabajo propone un método para determinar el número de centroides por cluster con siderando las características específicas del corpus, el número de documentos y el vocabulario, previo a realizar el agrupamiento de documentos y un algoritmo que evalúa en cada iteración el número de centroides para cada grupo para Improved FPAC. Tanto el método como el algoritmo propuesto se validan experimentalmente y muestran mejoras significativas en la calidad de los agrupamientos sin aumentar demasiado el tiempo de ejecución. Estas alternativas se adaptan mejor a las particularidades de cada conjunto de datos, superando las limitaciones de los valores fijos de centroides utilizados en estudios previos. La investigación presenta una me jora importante al algoritmo Improved-FPAC, ofreciendo una forma más adaptativa y eficiente de determinar el número de centroides, lo que resulta en una mejor calidad en el agrupamiento de documentos de texto”.
dc.folio20251128132252-9896-T
dc.formatpdf
dc.identificator7
dc.identifier.urihttps://hdl.handle.net/20.500.12371/32832
dc.language.isospa
dc.matricula.creator221570141
dc.publisherBenemérita Universidad Autónoma de Puebla
dc.rights.accesopenAccess
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0
dc.subject.classificationINGENIERÍA Y TECNOLOGÍA
dc.subject.lccRecursos de información (general)--Búsqueda y hallazgo de información--Sistemas de filtrado de información--Obras generales
dc.subject.lccAgrupación de documentos--Investigación
dc.subject.lccRecuperación de información--Procesamiento de datos
dc.subject.lccAlgoritmos
dc.thesis.careerDoctorado en Ingeniería del Lenguaje y del Conocimiento
dc.thesis.degreedisciplineÁrea de Ingeniería y Ciencias Exactas
dc.thesis.degreegrantorFacultad de Ciencias de la Computación
dc.thesis.degreetoobtainDoctor en Ingeniería del Lenguaje y del Conocimiento
dc.titleDeterminación del número de centroides en el algoritmo Improved-FPAC para el agrupamiento de documentos de texto
dc.typeTesis de doctorado
dc.type.conacytdoctoralThesis
dc.type.degreeDoctorado
Files
Original bundle
Now showing 1 - 2 of 2
Loading...
Thumbnail Image
Name:
20251128132252-9896-T.pdf
Size:
615.08 KB
Format:
Adobe Portable Document Format
Name:
20251128132252-9896-CARTA.pdf
Size:
524.37 KB
Format:
Adobe Portable Document Format