Descripción automática de imágenes con comprensión lectora: hacia máquinas con percepción visual mejorada e interpretación de imágenes con texto

dc.audiencegeneralPublices_MX
dc.contributorBeltrán Martínez, Beatriz
dc.contributorMartínez Torres, Rodolfo
dc.contributor.advisorBELTRAN MARTINEZ, BEATRIZ; 80293
dc.contributor.authorGallardo García, Rafael
dc.date.accessioned2022-08-26T19:26:07Z
dc.date.available2022-08-26T19:26:07Z
dc.date.issued2022-01
dc.description.abstract"El problema de la descripción automática de imágenes con comprensión lectora consiste en obtener descripciones textuales dada una imagen de entrada, con la condición de que dichas descripciones deben tomar en cuenta el texto presente en la escena visual. Para resolver este problema, es necesario que los sistemas sean capaces de leer, comprender y utilizar el texto leído, además de comprender la escena, los actores y los objetos involucrados en la misma, por último, el sistema debe ser capaz de integrar todo y describirlo en lenguaje natural. Dada la complejidad del problema, los sistemas y propuestas disponibles en la literatura hacen uso de técnicas y modelos que resultan sumamente costosos, tanto en términos de memoria como de procesamiento. En este trabajo se proponen dos arquitecturas de aprendizaje profundo (L-M4C y L-CNMT) que son capaces de resolver el problema, obteniendo puntajes cercanos al estado-del-arte y superando a los diversos métodos disponibles en la literatura, todo esto mientras se reduce el uso de memoria (del módulo de lectura) hasta en un 94 %. La segunda aportación de este trabajo consiste en presentar la primera arquitectura bilingüe (ML M4C) para el problema de la descripción automática de imágenes con comprensión lectora".es_MX
dc.folio20220128151244-0408-TLes_MX
dc.formatpdfes_MX
dc.identificator7es_MX
dc.identifier.urihttps://hdl.handle.net/20.500.12371/16235
dc.language.isospaes_MX
dc.matricula.creator201656917es_MX
dc.publisherBenemérita Universidad Autónoma de Pueblaes_MX
dc.rights.accesopenAccesses_MX
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0es_MX
dc.subject.classificationINGENIERÍA Y TECNOLOGÍAes_MX
dc.subject.dbgunamProcesamiento de textos (Computación)es_MX
dc.subject.lccInteligencia computacionales_MX
dc.subject.lccVisión por computadora--Métodos gráficoses_MX
dc.subject.lccProcesamiento de imágenes--Técnicas digitaleses_MX
dc.subject.lccProcesamiento de lenguaje natural (Computación)es_MX
dc.subject.lccAprendizaje automático (Inteligencia artificial)es_MX
dc.thesis.careerLicenciatura en Ingeniería en Ciencias de la Computaciónes_MX
dc.thesis.degreedisciplineÁrea de Ingeniería y Ciencias Exactases_MX
dc.thesis.degreegrantorFacultad de Ciencias de la Computaciónes_MX
dc.thesis.degreetoobtainIngeniero (a) en Ciencias de la Computaciónes_MX
dc.titleDescripción automática de imágenes con comprensión lectora: hacia máquinas con percepción visual mejorada e interpretación de imágenes con textoes_MX
dc.typeAnotaciónes_MX
dc.type.degreeLicenciaturaes_MX
Files
Original bundle
Now showing 1 - 2 of 2
Name:
20220128151244-0408-TL.pdf
Size:
35.1 MB
Format:
Adobe Portable Document Format
Description:
Name:
20220128151244-0408-CARTA.pdf
Size:
1008.6 KB
Format:
Adobe Portable Document Format
Description:
License bundle
Now showing 1 - 1 of 1
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed upon to submission
Description: