Aprendizaje por refuerzo vía Procesos de Decisión de Markov: Caso Descontado

dc.audiencegeneralPublic
dc.contributorCruz Suárez, Hugo Adán
dc.contributor.advisorCRUZ SUAREZ, HUGO ADAN; 202875
dc.contributor.authorJuárez Morales, Josué
dc.date.accessioned2024-10-04T20:39:46Z
dc.date.available2024-10-04T20:39:46Z
dc.date.issued2024-07
dc.description.abstract"El objetivo de este trabajo es dar una descripción matemática del Aprendizaje por Refuerzo; un paradigma inspirado en la interacción con el ambiente como medio de aprendizaje. Se presenta la teoría de Procesos de Decisión de Markov y el problema de control óptimo, la base que transcribe el paradigma de aprendizaje al lenguaje matemático. Las técnicas de Programación Dinámica y la Aproximación Estocástica son representadas mediante los algoritmos de Iteración de Valores y Q-learning respectivamente. Ambos algoritmos son implementados para la solución en distintos sistemas tomados como ejemplos".
dc.folio20240712132631-8344-T
dc.formatpdf
dc.identificator1
dc.identifier.urihttps://hdl.handle.net/20.500.12371/21495
dc.language.isospa
dc.matricula.creator222470429
dc.publisherBenemérita Universidad Autónoma de Puebla
dc.rights.accesopenAccess
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0
dc.subject.classificationCIENCIAS FÍSICO MATEMÁTICAS Y CIENCIAS DE LA TIERRA
dc.subject.lccProceso de Markov
dc.subject.lccProcesos estocásticos
dc.subject.lccProcesos estocásticos
dc.subject.lccOptimización matemática
dc.thesis.careerMaestría en Ciencias (Matemáticas)
dc.thesis.degreedisciplineÁrea de Ingeniería y Ciencias Exactas
dc.thesis.degreegrantorFacultad de Ciencias Físico Matemáticas
dc.thesis.degreetoobtainMaestro (a) en Ciencias (Matemáticas)
dc.titleAprendizaje por refuerzo vía Procesos de Decisión de Markov: Caso Descontado
dc.typeTesis de maestría
dc.type.conacytmasterThesis
dc.type.degreeMaestría
Files
Original bundle
Now showing 1 - 2 of 2
Loading...
Thumbnail Image
Name:
20240712132631-8344-T.pdf
Size:
3.08 MB
Format:
Adobe Portable Document Format
Name:
20240712132631-8344-CARTA.pdf
Size:
191.32 KB
Format:
Adobe Portable Document Format