Aprendizaje por refuerzo vía Procesos de Decisión de Markov: Caso Descontado
dc.audience | generalPublic | |
dc.contributor | Cruz Suárez, Hugo Adán | |
dc.contributor.advisor | CRUZ SUAREZ, HUGO ADAN; 202875 | |
dc.contributor.author | Juárez Morales, Josué | |
dc.date.accessioned | 2024-10-04T20:39:46Z | |
dc.date.available | 2024-10-04T20:39:46Z | |
dc.date.issued | 2024-07 | |
dc.description.abstract | "El objetivo de este trabajo es dar una descripción matemática del Aprendizaje por Refuerzo; un paradigma inspirado en la interacción con el ambiente como medio de aprendizaje. Se presenta la teoría de Procesos de Decisión de Markov y el problema de control óptimo, la base que transcribe el paradigma de aprendizaje al lenguaje matemático. Las técnicas de Programación Dinámica y la Aproximación Estocástica son representadas mediante los algoritmos de Iteración de Valores y Q-learning respectivamente. Ambos algoritmos son implementados para la solución en distintos sistemas tomados como ejemplos". | |
dc.folio | 20240712132631-8344-T | |
dc.format | ||
dc.identificator | 1 | |
dc.identifier.uri | https://hdl.handle.net/20.500.12371/21495 | |
dc.language.iso | spa | |
dc.matricula.creator | 222470429 | |
dc.publisher | Benemérita Universidad Autónoma de Puebla | |
dc.rights.acces | openAccess | |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/4.0 | |
dc.subject.classification | CIENCIAS FÍSICO MATEMÁTICAS Y CIENCIAS DE LA TIERRA | |
dc.subject.lcc | Proceso de Markov | |
dc.subject.lcc | Procesos estocásticos | |
dc.subject.lcc | Procesos estocásticos | |
dc.subject.lcc | Optimización matemática | |
dc.thesis.career | Maestría en Ciencias (Matemáticas) | |
dc.thesis.degreediscipline | Área de Ingeniería y Ciencias Exactas | |
dc.thesis.degreegrantor | Facultad de Ciencias Físico Matemáticas | |
dc.thesis.degreetoobtain | Maestro (a) en Ciencias (Matemáticas) | |
dc.title | Aprendizaje por refuerzo vía Procesos de Decisión de Markov: Caso Descontado | |
dc.type | Tesis de maestría | |
dc.type.conacyt | masterThesis | |
dc.type.degree | Maestría |
Files
Original bundle
1 - 2 of 2

- Name:
- 20240712132631-8344-CARTA.pdf
- Size:
- 191.32 KB
- Format:
- Adobe Portable Document Format