Aproximación vía Q-Learning en problemas de consumo-inversión

López Ríos, Ruy Alberto; LOPEZ RIOS, RUY ALBERTO; 660007

Aproximación vía Q-Learning en problemas de consumo-inversión

Files

20210830164824-3967-T.pdf (1.18 MB)

Date

2021-08-25

Authors

López Ríos, Ruy Alberto

Publisher

Benemérita Universidad Autónoma de Puebla

Abstract

“El control óptimo estocástico es un área de las matemáticas dedicada a resolver problemas de optimización cuya evolución en el tiempo es susceptible a ser influenciado por variables aleatorias. Los procesos de control de Markov (PCM) son problemas de control estocástico, también conocidos como procesos de decisión de Markov, procesos de Markov controlados. Los PCM aparecen en muchos campos, por ejemplo, ingeniería, economía, investigación de operaciones, estadística, administración de recursos, control de epidemias, etc. La técnica básica para resolver problemas de control de Markov es la programación dinámica, técnica creada por Richard Bellman en 1953, con el propósito de optimizar problemas complejos que pueden ser sincretizados y secuencializados. Sin embargo, se complica su utilidad al trabajar con espacios de inter ́es de grandes dimensiones, en la literatura esto se conoce como maldición de la dimensionalidad. Machine learning es el estudio de algoritmos computacionales que automáticamente mejoran a través de la experiencia. Los algoritmos machine learning construyen un modelo matemático sobre datos muestrales, conocido como training data, para hacer predicciones o tomar decisiones sin ser explícitamente programado para ello”.

URI

https://hdl.handle.net/20.500.12371/15004

Collections

Tesis de Doctorado

Full item page

Document Viewer

Select a file to preview:

Can't see the file? Try reloading