Aproximación vía Q-Learning en problemas de consumo-inversión

Cruz Suárez, Hugo AdánCRUZ SUAREZ, HUGO ADAN; 202875López Ríos, Ruy Alberto2021-11-042021-11-042021-08-25https://hdl.handle.net/20.500.12371/15004“El control óptimo estocástico es un área de las matemáticas dedicada a resolver problemas de optimización cuya evolución en el tiempo es susceptible a ser influenciado por variables aleatorias. Los procesos de control de Markov (PCM) son problemas de control estocástico, también conocidos como procesos de decisión de Markov, procesos de Markov controlados. Los PCM aparecen en muchos campos, por ejemplo, ingeniería, economía, investigación de operaciones, estadística, administración de recursos, control de epidemias, etc. La técnica básica para resolver problemas de control de Markov es la programación dinámica, técnica creada por Richard Bellman en 1953, con el propósito de optimizar problemas complejos que pueden ser sincretizados y secuencializados. Sin embargo, se complica su utilidad al trabajar con espacios de inter ́es de grandes dimensiones, en la literatura esto se conoce como maldición de la dimensionalidad. Machine learning es el estudio de algoritmos computacionales que automáticamente mejoran a través de la experiencia. Los algoritmos machine learning construyen un modelo matemático sobre datos muestrales, conocido como training data, para hacer predicciones o tomar decisiones sin ser explícitamente programado para ello”.pdfspaCIENCIAS FÍSICO MATEMÁTICAS Y CIENCIAS DE LA TIERRATeoría del control estocásticoOptimización matemática--Programas para computadoraProcesos de Markov--Modelos matemáticosProgramación dinámicaAprendizaje por refuerzoAproximación vía Q-Learning en problemas de consumo-inversiónTesis de doctoradoopenAccess