Procesos de decisión de Markov bajo el criterio de entropía relativa
Date
2019-11
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Benemérita Universidad Autónoma de Puebla
Abstract
"El tema principal de este trabajo de tesis es Procesos de Decisión de
Markov (PDMs). Un PDM es aquél que modela, mediante un Modelo de
Control de Markov, un sistema observado en el tiempo por un controlador
o agente decisor que influye en la evolución del sistema. El controlador
decide la acción (control) a tomar dependiendo del estado actual con el
objetivo de que el sistema se desempeñe eficazmente con respecto a cierto
criterio de optimalidad (función objetivo o criterio de rendimiento). La acción
genera un costo (o recompensa) a pagarse y repercute en el nuevo estado
del sistema de acuerdo con una distribución de probabilidad preestablecida.
Este procedimiento de selección se repite de manera periódica hasta cierto
momento dado llamado horizonte del problema, a la sucesión de acciones
determinada se le denomina política. La mejor política será aquella que
optimice el criterio de optimalidad, lo cual da origen al problema de control
óptimo [18], [30]."
Description
Keywords
Citation
Collections
Document Viewer
Select a file to preview:
Can't see the file? Try reloading