Aproximaciones contractivas al costo promedio óptimo bajo aversión al riesgo
Date
2021-11
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Benemérita Universidad Autónoma de Puebla
Abstract
"Este trabajo trata sobre cadenas de Markov controladas evolucionando en un espacio numerable. En este modelo un agente, llamado el controlador o tomador de decisiones, observa el estado del sistema en cada tiempo entero no negativo y selecciona una acción entre varias alternativas disponibles, intervención que tiene un efecto doble, a saber, afecta las probabilidades de transición del sistema hacia un nuevo estado, y ocasiona un costo que depende tanto del estado como de la acción aplicada. En general, el rendimiento de una estrategia de selección de acciones (llamada política) se mide usando la sucesión aleatoria de costos incurridos, y en este trabajo se supondrá que el funcionamiento de una política se evalúa usando la tasa de crecimiento exponencial de los costos acumulados. Como se verá más adelante, esta selección del criterio de funcionamiento corresponde a un controlador averso al riesgo que mide el desempeño de una política usando el costo que, en promedio la acción tomada, está dispuesto a pagar para evitar la incertidumbre ocasionada por el carácter aleatorio de los costos que se observarán durante la evolución del sistema".
Description
Keywords
Citation
Collections
Document Viewer
Select a file to preview:
Can't see the file? Try reloading