Sobre el modelo de Bandidos Armados con recompensa difusa
Date
2024-12
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Benemérita Universidad Autónoma de Puebla
Abstract
"Esta tesis se enfoca en la aplicación de la teoría de Bandidos Armados a procesos de decisión de Markov con recompensas difusas, mediante la transformación trapezoidal de dichas recompensas. Este enfoque permite establecer una transición entre modelos clásicos y modelos bajo incertidumbre, aportando herramientas útiles para la toma de decisiones en entornos inciertos. Se revisan contribuciones fundamentales como el método de Thompson (1933), el planteamiento de Robbins (1952) y la programación dinámica de Bellman (1956), que dio lugar al índice de Gittins, una estrategia óptima ampliamente utilizada. Por otro lado, se incorpora la teoría de conjuntos difusos introducida por Zadeh (1965), y se exploran desarrollos recientes en procesos de decisión de Markov con variables aleatorias difusas. Sin embargo, hasta el momento, no se había abordado de manera específica la combinación de Bandidos Armados con teoría difusa. Esta investigación propone un modelo híbrido que incorpora ambos marcos teóricos, desarrollando algoritmos para evaluar su desempeño en escenarios con incertidumbre. Los resultados numéricos evidencian mejoras en la optimización de la recompensa esperada. En resumen, la tesis contribuye con un enfoque novedoso para la toma de decisiones bajo incertidumbre, relevante para áreas como inteligencia artificial, teoría de decisión y sistemas adaptativos".
Description
Keywords
Citation
Collections
Document Viewer
Select a file to preview:
Can't see the file? Try reloading