Juegos Markovianos con tiempos de paro, bajo el criterio sensible al riesgo

Cruz Suárez, Hugo AdánCavazos Cadena, RolandoCRUZ SUAREZ, HUGO ADAN; 202875Cavazos Cadena, Rolando; 2433López Rivero, Jaicer Jonás2025-02-262025-02-262024https://hdl.handle.net/20.500.12371/27000“La presente tesis se centra en una clase de juegos de suma cero a tiempo discreto, espacio de estados numerable, transiciones Markovianas y recompensas acotadas. En estos juegos, participan dos jugadores, denominados Jugador I y Jugador II, quienes observan el estado actual del sistema y tienen la capacidad de influir en su evolución mediante la aplicación de acciones en cada época de decisión. El proceso de toma de decisiones es secuencial, comenzando con el Jugador II, quien puede elegir entre detener el juego o permitir que el sistema continúe su evolución. Si decide detenerlo, deberá pagar una recompensa terminal al Jugador I. Si opta por continuar, el Jugador I selecciona una acción, lo que genera dos efectos: primero, la cadena de Markov transita al siguiente estado conforme a la ley de transición; segundo, el Jugador II paga una recompensa inmediata al Jugador I. El proceso anterior se repite en cada nuevo estado al que el juego avanza. A este tipo de juegos se le conoce como juegos markovianos con tiempos de paro. Considerando esto, el objetivo general de nuestra investigación es determinar bajo qué condiciones sobre el modelo de control se garantiza la existencia de una solución para el juego”.pdfspaCIENCIAS FÍSICO MATEMÁTICAS Y CIENCIAS DE LA TIERRAMatemáticas--Álgebra--Teoría de juegosMatemáticas--Probabilidades--Procesos estocásticos--Procesos de MarkovJuegos Markovianos con tiempos de paro, bajo el criterio sensible al riesgoTesis de doctoradoopenAccess