Procesos de decisión de Markov con recompensa promedio: caso neutral y sensible
dc.audience | generalPublic | es_MX |
dc.contributor | Crúz Suárez, Hugo Adán | |
dc.contributor.advisor | CRUZ SUAREZ, HUGO ADAN; 202875 | |
dc.contributor.author | Hernández Dávila, Alejandra Xochitl | |
dc.creator | HERNANDEZ DAVILA, ALEJANDRA XOCHITL; 551969 | |
dc.date.accessioned | 2020-12-07T18:18:55Z | |
dc.date.available | 2020-12-07T18:18:55Z | |
dc.date.issued | 2015 | |
dc.description.abstract | “En este trabajo de tesis se presentan algunos conceptos relacionados con los Procesos de Decisión de Markov (PDM). Los PDM son aplicados en problemas de control en ingeniería y economía. Estos son observados por un controlador de forma discreta en el tiempo por un periodo determinado, este, puede ser finito o infinito, a la sucesión de decisiones seguidas por el controlador se le llama política. Para evaluar la calidad de cada política cada proceso de decisión de Markov cuenta con un criterio de rendimiento también se le llama función objetivo, que puede ser costo acumulado, costo descontado, recompensa descontada, costo promedio, entre otros, el objetivo es hallar una política que optimice el criterio de rendimiento, es decir, en el si se trata el de un criterio de rendimiento en donde se emplea una función de costo el problema es hallar una política que minimice el criterio de rendimiento, mientras que en el caso en el que se emplea una función recompensa lo que se busca es maximizar el criterio, a este problema se le llama problema de control óptimo. Para resolver este problema se emplea le técnica de programación dinámica, esta, permite determinar la estrategia a seguir”. | es_MX |
dc.folio | 612315T | es_MX |
dc.format | es_MX | |
dc.identificator | 1 | es_MX |
dc.identifier.uri | https://hdl.handle.net/20.500.12371/9592 | |
dc.language.iso | spa | es_MX |
dc.matricula.creator | 213470923 | es_MX |
dc.rights.acces | openAccess | es_MX |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/4.0 | es_MX |
dc.subject.classification | CIENCIAS FÍSICO MATEMÁTICAS Y CIENCIAS DE LA TIERRA | es_MX |
dc.subject.lcc | Redes de computadoras | es_MX |
dc.subject.lcc | Teoría de colas | es_MX |
dc.subject.lcc | Programación dinámica | es_MX |
dc.subject.lcc | Economía matemática | es_MX |
dc.subject.lcc | Transformaciones de Laplace | es_MX |
dc.thesis.career | Maestría en Ciencias (Matemáticas) | es_MX |
dc.thesis.degreediscipline | Área de Ingeniería y Ciencias Exactas | es_MX |
dc.thesis.degreegrantor | Facultad de Ciencias Físico Matemáticas | es_MX |
dc.thesis.degreetoobtain | Maestro (a) en Ciencias (Matemáticas) | es_MX |
dc.thesis.degreetoobtain | Maestro (a) en Ciencias (Matemáticas) | es_MX |
dc.title | Procesos de decisión de Markov con recompensa promedio: caso neutral y sensible | es_MX |
dc.type | Tesis de maestría | es_MX |
dc.type.conacyt | masterThesis | es_MX |
dc.type.degree | Maestría | es_MX |