An algorithm to obtain an optimal strategy for the Markov decision processes with probability distribution for the planning horizon



Título del documento: An algorithm to obtain an optimal strategy for the Markov decision processes with probability distribution for the planning horizon
Revista: Investigación operacional
Base de datos: PERIÓDICA
Número de sistema: 000379145
ISSN: 0257-4306
Autores: 1
Instituciones: 1University of Piraeus, Department of Statistics and Insurance Science, El Pireo. Grecia
Año:
Volumen: 31
Número: 2
Paginación: 159-170
País: Cuba
Idioma: Inglés
Tipo de documento: Artículo
Enfoque: Analítico, descriptivo
Resumen en español En este trabajo formulamos un Proceso de Decisión Markoviano con Horizonte Aleatorio. Desarrollamos la ecuación de optimalidad para este problema, sin embargo puede no existir estrategias optimales estacionarias. Para el MDP (Proceso de Decisión Markoviano), con distribución de probabilidad para horizonte de planeamiento con soporte infinito, demostramos el Teorema de Horizonte de Planeamiento de Turnpike. Desarrollamos un algoritmo para obtener una decisión de primera etapa optimal. Damos algunos ejemplos numéricos
Resumen en inglés In this paper we formulate Markov Decision Processes with Random Horizon. We show the optimality equation for this problem, however there may not exist optimal stationary strategies. For the MDP (Markov–Decision–Process), with probability distribution for the planning horizon with infinite support, we show Turnpike Planning Horizon Theorem. We develop an algorithm obtaining an optimal first stage decision. We give some numerical examples
Disciplinas: Matemáticas
Palabras clave: Matemáticas aplicadas,
Procesos de decisión de Markov,
Algoritmos
Keyword: Mathematics,
Applied mathematics,
Markov processes,
Algorithms
Texto completo: Texto completo (Ver PDF)