Mixed Acceleration Techniques for Solving Quickly Stochastic Shortest-Path Markov Decision Processes



Título del documento: Mixed Acceleration Techniques for Solving Quickly Stochastic Shortest-Path Markov Decision Processes
Revista: Journal of applied research and technology
Base de datos: PERIÓDICA
Número de sistema: 000342027
ISSN: 1665-6423
Autores: 1
1
2
1
1
1
3
Instituciones: 1Universidad de Guanajuato, Salamanca, Guanajuato. México
2Universidad Politécnica de Valencia, Valencia. España
3Instituto de Investigaciones Eléctricas, Temixco, Morelos. México
Año:
Periodo: Ago
Volumen: 9
Número: 2
Paginación: 129-144
País: México
Idioma: Inglés
Tipo de documento: Artículo
Enfoque: Experimental, aplicado
Resumen en español En este documento proponemos la combinación de variantes aceleradas del algoritmo de iteración de valor combinadas con el algoritmo de barrido priorizado mejorado para la rápida solución de los procesos de decisión de Markov de ruta estocástica más corta. Iteración de valor es un algoritmo clásico para resolver a los procesos de decisión de Markov, pero este algoritmo y sus variantes son lentos para resolver problemas considerablemente grandes. Con el objeto de mejorar el tiempo de solución de este algoritmo, en este documento se han explorado técnicas de aceleración tales como actualizaciones asíncronas, priorización y barrido priorizado. Un algoritmo de reordenamiento topológico también fue comparado con uno de reordenamiento estático. Los resultados experimentales obtenidos en un problema de ruta estocástica más corta con espacios de estados–acciones finitos; muestran que nuestro enfoque logra una considerable reducción en el tiempo de solución con respecto a las variantes de iteración de valor probadas. Por ejemplo, los experimentos mostraron en una prueba una reducción de 5.7 veces con respecto a iteración de valor usando actualizaciones asíncronas
Resumen en inglés In this paper we propose the combination of accelerated variants of value iteration mixed with improved prioritized sweeping for the fast solution of stochastic shortest–path Markov decision processes. Value iteration is a classical algorithm for solving Markov decision processes, but this algorithm and its variants are quite slow for solving considerably large problems. In order to improve the solution time, acceleration techniques such as asynchronous updates, prioritization and prioritized sweeping have been explored in this paper. A topological reordering algorithm was also compared with static reordering. Experimental results obtained on finite state and action–space stochastic shortest–path problems show that our approach achieves a considerable reduction in the solution time with respect to the tested variants of value iteration. For instance, the experiments showed in one test a reduction of 5.7 times with respect to value iteration with asynchronous updates
Disciplinas: Ciencias de la computación,
Matemáticas
Palabras clave: Matemáticas aplicadas,
Algoritmos,
Procesos de decisión de Markov,
Técnicas de aceleración,
Actualización asíncrona,
Priorización
Keyword: Computer science,
Mathematics,
Applied mathematics,
Algorithms,
Markov processes,
Acceleration techniques,
Asynchronous updating,
Priorization
Texto completo: Texto completo (Ver HTML)