- -

Mixed acceleration techniques for solving quickly stochastic shortest-path markov decision processes

RiuNet: Repositorio Institucional de la Universidad Politécnica de Valencia

Compartir/Enviar a

Citas

Estadísticas

  • Estadisticas de Uso

Mixed acceleration techniques for solving quickly stochastic shortest-path markov decision processes

Mostrar el registro sencillo del ítem

Ficheros en el ítem

dc.contributor.author García Hernández, Ma de Guadalupe es_ES
dc.contributor.author Ruiz Pinales, José es_ES
dc.contributor.author Onaindia de la Rivaherrera, Eva es_ES
dc.contributor.author Ledesma-Orozco, S es_ES
dc.contributor.author Aviña-Cervantes, J.G. es_ES
dc.contributor.author Alvarado-Méndez, E. es_ES
dc.contributor.author Reyes-Ballesteros, A es_ES
dc.date.accessioned 2015-02-04T19:36:00Z
dc.date.available 2015-02-04T19:36:00Z
dc.date.issued 2011-08
dc.identifier.issn 1665-6423
dc.identifier.uri http://hdl.handle.net/10251/46761
dc.description.abstract In this paper we propose the combination of accelerated variants of value iteration mixed with improved prioritized sweeping for the fast solution of stochastic shortest-path Markov decision processes. Value iteration is a classical algorithm for solving Markov decision processes, but this algorithm and its variants are quite slow for solving considerably large problems. In order to improve the solution time, acceleration techniques such as asynchronous updates, prioritization and prioritized sweeping have been explored in this paper. A topological reordering algorithm was also compared with static reordering. Experimental results obtained on finite state and action-space stochastic shortest-path problems show that our approach achieves a considerable reduction in the solution time with respect to the tested variants of value iteration. For instance, the experiments showed in one test a reduction of 5.7 times with respect to value iteration with asynchronous updates. es_ES
dc.description.abstract En este documento proponemos la combinación de variantes aceleradas del algoritmo de iteración de valor combinadas con el algoritmo de barrido priorizado mejorado para la rápida solución de los procesos de decisión de Markov de ruta estocástica más corta. Iteración de valor es un algoritmo clásico para resolver a los procesos de decisión de Markov, pero este algoritmo y sus variantes son lentos para resolver problemas considerablemente grandes. Con el objeto de mejorar el tiempo de solución de este algoritmo, en este documento se han explorado técnicas de aceleración tales como actualizaciones asíncronas, priorización y barrido priorizado. Un algoritmo de reordenamiento topológico también fue comparado con uno de reordenamiento estático. Los resultados experimentales obtenidos en un problema de ruta estocástica más corta con espacios de estados-acciones finitos; muestran que nuestro enfoque logra una considerable reducción en el tiempo de solución con respecto a las variantes de iteración de valor probadas. Por ejemplo, los experimentos mostraron en una prueba una reducción de 5.7 veces con respecto a iteración de valor usando actualizaciones asíncronas. es_ES
dc.language Inglés es_ES
dc.publisher Universidad Nacional Autónoma de México (UNAM) es_ES
dc.relation.ispartof Journal of Applied Research and Technology es_ES
dc.rights Reconocimiento - No comercial (by-nc) es_ES
dc.subject Markov decision processes es_ES
dc.subject Acceleration techniques es_ES
dc.subject Prioritization. es_ES
dc.subject.classification LENGUAJES Y SISTEMAS INFORMATICOS es_ES
dc.title Mixed acceleration techniques for solving quickly stochastic shortest-path markov decision processes es_ES
dc.type Artículo es_ES
dc.rights.accessRights Abierto es_ES
dc.contributor.affiliation Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació es_ES
dc.description.bibliographicCitation García Hernández, MDG.; Ruiz Pinales, J.; Onaindia De La Rivaherrera, E.; Ledesma-Orozco, S.; Aviña-Cervantes, J.; Alvarado-Méndez, E.; Reyes-Ballesteros, A. (2011). Mixed acceleration techniques for solving quickly stochastic shortest-path markov decision processes. Journal of Applied Research and Technology. 9(2):129-144. http://hdl.handle.net/10251/46761 es_ES
dc.description.accrualMethod S es_ES
dc.relation.publisherversion http://www.jart.ccadet.unam.mx/jart/volumen9_2.htm es_ES
dc.description.upvformatpinicio 129 es_ES
dc.description.upvformatpfin 144 es_ES
dc.type.version info:eu-repo/semantics/publishedVersion es_ES
dc.description.volume 9 es_ES
dc.description.issue 2 es_ES
dc.relation.senia 193235


Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem