Revista: | Controle & automacao |
Base de datos: | PERIÓDICA |
Número de sistema: | 000315284 |
ISSN: | 0103-1759 |
Autores: | Faria, Gedson1 Romero, Roseli A. Francelin |
Instituciones: | 1Universidade de Sao Paulo, Instituto de Ciencias Matematicas e de Computacao, Sao Paulo. Brasil |
Año: | 2002 |
Periodo: | Sep-Dic |
Volumen: | 13 |
Número: | 3 |
Paginación: | 219-230 |
País: | Brasil |
Idioma: | Portugués |
Tipo de documento: | Artículo |
Enfoque: | Aplicado |
Resumen en inglés | Reinforcement Learning can be seen as a way of programming agents by reward and punishment for solving specific tasks through repeated interactions with the environment. In this work, the performance of the most important reinforcement learning algorithms: Qlearning, Rlearning, H-learning is investigated in the context of a navigation task avoiding obstacles. Furthermore, this work proposes a sensor-based navigation method, named R'-learning, which incorporates fuzzy logic into the Rlearning algorithm for mobile robot navigation in uncertain environment. An application is realized consisting of teaching the robots to find small objects in a corridor. For this, a state set mapping has been proposed through force field concepts. R'learning algorithm has been used for this navigation task. The robot showed to have satisfactory behaviors in performing this task |
Resumen en portugués | Aprendizado por Reforço pode ser visto como uma forma de programar agentes utilizando recompensas e punições para resolver tarefas específicas através de interações com o ambiente. Neste trabalho é investigado o desempenho dos mais importantes algoritmos de aprendizado por reforço: Q-learning, R-learning e H-learning, no contexto de tarefas de navegação evitando colisões. Além disso, é proposto neste trabalho um método de navegação por sonares, denominado R'-learning, que incorpora lógica fuzzy ao algoritmo R-learning para navegação de robôs móveis em ambientes incertos. Foi também realizada uma aplicação de navegação utilizando o algoritmo R'-learning que consiste em ensinar robôs a encontrar pequenos objetos em um corredor. Para isto, foi proposto um mapeamento de estados do ambiente a partir do conceito de força de repulsão. O robô mostrou ter comportamentos satisfatórios ao executar a tarefa proposta |
Disciplinas: | Ingeniería |
Palabras clave: | Ingeniería de control, Robótica, Robot móvil, Navegación, Aprendizaje de máquinas, Lógica difusa |
Keyword: | Engineering, Control engineering, Robotics, Mobile robot, Navigation, Machine learning, Fuzzy logic |
Texto completo: | Texto completo (Ver HTML) |