Journal: | Controle & automacao |
Database: | PERIÓDICA |
System number: | 000315284 |
ISSN: | 0103-1759 |
Authors: | Faria, Gedson1 Romero, Roseli A. Francelin |
Institutions: | 1Universidade de Sao Paulo, Instituto de Ciencias Matematicas e de Computacao, Sao Paulo. Brasil |
Year: | 2002 |
Season: | Sep-Dic |
Volumen: | 13 |
Number: | 3 |
Pages: | 219-230 |
Country: | Brasil |
Language: | Portugués |
Document type: | Artículo |
Approach: | Aplicado |
English abstract | Reinforcement Learning can be seen as a way of programming agents by reward and punishment for solving specific tasks through repeated interactions with the environment. In this work, the performance of the most important reinforcement learning algorithms: Qlearning, Rlearning, H-learning is investigated in the context of a navigation task avoiding obstacles. Furthermore, this work proposes a sensor-based navigation method, named R'-learning, which incorporates fuzzy logic into the Rlearning algorithm for mobile robot navigation in uncertain environment. An application is realized consisting of teaching the robots to find small objects in a corridor. For this, a state set mapping has been proposed through force field concepts. R'learning algorithm has been used for this navigation task. The robot showed to have satisfactory behaviors in performing this task |
Portuguese abstract | Aprendizado por Reforço pode ser visto como uma forma de programar agentes utilizando recompensas e punições para resolver tarefas específicas através de interações com o ambiente. Neste trabalho é investigado o desempenho dos mais importantes algoritmos de aprendizado por reforço: Q-learning, R-learning e H-learning, no contexto de tarefas de navegação evitando colisões. Além disso, é proposto neste trabalho um método de navegação por sonares, denominado R'-learning, que incorpora lógica fuzzy ao algoritmo R-learning para navegação de robôs móveis em ambientes incertos. Foi também realizada uma aplicação de navegação utilizando o algoritmo R'-learning que consiste em ensinar robôs a encontrar pequenos objetos em um corredor. Para isto, foi proposto um mapeamento de estados do ambiente a partir do conceito de força de repulsão. O robô mostrou ter comportamentos satisfatórios ao executar a tarefa proposta |
Disciplines: | Ingeniería |
Keyword: | Ingeniería de control, Robótica, Robot móvil, Navegación, Aprendizaje de máquinas, Lógica difusa |
Keyword: | Engineering, Control engineering, Robotics, Mobile robot, Navigation, Machine learning, Fuzzy logic |
Full text: | Texto completo (Ver HTML) |