Revista: | Controle & automacao |
Base de datos: | PERIÓDICA |
Número de sistema: | 000315303 |
ISSN: | 0103-1759 |
Autores: | Scardua, Leonardo Azevedo1 Cruz, Jose Jaime da Costa, Anna Helena Reali |
Instituciones: | 1Universidade de Sao Paulo, Escola Politecnica, Sao Paulo. Brasil |
Año: | 2003 |
Periodo: | Nov-Dic |
Volumen: | 14 |
Número: | 4 |
Paginación: | 368-376 |
País: | Brasil |
Idioma: | Portugués |
Tipo de documento: | Artículo |
Enfoque: | Experimental |
Resumen en inglés | This paper describes the use of Reinforcement Learning to the computation of optimal trajectories and anti-swing control of a ship unloader. The unloading cycle is divided into six phases and an optimization problem is defined for each of them. A TD(0) algorithm together with a multilayer perceptron neural network as a value function approximator is used in the optimization. The results obtained are compared to Optimal Control results |
Resumen en portugués | Este trabalho descreve o uso de Aprendizado por Reforço para a obtenção de trajetórias ótimas e controle anti-balanço de um descarregador de navios. O ciclo de descarga é dividido em seis etapas e, para cada uma delas, é definido um problema de otimização. Para a solução deste são utilizados um algoritmo TD(0) juntamente com uma rede neural do tipo perceptron multicamada como um aproximador da função valor. Os resultados obtidos são comparados com resultados de Controle Ótimo |
Disciplinas: | Ingeniería |
Palabras clave: | Equipo y maquinaria, Ingeniería de control, Sistemas de control, Aprendizaje, Control óptimo, Descargadores, Redes neuronales artificiales, Balanceo |
Keyword: | Engineering, Control engineering, Equipment and machinery, Control systems, Learning, Optimal control, Unloaders, Artificial neural networks, Balancing |
Texto completo: | Texto completo (Ver HTML) |