Método de diferenças temporais aplicado às equações de Riccati acopladas entre si



Título del documento: Método de diferenças temporais aplicado às equações de Riccati acopladas entre si
Revista: Controle & automacao
Base de datos: PERIÓDICA
Número de sistema: 000315291
ISSN: 0103-1759
Autores: 1
Instituciones: 1Universidade de Sao Paulo, Escola Politecnica, Sao Paulo. Brasil
Año:
Periodo: Jul-Sep
Volumen: 14
Número: 3
Paginación: 223-234
País: Brasil
Idioma: Portugués
Tipo de documento: Artículo
Enfoque: Analítico
Resumen en inglés In this paper we present an iterative technique based on Monte Carlo simulations for deriving the optimal control of the infinite horizon linear regulator problem of discrete-time Markovian jump linear systems for the case in which the transition probability matrix of the Markov chain is not known. It is well known that the optimal control of this problem is given in terms of the maximal solution of a set of coupled algebraic Riccati equations (CARE), which have been extensively studied over the last few years. We trace a parallel with the theory of TD(lambda) algorithms for Markovian decision processes to develop a TD(lambda) like algorithm for the optimal control associated to the maximal solution of the CARE. Some numerical examples are also presented
Resumen en portugués Neste trabalho apresentaremos uma técnica iterativa baseada em simulações de Monte Carlo para calcular o controle ótimo de um problema de regulador linear quadrático de horizonte infinito para um sistema linear com saltos Markovianos a tempo discreto, quando a matriz de transição de probabilidade não é conhecida. Sabemos que o controle ótimo deste problema é dado em termos da solução maximal de um conjunto de equações algébricas de Riccati acopladas entre si (EARA) a tempo discreto, que foram extensivamente estudadas nos últimos anos. Traçaremos um paralelo com a teoria do algoritmo TD(lambda) para Processos Markovianos de Decisão (PMD) para desenvolver o algoritmo TD(lambda) para o controle ótimo associado à solução maximal de uma EARA
Disciplinas: Ingeniería
Palabras clave: Ingeniería de control,
Teoría de control,
Sistemas de control,
Control óptimo,
Simulación de Montecarlo,
Ecuaciones algebráicas
Keyword: Engineering,
Control engineering,
Control theory,
Control systems,
Optimal control,
Monte Carlo simulation,
Algebraic equations
Texto completo: Texto completo (Ver HTML)