Asymptotically Stable Adaptive–Optimal Control Algorithm With Saturating Actuators and Relaxed Persistence of Excitation

dc.creatorKyriakos G.vamvoudakis
dc.creatorMárcio Fantini Miranda
dc.creatorJoao p. Hespanha
dc.date.accessioned2022-02-25T15:49:53Z
dc.date.accessioned2025-09-09T01:15:14Z
dc.date.available2022-02-25T15:49:53Z
dc.date.issued2015
dc.description.abstractEste artigo propõe um algoritmo de controle baseado em programação dinâmica adaptativa para resolver o problema de controle ótimo de horizonte infinito para sistemas não lineares determinísticos conhecidos com atuadores saturantes e funcionais de custo não quadráticos. O algoritmo é baseado em um framework ator/crítico, onde uma rede neural crítica (NN) é usada para aprender o custo ótimo, e um ator NN é usado para aprender a política de controle ótima. A natureza de controle adaptativo do algoritmo requer que uma persistência da condição de excitação seja validada a priori, mas isso pode ser relaxado usando dados previamente armazenados concomitantemente com dados atuais na atualização do NN crítico. Um termo de controle robusto é adicionado ao controlador para eliminar o efeito de erros residuais, levando à estabilidade assintoticamente do sistema em malha fechada. Os resultados da simulação mostram a eficácia da abordagem proposta para um oscilador controlado de Van der Pol e também para uma planta de sistema elétrico.
dc.identifier.doi10.1109/TNNLS.2015.2487972
dc.identifier.issn2162237X
dc.identifier.urihttps://hdl.handle.net/1843/39711
dc.languageeng
dc.publisherUniversidade Federal de Minas Gerais
dc.relation.ispartofIEEE Transactions on Neural Networks and Learning Systems
dc.rightsAcesso Restrito
dc.subjectProgramação dinâmica aproximada
dc.subjectControle ideal
dc.subjectControle robusto
dc.subjectAprendizado por reforço
dc.subject.otherApproximate dynamic programming (ADP)
dc.subject.otherOptimal Control
dc.subject.otherreinforcement learning
dc.subject.otherrobust control
dc.titleAsymptotically Stable Adaptive–Optimal Control Algorithm With Saturating Actuators and Relaxed Persistence of Excitation
dc.title.alternativeAlgoritmo de controle adaptativo-ótimo assintoticamente estável com atuadores de saturação e persistência relaxada de excitação
dc.typeArtigo de periódico
local.citation.epage2398
local.citation.issue11
local.citation.spage2386
local.citation.volume27
local.description.resumoThis paper proposes a control algorithm based on adaptive dynamic programming to solve the infinite-horizon optimal control problem for known deterministic nonlinear systems with saturating actuators and nonquadratic cost functionals. The algorithm is based on an actor/critic framework, where a critic neural network (NN) is used to learn the optimal cost, and an actor NN is used to learn the optimal control policy. The adaptive control nature of the algorithm requires a persistence of excitation condition to be a priori validated, but this can be relaxed using previously stored data concurrently with current data in the update of the critic NN. A robustifying control term is added to the controller to eliminate the effect of residual errors, leading to the asymptotically stability of the closed-loop system. Simulation results show the effectiveness of the proposed approach for a controlled Van der Pol oscillator and also for a power system plant.
local.publisher.countryBrasil
local.publisher.departmentCOLTEC - COLEGIO TECNICO
local.publisher.initialsUFMG
local.url.externahttps://ieeexplore.ieee.org/document/7302057/keywords#keywords

Arquivos

Licença do pacote

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
License.txt
Tamanho:
1.99 KB
Formato:
Plain Text
Descrição: