Online optimal auto-tuning of PID controllers for tracking in a special class of linear systems

Márcio Fantini Miranda; Kyriakos Vamvoudakis

doi:10.1109/ACC.2016.7526523

Online optimal auto-tuning of PID controllers for tracking in a special class of linear systems

Data

2016

Autor(es)

Márcio Fantini Miranda

Kyriakos Vamvoudakis

Editor

Universidade Federal de Minas Gerais

Tipo

Artigo de evento

Título alternativo

Auto-ajuste otimizado on-line de controladores PID para rastreamento em uma classe especial de sistemas lineares

Resumo

This paper proposes a reinforcement learning (RL) algorithm based on approximate dynamic programming to optimally auto-tune a Proportional Integral Derivative (PID) controller by solving an infinite-horizon optimal tracking control problem for a special class of linear systems. The algorithm is based on an actor/critic framework where a critic approximator is used to learn the optimal cost and an actor approximator is used to learn the optimal PID gains. The adaptive control nature of the algorithm requires a persistence of excitation condition to be a-priori validated, but this can be relaxed by using previously stored data concurrently with current data in the tuning of the critic approximator. Simulation results show the effectiveness of the proposed approach for a stirred-tank plant reactor.

Abstract

Este artigo propõe um algoritmo de aprendizado por reforço (RL) baseado em programação dinâmica aproximada para auto-ajustar de forma otimizada um controlador Proporcional Integral Derivado (PID) resolvendo um problema de controle de rastreamento ótimo de horizonte infinito para uma classe especial de sistemas lineares. O algoritmo é baseado em uma estrutura ator/crítico onde um aproximador crítico é usado para aprender o custo ótimo e um aproximador ator é usado para aprender os ganhos ótimos do PID. A natureza de controle adaptativo do algoritmo requer uma persistência da condição de excitação para ser validada a priori, mas isso pode ser relaxado usando dados previamente armazenados simultaneamente com dados atuais na sintonia do aproximador crítico. Os resultados da simulação mostram a eficácia da abordagem proposta para um reator de usina de tanque agitado.

Assunto

Aprendizado por reforço, Derivada Integral Proporcional, Algorítimo

URI

https://hdl.handle.net/1843/39710

Departamento

COLTEC - COLEGIO TECNICO

Endereço externo

https://ieeexplore.ieee.org/document/7526523

Coleções

Artigo de Evento

Página do item completo

Online optimal auto-tuning of PID controllers for tracking in a special class of linear systems

Data

Autor(es)

Título da Revista

ISSN da Revista

Título de Volume

Editor

Descrição

Tipo

Título alternativo

Primeiro orientador

Membros da banca

Resumo

Abstract

Assunto

Palavras-chave

Citação

URI

Departamento

Curso

Endereço externo

Coleções

Avaliação

Revisão

Suplementado Por

Referenciado Por