UNIVERSIDADE FEDERAL DE MINAS GERAIS - UFMG Mestrado em Engenharia Elétrica Mateus de Araújo Carvalho CONTROLADOR NEUROFUZZY COM APRENDIZADO ON-LINE: TEORIA E APLICAÇÃO NA INDÚSTRIA DE PETRÓLEO Belo Horizonte (MG) 2010 Mateus de Araújo Carvalho CONTROLADOR NEUROFUZZY COM APRENDIZADO ON-LINE: TEORIA E APLICAÇÃO NA INDÚSTRIA DE PETRÓLEO Dissertação apresentada ao Curso de Mestrado em Engenharia Elétrica, do Programa de Pós- Graduação Stricto Sensu do Universidade Federal de Minas Gerais – UFMG, como requisito parcial à obtenção do título de Mestre. Área de Concentração: Inteligência Computacional Orientadores: Dr. Benjamim Rodrigues de Menezes e Dr. Walmir Matos Caminhas Belo Horizonte (MG) 2010 Mateus de Araújo Carvalho CONTROLADOR NEUROFUZZY COM APRENDIZADO ON-LINE: TEORIA E APLICAÇÃO NA INDÚSTRIA DE PETRÓLEO Dissertação apresentada ao Curso de Mestrado em Engenharia Elétrica da Universidade Federal de Minas Gerais - UFMG, em 29 de março de 2010, como requisito parcial para obtenção do título de Mestre em Engenharia Elétrica, aprovada pela Banca Examinadora constituída pelos professores: ____________________________________________________ Benjamim Rodrigues de Menezes – Dr. Prof. DEE/EEUFMG - Orientador ____________________________________________________ Walmir Matos Caminhas – Dr. Prof. DEE/EEUFMG – co-Orientador ____________________________________________________ Prof(a). Dr(a). ..................................................- Instituição ____________________________________________________ Prof(a). Dr(a). ................................................- Instituição I Dedicatória Dedico este trabalho aos que ajudaram nesta caminhada com apoio, paciência, carinho e compreensão. Aos que estavam presentes no trabalho, em casa, na universidade, me multiplicando-me e fazendo a engrenagem da vida rodar. Mesmo na distância dos dias curtos, entenderam e me apoiaram nas minhas ausências. Dedico em especial à minha mãe por este amor maior do que a razão consegue explicar. Ao meu pai, pela dedicação, cuidado, carinho e por me ensinar desde cedo a importância da educação e do conhecimento. Agradeço enfim pela entrega e dedicação destas duas vidas. À minha namorada, pelo aconchego, mesmo que distante, dos dias difíceis. Aos meus afilhados, minhas avós e família de quem eu fiquei tão longe durante este tempo. Aos amigos que sempre estão ao meu lado, trazendo sempre descontração e alegria tão importantes na vida de todos. Dedico este trabalho aos grandes mestres que tive e tenho na vida. À sabedoria maior do que números e palavras. Às grandes lições de vida e amor pela profissão. À fé, força e apoio. Por fim agradeço à Deus por me privilegiar com a oportunidade de ter chegado até aqui. II Agradecimentos Aos Professores Dr. Benjamim Rodrigues de Menezes e Dr. Walmir Matos Caminhas, por ter orientado, mediado e acompanhado com dedicação o meu processo de aprendizagem. Aos integrantes do grupo de pesquisa da UFMG Celso Araújo, Luiz Cláudio, Daniel Alves e Rodrigo Magalhães, que contribuíram muito para este trabalho. Aos colegas e colaboradores da Petrobras Dr. Carlos Henrique Bomfim, Davidson Allyson Souza e Dr. Mário Cesar Campos pela orientação e apoio no desenvolvimento e implementação do trabalho. Nesta trajetória desses anos de estudos, várias pessoas contribuíram de alguma forma com este trabalho. A todos com quem dialoguei e troquei informações, o meu muito obrigado. III “Há um tempo em que é preciso abandonar as roupas usadas, que já têm a forma do nosso corpo, e esquecer os nossos caminhos que nos levam sempre aos mesmos lugares. É o tempo da travessia e, se não ousarmos fazê-la, teremos ficado, pra sempre, à margem de nós mesmos.” Fernando Pessoa IV Resumo Este trabalho apresenta um controlador que é uma evolução do "On-line Neurofuzzy Controller (ONFC)", que é um controlador simples, de baixo custo computacional e que se adapta à dinâmica do processo numa ampla faixa de operação. São apresentados o desenvolvimento e a análise do novo algoritmo de aprendizagem, abordando aspectos relativos à estabilidade, aplicação e critérios para sintonia. Este controlador, denominado de ONFCDw, pode ser aplicado às plantas tipicamente encontradas na indústria e se mostrou eficiente diante de problemas de controle onde controladores PID (Proporcional Integral Derivativo) têm um baixo desempenho devido as não-linearidades, mudanças frequentes no ponto operacional, perturbações variáveis no tempo, etc. Sua capacidade adaptativa confere ao ONFCDw também a vantagem de se ajustar à mudanças temporais em processos, evitando ou diminuindo muito a necessidade de ressintonia para manutenção do desempenho desejado. Este algoritmo, por ser simples, pode ser implementado na grande maioria dos sistemas supervisórios industriais. Neste trabalho é também apresentada a implementação bem sucedida do algoritmo ONFCDw para controle de temperatura de uma região da torre fracionadora principal de uma unidade industrial de Coqueamento Retardado da Petrobras, fazendo parte de um projeto de P&D entre a UFMG e a PETROBRAS. A metodologia proposta para implementação constitui-se da análise prévia de desempenho em simuladores dinâmicos convencionais e da aplicação em simuladores dinâmicos de processos capazes de simular os equipamentos e unidades tipicamente encontradas em refinarias. Os resultados obtidos motivam a avaliação destes sistemas para outros processos com características não lineares e sujeitos à perturbações externas intensas. Por fim, são apresentadas propostas de continuidade e possíveis novas aplicações do algoritmo. Palavras-chave: Controle de processo, Não linear, adaptativo, Neuro-Fuzzy V Abstract This work presents a controller, based on the evolution of the "On-line neurofuzzy controller (ONFC)", which is a simple controller, with low computational cost and adaptive capacity. The development and the analysis of a new learning algorithm, introducing relative aspects of stability, application and tuning methods are presented. This controller, called ONFCDw, can be applied in typical industrial plants and it has showed efficient performance in controlling plants where PID controllers have low performance due to non linearity, frequent changes in the operational point, time varying variable disturbances, etc. Its adaptive nature also gives ONFCDw the advantage of automatically adjusting to temporary changes in processes, avoiding or decreasing the necessity of re-tuning. This algorithm, due to its simplicity, can be implemented in most industrial supervisory systems. In this work it is also presented a successfully implementation of ONFCDw in a temperature control of an area of the main distillation tower in an industrial Delayed Coke unit of Petrobras, being part of a R&D project between UFMG and PETROBRAS. The methodology proposed for implementation included a previous analysis in a conventional dynamic simulator and in a process dynamic simulator, wich is capable to simulate equipments and units typically present in refineries. The promising results motivate the evaluation of these systems in other processes with non linear characteristics and intense external disturbances. Finally, it is presented some proposes for continuity and new possible applications. Key-words: Process control, Non Linear, adaptive, Nero-Fuzzy. VI Lista de Figuras Figura 1.1: Sistema integrado de controle. ........................................................................... 2 Figura 1.2: Impacto do controle regulatório no resultado financeiro. .................................. 2 Figura 1.3: Estrutura típica de um controlador fuzzy (PASSINO, 1998). ........................... 9 Figura 1.4: Representação da rede ANFIS (UCHINO, 1994). .......................................... 11 Figura 1.5: Representação de uma estrutura NFN. ............................................................ 12 Figura 1.6: Representação das funções de pertinência de uma estrutura NFN. ................. 12 Figura 2.1: Diagrama de blocos de um sistema controlado pelo ONFC. ........................... 16 Figura 2.2: Estrutura do controlador ONFC. ...................................................................... 16 Figura 2.3: Funções de pertinências complementares usadas no controlador ONFC. ....... 17 Figura 2.4: A) Controle de uma planta específica usando ONFC com proteção de reinicialização de pesos B) Evolução dos valores dos pesos ao longo do processo. ........................................................................................................... 26 Figura 2.5: Efeito da diferença entre os pesos em regime permanente. ............................. 28 Figura 2.6: A) Controle de uma planta genérica usando ONFC sem proteção de reinicialização de pesos B) Evolução dos valores dos pesos ao longo do processo. ........................................................................................................... 28 Figura 3.1: Planta de primeira ordem com atraso puro de tempo para avaliação de efeito a alteração do tempo integral. .............................................................................. 40 Figura 3.2: Resposta ao de ..... 41 .......................................................................................................................... 41 ..... 42 VII saída do controlador: ........................................................................................ 42 Figura 3.6: Diagrama da estrutura utilizada para avaliação do α adequado em função dos parâmetros das plantas. ..................................................................................... 45 Figura 3.7: Relação entre constante de tempo e sintonia do α. .......................................... 46 Figura 3.8: Evolução dos sinais de controle e pesos (1) e variação do desempenho das plantas usando as respectivas sintonias propostas para o α e variando a constante de tempo (2): ..................................................................................... 48 Figura 3.9: Relação entre tempo morto e sintonia do α. .................................................... 49 Figura 3.10: Evolução dos sinais de controle e pesos (1) e variação do desempenho das plantas usando as respectivas sintonias propostas para o α e variando o Tempo Morto (2): ......................................................................................................... 50 Figura 3.11: Relação entre ganho da planta e sintonia do α. .............................................. 52 Figura 3.12: Evolução dos sinais de controle e pesos (1) e variação do desempenho das plantas usando as respectivas sintonias propostas para o α e variando o ganho da planta (2): ..................................................................................................... 53 Figura 3.13: Efeito da variação da constante de tempo da planta no desempenho do controlador em relação a uma sintonia fixa. ..................................................... 55 Figura 3.14: Efeito da variação do tempo morto da planta no desempenho do controlador em relação a uma sintonia fixa. ........................................................................ 57 Figura 3.15: Efeito da variação do ganho da planta no desempenho do controlador em relação a uma sintonia fixa. .............................................................................. 58 Figura 3.16: Ilustração esquemática das plantas usadas para determinação dos α ótimos. 63 Figura 3.17: Resultados da etapa de treinamento da rede neural para definição de α ótimo: .......................................................................................................................... 64 Figura 3.18: Resultados da etapa de validação da rede neural para definição de α ótimo: 64 Figura 3.19: Estrutura da rede neural desenvolvida para determinação do α ótimo .......... 65 Figura 3.20: Resposta da planta com =100, TM=50 e G= 1.2 para a parametrização de α ótimo obtido usando a rede neural treinada. .................................................... 66 VIII Figura 3.21: Resposta da planta com  =20, TM=10 e G= 0.2 para a parametrização de α ótimo obtido usando a rede neural treinada. .................................................... 67 Figura 3.22: Resposta da planta com  =200, TM=150 e G= 2 para a parametrização de α ótimo ótimo obtido usando a rede neural treinada. ......................................... 67 Figura 4.1: Implementação do controlador ONFCDw para avaliação de controle e análise de parâmetros. ................................................................................................... 75 Figura 4.2: A) Resposta do controlador ONFCDw a aplicação de um sinal de referência do tipo onda quadrada; B) Evolução dos pesos e da saída do controlador; C) Evolução do ganho do controlador. .................................................................. 78 Figura 4.3: A) Resposta do controlador ONFC a aplicação de um sinal do tipo onda quadrada no setpoint; B) Evolução dos pesos e da saída do controlador; C) Evolução do ganho do controlador. .................................................................. 79 Figura 4.4: Saída do planta simulada no teste 1, com o controlador ONFC: ..................... 81 Figura 4.5: Simulação de destilação para avaliação do controlador ONFCDw. ................ 83 Figura 4.6: Variação de Set-Point no topo de três graus. ................................................... 85 Figura 4.7: Variação de Set-Point no fundo da torre. ......................................................... 85 Figura 4.8: Variação de pressão no controlador de pressão do topo de 6,8 para 7,4 kg/cm2. .......................................................................................................................... 85 Figura 4.9: Variação da vazão da carga de 1400 para 900m3/dia. ..................................... 86 Figura 4.10: Variação da temperatura do fluido quente do refervedor de fundo de 533 para 500K. ................................................................................................................ 86 Figura 4.11: Variação da composição de carga através de um aumento da proporção de propano e butano para 10% do volume total. ................................................... 86 Figura 5.1: Ilustração esquemática de uma planta genérica de Coqueamento Retardado. 89 Figura 5.2: Controle de temperatura da região de GOPK usando PID ajustado. ............... 91 Figura 5.3: Controle de temperatura da região de GOPK antes e depois da implementação do ONFCDw. .................................................................................................... 92 Figura 5.4: Correção de perturbação de processo e saída de controle: .............................. 94 IX Figura 5.5: Alteração do modo do controlador de PID para ONFC (trecho claro) e retorno para modo PID. ................................................................................................. 95 Figura 5.6: Efeito do ajuste dos pesos e a otimização da diferença entre os pesos. ........... 96 Figura 6.1: Estrutura de controle de pressão de topo baseado em Split-Range. ................ 98 Figura 6.2: Comparação entre o desempenho do PID e do ONFCDw para controle Split- Range simulado ................................................................................................ 99 Figura 6.3: Resposta do sistema para controladores ONFCDw com θ = 0.6, 0,4 e 0,2 respectivamente. ............................................................................................. 100 Figura 6.4: Curva características de válvulas (TALLES, 2001). ..................................... 102 Figura 6.5: Representação de uma unidade de destilação atmosférica com coluna pré-flash (FROZZA, 2005). ........................................................................................... 104 Figura 6.6: Representação de uma estrutura multivariável baseada no ONFCDw .......... 106 X Lista de Tabelas Tabela 1.1: Situação típica de malhas de controle ............................................................... 3 Tabela 3.1: Avaliação do α variando a constante de tempo da planta. .............................. 46 Tabela 3.2: Avaliação do  variando o tempo morto da planta. ........................................ 49 Tabela 3.3: Avaliação do variando o ganho da planta. ................................................... 51 Tabela 3.4: Análise de robustez da sintonia do α em relação à constante de tempo da planta ................................................................................................................ 54 Tabela 3.5: Análise de robustez da sintonia do α em relação ao tempo morto da planta .. 56 Tabela 3.6: Análise de robustez da sintonia do α em relação ao ganho da planta ............. 58 Tabela 3.7: Faixa de avaliação dos parâmetros das plantas ............................................... 61 Tabela 3.8: Parametrização da rede neural para determinação de α ótimo ........................ 65 Tabela 4.1:Comparação do desempenho do ONFC e do ONFCdw ................................... 76 Tabela 4.2: Resultados do teste de comparação entre os algoritmos ONFC e ONFCdw .. 80 Tabela 5.1: Avaliação baseada na variável de processo ..................................................... 93 Tabela 5.2: Avaliação baseada no erro entre variável de processo e valor de referência .. 93 XI Lista de Abreviaturas UFMG Universidade Federal de Minas Gerais. PID Algoritmo de controle com ação Proporcional, Integral e Derivativo. PI Algoritmo de controle com ação Proporcional e Integral. ONFC On line Neuro Fuzzy Controller. ONFCDw On line Neuro Fuzzy Controller modificado, com inclusão da ponderação entre a diferença dos pesos das funções de pertinências. Dw Diferença entre os pesos das duas funções de pertinências do ONFC e ONFCDw ANFIS Adaptative Neuro Fuzzy Interfece System. NFN Neo Fuzzy Neuron. Indiss Software de simulação dinâmica de processo desenvolvido pela RSI. GLP Gás liquefeito de petróleo. GOPK Gasóleo Pesado de Coque. ITAE Integral do erro absoluto. ITSE Integral do quadrado do erro. PIC/TIC Indicador controlador de pressão/temperatura. MPC Model predictive control. TM Tempo morto da planta. pH Potencial hidrogeniônico. XII Lista de Símbolos A(z), N(z) Operadores lineares e não lineares respectivamente. 𝜃 Taxa de aprendizagem do algoritmo ONFC ou (1-fator de esquecimento do algoritmo). 𝑤𝑖 Peso associado à função de pertinência i. 𝜇𝑖 Função de pertinência associada à característica linguística i. 𝑓 𝑥𝑖 Simbologia associada à uma função qualquer do parâmetro 𝑥𝑖 . 𝐸𝑡 , 𝑒 Erro entre uma variável a ser controlada e o valor de referência desejado. 𝛼𝑜 Passo do método do gradiente de ajuste dos pesos do ONFC e ONFCDw. 𝛼 Parâmetro de sintonia do controlador NFN, ONFC e ONFCDw. Determina o passo de ajuste dos pesos. EM Parâmetro do controlador ONFC. Está associado à região de excursão do erro entre a variável de processo e a variável de referência. 𝑒𝑚𝑎𝑥 Erro máximo esperado entre a variável de processo e o valor de referência. 𝑒𝑚𝑖𝑛 Erro mínimo esperado entre a variável de processo e o valor de referência. 𝑢 Ação de saída do controlador. 𝑦 Valor da variável de processo. 𝐽 Valor da função objetivo ou de custo. 𝑘, 𝑖 Variável usada como índices relativos. XIII 𝐾𝑝 Valor usado pelo controlador PI ou PID para definir a ação de controle associada ao erro entre a variável de processo e variável de referência. 𝐾𝑖 Valor usado pelo controlador PI/ PID para definir a ação de controle associada à integral do erro entre a variável de processo e variável de referência. 𝑡𝑖 Tempo integral. 𝜎 Desvio padrão. 𝜎2 Variância. 𝜎𝑟𝑢𝑖𝑑𝑜𝐵 Variação associada à ruídos de medição. Δ Delta de variação. 𝛽 Variável genérica de ajuste para redução da diferença entre os pesos das funções de pertinência. 𝐸 𝑒 Esperança matemática do erro. ep Erro associado à variações do processo decorrentes de perturbações e alteração de valor de referência.  Constante de tempo das plantas. K Relação de magnitude entre a variável manipulada e a saída da planta após estabelecimento da dinâmica entre as partes. 𝑕𝑖 Importância ou peso relativo da variável i no algoritmo de controle multivariável. 𝑠𝑡𝑖 Condição de ativação da variável i no algoritmo de controle multivariável. 𝑘1 𝑒 𝑘2 Constante de proporcionalidade usadas na função objetivo do algoritmo de determinação do alfa ótimo. XIV Sumário 1 Introdução .......................................................................................................................... 1 1.1 Motivação ........................................................................................................................ 1 1.2 Utilização e Aplicação de controladores ......................................................................... 4 1.3 Revisão Bibliográfica ...................................................................................................... 6 Controladores Neurais .................................................................................................. 6 Controladores Nebulosos ............................................................................................. 8 1.4 Proposta de Trabalho ..................................................................................................... 13 2 Análise e Contribuição ao Projeto do Controlador ONFC ......................................... 15 2.1 Avaliação do controlador ONFC ................................................................................... 15 Etapa de determinação da ação de controle ............................................................... 16 Etapa de ajuste de pesos ............................................................................................. 18 Análise matemática do controlador neurofuzzy ONFC ............................................. 20 2.2 Efeito do ajuste de pesos ............................................................................................... 25 2.3 Contribuição ao Projeto do Controlador ONFC ............................................................ 29 2.4 Minimização da esperança matemática do erro - E[e] .................................................. 30 2.5 Algoritmo baseado no ajuste por número de reversões ................................................. 32 2.6 Algoritmo baseado no método de redução de Dw2 ....................................................... 35 3 Análise do controlador ONFCDw ................................................................................... 39 3.1 Avaliação da influência do parâmetros α no desempenho do sistema .......................... 39 3.2 Sensibilidade do parâmetro α em relação às características de ganho, tempo morto e constante de tempo das plantas ..................................................................................... 44 3.3 Efeito da mudança das características da planta em relação a uma sintonia de alfa ..... 54 XV 3.4 Determinando o alfa ótimo ............................................................................................ 59 Metodologia ............................................................................................................... 60 Resultados .................................................................................................................. 63 3.5 Estabilidade ................................................................................................................... 68 3.6 Análise matemática da estabilidade do controlador ...................................................... 70 3.7 Conclusões Parciais ....................................................................................................... 73 4 Implementação prática do controlador ONFCDw– Metodologia ................................ 74 4.1 Implementação do algoritmo em simulações com sistemas lineares ............................ 75 Resultados .................................................................................................................. 77 4.2 Uso de simuladores fenomenológicos para análise de viabilidade de implementação do controlador ONFCDw .................................................................................................... 81 Resultados .................................................................................................................. 84 5 Implementação do ONFCDw em uma Unidade de Coqueamento Retardado ............ 88 5.1 Unidade de Coqueamento Retardado ............................................................................ 88 Situação inicial ........................................................................................................... 90 5.2 Resultados da Implementação do ONFCDW .................................................................. 92 6 Proposta de trabalhos futuros ........................................................................................ 97 6.1 Estratégia de controle utilizando “Split-Range” ........................................................... 98 6.2 Válvulas operando próximo à condição de saturação ................................................. 101 6.3 Válvulas com características não lineares ................................................................... 102 6.4 Sistemas multivariáveis ............................................................................................... 103 7 Conclusão ....................................................................................................................... 109 8 Referências Bibliográficas ............................................................................................ 112 1 Capítulo 1 1 Introdução 1.1 Motivação Historicamente a evolução e desenvolvimento da indústria sempre foram suportados por sistemas de controle automático. Desde os primórdios, sistemas automáticos são usados para substituir a ação do homem para execução das mais diversas tarefas. Sistemas que inicialmente eram basicamente engenhocas mecânicas, com o advento da tecnologia foram se tornando mais sofisticados e imprescindíveis. Em um mercado globalizado e competitivo, a busca por melhores resultados é uma rotina constante. As empresas a cada dia buscam melhorar seus processos, produtos e serviços de modo a garantir que seu produto seja atrativo e competitivo. Neste cenário é cada vez mais importante a confiabilidade dos sistemas e processos. Buscam-se tecnologias novas, mais limpas, produtos melhores e diferenciados, qualidade etc. Inevitavelmente estes novos desafios vêm acompanhados normalmente de um aumento de complexidade de processos e sistemas. Com mais informação disponível, instrumentação, analisadores e outros recursos, aumenta-se a capacidade de se conhecer o processo e de se implementar técnicas de controle com o intuito de obter máximo resultado dos sistemas existentes. No contexto exposto, os sistemas de controle de processo se mostram fundamentais para o bom desempenho do processo. Em uma visão mais global, busca-se uma maior eficiência no sistema integrado de controle, que se inicia na instrumentação de campo, seguidos de sistema supervisório, controle regulatório, etc (Figura 1.1). Nesta estrutura integrada, as camadas superiores são fortemente dependentes das anteriores. Figura 1.1: Sistema integrado de controle. Observa-se na Figura 1.1 que na base da pirâmide estão os sistemas de instrumentação e a estrutura de controle regulatório. Estes sistemas buscam monitorar e controlar variáveis de processos, permitindo a implementação das demais camadas do sistema integrado. Um baixo desempenho nesta camada impacta diretamente o negócio da empresa (Figura 1.2). Figura 1.2: Impacto do controle regulatório no resultado financeiro. Os métodos convencionais de controle automático baseados em controladores PID (Proporcional Integral Derivativo) são os mais usados por sua simplicidade, eficiência e por apresentarem base teórica bem desenvolvida e consolidada (OGATA, 2003). Entretanto, dificilmente encontram-se controladores bem sintonizados nos processos onde são utilizados. Estima-se que apesar do grau de importância do controle de processo para o resultado financeiro, cerca de 85% das malhas existentes nas indústrias apresenta desempenho insatisfatório (FONSECA, 2004). Uma melhor estratificação do problema pode ser vista na Tabela 1.1. Tabela 1.1: Situação típica de malhas de controle Situação levantada Percentual (%) Válvulas de controle com problemas 30 Parâmetros com sintonia incoerentes 30 Sintonia piorando o desempenho 85 Estratégia de controle inadequada 15 Controle em modo manual 30 Desempenho de malha insatisfatório 85 Malhas com melhor desempenho em automático do que em manual 25 Fonte: (FONSECA, 2004) Entretanto, controladores PID não são capazes de prover soluções para todo tipo de sistema. Em muitos casos a complexidade do sistema é grande, apresentando variação no tempo, tempo morto elevado, não-linearidades, dinâmica variante no tempo, etc. Neste cenário, tenta-se normalmente aproximar o comportamento do sistema por um modelo de sistema linear para aplicação de PIDs, com prejuízo de desempenho do sistema em malha fechada. Em função de problemas de desempenho, boa parte do controle é fortemente dependente da ação humana através de operadores experientes (REZNIK, 2000). Surge então a necessidade e interesse em controladores adaptativos, que buscam determinar os parâmetros a partir da identificação das características dos sistemas que se deseja controlar. Dentre as alternativas existentes estão os controladores nebulosos, neurais, neurofuzzy e outras técnicas clássicas baseadas em modelos determinísticos e estocásticos. 1.2 Utilização e Aplicação de controladores Desde os primórdios, os sistemas de controle foram desenvolvidos para substituir a ação do homem em suas atividades. O relógio d’água com controle automático de nível do grego Ktesibio, ano 270 AC, é o sistema automático mais antigo que se tem conhecimento. Os sistemas de controle se iniciaram baseados em sistemas simples, basicamente engenhocas mecânicas. Estes sistemas foram evoluindo, passando sequencialmente por princípios mecânicos, pneumáticos, hidráulicos, elétricos, eletrônicos, microprocessados, biológicos e mais recentemente sistemas inteligentes (FONSECA, 2004). O termo “controle de processos” costuma ser utilizado para se referir a sistemas que têm por objetivo manter certas variáveis em um determinado valor ou faixa desejável. Os sistemas de controle automático ainda podem ser divididos em sistemas operados manualmente, onde é necessária a figura do operador para definir a atuação do mecanismo, e em sistemas automáticos em malha fechada. No sistema de malha fechada surge a figura do “controlador” que através da comparação entre o valor desejado e o valor medido, manipula uma ou mais variáveis de forma a eliminar esta diferença. Desta forma, o controlador tem como objetivo manter a(s) variável(is) de interesse no valor desejável, rejeitando as possíveis perturbações externas e realizando os ajustes solicitados. O custo dos controles em malha fechada é a necessidade de se ajustar um controlador adequadamente. Um controlador mal ajustado ou impróprio pode piorar a condição de controle do sistema, podendo levar o mesmo a se tornar instável. O controlador mais utilizado é sem dúvida do tipo Proporcional-Integral-Derivativo (PID). Este controlador é bastante popular em função de sua simplicidade e aplicabilidade em diversos sistemas. Disponível em praticamente todos os sistemas de controle e supervisão de plantas dinâmicas, este algoritmo apresenta teoria bastante explorada e difundida. Apesar da maioria dos processos serem intrinsecamente não lineares, o uso deste tipo de controlador basea-se na consideração de que, em torno do ponto típico de operação, o sistema se comporta de maneira aproximadamente linear. Esta premissa funciona bem em grande parte dos processos, para uma determinada janela de tempo e operação, a partir da qual normalmente se faz necessária uma ressintonia do controlador. Observa-se, entretanto, que por sua característica linear, este controlador apresenta limitações de aplicabilidade e necessidade de sintonia periódica para manter um bom desempenho. Estudos (FONSECA, 2004 e TORRES, 2005) mostram que mesmo sendo amplamente utilizados, a maioria dos controladores PID apresentam baixo desempenho. Esta avaliação é comprovada pela experiência prática onde se notam varias situações em que controladores são colocados em modo manual ou são sintonizados com ganhos extremamente pequenos, para “não perturbarem” o processo. Dentre os diversos motivos do baixo desempenho podemos citar: 1. A dificuldade de se conhecer o sistema que se deseja controlar e, por consequência, de se fazer uma sintonia adequada; 2. As mudanças naturais dos sistemas ao longo do tempo, decorrente de desgastes de atuadores, sensores, alterações de condições operacionais, etc; 3. Plantas não-lineares operando em vários pontos de operação; 4. Estratégias de controle inadequadas; 5. Plantas e processos multi-objetivos. Apesar de menos difundidos, existe um grande número de pesquisas e aplicações de controladores baseados em outras tecnologias. Dentre elas, um campo que vem se desenvolvendo consideravelmente é o uso de inteligência computacional aplicada a controle. Destaca-se nesta linha controladores baseados em redes neurais, lógica fuzzy e controladores neuro-fuzzy. 1.3 Revisão Bibliográfica Controladores Neurais A teoria de inteligência computacional vem sendo amplamente estudada, se mostrando como uma alternativa para projetos de controladores e modelos convencionais. O uso de técnicas neurais permite, sem conhecimento profundo dos sistemas, obter modelos e controladores que apresentam um “bom” desempenho. Com o desenvolvimento do algoritmo de retropropagação do erro (backpropagation) começou-se a utilização de redes neurais artificiais em controle de processo. As características de aproximador universal, capacidade de trabalhar com sistemas com múltiplas entradas e saídas e facilidade relativa de identificação dos sistemas atraem o interesse de uso deste tipo de estrutura como controladores. A partir destas características é possível obter um algoritmo de controle adequado para o processo de interesse, sem a necessidade de se conhecer a fundo o modelo matemático do mesmo. Entre as desvantagens podemos citar a dificuldade de interpretação física das redes neurais, sobreparametrização e o dilema entre variância e bias (BRAGA, 2000). Convém distinguir entre duas categorias de sistemas de controle:  Sistemas de controle dinâmicos, onde existe uma planta cujas variáveis evoluem de acordo com um sistema de equações diferenciais especificadas por leis físicas. Tem-se como objetivo controlar a evolução destas variáveis ao longo o tempo.  Sistemas de controle supervisor onde o controlador, embora possa ter módulos dinâmicos, tem como objetivo a temporização, sincronização e intertravamento de eventos que decorrem do processo. Busca-se nestes casos índices globais de desempenho, especificação, segurança etc (BRAGA, 2000). O desenvolvimento de um projeto de controlador está intimamente ligado à descrição dinâmica da planta. Isto nos leva a um problema de identificação de sistemas. Como um primeiro passo, assume-se uma estrutura adequada e, mediante um algoritmo apropriado busca-se um modelo. À medida que se aumenta a complexidade dos sistemas considerando-se as não-linearidades envolvidas, observações imprecisas e ruidosas, algoritmos algébricos podem não apresentar bom desempenho, sendo interessante o emprego de outras técnicas. A literatura de identificação de sistemas não lineares é extensa. A publicação de Narendra e Parhasarathy (NARENDRA, 1990) apresenta de forma clara o problema de aplicabilidade de redes neurais na identificação e controle de sistema dinâmicos. Em seu trabalho, são propostos quatro modelos básicos com operadores lineares A(z) e não lineares N(z). Para a identificação adequada dos parâmetros do operador linear A(z) e das redes neurais N(z), Narendra e Parthrasaraty propuseram a utilização do método do gradiente que resultará em um algoritmo de retropropagação. Todavia tratava-se de uma retropropagação sobre uma matriz dinâmica variável em função das particulares sequências de entradas aplicadas à planta. A este tipo de algoritmo Narendra e Parthrasaraty chamaram de retropropagação dinâmica. Para a retropropagação dinâmica considera-se uma representação em espaço de estados conforme apresentado a seguir: 𝑥 𝑘 + 1 = 𝜑 𝑥 𝑘 ,𝑢 𝑘 ,𝑊 , 1.1 𝑦 𝑘 = 𝛹 𝑥 𝑘 . 1.2 Onde x(k+1) representa o estado e 𝒚 𝒌 a saída do sistema. Lembrando que o erro quadrático é obtido por: 𝐸 𝑊 = 𝑦 𝑘 − 𝑦 𝑘 2 2 . 1.3 Os elementos do gradiente de E(W) em relação aos parâmetros 𝑤𝑖 , ressultam em: 𝛿𝐸 𝑊 𝛿𝑤 𝑖 = −1 𝑦 𝑘 − 𝑦 𝑘 𝛿𝑦 (𝑘) 𝛿𝑤 𝑖 . 1.4 Através das derivadas parciais do erro quadrático em relação aos parâmetros 𝑤𝑖 , é feito o ajuste do modelo dinâmico. Conclui-se desta forma, que a diferença essencial entre a retropropagação estática e dinâmica está no cálculo da derivada 𝑦 𝑤𝑖 𝑘 , que no modelo dinâmico evolui segundo uma equação de estado (KOVÁCS, 1996). Esta mesma estrutura pode ser aplicada para o ajuste dos pesos de controladores. São inúmeros trabalhos com controladores neurais com bons resultados. A despeito das características positivas e do bom desempenho, um problema recorrente ainda decorre do fato das redes neurais trabalharem como “caixas pretas”. Esta característica pode não ser interessante para quem deseja interpretar a estrutura física e saída do controlador, ou mesmo avaliar possíveis limites da estrutura da rede neural. Controladores Nebulosos Técnicas nebulosas também são alternativas para configuração de sistemas de controle. Esta técnica busca mapear, através de estruturas linguísticas, os controladores desenvolvidos. Conforme apresentado em Pires (PIRES, 2007): “A lógica nebulosa tem sido vastamente aplicada em controle desde que a teoria dos conjuntos nebulosos foi introduzida por Zadeh (1965). Mamdani (1976) foi um dos pioneiros em utilizar lógica nebulosa em controle e demonstrou as vantagens em utilizar a linguagem natural para desenvolver controladores. Desde então, a lógica nebulosa vem sendo aplicada com bastante sucesso em uma vasta gama de aplicações.” Apesar das facilidades de implementação e compreensão das funções linguísticas, um modelo puramente nebuloso esbarra em perdas e imperfeições quando não aplicado um treinamento adequado com dados reais. Uma estrutura de controle de um controlador nebuloso pode ser definida conforme a Figura 1.3. Figura 1.3: Estrutura típica de um controlador fuzzy (PASSINO, 1998). Na estrutura acima observa-se um controlador em malha fechada. As entradas do algoritmo são as saídas da planta e o sinal de referência. Estas informações passam por uma etapa de fuzzificação. As informações linguísticas são então processadas em função de uma estrutura de regras nebulosas e posteriormente são defuzzificadas, definindo a saída do controlador. O controlador pode conter apenas a informação de erro ou incluir também outras informações como derivadas do erro e variáveis de perturbação externa. Este tipo de processamento pode ser facilmente obtido com inclusão de algumas funções de pertinência e regras. Pode-se também definir múltiplas variáveis de saídas. Pode-se dizer que as duas fontes principais de informação para a construção de um bom controlador são as medições e o conhecimento de especialistas humanos sobre o sistema. As informações numéricas, obtidas dos sensores, e as informações linguísticas disponíveis devido ao conhecimento do especialista, juntas constituem uma base mais ampla. Mesmo em sistemas de difícil modelagem via métodos clássicos, pode-se tirar algumas conclusões do tipo “se isto acontece, então” e o grande desafio é usar o conhecimento linguístico de maneira científica. Um sistema fuzzy adaptativo ou neuro-fuzzy é definido como uma estrutura fuzzy com um algoritmo de treinamento. A estrutura lógica de raciocínio é construída em função do conhecimento linguístico e seus parâmetros são ajustados por um algoritmo de treinamento. Pode-se citar duas estratégias aplicadas a sistemas fuzzy adaptativos:  Construção da estrutura linguística e posterior ajuste de parâmetros baseado em informações numéricas;  Uso de informações numéricas e linguísticas para construção de duas estruturas fuzzy separadas, com subseqüente integração para se obter uma combinação das duas como estrutura final. Uma das classes de estruturas neurofuzzy bastante difundida são as redes ANFIS (Adaptative Neuro-Fuzzy Inference System) (JANG, 1997). Existem diversas aplicações de redes ANFIS bem sucedidas, incluindo sistemas de controle. O trabalho original apresenta como desvantagem o fato de que as regras (neurônios) aumentam exponencialmente com o número de entradas, o que pode implicar em uma estrutura relativamente complexa, além da possibilidade de demandar um considerável esforço computacional. Redes NFN (Neo Fuzzy Neuron) (YAMAKAWA, 1992) apresentam uma estrutura bem mais simples, tendo sido utilizadas com sucesso em diversas aplicações, destacando-se trabalhos na área de identificação de falhas em sistemas dinâmicos, identificação e predição de variáveis. Nesta estrutura o número de regras ativas varia linearmente com o número de entradas. Shing e Jang (SHING, 1993) apresentaram uma representação em forma de rede de uma estrutura fuzzy. Separando o algoritmo em cinco camadas, obtém-se respectivamente: 1ª camada: Funções linguísticas de pertinência dos dados de entrada. Os parâmetros das funções de pertinências são definidos como parâmetros de ajuste; 2ª camada: Operadores T-Norma, (na Figura 1.4 é usado o produtório); 3ª camada: Normalização das saídas da camada anterior; 4ª camada: Regra da camada de saída. Em seu artigo é usada a estrutura fuzzy Sugeno. Desta forma, esta camada é relativa às funções de saída do modelo. Os parâmetros de saída são ajustáveis; 5ª camada: Somatório das funções de saída. Figura 1.4: Representação da rede ANFIS (UCHINO, 1994). A partir da estrutura definida para ANFIS usa-se algoritmos de ajustes de pesos. Dentre as propostas apresentadas em seu trabalho Shing sugere o uso do algoritmo de retropropagação e/ou o uso do algoritmo de mínimos quadrados para definição dos parâmetros iniciais da última camada para posteriormente empregar o algoritmo de retropropagação. As características não-lineares dos modelos nebulosos com a capacidade de aprendizagem das redes fazem desta uma aplicação de sucesso na modelagem de sistemas complexos ou controladores. São mostradas ainda várias aplicações bem sucedidas do emprego do ANFIS (SHING, 1993). No trabalho original sobre ANFIS propõe-se uma estrutura onde todas as funções de pertinência da primeira camada estão conectadas e participam do processo de treinamento. Observa-se que nesta condição o incremento de uma função linguística ou variável aumenta consideravelmente a complexidade do sistema. Isto leva a um esforço computacional alto, sendo este um dos pontos fracos deste algoritmo. Em aplicações como controladores, onde o tempo de processamento é crítico para o bom desempenho, este fator pode ser bastante restritivo. A estrutura NFN (Neo Fuzzy Neuron), primeiramente proposta por Yamakawa (YAMAKWA, 1992), possui características de transferências sinápticas não-lineares onde a sinapse é realizada por um conjunto de regras fuzzy do tipo Sugeno de ordem zero (Figura 1.5). As funções de pertinências são construídas contemplando toda a faixa das variáveis de entrada correspondentes. As funções de pertinência triangulares são construídas de forma a serem complementares em relação às suas vizinhas (Figura 1.6). Com isto, para qualquer entrada ativa-se no máximo duas funções de pertinência e a soma destas duas funções é sempre igual a um (equação 1.5 e equação 1.6). Em função desta característica a etapa de defuzzificação baseada no método do centróide não precisa do termo de divisão. Alguns trabalhos apresentam variações desta metodologia, como por exemplo, estruturas com funções de pertinências diferenciadas por região (CHATURVEDI, 2008). )( 11 xf f xi i( ) xi f xn n( ) xn  y   i ix1   ip ix xi  yi   ij ix w i1 w ij wip  y1 yn y i Fuzzificação Defuzzificação x1 Figura 1.5: Representação de uma estrutura NFN. 𝜇𝑖𝑗 + 𝜇𝑖𝑘𝑖+1 = 1 1.5 𝑓𝑖 𝑥𝑖 = 𝜇𝑖𝑘𝑗 𝑥𝑖 𝑤𝑖𝑘𝑖 + 𝜇𝑖𝑘𝑖+1 𝑥𝑖 𝑤𝑖𝑘𝑖+1 𝜇𝑖𝑘𝑖 𝑥𝑖 + 𝜇𝑖𝑘𝑖+1 𝑥𝑘 = 𝜇𝑖𝑘𝑖 𝑥𝑖 𝑤𝑖𝑘𝑖 + 𝜇𝑖𝑘𝑖+1 𝑥𝑖 𝑤𝑖𝑘𝑖+1 1.6  i ix1  i ix2  ip ix1  ip ix xi ximin x i m a x    Figura 1.6: Representação das funções de pertinência de uma estrutura NFN. No processo de aprendizagem utiliza-se a técnica de retropropagação do erro. Observa-se que apenas as funções ativas são relevantes durante este processo, segundo o método de retropropagação. Assim, só um ou dois pesos correspondentes aos ramos ativos são ajustados durante um passo de treinamento do NFN. Devido à este mecanismo, uma rede NFN exibe um tempo de treinamento muito menor do que uma rede convencional, além de uma simplicidade muito maior (GOUVÊA, 2005). O método de aprendizagem consiste nos ajustes dos pesos, tal que: 𝑤𝑖𝑘𝑖 𝑗+1 = 𝑤𝑖𝑘𝑖 𝑗 − 𝛼𝑗 𝜕𝐸𝑡 𝑤𝑖𝑘𝑖 𝑗 𝜕 𝑤𝑖𝑘𝑖 𝑗 , 1.7 resultando em: 𝑤𝑖𝑘𝑖 𝑗+1 = 𝑤𝑖𝑘𝑖 𝑗 − 𝛼𝑗 𝑦𝑡 𝑗 − 𝑦𝑑 𝑗 𝜇𝑖𝑘𝑖 𝑥𝑡𝑖 . 1.8 O termo 𝛼𝑗 está relacionado ao tamanho do passo de otimização e pode ser determinado empiricamente ou por algum método de busca (GOUVÊA, 2005 e CAMINHAS, 1998). Gouvêa, em sua tese de doutorado (GOUVÊA, 2005), propõe um controlador neurofuzzy de estrutura simples denominado ONFC. Este controlador de baixa complexidade computacional, baseado em apenas duas regras, apresenta características adaptativas e já foi implementado com sucesso em aplicações como, por exemplo, no controle de um motor de Indução (GOUVÊA, 2005) e em um sistema de controle de pH (CARVALHO, 2006). O controlador ONFC também foi estudado por Pires (PIRES, 2007). Em seu trabalho Pires faz uma análise matemática do controlador, apresentando suas principais características e seus componentes. 1.4 Proposta de Trabalho São inúmeros os trabalhos de aplicação de inteligência artificial para controle das mais diversas plantas e sistemas (PHAN, 2008; SJÖBERG, 2009; SOUSA, 1999; CHEN, 1999; YING, 2007; ASILTÜRK, 2008 e CHENA, 2007). Normalmente estas técnicas são aplicadas a sistemas complexos onde os controles típicos baseados em PID e outras técnicas clássicas falharam. A aplicação deste tipo de técnica engloba inclusive sistemas de ajuste e sintonia on- line de controladores PID como vemos no trabalho de Reznik (REZNIK, 2000) onde controladores fuzzy buscam ajustar os parâmetros do controlador PID dinamicamente, em função das características do sistema. Outras configurações são apresentadas usando lógica fuzzy para complementar a ação do PID, para fazer um pré-tratamento do sinal de erro, etc. Estas várias aplicações bem sucedidas aumentam o interesse em tais tecnologias. Mesmo assim ainda se observa resistência em implementações mais massivas dos algoritmos fuzzy, neurais, etc. Essa resistência talvez decorra do fato de tais técnicas ainda não terem atingido uma massa crítica, ou talvez pela falta de conhecimento. Fato é que a aplicação ainda se mostra tímida e pontual em grande parte das indústrias. Em função disto, algoritmos mais simples e mais genéricos são sempre interessantes. A simplicidade, associada ao bom desempenho, é um bom caminho para o desenvolvimento e a utilização em larga escala. O presente trabalho tem como questão principal a implementação, desenvolvimento e avaliação de desempenho de um controlador adaptativo baseado em sistemas neurofuzzy aplicado a plantas industriais não lineares. Além disto, busca-se um aprofundamento do entendimento do controlador ONFC com uma avaliação de condição de estabilidade. É proposto um método de ajuste dos parâmetros do controlador, bem como o desenvolvimento de técnicas capazes de corrigir limitações observadas em versões anteriores, como a divergência dos pesos das funções de pertinência. Propõe-se então uma otimização dos pesos baseada não somente no erro total do sistema, mas também no erro associado ao aumento desta diferença, que será definido como Dw. Busca-se também a implementação do ONFC modificado, ou ONFCDw, em um sistema de controle de temperatura de uma seção intermediária da torre de fracionamento principal de uma unidade de Coqueamento Retardado. Capítulo 2 2 Análise e Contribuição ao Projeto do Controlador ONFC 2.1 Avaliação do controlador ONFC Buscando a implementação de um algoritmo para controle on-line, Gouvêa (GOUVÊA, 2005) apresenta em seu trabalho o algoritmo ONFC (on-line neurofuzzy controller). Baseado na estrutura NFN, o ONFC apresenta uma estrutura bastante simplificada com apenas duas funções de pertinência complementares. Sua estrutura simples apresenta um custo computacional baixo, da mesma ordem de grandeza de um controlador PID. Aplicado em processos com características distintas, como controle vetorial de motor de indução (GOUVÊA, 2005) e controle de pH em processos de neutralização (CARVALHO, 2006), este controlador vem apresentando bons resultados. As características citadas são importantes para a aplicação on-line deste controlador. O controlador apresenta apenas duas funções de pertinência triangulares e complementares. O erro entre o valor desejado e o valor atual é utilizado tanto para determinação da ação de controle, quanto para correção dos seus pesos (parâmetros livres). A Figura 2.1 apresenta um diagrama de blocos de um sistema genérico usando o controlador ONFC. A Figura 2.2 apresenta a estrutura interna do ONFC. Figura 2.1: Diagrama de blocos de um sistema controlado pelo ONFC. Figura 2.2: Estrutura do controlador ONFC. O processamento dos sinais pode ser separado em duas etapas: determinação da ação de controle e ajuste dos pesos do controlador. Etapa de determinação da ação de controle Na etapa de determinação da ação de controle, o sinal do erro é usado para determinar os valores das duas funções de pertinência. A estrutura do controlador é definida com duas funções de pertinência complementares entre si, o que minimiza ainda mais a complexidade do algoritmo. Uma vez calculado o valor de uma função de pertinência, a outra poderá ser PROCESO definida por diferença. A Figura 2.3 ilustra a estrutura proposta para as funções de pertinências. Figura 2.3: Funções de pertinências complementares usadas no controlador ONFC. Os cálculos das funções de pertinências µ1 e µ2 são determinados segundo as equações 2.1 e 2.2: 𝜇1 = maxmin 2 eee EM eEM   0 maxee  1 𝑒 ≤ 𝑒𝑚𝑖𝑛 2.1 𝜇2 = maxmin 2 eee EM EMe   0 minee  1 𝑒 ≤ 𝑒𝑚𝑎𝑥 2.2 Ou simplesmente, 𝜇2 = 1 − 𝜇1 2.3 Onde, 𝐸𝑀 = 𝑒𝑚𝑎𝑥 − 𝑒min 2 , 2.4 𝑒 = 𝑦𝑑 − 𝑦. 2.5 Os valores de emin e emax são definidos em função do processo. Diferentemente do caso do NFN, estes parâmetros não representam necessariamente todo o universo possível de excursão do erro (e). Estes parâmetros são ajustáveis e normalmente são configurados de forma a representar uma faixa viável de excursão do erro. A configuração pode ser feita com base em estatísticas, usando o desvio padrão da variável erro (𝜃𝑒𝑟𝑟𝑜 ). Sugere-se um ajuste conforme apresentado na equação 2.6. 𝐸𝑀 = 3 𝜃𝑒𝑟𝑟𝑜 2.6 Mais à frente será feita uma abordagem mostrando a influência desta variável para o controlador. É importante salientar que mesmo fora dos limites emin e emax as funções continuam válidas, apresentando valores um ou zero. A saída do controlador é definida segundo um modelo Sugeno de ordem zero. Usa-se a regra do centróide para definição do valor. Como as funções de pertinências são complementares, o cálculo é reduzido para: 𝑢 = 𝜇1𝑤1 + 𝜇2𝑤2. 2.7 Etapa de ajuste de pesos O princípio de ajuste de pesos é a minimização da função definida como sendo o erro quadrático. 𝐽 = 1 2 𝑦𝑑 − 𝑦 2 𝑜𝑢 𝐽 = 1 2 𝑒 2. 2.8 Derivando a equação anterior em relação aos pesos teremos, respectivamente: 𝜕𝐽 𝜕𝑤1 = 𝜕𝐽 𝜕𝑒 𝜕𝑒 𝜕𝑦 𝜕𝑦 𝜕𝑢 𝜕𝑢 𝜕𝑤1 , 2.9 𝜕𝐽 𝜕𝑤2 = 𝜕𝐽 𝜕𝑒 𝜕𝑒 𝜕𝑦 𝜕𝑦 𝜕𝑢 𝜕𝑢 𝜕𝑤2 . 2.10 Desenvolvendo as relações apresentadas, chega-se ao cálculo do gradiente da função custo. O desenvolvimento para o segundo termo será omitido por ser análogo. 𝜕𝐽 𝜕𝑒 = 2 1 2 𝑒 = 𝑒, 2.11 𝜕𝑒 𝜕𝑦 = 𝜕(𝑦𝑑 − 𝑦) 𝜕𝑦 = −1, 2.12 𝜕𝑢 𝜕𝑤1 = 𝜕 𝜇1𝑤1 + 𝜇2𝑤2 𝜕𝑤1 = 𝜇1. 2.13 A derivada 𝜕𝑦 𝜕𝑢 representa a variação da saída da planta em relação à entrada. No trabalho originalmente proposto por Gôuvea, esta derivada é incorporada à taxa de aprendizagem determinando o sinal da mesma (equação 2.14). Caso a planta apresente ganho estático positivo em relação à variável de saída do controlador este termo será positivo. Caso contrário, a variável de determinação da taxa de amostragem deverá ter sinal negativo. 𝛼 = 𝛼𝑜 𝜕𝑦 𝜕𝑢 . 2.14 Obtém-se, ao final, o gradiente da função objetivo que se deseja minimizar. O ajuste dos pesos é então realizado no sentido oposto ao gradiente, resultando na equação 2.15. 𝑤1 𝑘 + 1 = 𝑤1 𝑘 − 𝛼 𝜇1 −1 𝑒 2.15 Ou simplesmente: 𝑤1 𝑘 + 1 = 𝑤1 𝑘 + 𝛼𝜇1𝑒. 2.16 Gouvêa (GOUVÊA, 2005) apresenta ainda uma análise de convergência/divergência baseado na tendência do controlador de atingir um erro nulo, o que levaria a uma interrupção nos ajustes de pesos e consequentemente na ação de saída do controlador. Análise matemática do controlador neurofuzzy ONFC O controlador ONFC foi estudado também por Pires em sua dissertação de mestrado (PIRES, 2007). Naquele trabalho, o algoritmo de controle é apresentado de forma a separar as principais componentes deste controlador e avaliar alguma de suas características. Segundo Pires, observando a lei de controle do ONFC vê-se que a saída do controlador pode ser representada pela seguinte função quando o erro está entre emin e emax: 𝑢𝑘 = 𝐸𝑀 − 𝑒𝑘 2𝐸𝑀 𝑤1 + 𝑒𝑘 + 𝐸𝑀 2𝐸𝑀 𝑤2. 2.17 Manipulando um pouco mais a equação anterior, chegamos à equação 2.18 onde se pode observar claramente um primeiro termo proporcional ao erro e um termo de polarização. Observa-se que o termo proporcional do controlador é relacionado diretamente à diferença entre os pesos das respectivas funções de pertinência, enquanto o termo polarizado reflete a soma dos mesmos. 𝑢𝑘 = 𝑤2 − 𝑤1 2𝐸𝑀 𝑒𝑘 + 𝑤1 + 𝑤2 2 2.18 A regra de atualização dos pesos apresentada na equação 2.19 mostra-se como uma função incremental, associada ao erro. 𝑤𝑖 𝑘 + 1 = 𝑤𝑖 𝑘 + 𝛼𝜇𝑖𝑘𝑒𝑘 . 2.19 Ao longo do tempo, pode-se reescrever, para um instante de tempo n: 𝑤𝑖 𝑛 = 𝑤𝑖 0 + 𝛼𝜇𝑖𝑘𝑒𝑘 . 𝑛 𝑘=1 2.20 Substituindo 2.19 em 2.18 teremos 𝑢𝑛 = 𝑤2 0 −𝑤1 0 + 𝛼𝑒𝑘(𝜇2𝑘 − 𝜇1𝑘) 𝑛 𝑘=1 2𝐸𝑀 𝑒𝑛 + 𝑤1 0 +𝑤2 0 + 𝛼𝑒𝑘(𝜇1𝑘 + 𝜇2𝑘) 𝑛 𝑘=1 2 . 2.21 Pode-se ainda substituir a diferença entre as funções de pertinência sendo esta equivalente: 𝜇2𝑘 − 𝜇1𝑘 = 𝑒𝑘 + 𝐸𝑀 2𝐸𝑀 − 𝐸𝑀 − 𝑒𝑘 2𝐸𝑀 = 𝑒𝑘 𝐸𝑀 . 2.22 Observe ainda que a soma das duas funções de pertinência é igual a um para qualquer instante k, ou seja: 𝜇2𝑘 + 𝜇1𝑘 = 1. 2.23 Por fim, substituindo 2.22 em 2.21 chega-se à equação 2.24. 𝑢𝑛 = 𝛼 𝑒𝑘 2𝑛 𝑘=1 2𝐸𝑀2 𝑒𝑛 + 𝛼 𝑒𝑘 𝑛 𝑘=1 2 + 𝑤2 0 −𝑤1 0 2𝐸𝑀 + 𝑤1 0 +𝑤2 0 2 . 2.24 Os termos w1(0) e w2(0) são constantes relacionadas ao modo de inicialização dos pesos. Desta forma pode-se, por fim, simplificar a equação 2.24, representando-a conforme a equação 2.25. 𝑢𝑛 = 𝛼 𝑒𝑘 2𝑛 𝑘=1 2𝐸𝑀2 𝑒𝑛 + 𝛼 2 𝑒𝑘 𝑛 𝑘=1 + 𝑐𝑡𝑒. 2.25 Pode-se ver que o ONFC se assemelha bastante a um controlador PI adaptativo (eq. 2.25). Pode-se separar então os termos das equações e chegar a uma analogia com os parâmetros do controlador PI: 𝐾𝑝 ≅ 𝛼 𝑒𝑘 2𝑛 𝑘=1 2𝐸𝑀2 , 2.26 𝐾𝑖 ≅ 𝛼 2 . 2.27 Nesta estrutura é possível identificar o comportamento do parâmetro proporcional (equação 2.26) e do parâmetro integral (equação 2.27). O parâmetro proporcional é diretamente relacionado à magnitude de 𝜶 e inversamente proporcional ao dobro do quadrado da faixa EM onde as funções de pertinências são definidas. A avaliação matemática apresentada permite uma avaliação pontual da ação do controlador. Fazendo-se uma analogia a controladores PI temos uma melhor compreensão do algoritmo, facilitando a definição dos parâmetros como 𝜶. Ressalta-se ainda que as aplicações recentes mostram que a sintonia desse controlador não é difícil e pode ser realizada apenas com conhecimento da direção do ganho estático da planta em função da variável manipulada e conhecimento intuitivo sobre a dinâmica da planta. Em termos de estabilidade, trabalhos com 𝜶 pequenos (da ordem de 10-2) tendem a apresentar pouca tendência à instabilidade e são recomendados para dinâmicas de velocidade baixas. Valores altos de 𝜶 (superiores a ordem de 10-1) tendem a gerar um controlador mais agressivo e ajustes mais rápidos, podendo, porém gerar aumento rápido dos pesos das funções de pertinências, distanciamento entre os dois pesos com consequentes problemas de instabilidades. Um aumento grande da diferença entre os pesos das funções de pertinência pode ser interpretado analogamente ao aumento do ganho proporcional de um controlador PI, assim como um valor alto de 𝜶 (alfa) guarda relação com o aumento da ação integral, porém vale ressaltar que esta também influenciará a parcela proporcional do controlador. O ONFC apresenta características bastante interessantes de desempenho. Em suas aplicações recentes, observa-se bom desempenho e capacidade adaptativa. Entretanto, existem limitações no desenvolvimento inicialmente proposto por Gôuvea (GOUVÊA, 2005). Talvez a limitação mais visível seja a tendência de aumento constante da diferença entre os pesos das duas funções de pertinências. Esta tendência é evidenciada pelo algoritmo de aprendizagem. Observando a equação 2.19 de ajuste dos pesos nota-se que a correção é diretamente proporcional ao erro e à pertinência. A variação da diferença entre os pesos é definida então como: ∆𝐷𝑤 𝑘 = ∆𝑤2 𝑘 − ∆𝑤1 𝑘 , 2.28 Lembrando que: ∆𝐷𝑤 𝑘 = 𝛼𝜇2𝑒 − 𝛼𝜇1𝑒, 2.29 Manipulando a equação 2.29: ∆𝐷𝑤 𝑘 = 𝛼𝑒 𝜇2 − 𝜇1 , 2.30 Chega-se finalmente à equação que determina a evolução de ∆𝐷𝑤 𝑘 como: ∆𝐷𝑤 𝑘 = 𝛼 𝑒 𝜇2 − 𝜇1 , 𝑒 > 0; 𝛼 𝑒 𝜇1 − 𝜇2 , 𝑒 < 0; 2.31 Pela Figura 2.3 e equações 2.1 e 2.2 sabe-se que: 𝜇2 − 𝜇1 > 0 𝑠𝑒 𝑒 > 0, 𝜇1 − 𝜇2 > 0 𝑠𝑒 𝑒 < 0. 2.32 Desta forma fica evidente que a diferença entre os pesos é sempre crescente. Este aumento constante da diferença leva a um problema de estabilidade. Como mencionado anteriormente, a diferença entre os pesos guarda semelhanças com o termo proporcional de um controlador PI. À medida que este termo aumenta, o controlador tende a se aproximar de uma região instável. Pequenas variações na variável de processo levam a ações bruscas na variável manipulada. Nesta condição é necessária uma ação de ajuste dos pesos. Como sempre ocorrerá um aumento da diferença dos pesos, chaga-se à conclusão que é necessário um processo de redução desta diferença. Em seu trabalho, Gouvêa propõe um ajuste baseado na ponderação dos pesos conforme equação 2.33 (GOUVÊA, 2005). 𝑤1 𝑘 = 𝑢 − 𝑤2 𝑘 (1 − 𝜇1) 𝜇1 2.33 Esta solução, aparentemente simples e trivial, apresenta dois problemas crônicos. O primeiro é a falta de um critério para definir o momento adequado para efetuar a correção. Esta condição é singular para cada planta. Para sistemas variantes no tempo ou não-lineares esta condição pode, inclusive, ser dependente do ponto de operação do sistema ou condição da planta. Isto torna difícil a definição exata do momento adequado para efetuar a correção. O segundo problema notado está no próprio método de ajuste uma vez que o termo 𝜇1 pode apresentar valores entre 0 e 1. Quando o termo de pertinência de um dos pesos tende a zero, a função apresenta uma instabilidade numérica (equação 2.34). lim 𝜇 𝑖→0 𝑤𝑖 𝑘 = lim 𝜇 𝑖→0 𝑢(𝑘) −𝑤𝑗 𝑘 (1 − 𝜇𝑖) 𝜇𝑖 = ∞ 2.34 Esta condição seria bastante crítica, levando o algoritmo a um erro numérico com consequências sérias. Em seu trabalho, GOUVÊA propõe, como condição para efetuar o ajuste, que µi ≠ 0. Mesmo quando 𝜇𝑖 > 0, pode-se ter problemas caso 𝜇𝑖 seja pequeno. O novo valor calculado para 𝑤𝑖 𝑘 pode ser inconsistente (por exemplo: w1> w2 em uma planta de resposta direta). Esta condição poderia inverter a ação de controle na próxima iteração, o que também poderia ser tratado com a inclusão de mais uma lógica de segurança. Uma solução encontrada foi realizar uma reinicialização dos pesos (CARVALHO, 2006). Baseando-se no conhecimento da planta é definido um valor limite para os pesos w1 e w2. Quando este limite é atingido, os dois pesos são reinicializados com o valor da saída do controlador. 𝑠𝑒 𝑤𝑖𝑢𝑙𝑡𝑟𝑎𝑝𝑎𝑠𝑠𝑎𝑟 𝑙𝑖𝑚𝑖𝑡𝑒 → 𝑤1 = 𝑢 𝑘 , 𝑤2 = 𝑢 𝑘 . 2.35 Esta condição evita os problemas de ordem numérica apresentados anteriormente ou a necessidade de se implementar muitas lógicas de segurança, mas não soluciona a questão da influência negativa de se perder a informação de aprendizagem exatamente no momento em que o erro é significativo. Mesmo se o ajuste não ocorrer durante um transiente forte, as pequenas perturbações levarão a um aumento gradativo da diferença entre os pesos e em algum momento será necessário o ajuste. Nesta condição depara-se com outro problema, pois após a reinicialização dos pesos, o algoritmo terá que recomeçar o processo de aprendizagem. Observa-se que a variação da diferença dos pesos é diretamente proporcional ao módulo do erro. Desta forma, se for usada a diferença entre os pesos para definir o momento de se realizar o ajuste do Dw, existe uma grande probabilidade disto ocorrer exatamente em um momento onde existe um erro significativo, aumentando ainda mais o risco envolvido. 2.2 Efeito do ajuste de pesos O efeito negativo da reinicialização dos pesos decorre do fato de que a informação anteriormente existente em relação à ação do controlador é perdida durante este processo. Este fato é melhor ilustrado através de um caso base. Para as avaliações seguintes será utilizada uma planta caracterizada segundo a equação 2.36. É somado ao sinal de saída do processo, um sinal randômico de amplitude 0,1 e média nula para simular o ruído de medição. 𝑦 𝑘 = 1,248 𝑦 𝑘 − 1 − 0,3506 𝑦 𝑘 − 2 + 1,526 𝑢 𝑘 − 1 + 0,803 𝑢 𝑘 − 2 . 2.36 Durante o processo de controle da planta, ao ocorrer uma perturbação do sistema, se inicia o processo de ajuste dos pesos. Este ajuste leva a um aumento da diferença entre os pesos. Se durante este ajuste a lógica de reinicialização dos pesos for acionada, os dois pesos passarão a apresentar uma redução drástica de suas diferenças, sendo novamente iniciada a ação de otimização. Como o erro está em um sentido único, a tendência é que os dois pesos aumentem ou diminuam juntos. Quando o erro tende a diminuir, o peso da função de pertinência estará considerando apenas o efeito de aprendizagem em um único sentido. Nesta condição não há uma resposta satisfatória na direção contrária, levando a um efeito de sobre- sinal e perda de desempenho logo após a reinicialização dos pesos. Este efeito pode ser visualizado na Figura 2.4. Figura 2.4: A) Controle de uma planta específica usando ONFC com proteção de reinicialização de pesos B) Evolução dos valores dos pesos ao longo do processo. A variação observada está também relacionada ao aumento proporcional da parcela integradora do controlador em relação à ação proporcional, após a reinicialização dos pesos. Conforme citado nas seções anteriores, na análise dos termos do ONFC, de maneira instantânea, a saída do controlador é definida segundo a equação 2.37. 𝑢𝑘 = 𝑤1 − 𝑤2 2𝐸𝑀 𝑒𝑘 + 𝑤1 + 𝑤2 2 2.37 Nesta condição vemos que ao se reinicializar os pesos, o primeiro termo da equação é anulado ( 𝑤1 −𝑤2 = 0 ). Com isto, a ação do controlador é influenciada apenas pela integração do erro (equação 2.38). 𝑢𝑘 ≅ 𝑤1 + 𝑤2 2 ≅ 𝛼 2 𝑒𝑖 𝑘 𝑖=1 + 𝑐𝑡𝑒 2.38 Verifica-se que a primeira parte da equação, após a reinicialização, inicia-se com valor nulo e evolui à medida que o processo continua. Nesta condição o segundo termo da equação passará a definir a dinâmica do controlador. Esta segunda parcela da equação apresenta características similares à parcela integral de um controlador PI. Para sistemas lineares, um controlador baseando fortemente na parcela integradora tende a gerar um sobre sinal. Outra situação visivelmente ilustrada na Figura 2.4 é o efeito da reinicialização em regime estacionário. O ruído presente no sinal da variável de processo tende a levar a um aumento gradativo da diferença entre os pesos, mesmo sem grandes variações no processo. 0 500 1000 1500 2000 2500 3000 3500 4000 0 20 40 60 80 100 120 140 160 180 0 500 1000 1500 2000 2500 3000 3500 4000 -30 -20 -10 0 10 20 30 40 A B tempo tempo Após a reinicialização dos pesos verifica-se uma degradação no controle do processo, mesmo sem variação do sinal de referência. Ressalta-se que esta condição poderia ser mitigada com a implementação de um ajuste ponderado dos pesos, sendo necessária, entretanto, a inclusão de lógicas de segurança com consequente aumento de complexidade, para evitar os problemas numéricos relatados na seção 2.1. Nota-se uma relação de compromisso, onde existe a necessidade de se reduzir a diferênça entre os pesos e a preocupação em se fazer isto preservando ao máximo o processo. Nas figuras anteriores pode-se ter a falsa impressão de que não há problema com a elevação da diferenças entre os pesos. Esta impressão não é coerente. Para ilustrar uma situação indesejada em regime permanente ilustramos o efeito de diversos valores de pesos para esta condição. Nota-se na Figura 2.5 que um aumento excessivo dos pesos leva a uma grande variabilidade no sinal de saída da planta. Apesar de exagerada, a condição 𝐷𝑤𝑖 = 600 demonstra uma clara incapacidade de controle da planta. Pensando-se em um processo que funciona de maneira contínua por um longo período, esta condição fatalmente será atingida em um determinado momento a menos que se encontre um método de diminuição do 𝐷𝑤. Uma visão clara se dá quando associamos esta diferença entre pesos com a parcela proporcional de um controlador PI. Se o ganho de um controlador aumenta indefinidamente, para praticamente todos os sistemas reais, acaba-se por atingir a margem de ganho crítica e, consequentemente, ocorrerá instabilidade no sistema. 𝐷𝑤𝑖 = 20 𝐷𝑤𝑖 = 600 Figura 2.5: Efeito da diferença entre os pesos em regime permanente. A e C: Sinal da variável de processo. B e D: Valores dos pesos w1 e w2. O controle desta mesma planta sem o efeito da reinicialização pode ser visualizado na Figura 2.6. Figura 2.6: A) Controle de uma planta genérica usando ONFC sem proteção de reinicialização de pesos B) Evolução dos valores dos pesos ao longo do processo. 0 500 1000 1500 2000 2500 3000 3500 4000 0 20 40 60 80 100 120 0 500 1000 1500 2000 2500 3000 3500 4000 -1000 -800 -600 -400 -200 0 200 400 600 800 1000 0 500 1000 1500 2000 2500 3000 3500 4000 0 20 40 60 80 100 120 0 500 1000 1500 2000 2500 3000 3500 4000 -1000 -800 -600 -400 -200 0 200 400 600 800 1000 0 500 1000 1500 2000 2500 3000 3500 4000 0 50 100 150 200 250 0 500 1000 1500 2000 2500 3000 3500 4000 -80 -60 -40 -20 0 20 40 60 80 100 A B C D A B Tempo (k) Tempo (k) Tempo (k) Tempo (k) Tempo (k) Tempo (k) 2.3 Contribuição ao Projeto do Controlador ONFC Um dos pontos questionáveis a respeito da implementação original do ONFC é a tendência constante de incremento da diferença entre os pesos das funções de pertinência. Em uma primeira análise, pode-se questionar se esta condição poderia ser originária de alguma consideração realizada. Fazendo-se uma análise da função objetivo é verificado um ponto relevante. Inicialmente é proposta a minimização do erro entre o valor de referência e a variável de processo. Entretanto, para sistemas reais, existe uma incerteza associada à medição deste erro. Esta incerteza é inerente a todos os sistemas de medições. O erro deve ser dividido então em uma parcela referente à saída do sistema e outra referente ao ruído de medição. É mais razoável trabalhar então com a minimização da esperança matemática do erro: 𝑒 = 𝐸 𝑒 + 𝜎𝑟𝑢𝑖𝑑𝑜 . 2.39 Os ruídos associados à instrumentação guardam relações com ruídos de natureza branca, normalmente não apresentam correlação com outro sinal a não ser com ele mesmo no atraso zero e apresentam média nula. Não há como minimizar este erro através de sistemas de controles. Sob este ponto de vista, a primeira conclusão obtida é que não se pode atingir o valor zero na função objetivo. Quando o erro estiver na faixa do ruído de medição pode-se considerar que a função de otimização já atingiu seu mínimo e o ajuste dos pesos deve ser interrompido. Esta nova consideração nos leva a uma nova função a ser otimizada e a um novo cálculo de gradiente para o ajuste dos pesos. 2.4 Minimização da esperança matemática do erro - E[e] Considera-se o seguinte modelo de uma planta: 𝑥 = 𝑥 + 𝐶 𝑢 , 𝑦 𝑥 = 𝑓 𝑥,𝑢 . 2.40 Seja u a ação de controle. Suponha que exista um controlador tal que seja possível controlá-la com um controlador específico. Por se tratar de um processo real, o sinal que o controlador recebe apresenta características inerentes a todos os sistemas reais tais como ruído, sendo um valor estocástico. Desta forma, à medida que o ONFC desenvolve sua curva de aprendizagem, a diferença entre os pesos das funções de pertinência (Dw) aumenta. Durante períodos de perturbação este aumento não é significativamente percebido, pois ambos os pesos seguirão para a mesma direção. Entretanto, após o encerramento ou correção do distúrbio, um aumento excessivo do Dw, acumulado nos pesos do ONFC, poderá aparecer na ação de controle. Pequenos distúrbios tendem a gerar ações fortes de controle. Desta forma, observa-se a tendência de amplificação de sinais como ruídos de processos. Estes e outros distúrbios tendem a ser amplificados pela ação de controle. A análise da variável de processo passará então a contar com dois termos relevantes: Δ𝑦 = 𝜎𝑟𝑢𝑖𝑑𝑜 + 𝑔 𝑢 . 2.41 O controlador é incapaz de minimizar o ruído branco. Desta forma, a variabilidade do processo pode, no máximo, ser equivalente a este valor (desconsiderando intervenções em processos e instrumentação). Como Δ𝑦 ≈ e quando nossa referência desejada é constante, chega-se a conclusão que para minimização do erro devemos também minimizar o termo referente ao efeito da ação do controlador na planta (𝑔(𝑢)) e rejeitar perturbações externas. Com isto, nossa função objetivo é alterada para a inclusão de mais um termo. 𝐽 = 1 2 𝑒 2 → 𝐽 = 1 2 𝑦𝑑 − 𝑦 2 → 𝐽 = 1 2 𝑦𝑑 − (𝐸 𝑦 + 𝜎𝑟𝑢𝑖𝑑𝑜 ) 2 2.42 Nesta condição, a saída do controlador passará a apresentar a seguinte expressão equivalente: 𝑢𝑘 = 𝑤1 − 𝑤2 2𝐸𝑀 𝐸[𝑒𝑘] + 𝑤1 − 𝑤2 2𝐸𝑀 𝜎𝑟𝑢𝑖𝑑𝑜 + 𝑤1 + 𝑤2 2 . 2.43 Independentemente da ação da planta, o aumento da diferença entre os pesos, ou simplesmente Dw, tende a aumentar a ação de saída. Ocorrerão variações na saída do controlador, mesmo que 𝐸[𝑒𝑘] → 0. Esta ação é função da resposta do controlador ao ruído de medição. Se esta variação não é significativa ou estiver em um patamar filtrável pela própria dinâmica da planta, 𝐸[𝑒𝑘] continuará tendendo a zero. Considere então que 𝐸[𝑒𝑘] pode ser dividido em duas parcelas, uma relativa à perturbações em plantas e processos (ep) e outra relativa no efeito da variação da saída do controlador no processo (equação 2.44) . A segunda parcela do erro é então proporcional ao sinal de ruído de medição associado a um ganho (Kr). Este ganho, por sua vez é função das características da planta e também do valor da variável Dw como pode se verificar na equação 2.45. 𝑒 = 𝑓 𝑥,𝑢 , 2.44 𝑢𝑘 = 𝑤1 − 𝑤2 2𝐸𝑀 𝜎𝑟𝑢𝑖𝑑𝑜 + 𝑤1 + 𝑤2 2 , 2.45 Generalizando então, 𝑒 = 𝑒𝑝 + 𝐾𝑟 𝐷𝑤.𝜎𝑟𝑢𝑖𝑑𝑜 + 𝜎𝑟𝑢𝑖𝑑𝑜 , 2.46 𝐸 𝑒 + 𝜎𝑟𝑢𝑖𝑑𝑜 = 𝑒𝑝 + 𝐾𝑟 𝐷𝑤.𝜎𝑟𝑢𝑖𝑑𝑜 + 𝜎𝑟𝑢𝑖𝑑𝑜 , 2.47 lim 𝐷𝑤→𝑥 𝐾𝑟 𝐷𝑤.𝜎𝑟𝑢𝑖𝑑𝑜 = 0; → 𝐸[𝑒] → 0; 2.48 Sendo que x é um valor tal que não sejam observadas maiores oscilações no processo. Para sistemas lineares, por exemplo, um controlador com ganho unitário não amplificaria o ruído branco do sistema. Uma vez que o limite do erro do sistema é definido por 𝜎𝑟𝑢𝑖𝑑𝑜𝐵 pode-se usar este termo como limite de estabilidade do controlador. Caso o controle apresente variação superior a 𝜎𝑟𝑢𝑖𝑑𝑜𝐵 , deve-se ajustar o Dw no sentido de diminuir a diferença entre os pesos. Este método reduz a energia entregue pelo controlador à planta. O efeito de amplificação do ruído é um dos mecanismos de instabilização de sistemas. Este fato não avaliado na proposta original permite explorar novos algoritmos incorporando esta informação. Conforme mencionado anteriormente, o ruído de medição define o limite de otimização da função custo. Esta é também uma métrica eficaz para determinação da energia disponível no sistema. O ONFC, após algumas rejeições de perturbações ou ajuste aos valores de referência pode acumular grandes valores de Dw. Valores elevados de Dw tendem a amplificar o ruído de medição ou deixar o controlador com ganho proporcional elevado. Desta forma, sabendo-se a faixa do ruído, pode-se definir o momento onde está ocorrendo um acúmulo de energia. Serão propostas duas metodologias para redução de Dw baseados neste conceito. 2.5 Algoritmo baseado no ajuste por número de reversões O ruído de medição apresenta características próximas à um ruído branco, como média nula, variabilidade e baixa correlação com outros sinais. Este tipo de sinal apresenta ganho constante em todas as faixas de frequência. Normalmente, o efeito do ruído é mais significativo para frequências elevadas, em função da relação sinal-ruído obtida na saída do processo. Este problema pode ser minimizado com a utilização de filtros passa baixa, porém existe um limite de aplicação, pois o uso dos mesmos leva a um atraso no sinal filtrado. Outra de suas características é a natureza oscilatória do mesmo, apresentando grande número de reversões. A parcela proporcional do controlador tende a atuar para a correção deste ruído. Nesta condição, caso o ganho do controlador esteja excessivamente grande, este poderá perturbar a planta, gerando um incremento de amplitude na saída da planta. Este problema guarda relação direta com a redução da margem de ganho até limites críticos. Sabendo-se a magnitude do ruído é possível delimitar um limite tal que, quando ultrapassado, deve-se atuar de forma a reduzir o ganho do controlador. Esta condição só é verdadeira quando estamos em regime permanente. Em caso de uma perturbação ou mudança do valor de referência, o erro ultrapassará o limite delimitado sem que isto incorra em uma restrição ao ganho do controlador. A partir desta característica é proposto um método de ajuste do Dw baseado em um sistema de contador de reversões. Esta proposta é fundamentada no fato de que, quando o ganho do controlador estiver amplificando o ruído, a saída da planta apresentará um comportamento similar ao do sinal do ruído, porém de maior magnitude, ou seja, um comportamento oscilatório de magnitude superior ao do ruído. Nesta condição o algoritmo tenderá a reduzir o ganho do controlador, através da redução de Dw até que o erro esteja dentro da faixa do ruído de medição. Faz-se então uma otimização dos pesos baseado não somente no erro total do sistema, mas também no erro associado à amplificação do ruído através da inclusão do termo. 𝑤1 − 𝑤2 𝜎𝑟𝑢𝑖𝑑𝑜𝐵 = 𝐷𝑤 𝜎𝑟𝑢𝑖𝑑𝑜 . 2.49 𝐽 = 1 2 𝑒 2 + (𝑤1 − 𝑤2)𝜎𝑟𝑢𝑖𝑑𝑜 → 𝐽 = 1 2 𝑒 2 + (𝐷𝑤 + 1)𝜎𝑟𝑢𝑖𝑑𝑜 2.50 O termo (𝐷𝑤 + 1)𝜎𝑟𝑢𝑖𝑑𝑜𝐵 é considerado significativo apenas quando (𝐷𝑤 + 1)𝜎𝑟𝑢𝑖𝑑𝑜 > 𝜎𝑟𝑢𝑖𝑑𝑜 . 2.51 O contador de reversões acima do valor de 𝜎𝑟𝑢𝑖𝑑𝑜 busca definir esta condição. Desta forma a derivada deste termo é definida por: 𝜕𝐷𝑤 𝜕𝑤𝑖 = 𝜕 𝑤2 − 𝑤1 𝜕𝑤𝑖 => 𝜕𝐷𝑤 𝜕𝑤1 = −1; 𝜕𝐷𝑤 𝜕𝑤2 = 1; 2.52 Como deseja-se minimizar Dw, pelo método do gradiente descendente tem-se: 𝑤1 𝑘 = 𝑤1 𝑘 − 1 + 𝛽, 𝑤2 𝑘 = 𝑤2 𝑘 − 1 − 𝛽. 2.53 Onde β é definido como sendo α0/µi a cada reversão com amplitude superior ao limite máximo estabelecido. Ressalta-se que, para esta condição, é necessário evitar ajustes quando µi 0 com inclusão de lógicas de segurança específicas. Foram testadas implementações de avaliação de reversões tanto para a variável de processo quanto para a variável de manipulação. 2.6 Algoritmo baseado no método de redução de Dw2 Outra abordagem proposta é a minimização do erro quadrático total, incluindo a parcela relativa ao efeito do ruído. O erro é separado então em duas parcelas, sendo a primeira associada ao processo e alterações de valores de referência (ep) e a segunda ao efeito do ruído na ação de controle (Kr.(Dw)ruído). Para a segunda parcela, considera-se que o erro associado à este termo será proporcional ao sinal do ruído multiplicado por um fator relacionado à variável Dw e um ganho Kr devido aos efeitos da planta. A alteração leva a uma função objetivo conforme apresentada na equação 2.54. 𝐽 = 1 2 𝑒 2 → 𝐽 = 1 2 𝑒𝑝 + 𝐾𝑟 𝑤1 − 𝑤2 𝜎𝑟𝑢𝑖𝑑𝑜 ) 2 → 2.54 𝐽 = 1 2 𝑒𝑝 2 + 2.𝐾𝑟 𝑤1 − 𝑤2 . 𝑒𝑝 .𝜎𝑟𝑢𝑖𝑑𝑜 + 𝐾𝑟 𝑤1 − 𝑤2 𝜎𝑟𝑢𝑖𝑑𝑜 2 . 2.55 Observe que o produto vetorial de um sinal com um ruído de medição tende a apresenta correlação nula exceto com ele mesmo. Fazendo a consideração de que o ruído de medição apresenta média nula conclui-se que: 𝑒𝑝𝑘𝜎𝑘𝑟𝑢𝑖𝑑𝑜 𝑛 𝑘=1 ≈ 0. 2.56 Com isto a função de otimização passa a ser então: 𝐽 = 1 2 𝑒𝑝 2 + 1 2 𝐾𝑟 𝑤1 − 𝑤2 𝜎𝑟𝑢𝑖𝑑𝑜 2. 2.57 O problema passa a ser a otimização do erro associado a perturbações passíveis de serem corrigidas e perturbações geradas pelo próprio controle. O ruído passa a ser uma variável de perturbação para o controlador e deve-se minimizar o efeito de amplificação deste termo, onde o principal fator envolvido é o ganho proporcional do controlador. Para o ONFC este termo é associado à variável Dw. Derivando esta função em relação aos pesos novamente tem-se, respectivamente: 𝜕𝐽 𝜕𝑤1 = 𝜕𝐽 𝜕𝑒𝑝 𝜕𝑒𝑝 𝜕𝑦 𝜕𝑦 𝜕𝑢 𝜕𝑢 𝜕𝑤1 + 𝐾𝑟 .𝜎𝑟𝑢𝑖𝑑𝑜 2 𝑤1 − 𝑤2 , 2.58 𝜕𝐽 𝜕𝑤2 = 𝜕𝐽 𝜕𝑒𝑝 𝜕𝑒𝑝 𝜕𝑦 𝜕𝑦 𝜕𝑢 𝜕𝑢 𝜕𝑤2 − 𝐾𝑟 .𝜎𝑟𝑢𝑖𝑑𝑜 2 𝑤1 − 𝑤2 . 2.59 Desenvolvendo as demais relações apresentadas chega-se ao cálculo do gradiente da função custo. O desenvolvimento para o segundo termo é análogo ao obtido para o primeiro termo e será suprimido deste texto. 𝜕𝐽 𝜕𝑒 = 2 1 2 𝑒𝑝 = 𝑒𝑝 2.60 𝜕𝑒 𝜕𝑦 = 𝜕(𝑦𝑑 − 𝑦) 𝜕𝑦 = −1 2.61 𝜕𝑢 𝜕𝑤1 = 𝜕 𝜇1𝑤1 + 𝜇2𝑤2 𝜕𝑤1 = 𝜇1 2.62 O termo associado ao ep será aproximado do valor medido do erro (e) quando este for superior à faixa de ruído. Como para condições onde o erro (e) é inferior à faixa do ruído, não é feito o ajuste dos pesos, esta condição já está inserida no algoritmo. A consideração aqui realizada é a de que o termo Dw é minimizado para não apresentar valor capaz de amplificar o ruído. Esta consideração se faz necessária devido à dificuldade de se medir o valor real de ep. A derivada 𝜕𝑦 𝜕𝑢 representa a variação da saída da planta em relação à entrada. Mantendo a idéia apresentada no trabalho de Gouvêa (GOUVEA, 2005), propõe-se a incorporação desta derivada juntamente com o passo do algoritmo de otimização. 𝛼 = 𝛼1 𝜕𝑦 𝜕𝑢 2.63 Para melhor compreensão do algoritmo, este termo será novamente detalhado em um primeiro momento, o que nos leva a um gradiente 𝜕𝐽 𝜕𝑤1 = 𝛼1(( 𝜕𝑦 𝜕𝑢 )𝜇1(𝑒𝑝) + 𝐾𝑟 2.𝜎𝑟𝑢𝑖𝑑𝑜 2 𝑤1 − 𝑤2 ), 2.64 𝜕𝐽 𝜕𝑤2 = 𝛼1(( 𝜕𝑦 𝜕𝑢 )𝜇2(𝑒𝑝) − 𝐾𝑟 2.𝜎𝑟𝑢𝑖𝑑𝑜 2 𝑤1 − 𝑤2 ) . 2.65 Agrupando novamente o termo para manter a idéia original tem-se 𝜕𝐽 𝜕𝑤1 = 𝛼 𝜇1 𝑒𝑝 + 𝐾𝑟 2𝜎𝑟𝑢𝑖𝑑𝑜 2 𝛼 𝑤1 − 𝑤2 , 2.66 𝜕𝐽 𝜕𝑤2 = 𝛼 𝜇2 𝑒𝑝 − 𝐾𝑟 2𝜎𝑟𝑢𝑖𝑑𝑜 2 𝛼 𝑤1 −𝑤2 . 2.67 Incluindo a consideração em relação à ep, chega-se então à nova regra de ajuste dos pesos do controlador: 𝑤1 𝑘 + 1 = 𝑤1 𝑘 + 1 + 𝛼𝜇1𝑒 + 𝐾𝑟 2𝜎𝑟𝑢𝑖𝑑𝑜 2 𝑤1 − 𝑤2 , 2.68 𝑤2 𝑘 + 1 = 𝑤2 𝑘 + 1 + 𝛼𝜇1𝑒 − 𝐾𝑟 2𝜎𝑟𝑢𝑖𝑑𝑜 2 𝑤1 −𝑤2 . 2.69 A partir desta nova estratégia de ajuste e otimização de erro pode-se ter um controlador que apresenta uma relação de compromisso entre a necessidade de ajuste dos pesos de suas funções de pertinência e a necessidade de se reduzir a distância entre os pesos, e consequentemente o efeito de ganho proporcional do controlador. Ressalta-se que, como discutido anteriormente, ao se atingir um valor de erro dentro da faixa esperada do ruído, não é mais necessário o ajuste dos pesos. Desta forma, o novo algoritmo proposto prevê que dentro da faixa de erro estipulada como ruído de medição, o ajuste dos pesos é interrompido. Outro ponto relevante é que o passo responsável pela redução da diferenças entre os pesos 𝐾𝑟 2𝜎𝑟𝑢𝑖𝑑𝑜 2 𝑤1 − 𝑤2 , segundo equacionamento teórico, apresenta o termo do ruído. O valor do ruído não é passível de ser determinado com precisão em tempo real sendo então necessária a definição de um parâmetro que definirá a importância relativa de cada parcela da equação. Este parâmetro é definido como taxa e pode apresentar valores entre 0 e 1. À medida que o valor da taxa se aproxima de um, o efeito de ajuste para minimização da diferença entre os valores medidos e o valor de referência é aumentado em relação ao efeito de minimização da diferença entre w1 e w2. Consequentemente, a implementação proposta para o algoritmo de ajuste dos pesos passa a ser definida segundo as equações 2.70 e 2.71. 𝑤1 𝑘 + 1 = 𝑤1 𝑘 + 𝛼(𝑡𝑎𝑥𝑎)𝜇1𝑒 + (1 − 𝑡𝑎𝑥𝑎) 𝑤1 − 𝑤2 2.70 𝑤2 𝑘 + 1 = 𝑤2 𝑘 + 𝛼(𝑡𝑎𝑥𝑎)𝜇2𝑒 − (1 − 𝑡𝑎𝑥𝑎) 𝑤1 − 𝑤2 2.71 Este novo algoritmo proposto será denominado ONFCDw e será analisado quanto as suas características e desempenho. A implementação proposta nas equações 2.70 e 2.71 lembra uma implementação em paralelo, onde cada termo é associado diretamente com um objetivo específico. Caso se deseje, pode-se buscar também uma implementação em série de alguns parâmetros. Assim como visto em várias implementações de controladores PI, pode-se agrupar os parâmetros de ajuste como feito nas equações 2.66 e 2.67, o que nos leva à: 𝑤1 𝑘 + 1 = 𝑤1 𝑘 + 𝛼(𝑡𝑎𝑥𝑎𝑎)𝜇1𝑒 + 𝛼(1 − 𝑡𝑎𝑥𝑎𝑎) 𝑤1 − 𝑤2 , 2.72 𝑤2 𝑘 + 1 = 𝑤2 𝑘 + 𝛼(𝑡𝑎𝑥𝑎𝑎)𝜇2𝑒 − 𝛼(1 − 𝑡𝑎𝑥𝑎𝑎) 𝑤1 − 𝑤2 . 2.73 A implementação apresentará desempenho similar, uma vez que se trata apenas de alteração de constantes, sendo necessário, obviamente, um ajuste diferenciado dos parâmetros. Capítulo 3 3 Análise do controlador ONFCDw 3.1 Avaliação da influência do parâmetros α no desempenho do sistema Um dos parâmetros a serem configurados do ONFC é o coeficiente α de ajustes dos pesos w1 e w2. Conforme apresentado em Gouvêa (GOUVEA, 2005), este termo agrupa o passo do método do gradiente e a relação entre a variável manipulada e a saída da planta. Em função de sua importância, o ajuste deste termo é crítico para a estabilidade e desempenho do controlador. Nesta seção é apresentada uma discussão sobre o efeito do parâmetro α no algoritmo. O ajuste dos pesos utiliza como base o método do gradiente descendente. Como discutido em seções anteriores, o α incorpora tanto a dinâmica da planta, quanto o tamanho do passo do método do gradiente. Neste contexto, verifica-se que a escolha adequada do α está diretamente relacionada com a estabilidade do controlador. Esta avaliação pode ser feita segundo duas óticas. Observando o desenvolvimento sugerido por Pires pode-se relacionar o termo diretamente com a ação integral do controlador (PIRES, 2007). Este termo seria então inversamente proporcional a um suposto tempo integral. Sob esta ótica, um aumento de α seria equivalente à redução do tempo integral. O tempo integral, para plantas lineares, deve ser ajustado conforme a dinâmica da planta a ser controlada. Observe a resposta de um sistema frente à ação de controladores PI com diferentes parametrizações para o ganho e o tempo integral distinto. Para o estudo foi considerada uma planta genérica de primeira ordem com um atraso puro de tempo (Figura 3.1). Figura 3.1: Planta de primeira ordem com atraso puro de tempo para avaliação de efeito a alteração do tempo integral. Situação 1: Sistema sem ação integral A ação integral é útil essencialmente para correção do erro em regime permanente. Esta análise é valida para sistemas sem características integradoras. Para plantas sem esta característica, um controlador puramente proporcional não seria capaz de anular o erro em regime uma vez que a saída do controlador deverá ser proporcional ao erro. Na Figura 3.2 é ilustrada a resposta ao degrau unitário para um controlador sem a parcela integral e ganho proporcional unitário. A ausência de um termo integrador faz com que exista um erro em regime permanente para esta planta. Figura 3.2: Situação 2: Sistema com ação integral proporcional ao tempo de resposta da planta Considerando o sistema estudado, o controlador PI foi configurado com um tempo integral proporcional ao tempo de resposta da planta. O sistema em estudo apresenta um tempo morto de um segundo e constante de tempo de um segundo (ts = 1). Em função disto o PI é ajustado de forma que o tempo integral seja da mesma ordem de grandeza do tempo de resposta da planta. Lembrando que o tempo integral é o inverso do ganho integral (ki =1/ti), este termo foi ajustado no valor de 0,5, resultando em um tempo integral de 2 segundos. Com este ajuste a resposta da planta pode ser vista na Figura 3.3. Figura 3.3: Resposta ao degrau unitário n 0,333. Com esta parametrização não é verificado mais o erro em regime permanente e verifica-se que o controlador é capaz de anular o erro entre variável de processo e referência. 0 20 40 60 80 100 120 140 160 180 200 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 0 20 40 60 80 100 120 140 160 180 200 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 Com o aumento do ki para o dobro (ki = 1) vê-se um aumento do sobre sinal do sistema (Figura 3.4). Figura 3.4: Resposta ao degrau unitário n Aumentando ainda mais a ação integral, o sistema tenderá à instabilidade. Figura 3.5: Resposta ao degrau unitário n e saída do controlador: A) Sinal de referência em azul e sinal da variável de processo em verde, B) Sinal da ação de controle. Analisando a saída do controlador observa-se que este tende a estar fora de fase com a planta. Esta diferença é decorrente da ação integral. Desta forma, concluí-se que, se o tempo integral é configurado com valores muito pequenos em relação ao tempo de resposta da 0 20 40 60 80 100 120 140 160 180 200 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 0 20 40 60 80 100 120 140 160 180 200 0 0.2 0.4 0.6 0.8 1 0 20 40 60 80 100 120 140 160 180 200 0 1 2 3 4 5 A B planta, durante uma perturbação ou mudança de referência, a ação de controle levará a planta à instabilidade. Guardando as devidas proporções, verifica-se que o parâmetro α deve ser configurado de forma que sua influência como parcela integradora não leve à instabilidade do sistema, devendo ser menor ou da mesma ordem de grandeza do tempo de resposta da planta. Para o caso específico do ONFC, deve-se levar em consideração o ganho da planta, uma vez que o α também guarda relação com a parte proporcional do controlador. Outra forma de se avaliar o efeito do α é analisando o método de minimização usado na função objetivo. Deseja-se a minimização do erro quadrático entre o valor de referência e o valor da variável de processo. O método utilizado é o gradiente descendente. Este método consiste em buscar a direção contrária ao do gradiente da função objetivo. A aplicação deste método pressupõe o emprego de um passo de ajuste a cada iteração. Este passo pode ser variável ou constante. O algoritmo ONFC proposto apresenta passo constante. Desta forma, observa-se que a convergência do método pode ser prejudicada com a escolha de um passo inadequado. Caso o α apresente valores elevados pode-se prever um comportamento errático do método do gradiente descendente. Nesta condição o algoritmo pode passar do valor ótimo da função e oscilar em torno dele. Caso este valor esteja excessivamente pequeno, o algoritmo irá demorar a atingir a convergência para o valor ótimo. O efeito do α no desempenho do controlador pode ser avaliado segundo duas óticas: efeito relacionado a um termo de integração excessivamente baixo e baixa velocidade de aumento da diferença dos pesos w1 e w2, levando a um termo proporcional baixo. As duas situações levam a uma ação de controle lenta, atrapalhando o desempenho final. A análise do efeito de uma integração lenta será feita observando a avaliação realizada por Pires (PIRES, 2007). Usando a mesma analogia com o termo ti de um controlador PI, sabe-se que quando se utiliza um tempo integral muito superior à dinâmica da planta, o controlador apresentará um período de estabilização mais elevado. Isto ocorre porque será necessário um longo período para a integração do erro e determinação da saída adequada em regime estacionário. 3.2 Sensibilidade do parâmetro α em relação às características de ganho, tempo morto e constante de tempo das plantas A despeito de todas as boas qualidades do controlador ONFCDw e das aplicações bem sucedidas, ainda faz-se necessário um melhor entendimento de um método de ajuste eficaz, baseado em propriedades das plantas. Não basta apenas um bom algoritmo, de estrutura simples e propriedades adaptativas consistentes. É necessário também um conhecimento básico e algumas referências de ajustes para que o usuário se sinta confortável para realizar a sintonia do controlador. Historicamente um bom exemplo desta necessidade pode ser visto em relação ao controlador PID. Hoje extremamente popular este algoritmo só ganhou destaque após o desenvolvimento de uma metodologia empírica de ajuste desenvolvida por Ziegler e Nichols (ZIEGLER, 1942). A existência de um método de sintonia, mesmo que não leve à sintonia ótima, é importante para permitir a disseminação da técnica. Realizou-se então um estudo com o intuito de identificar qualitativamente o efeito da variação dos termos tipicamente utilizados para determinação de sintonia de controladores como tempo morto, ganho e constante de tempo, na escolha de parâmetros iniciais para o termo α do ONFCDw. Para tal, foram estudados os comportamentos de diversas plantas de primeira ordem em relação à variação dos parâmetros anteriormente citados. Usou-se como valor de referência (setpoint), um sinal caracterizado por uma onda quadrada de período equivalente à mil segundos. O caso base considerado é caracterizado a partir de uma planta com ganho 3,8, tempo morto de 8 segundos e constante de tempo de 14,9 segundos. Utilizou-se para avaliação a ferramenta Simulink do software Matlab, conforme estrutura apresentada na Figura 3.6. Figura 3.6: Diagrama da estrutura utilizada para avaliação do α adequado em função dos parâmetros das plantas. Foram executados três testes para a análise e previsão de comportamento do sistema:  Variação da constante de tempo com ganho e tempo morto fixado;  Variação do ganho com constante de tempo e tempo morto fixado;  Variação do tempo morto com ganho e constante de tempo fixado; Em cada uma das condições o α foi ajustado de forma a se obter uma resposta capaz de atingir o valor de referência sem sobresinal na variável controlada. 1º Teste: Variação de constante de tempo Foram realizados testes variando os valores de constante de tempo conforme a Tabela 3.1. Para cada sistema, foi realizada a sintonia do α. Tabela 3.1: Avaliação do α variando a constante de tempo da planta. Const. tempo tempo morto ganho α 1,49 8 3,8 0,00454 2,98 8 3,8 0,00467 5,96 8 3,8 0,00477 11,92 8 3,8 0,00483 14,9 8 3,8 0,00474 18 8 3,8 0,00442 25 8 3,8 0,00239 35 8 3,8 0,00112 50 8 3,8 0,00069 Através de um gráfico da variação do α com a constante de tempo pode-se ter uma idéia da relação entre as variáveis analisadas (Figura 3.7). Figura 3.7: Relação entre constante de tempo e sintonia do α. 0 5 10 15 20 25 30 35 40 45 50 0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5 x 10 -3 Constante de tempo A lf a A partir da relação visualizada no gráfico é possível determinar um valor para α adequado para uma variação em relação à constante de tempo da planta. Para valores de constante de tempo de 5s, 20s, 40s e 60s, encontram-se as seguintes relações: τ = 5 : α = 4,73x10-3, τ = 20 : α = 3,84x10-3, τ = 40 : α = 9,76x10-4, τ = 60 : α = 6,19x10-4. A partir dos valores de α determinados graficamente, obtiveram-se as respostas apresentadas na Figura 3.8. Figura 3.8: Evolução dos sinais de controle e pesos (1) e variação do desempenho das plantas usando as respectivas sintonias propostas para o α e variando a constante de tempo (2): A: Resultado para planta com constante de tempo = 5, B: Resultado para planta com constante de tempo = 20, C: Resultado para planta com constante de tempo =40, D: Resultado para planta com constante de tempo = 60. Observa-se que o desempenho do controlador sintonizado a partir das curvas levantadas se mostrou adequado em todos os casos, mantendo o sistema em controle. 2º Teste: Variação do tempo morto Os testes variando o tempo morto foram realizados conforme Tabela 3.2. Tabela 3.2: Avaliação do  variando o tempo morto da planta. tempo morto Const. tempo ganho α 0 14,9 3,8 0,00395 2 14,9 3,8 0,00437 4 14,9 3,8 0,00508 8 14,9 3,8 0,00474 16 14,9 3,8 0,00247 32 14,9 3,8 0,00131 Analisando graficamente os resultados obtidos percebe-se que o termo α é inversamente proporcional ao tempo morto (Figura 3.9). Figura 3.9: Relação entre tempo morto e sintonia do α. A partir da curva é possível definir valores para α, dado um valor de tempo morto. Testaram-se valores de 5s, 10s, 20s e 40s para o tempo morto: Tempo morto = 5 : α = 4,99x10-3, Tempo morto = 10 : α = 4,17x10-3, 0 5 10 15 20 25 30 35 0 1 2 3 4 5 x 10 -3 Tempo morto A lf a Tempo morto = 20 : α = 2,18x10-3, Tempo morto = 40 : α = 7,66x10-4. A partir destes valores de sintonias dos α obtém-se as seguintes respostas nas plantas estudadas (Figura 3.10). Figura 3.10: Evolução dos sinais de controle e pesos (1) e variação do desempenho das plantas usando as respectivas sintonias propostas para o α e variando o Tempo Morto (2): A: Resultado para planta com relação Tempo Morto = 5, B: Resultado para planta com relação Tempo Morto = 10, C: Resultado para planta com relação Tempo Morto = 20, D: Resultado para planta com relação Tempo Morto = 40. Verifica-se que para condições dentro das faixas de validade, a sintonia proposta mantém estável a planta controlada. Observa-se também que uma pequena extrapolação da faixa avaliada pode ser usada como um ponto inicial para sintonia mais adequada. C.2 3º Teste: Variação do ganho Os testes variando o ganho foram realizados conforme Tabela 3.3. Tabela 3.3: Avaliação do variando o ganho da planta. ganho Const. tempo tempo morto α 0,1 14,9 8 0,18036 0,5 14,9 8 0,03607 1,0 14,9 8 0,01803 2,0 14,9 8 0,00901 3,0 14,9 8 0,00601 3,8 14,9 8 0,00474 4,0 14,9 8 0,00450 5,0 14,9 8 0,00360 6,0 14,9 8 0,00300 8,0 14,9 8 0,00225 12 14,9 8 0,00150 20 14,9 8 0,00090 Analisando graficamente os resultados obtidos percebe-se que o termo α também é inversamente proporcional ao ganho da planta, decrescendo rapidamente com o aumento deste parâmetro (Figura 3.11). Figura 3.11: Relação entre ganho da planta e sintonia do α. De modo análogo, a obtenção do α será feita utilizando o gráfico da figura acima. A partir da curva é possível definir valores para α, dado um valor de ganho. Testaram- se valores de 7, 10 e 14,9 para o ganho da planta. Consultando o gráfico temos que: Ganho = 3 : α = 6,01x10-3 Ganho = 7 : α = 2,62x10-3 Ganho = 10 : α = 1,87x10-3 Ganho = 14,9 : α = 1,28x10-3 A partir destes valores de sintonias dos α obtém-se as seguintes respostas nas plantas estudadas (Figura 3.12). 0 2 4 6 8 10 12 14 16 18 20 0 0.02 0.04 0.06 0.08 0.1 0.12 0.14 0.16 0.18 0.2 Ganho A lf a Figura 3.12: Evolução dos sinais de controle e pesos (1) e variação do desempenho das plantas usando as respectivas sintonias propostas para o α e variando o ganho da planta (2): A: Resultado para planta com ganho = 3, B: Resultado para planta com ganho = 7, C: Resultado para planta com ganho = 10, D: Resultado para planta com ganho = 14.9. Constata-se que, para condições dentro das faixas de validade, a sintonia proposta tem bons resultados sendo capaz de manter o sistema estável. De maneira geral, não pode-se dizer que métodos gráficos sejam uma maneira eficiente para a determinação da sintonia adequada para α. Os testes realizados, no entanto, mostram o efeito da variação dos parâmetros normalmente usados para representar plantas, como tempo morto, constante de tempo e ganho, na sintonia do parâmetro α do controlador. Esta relação é interessante e permite uma maior sensibilidade em relação a este termo. Pode- se então, a partir de uma sintonia inicial, fazer um ajuste baseado nas tendências apresentadas. 3.3 Efeito da mudança das características da planta em relação a uma sintonia de alfa O controlador ONFCDw tem como característica sua capacidade adaptativa. Um fator importante a ser avaliado é o efeito das mudanças nos parâmetros da planta em relação a uma sintonia fixa do parâmetro α. Estes testes visam avaliar a sensibilidade de um ajuste às variações nas características dos processos. Para tal, a partir do mesmo caso base citado anteriormente (const. tempo = 14,9; tempo morto = 8, ganho = 3,8) é proposta uma sintonia inicial (α = 0,00152). Após a sintonia, avalia-se a robustez do controlador conforme a seguinte metodologia:  Variação da constante de tempo, mantendo α, tempo morto e ganho constante;  Variação do tempo morto, mantendo α, constante de tempo e ganho constante;  Variação do ganho, mantendo α, tempo morto e constante de tempo constante; 1º Teste: Variação da constante de tempo Para a análise foram realizados testes conforme apresentados na Tabela 3.4. Os resultados são apresentados na Figura 3.13. Tabela 3.4: Análise de robustez da sintonia do α em relação à constante de tempo da planta Const. Tempo ganho tempo morto α A 2.9 3,8 8 0,00152 B 8.9 3,8 8 0,00152 C 10.9 3,8 8 0,00152 D 14.9 3,8 8 0,00152 E 20.9 3,8 8 0,00152 F 26.9 3,8 8 0,00152 Figura 3.13: Efeito da variação da constante de tempo da planta no desempenho do controlador em relação a uma sintonia fixa. Observa-se que, com exceção da primeira planta com constante de tempo 53% menor do que a usada para sintonia, o desempenho para as demais plantas foi satisfatório. Para estas plantas, observa-se que o controlador permaneceu estável e consegue rastrear o sinal de referência. 0 500 1000 1500 2000 2500 3000 3500 4000 -300 -200 -100 0 100 200 300 tau =6.91 ou53.624 % abaixo. ytopo SP 0 500 1000 1500 2000 2500 3000 3500 4000 -0.4 -0.2 0 0.2 0.4 0.6 0.8 1 1.2 1.4 tau =7.91 ou46.913 % abaixo. ytopo SP 0 500 1000 1500 2000 2500 3000 3500 4000 -0.2 0 0.2 0.4 0.6 0.8 1 1.2 tau =10.91 ou26.779 % abaixo. ytopo SP 0 500 1000 1500 2000 2500 3000 3500 4000 0 0.2 0.4 0.6 0.8 1 1.2 1.4 tau =14.91 ou0.067114 % acima ytopo SP 0 500 1000 1500 2000 2500 3000 3500 4000 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 tau =20.91 ou40.336 % acima ytopo SP 0 500 1000 1500 2000 2500 3000 3500 4000 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 tau =26.91 ou80.604 % acima ytopo SP A B C D E F 2º Teste: Variação do tempo morto Para a análise foram realizados testes conforme apresentados na Tabela 3.5. Os resultados são apresentados na Figura 3.14. Tabela 3.5: Análise de robustez da sintonia do α em relação ao tempo morto da planta Const. tempo ganho tempo morto α A 14.9 3.8 1 0.00152 B 14.9 3.8 3.5 0.00152 C 14.9 3.8 8 0.00152 D 14.9 3.8 10 0.00152 E 14.9 3.8 14.5 0.00152 F 14.9 3.8 16 0.00152 Figura 3.14: Efeito da variação do tempo morto da planta no desempenho do controlador em relação a uma sintonia fixa. Como esperado, os resultados foram satisfatórios para condições de tempo morto menores do que as utilizadas para a sintonia inicial. Para estas plantas, observa-se que o controlador foi estável e consegue rastrear o sinal de referência. Observa-se que com o aumento do tempo morto o desempenho do controlador piora, chegando à instabilidade após uma variação de 56,25% em relação ao valor usado para sintonia. 3º Teste: Variação do ganho Para a análise foram realizados testes conforme apresentados na Tabela 3.6. Os resultados são apresentados na Figura 3.15. 0 500 1000 1500 2000 2500 3000 3500 4000 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 tempo morto =1 ou87.5 % abaixo. ytopo SP 0 500 1000 1500 2000 2500 3000 3500 4000 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 tempo morto =3.5 ou56.25 % abaixo. ytopo SP 0 500 1000 1500 2000 2500 3000 3500 4000 0 0.2 0.4 0.6 0.8 1 1.2 1.4 tempo morto =8 ou0 % acima ytopo SP 0 500 1000 1500 2000 2500 3000 3500 4000 -0.4 -0.2 0 0.2 0.4 0.6 0.8 1 1.2 1.4 tempo morto =10 ou25 % acima ytopo SP 0 500 1000 1500 2000 2500 3000 3500 4000 -0.5 0 0.5 1 1.5 tempo morto =12 ou50 % acima ytopo SP 0 500 1000 1500 2000 2500 3000 3500 4000 -250 -200 -150 -100 -50 0 50 100 150 200 250 tempo morto =12.5 ou56.25 % acima ytopo SP A B C D E F Tabela 3.6: Análise de robustez da sintonia do α em relação ao ganho da planta Const. tempo ganho tempo morto α A 14,9 0.3 1 0,00152 B 14,9 1.5 3,5 0,00152 C 14,9 2.4 8 0,00152 D 14,9 4.2 10 0,00152 E 14,9 5.7 12 0,00152 F 14,9 7.5 12,5 0,00152 Figura 3.15: Efeito da variação do ganho da planta no desempenho do controlador em relação a uma sintonia fixa. 0 500 1000 1500 2000 2500 3000 3500 4000 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 ganho =0.3 ou92.105 % abaixo. ytopo SP 0 500 1000 1500 2000 2500 3000 3500 4000 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 ganho =1.5 ou60.526 % abaixo. ytopo SP 0 500 1000 1500 2000 2500 3000 3500 4000 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 ganho =2.4 ou36.842 % abaixo. ytopo SP 0 500 1000 1500 2000 2500 3000 3500 4000 -0.2 0 0.2 0.4 0.6 0.8 1 1.2 ganho =4.2 ou10.526 % acima ytopo SP 0 500 1000 1500 2000 2500 3000 3500 4000 -0.4 -0.2 0 0.2 0.4 0.6 0.8 1 1.2 1.4 ganho =5.1 ou34.211 % acima ytopo SP 0 500 1000 1500 2000 2500 3000 3500 4000 -1 -0.5 0 0.5 1 1.5 2 ganho =5.7 ou50 % acima ytopo SP A B C D E F Com exceção dos dois extremos, a sintonia proposta foi estável e conseguiu rastrear o sinal de referência. Para a condição de ganho 0,3 observa-se que o controlador ficou lento, não conseguindo atingir a condição de regime para o sinal de referência usado. Já para a condição de ganho 5,7 verifica-se uma tendência à instabilidade durante a ação de controle. De maneira geral, os resultados obtidos mostram que o ONFCDw é capaz de absorver os efeitos de variações nos parâmetros das plantas dentro de uma faixa relativamente grande sem a necessidade de ressintonia. 3.4 Determinando o alfa ótimo A análise do efeito dos parâmetros da planta permite maior sensibilidade no ajuste do termo α. De posse de uma referência de valor inicial é possível mensurar melhor o grau do ajuste a ser feito a partir de um conhecimento prévio da ordem de grandeza dos parâmetros da planta a ser controlada pelo ONFCDw. Como visto, o ajuste feito será capaz de manter o sistema estável e sob controle mesmo sem o conhecimento preciso dos parâmetros do sistema. Esta flexibilidade é bastante importante para sintonia de controladores. Entretanto, ainda não é possível, com as informações disponibilizadas até então, definir diretamente o valor de α a partir da informação de tempo morto, constante de tempo e ganho do sistema. É proposto então um estudo para determinação do α ótimo a partir do conhecimento deste parâmetro. Em (SWIECH, 2005) é proposta uma metodologia para ajuste dos controladores PID de uma coluna de destilação através de algoritmos genéticos. Neste trabalho, define-se uma função objetivo associada à integral do quadrado do erro (ITSE), variância do erro (𝑒𝑟𝑟𝑜 2 ) e variância do sinal de saída do controlador (𝑚𝑣 2 ). O primeiro termo da função objetivo busca penalizar principalmente os erros associados a estados estacionários, buscando uma garantia de se estabilizar o sistema sobre o valor de referência. O segundo termo busca diminuir oscilações que possam ocorrer na saída do sistema, a partir da minimização da variância observada no sinal do erro. O último termo possibilita buscar uma sintonia que gere sinais de controle mais estáveis. São ainda usados dois termos de ponderação (k1 e k2) para permitir que os termos tenham ordem de grandezas compatíveis. No trabalho em questão, o objetivo era apenas a sintonia de uma planta específica. O objetivo deste estudo é definir uma função que, dado o tempo morto, o ganho e a constante de tempo da planta, seja possível obter um termo α com bom desempenho. Para determinação do que seria um desempenho otimizado, propõe-se a utilização da mesma abordagem apresentada em (SWIECH, 2005). Esta função objetivo é bastante interessante, abordando aspectos importantes para um controlador. Apenas uma pequena mudança foi efetuada, substituindo o termo ITSE pelo termo ITAE (integral do valor absoluto do erro). Esta alteração não gera mudanças na idéia central do algoritmo e é meramente numérica. O termo α ótimo está relacionado a um objetivo claro de controle definido segundo a equação 3.1 𝐽 = 𝐼𝑇𝐴𝐸 + 𝑘1𝑒 2+𝑘2𝑚𝑣 2 3.1 Os termos de ponderação foram calculados em função do valor encontrado do ITAE, representando 50% do mesmo. Uma vez definida a métrica de avaliação do controlador propõe-se a determinação de uma rede neural capaz de definir o termo α adequado para cada planta. Para a definição de uma rede neural é necessária a obtenção de dados capazes de mostrar a características do sistema a ser estudado. Precisa-se então de informações sobre sintonias que permitam um desempenho otimizado do controlador em função das características das plantas que desejamos controlar. Em função disto é proposta uma metodologia baseada em um algoritmo de otimização associado à simulações dinâmicas de plantas lineares para levantamento dos dados. A partir dos dados levantados é desenvolvido um algoritmo baseado em redes neurais. Metodologia A etapa de levantamento é feita a partir de um levantamento da sintonia ótima de uma série de plantas de primeira ordem com parâmetros de tempo morto, constante de tempo e ganho definidos de forma aleatória dentro dos intervalos apresentados na Tabela 3.7. Foi utilizada uma distribuição randômica uniforme para definição das plantas. Os intervalos definidos buscam contemplar condições características de boa parte das plantas industriais. Tabela 3.7: Faixa de avaliação dos parâmetros das plantas Mínimo Máximo Ganho 0 5 Tempo Morto (s) 0 300 Constante de tempo (s) 5 300 1 Foram então definidos os parâmetros de 1000 plantas de primeira ordem a partir da combinação de valores dentro dos intervalos especificados. Para cada planta em questão, são seguidas as seguintes etapas:  Definição de um sinal de referência específico (setpoint) a ser simulado.  Aplicação de método de otimização para se buscar o α ótimo relativo à planta.  Simulação da planta com os controladores e sintonias propostas.  Incorporação do resultado em um banco de dados. A definição do sinal de referência tem por objetivo simular mudanças no setpoint para avaliação do desempenho do controlador para encontrar o α ótimo. Busca-se simular uma operação convencional da planta conforme esperado em um processo real. São aplicados diversos degraus de maneira aleatória na planta ao longo de um período de tempo. O sinal de referência é determinado de modo que seja passível de controle. É necessário definir as magnitudes dos degraus e a frequência. As magnitudes são definidas de acordo com o ganho da planta e a frequência de acordo com o tempo de estabilização do processo. Para cada planta é definido um sinal específico, porém único, que será usado como referência durante toda a etapa de otimização. A partir do sinal de referência e do ruído são definidos os valores fixos para faixa de banda morta do ajuste dos pesos e do parâmetro EM. Em função da falta dos dados de saída da planta, EM é definido como sendo três vezes o desvio padrão do sinal de referência. Esta aproximação é bastante razoável dentro do procedimento proposto, pois os valores de erro serão pertinentes à esta faixa. O termo taxa é definido com um valor padrão de 0,99. 1 Para a segunda rede neural, usando as equações 2.72 e 2.73 como base, esta faixa foi ampliada até 600 s. Para a etapa de otimização foi escolhido o método de Monte Carlo. Este método consiste na aplicação de diversos valores de α em um intervalo definido e a seleção do melhor resultado. A partir do melhor resultado, o intervalo de busca é reduzido segundo um valor de referência percentual (neste caso usou-se 95% do intervalo anterior) e repete-se o procedimento. Este procedimento é repetido até que se obtenha a convergência do método ou que o espaço de busca esteja suficientemente limitado. O método de Monte Carlo foi escolhido por sua simplicidade de aplicação e por sua característica estocástica que permite explorar bem o universo de discurso mesmo para funções multimodais. Ressalta-se que este trabalho não visa explorar diversos recursos de otimização e ponderar sobre cada um. Desta forma, a aplicação de outros algoritmos como algoritmos genéricos, Lagrangeano aumentado, etc, foi descartada. O algoritmo de otimização propõe diversos valores aleatórios de sintonia de α para o controlador ONFCDw. Cada valor proposto é testado no simulador de processo ilustrado na Figura 3.16. A partir do teste são definidos os valores de ITAE, variância do sinal de erro e variância do sinal de controle. Estes valores são usados para cálculo da função objetivo e, a partir deles, é definida uma métrica para avaliação de cada α. A sintonia de α associado ao melhor valor da função objetivo da época específica é mantida e, a partir dela é realizada a redução do espaço de busca (95% da anterior). Esta redução é feita de tal forma que o valor de α ótimo encontrado na época anterior esteja no meio desta nova faixa. Vale ressaltar que não é pertinente a inversão do sinal do α de forma que casos onde a faixa nova apresente valores negativos devem ser tratados. Ao final do processamento tem-se um valor de sintonia de α ótimo para a planta em questão. Figura 3.16: Ilustração esquemática das plantas usadas para determinação dos α ótimos. O valor obtido é então incorporado a um banco de dados contendo informações relativas aos parâmetros da planta (tempo morto, ganho e constante de tempo) e o valor de sintonia encontrado para o α. Ao final do procedimento foram obtidos 1000 conjuntos de dados. De posse deste conjunto de dados, separaram-se dois conjuntos específicos para treinamento e validação de uma rede neural capaz de, a partir dos dados de tempo morto, constante de tempo e ganho, definir um valor adequado de α. Resultados Com os dados foi possível desenvolver uma rede capaz de prover as soluções para sintonia a partir das características das plantas. A rede utilizada apresenta estrutura bastante simples, com duas camadas, sendo dois neurônios na camada escondida e um na camada de saída. Em função dos valores dos α ótimos e de sua ordem de grandeza, usou-se para treinamento valores relativos a –log() como saída da rede. Os dados foram normalizados para a execução do treinamento da rede. Os resultados obtidos para a etapa de treinamento e para a etapa de validação são apresentados na Figura 3.17 e na Figura 3.18 respectivamente. Observa-se que os resultados obtidos foram satisfatórios e que é possível, a partir da rede desenvolvida, determinar valores de α ótimos uma vez conhecidos os parâmetros tempo morto, constante de tempo e ganho de uma planta de primeira ordem. Figura 3.17: Resultados da etapa de treinamento da rede neural para definição de α ótimo: A) Visão geral dos resultados da etapa de treinamento, B) Visão ampliada dos pontos 58 à 110 para melhor visualização dos resultados. Figura 3.18: Resultados da etapa de validação da rede neural para definição de α ótimo: A) Visão geral dos resultados da etapa de treinamento, B) Visão ampliada dos pontos 0 à 60 para melhor visualização dos resultados. A rede obtida apresenta estrutura conforme apresentada na Figura 3.19. Os dados de parametrização da rede são apresentados na Tabela 3.8. 100 200 300 400 500 600 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 Etapa de treinamento da rede Saida da rede Dados de Sintonia Ótima 60 65 70 75 80 85 90 95 100 105 110 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 Etapa de treinamento da rede Saida da rede Dados de Sintonia Ótima 0 50 100 150 200 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 Etapa de validação da rede Saida da rede Dados de Sintonia Ótima 10 20 30 40 50 60 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 Etapa de validação da rede Saida da rede Dados de Sintonia Ótima A B A B Figura 3.19: Estrutura da rede neural desenvolvida para determinação do α ótimo Tabela 3.8: Parametrização da rede neural para determinação de α ótimo2 Normalização 1ª Camada 2ª Camada Saída Range(t) 294,3/593.9 w11 0,187/0.779 ws1 1527,4 /-758 Range(y) 10,4/12.6 Range(TM) 282,6/292.3 w12 -0,199/2.4672 ws2 -1612/-1.1362 Range(G) 4,98/4.89 w21 -0,0217/-1.640 wbs1 -3138/-758.4 Bias1 1 w22 -2,999/-47.154 Bias2 1 w31 2,8536/-0.393 w32 0,0370/1.428 wb1 3,7145/-3.3856 wb2 -3,8295/-1.895 Para uma melhor visualização da capacidade da rede neural de prover soluções adequadas são apresentados alguns estudos de casos para algumas plantas (Figura 3.20 à Figura 3.22). 2 A parametrização à esquerda do separador “/” é referênte à implementação apresentada nas equações 2.70 e 2.71. Os dados à direita do separador “/” são referentes à implementação apresentada nas equações 2.72 e 2.73. Os resultados apresentados mostram a capacidade da rede de prover soluções otimizadas de sintonia para o parâmetro α. Pode-se constatar que as sintonias propostas apresentam bons resultados de controle e sinais estáveis na saída dos controladores. Ressalta- se ainda que estes resultados são pertinentes à inicialização dos algoritmos e devem apresentar desempenho ainda melhor após algumas iterações. A partir do algoritmo proposto e a partir do conhecimento aproximado das características do processo a ser controlado, é possível definir uma sintonia adequada para o controlador ONFCDw. Este é um passo importante para facilitar o uso do algoritmo em aplicações diversas. Figura 3.20: Resposta da planta com =100, TM=50 e G= 1.2 para a parametrização de α ótimo obtido usando a rede neural treinada. 0 1000 2000 3000 4000 5000 6000 7000 8000 9000 0 1 2 3 Saída da planta SP PV 0 1000 2000 3000 4000 5000 6000 7000 8000 9000 0 0.5 1 1.5 2 Ação de controle MV Figura 3.21: Resposta da planta com  =20, TM=10 e G= 0.2 para a parametrização de α ótimo obtido usando a rede neural treinada. Figura 3.22: Resposta da planta com  =200, TM=150 e G= 2 para a parametrização de α ótimo obtido usando a rede neural treinada. 0 200 400 600 800 1000 1200 1400 1600 1800 0 0.2 0.4 0.6 Saída da planta SP PV 0 200 400 600 800 1000 1200 1400 1600 1800 2000 1 2 3 Ação de controle MV 0 1000 2000 3000 4000 5000 6000 7000 8000 9000 0 1 2 3 4 Saída da planta SP PV 0 1000 2000 3000 4000 5000 6000 7000 8000 9000 0 1 2 3 Ação de controle MV 3.5 Estabilidade Um dos pontos críticos de um sistema de controle está na capacidade de se manter estável e de convergir para esta condição após uma perturbação. O conceito de estabilidade tem origem na mecânica onde um sistema é chamado estável se, após ter sofrido um pequeno deslocamento, este retorna a sua posição original ou uma posição estacionária nova. Esta analogia pode ser feita também para sistemas dinâmicos associados às equações diferenciais ordinárias. Por definição, diz-se que o estado de equilíbrio é estável se, dado um ε positivo, existe um δ (ε) positivo tal que para qualquer condição inicial x to < δ ε ,→ x t < 𝜀. 3.2 Caso contrário o sistema é considerado instável. Seguindo esta linha, outro conceito importante é o de ponto de equilíbrio. Chama-se de ponto de equilíbrio do sistema dinâmico os valores do vetor de estado x para os quais a derivada do vetor x é nula. Um ponto de equilíbrio pode ainda ser classificado como assintoticamente estável se, além de estável, satisfizer à condição de retornar à origem quando o tempo tende ao infinito. lim 𝑡→∞ ||x (t) ; xo|| = 0. 3.3 Podemos associar estabilidade à variação da energia total do sistema. Quando a variação da energia é positiva ao longo do tempo, o sistema tende a se tornar instável. Quando esta energia se mantém ou decresce, o sistema tende a um equilíbrio. Uma analogia interessante é apresentada em CASTRUCCI (1981) para um sistema massa-mola. Considerando um objeto preso a uma mola deslocado do ponto de estabilidade como um sistema dinâmico, pode-se imaginar dois cenários: 1º Cenário modelado sem atrito: Nesta condição, ao se soltar o objeto, este se moverá ininterruptamente em função da lei de conservação de energia. A energia é constantemente alternada entre energia cinética e potencial. Esta é uma condição em que a variação de energia é nula. O objeto apresentará trajetória estável e definida. 2º Cenário modelado com atrito: Durante a trajetória do objeto parte da energia do sistema é despendida em função do atrito. Neste caso, a variação de energia é negativa, decrescendo ao longo do tempo. Quando t → ∞ x → x0. Este é tipicamente um sistema que podemos descrever como assintoticamente estável. Pires demonstra que a saída do controlador ONFC apresenta aspectos semelhantes à de um controlador PI conforme mostrado anteriormente (PIRES, 2007). A parcela diretamente proporcional ao erro é definida como a diferença entre os pesos das funções de pertinência (w2 – w1). Em um sistema direto e linear, sabe-se que um aumento do termo proporcional tende a aproximar o sistema da instabilidade em malha fechada. Desta forma, deve-se ter uma atenção especial ao incremento desta diferença. É desejável encontrar uma solução tal que, durante os processos de controle do sistema e de ajuste dos pesos, verifique-se um equilíbrio capaz diminuir o erro entre o ponto de referência e a variável de processo sem, entretanto, existir um incremento na energia total do sistema. Para tal, deve-se buscar uma função que balanceie a tendência do ONFC de incrementar a diferença entre os pesos das funções de pertinência e o erro. Aplicando-se uma teoria de linearização local para o controlador ONFC é necessário garantir que durante o processo de correção dos pesos, a diferença entre w1 e w2 seja interrompida ou corrigida quando se observar um incremento de energia do sistema. A inserção da ponderação da diferença entre os pesos confere ao ONFCDw uma limitação da ação de controle e da capacidade do mesmo de incrementar a energia total. Com isto é garantida a estabilidade matemática da saída do controlador conforme apresentado na seção a seguir. 3.6 Análise matemática da estabilidade do controlador Com a nova implementação proposta ocorre uma alteração significativa em relação ao algoritmo inicial. A inclusão do termo de ajuste da diferença de pesos nos leva a um novo algoritmo de ajuste com um termo auto-regressivo em relação ao peso. Desta forma, será apresentada a avaliação matemática deste termo. Na nova condição teremos: 𝑤1 𝑘 + 1 = 𝑤1 𝑘 + 𝛼𝜃𝜇1𝑒 𝑘 − 𝛼 1 − 𝜃 𝑤1 𝑘 − 𝑤2 𝑘 , 3.4 𝑤2 𝑘 + 1 = 𝑤2 𝑘 + 𝛼𝜃𝜇2𝑒 𝑘 + 𝛼 1 − 𝜃 𝑤1 𝑘 − 𝑤2 𝑘 . 3.5 Desenvolvendo as equações anteriores teremos que, 𝑤1 𝑘 + 1 = 𝑤1 𝑘 − 𝛼 1 − 𝜃 𝑤1 𝑘 + (1 − 𝜃)𝑤2 𝑘 + 𝛼𝜃𝜇1𝑒 𝑘 , 3.6 𝑤2 𝑘 + 1 = 𝑤2 𝑘 − 𝛼 1 − 𝜃 𝑤2 𝑘 + (1 − 𝜃)𝑤1 𝑘 + 𝛼𝜃𝜇2𝑒 𝑘 . 3.7 A ação de controle é definida pela relação entre as funções de pertinências e seus pesos, e pelo desenvolvimento da fórmula pode-se considerar a seguinte equação: 𝑢 = 𝜇1𝑤1 + 𝜇2𝑤2, 3.8 𝑢𝑘 = 𝑤2 − 𝑤1 2𝐸𝑀 𝑒𝑘 + 𝑤1 + 𝑤2 2 . 3.9 Dois termos importantes aparecem nesta equação, sendo eles Dw e a soma dos pesos. Pelos desenvolvimentos acima vê-se que Dw evolui segundo: 𝐷𝑤 𝑘 + 1 = 𝐷𝑤 𝑘 1 − 2 1 − 𝜃 + 𝛼𝜃𝑒 𝑘 2𝐸𝑀 𝑒 𝑘 . 3.10 O termo de soma dos pesos será então 𝑤1 𝑘 + 1 + 𝑤2 𝑘 + 1 = 𝑤1 𝑘 + 𝑤2 𝑘 + 𝛼𝜃𝑒 𝑘 . 3.11 O termo de somatório dos pesos da equação 3.9 não é alterado pela inclusão do termo de ajuste de Dw. Desta forma, verifica-se que o impacto da mudança está exatamente no termo de ajuste do que poderíamos chamar de ação proporcional direta ou diferença entre os pesos. Avaliando como varia Dw chega-se à seguinte expressão: 𝐷𝑤 𝑘 + 1 − 𝐷𝑤 𝑘 = −2𝛼 1 − 𝜃 𝐷𝑤 𝑘 + 𝛼𝜃 2𝐸𝑀 𝑒2 𝑘 3.12 Quando o sistema atinge a estabilidade o ajuste de Dw é interrompido. A variação de Dw apresenta então derivada nula. Vemos então que os termos do lado direito da equação se anulam nesta condição, limitando o valor máximo do Dw ou seja: 2𝛼 1 − 𝜃 𝐷𝑤 𝑘 = 𝛼𝜃 2𝐸𝑀 𝑒2 𝑘 . 3.13 Pela expressão acima, chega-se a conclusão de que 𝐷𝑤 𝑘 = 𝛼𝜃 4𝐸𝑀𝛼 1 − 𝜃 𝑒2 𝑘 . 3.14 Lembrando o conceito fundamental do EM como sendo equivalente à 3 da variável de processo pode-se entender este valor como um erro máximo deste sistema. De maneira similar pode-se entender 𝜎𝑟𝑢𝑖𝑑𝑜 como o erro mínimo esperado. Vê-se, desta forma, dois casos extremos em relação ao erro: Erro = EM 𝐷𝑤 𝑘 = 𝛼𝜃 4𝐸𝑀𝛼 1 − 𝜃 𝐸𝑀2 = 𝜃 4 1 − 𝜃 𝐸𝑀 3.15 Erro = 𝜎𝑟𝑢𝑖𝑑𝑜 𝐷𝑤 𝑘 = 𝜃 4𝐸𝑀 1 − 𝜃 𝜎𝑟𝑢𝑖𝑑𝑜 2 3.16 Estas duas equações definem o espaço de excursão de Dw. Observe que esta relação não depende do erro ou mesmo do termo α nas condições avaliadas. Entretanto, uma vez que se trata de sistemas dinâmicos, verifica-se que de fato isto só ocorreria se o erro fosse constante ao longo do tempo. Em um sistema real os valores de Dw devem excursionar dentro desta faixa. Para uma análise precisa do termo Dw, o correto seria considerar as equações 3.17 e 3.18, onde k1 seria o instante do início da perturbação, k2 instante onde se observa o ponto máximo de erro e k3 o instante onde o sistema retorna a faixa de estabilidade. É razoável então avaliar esta função durante um ajuste decorrente de uma perturbação ou depois da ação de controle e no sentido de redução do erro até e = 𝜎𝑟𝑢𝑖𝑑𝑜 : 𝐷𝑤 𝑘 = 𝛼𝜃 4𝐸𝑀𝛼 1 − 𝜃 𝑒(𝑘)2 𝑘2 𝑘1 3.17 𝐷𝑤 𝑘 = 𝛼𝜃 4𝐸𝑀𝛼 1 − 𝜃 𝑒(𝑘)2 𝑘3 𝑘2 3.18 Entretanto, observa-se claramente pelas equações anteriores que o termo Dw está sempre limitado a um valor máximo e mínimo. Com isto pode-se garantir que não haverá um incremento constate da diferença entre os pesos e, por consequência, do ganho do mesmo. Conclui-se também que a ação de controle estará limitada em função do ajuste dos termos 𝜃, 𝛼 e 𝐸𝑀. Com isto o controlador apresenta saída limitada para qualquer condição definida. 3.7 Conclusões Parciais A análise do controlador ONFCDw permite concluir que o sistema de controle apresenta parâmetros e métricas de ajustes consistentes e aplicáveis. É possível analisar os efeitos das mudanças nos parâmetros das plantas e com isto, prever qualitativamente o sentido do ajuste a ser feito no controlador. O estudo da robustez do controle frente às variações destes parâmetros também mostra sua boa capacidade de se ajustar ao processo. A rede neural desenvolvida permite uma sintonia adequada do principal parâmetro de ajuste do controlador, servindo como uma importante ferramenta para o projeto e implementação do ONFCDw. Por fim, a análise do algoritmo de ajuste permite uma definição da faixa de excursão da diferença entre os pesos. Este ponto importante, levantado como limitação da implementação original, nos garante a saída do controlador dentro de uma faixa limitada e por consequência, da ação introduzida na planta. Capítulo 4 4 Implementação prática do controlador ONFCDw– Metodologia A proposta desenvolvida para mitigação do fator limitante relacionado ao algoritmo inicialmente proposto por Gouvêa se mostrou bastante promissora. A partir do desenvolvimento teórico deve-se, entretanto, buscar um método de validação dos resultados esperados e amadurecimento dos efeitos dos parâmetros. Para tal, foram utilizados simuladores para avaliação e análise do novo controlador, permitindo uma maior assertividade na implementação do mesmo em um processo real. A complexidade associada à implementação de um sistema novo em um processo real apresenta normalmente desafios grandes e uma amplitude superior à contemplada por simuladores. Para tentar reduzir esta distância, além do emprego de simuladores convencionalmente utilizados para validação, como a ferramenta simulink do software Matlab, o algoritmo foi testado em um simulador dinâmico fenomenológico denominado INDISS, onde sistemas como colunas de destilação, trocadores de calor, etc, podem ser simulados com maior fidedignidade. Após a validação das implementações nos simuladores, foi realizada a implementação do algoritmo ONFCDw em uma planta industrial de grande porte para controle de temperatura da região intermediária da torre fracionadora principal da unidade de Coqueamento Retardado de uma refinaria da Petrobras. A metodologia utilizada em cada etapa será detalhada nos itens a seguir. 4.1 Implementação do algoritmo em simulações com sistemas lineares Para avaliação do algoritmo proposto foi configurada uma estrutura no ambiente de simulação computacional Simulink conforme apresentando na Figura 4.1. Figura 4.1: Implementação do controlador ONFCDw para avaliação de controle e análise de parâmetros. Uniform Random Number Transport Delay Transfer Fcn 1 5s+1 To Workspace 5 yr To Workspace 4 u To Workspace3 w2 To Workspace 2 e To Workspace1 w1 To Workspace yStep Scope 2 Scope 1 Scope Pulse Generator Divide Controlador e w1 w2 u Constant 50 2*EM 20 A partir da implementação desenvolvida, foi possível avaliar o controlador em relação a plantas lineares com variação de tempo morto, ganho e constante de tempo. Para maior proximidade em relação aos processos reais, incluiu-se também o efeito de um ruído randômico de medição. Foi simulada a resposta do controlador à variação do valor de referência (setpoint) segundo uma entrada do tipo “onda quadrada” e degrau. A partir da implementação proposta, estudou-se a capacidade do controlador de responder a esta entrada, seu desempenho e o efeito do ajuste dos pesos considerando a diferença entre os mesmos. Foram realizados testes para a avaliação do efeito de inclusão do termo de otimização da diferença dos pesos, em relação ao algoritmo inicialmente proposto por Gouvêa (GOUVÊA, 2005) sem a inclusão das lógicas de ajuste de pesos. Para tal foram realizados testes conforme descrito na Tabela 4.1. Tabela 4.1:Comparação do desempenho do ONFC e do ONFCdw Algoritmo Tipo de sinal taxa Período Amplitude Tempo de simulação 1 ONFC Onda quadrada 1 200 5 15000 2 ONFCDw Onda quadrada 0,99 200 5 15000 3 ONFC Onda quadrada 1 200 10 15000 4 ONFCDw Onda quadrada 0,99 200 10 15000 5 ONFC Onda quadrada 1 100 5 15000 6 ONFCDw Onda quadrada 0,99 100 5 15000 Para avaliação da nova implementação, o controlador ONFCDw foi configurado com o termo taxa igual à 0,99. Verifica-se, nas implementações realizadas, que o valor deste parâmetro gira em torno deste número. Valores muito baixos deste termo impedem uma progressão do ajuste dos pesos, fazendo com que a diferença entre eles se torne muito pequena. Para o ajuste deste parâmetro, sugerimos que se inicie o processo com o valor 0,990. Após o ajuste, verifica-se no processo a evolução da diferenças entre os pesos (Dw). Após um período de tempo, avalia-se se Dw está dentro de uma faixa aceitável, lembrando que o ganho do controlador pode ser analisado segundo a relação 4.1 3 . 𝐾 ≈ 𝐷𝑤 2𝐸𝑀 . 4.1 Valores excessivamente baixos de ganho são uma indicação de que o valor do parâmetro taxa está pequeno e deve ser mais próximo de um. Valores excessivamente grandes e/ou crescentes de Dw indicam uma necessidade de maior controle deste parâmetro, sendo recomendada uma redução no termo taxa. Resultados A implementação se mostrou bastante eficiente para mitigação do problema de divergência de valores dos pesos. Analisando os resultados obtidos a partir do mesmo ajuste dos demais parâmetros, é possível ver a diferença entre as duas implementações nas Figura 4.2 e Figura 4.3. Estes resultados são referentes aos testes 3 e 4 da Tabela 4.1, respectivamente. 3 Este cálculo é válido para valores normalizados do erro em relação à medição. Para utilização de variáveis de processo, deve-se dividir este valor pela faixa de calibração do instrumento. Figura 4.2: A) Resposta do controlador ONFCDw a aplicação de um sinal de referência do tipo onda quadrada; B) Evolução dos pesos e da saída do controlador; C) Evolução do ganho do controlador. O ONFCDw manteve-se estável durante todo período da simulação. A Figura 4.2 mostra a capacidade do controlador seguir o valor de referência. Observa-se também a evolução dos pesos e da saída do controlador. Por fim é apresentada a evolução do ganho do controlador. Pode-se observar que a partir de determinado ponto, tanto o ganho quanto os pesos entram em uma faixa de estabilidade. São verificadas variações nos pesos das funções de pertinência e no ganho devido à necessidade de se adequar ao efeito de mudança do sinal de referência. Entretanto estes parâmetros atingem uma faixa de equilíbrio não sendo observado estouro de pesos. 0 5 10 15 x 10 4 40 45 50 55 60 65 70 0 5 10 15 x 10 4 0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5 0 5 10 15 x 10 4 -100 -50 0 50 100 150 200 A B C Figura 4.3: A) Resposta do controlador ONFC a aplicação de um sinal do tipo onda quadrada no setpoint; B) Evolução dos pesos e da saída do controlador; C) Evolução do ganho do controlador. A Figura 4.3 mostra o comportamento do ONFC sem inclusão de lógica de limitação dos pesos, sujeito à mesma parametrização do controlador ONFCDw. Pode-se verificar que o comportamento do controlador fica instável após um determinado tempo de simulação. Observando os pesos e a saída do controlador, é possível entender o motivo do comportamento oscilatório do controlador. Em um determinado momento ocorre uma variação grande dos pesos das funções de pertinências e é possível notar que a saída do controlador fica oscilatória, levando a um descontrole da saída do processo. Por fim, pode-se ver o aumento do ganho do controlador também neste momento. Na Tabela 4.2 são apresentados os resultados obtidos em relação ao desvio padrão do erro entre valor de referência e variável controlada. 0 5 10 15 x 10 4 40 45 50 55 60 65 70 0 5 10 15 x 10 4 0 5 10 15 20 25 30 35 40 45 50 0 5 10 15 x 10 4 -400 -300 -200 -100 0 100 200 300 400 500 A B C Tabela 4.2: Resultados do teste de comparação entre os algoritmos ONFC e ONFCdw Algoritmo Tipo de sinal Período Amplitude Tempo de simulação Desvio Padrão do erro ONFC Onda quadrada 200 5 15000 1,1715 ONFCDw Onda quadrada 200 5 15000 1,3644 ONFC Onda quadrada 200 10 15000 4,2620 ONFCDw Onda quadrada 200 10 15000 2,0030 ONFC Onda quadrada 500 10 15000 1,6511 ONFCDw Onda quadrada 500 10 15000 1,4684 Observa-se que, para quase todos os testes, o resultados do ONFCDw foi superior ao do ONFC sem a implementação da lógica de ajuste dos pesos. Porém, para os primeiros testes o resultado do ONFC convencional foi superior. Isto se deve ao fato de que, para estes testes, não foram atingidas condições críticas de diferença entre os pesos. Com isto, o algoritmo pode efetuar as correções sem gerar grandes perturbações no processo. Este resultado mostra que a aplicação de uma métrica de limitação de pesos leva a um pequeno prejuízo em relação ao controle da variável de processo. Porém, observando o comportamento do processo na Figura 4.4, vê-se que os resultados tenderiam à instabilidade caso o teste continuasse por mais iterações. Uma visão expandida mostra que, em função do aumento da diferença dos pesos e, por consequência, do ganho, o controlador apresenta velocidade de subida mais rápida, porém menos estável a cada perturbação. Figura 4.4: Saída do planta simulada no teste 1, com o controlador ONFC: A: Sinal referente a todo período teste. B: Visão ampliada de três períodos do sinal. 4.2 Uso de simuladores fenomenológicos para análise de viabilidade de implementação do controlador ONFCDw Após várias análises do controlador ONFCDw utilizando o aplicativo Simulink do programa computacional Matlab, foi utilizado um simulador dinâmico comercial denominado INDISS. O INDISS é um simulador industrial de processo capaz de efetuar simulações variadas, através de representações fenomenológicas dos principais equipamentos disponíveis nas refinarias. Com modelos de trocadores de calor, colunas de destilação, bombas, vasos, etc, é possível desenvolver simulações capazes de representar processos complexos e utilizá-las para diversas aplicações, entre elas, a avaliação de sistemas de controle. O uso de simuladores com características similares ao processo no qual se propõe a implementação de um novo algoritmo de controle é uma estratégia que permite avaliar de maneira mais ampla as consequências da implementação proposta. Este tipo de estratégia é importante inclusive para verificação de consistência do algoritmo proposto. Por se apresentar como um processo virtual, é possível verificar a consistência das ações lógicas de segurança, 0 2 4 6 8 10 12 14 x 10 4 42 44 46 48 50 52 54 56 58 60 1.08 1.085 1.09 1.095 1.1 1.105 1.11 1.115 1.12 1.125 1.13 x 10 5 46 48 50 52 54 56 58 A B saturação de válvulas, modo de chaveamento para operação manual, etc. Estes cuidados são muito importantes para quem deseja implementar uma solução em um processo real. Esta etapa busca mais do que apenas a avaliação do desempenho do controlador. Com o emprego do simulador dinâmico fenomenológico é possível simular a operação de um processo real por um período longo, submetendo o sistema a condições de acoplamento com outras malhas, variações de processos, mudança de especificações, verificar a confiabilidade do algoritmo e sua capacidade de se manter estável. Permite identificar comportamentos indesejáveis e corrigi-los antes de submeter a planta industrial ao sistema de controle proposto. Vale ressaltar que a implementação de um algoritmo novo em um processo real, seja ele qual for, está sempre associada a riscos, seja em relação à nova estratégia de atuação, seja em relação a possíveis falhas na implementação do algoritmo ou mesmo falhas durante a execução da instalação e carregamento da programação lógica. Deve-se buscar minimizar a probabilidade de falhas, uma vez que este tipo de erro pode representar um custo elevado e até mesmo um risco à segurança. Destaca-se também que, uma vez observada uma falha no algoritmo em um processo real, mesmo que diagnosticada e tratada, possivelmente a aceitação e a disposição de se testar o algoritmo uma segunda vez será muito prejudicada, podendo inclusive inviabilizar o processo em alguns casos. Neste cenário utilizou-se uma simulação desenvolvida para um processo real de destilação para servir de plataforma para a implementação do algoritmo proposto. Nesta implementação, tomou-se o cuidado de se inserir o mesmo algoritmo a ser implementado no SDCD (Sistema Digital de Controle Distribuído) da planta, com exceção apenas de possíveis referências de variáveis associadas a cada software. A implementação foi testada em um sistema de controle de temperatura de topo de uma coluna debutanizadora. Na Figura 4.5 pode-se ver a implementação desenvolvida. Figura 4.5: Simulação de destilação para avaliação do controlador ONFCDw. A implementação foi feita de forma que o controle de temperatura pudesse ser realizado tanto com o ONFCDw quanto com a estrutura anterior (controlador PID). Foi implementada uma chave de seleção para simular esta estrutura conforme planejado para a implementação real. Testa-se a implementação proposta tanto para o ONFCDw quanto para o sistema de chaveamento. Para avaliação do desempenho foram realizados os seguintes testes:  Variação do valor de referência no topo e no fundo de três graus.  Variação de pressão no controlador de pressão do topo de 6,8 para 7,4 kg/cm2.  Variação da vazão da carga de 1400 para 900m3/dia.  Variação da temperatura do fluido quente do refervedor de fundo de 533 para 500K.  Variação da composição de carga através de um aumento da proporção de propano e butano para 10% do volume total. Após o ajuste dos controladores foi feito o chaveamento para a ativação do ONFCDw. Nesse momento os pesos do controlador são inicializados com o valor da ação de controle do PID. Isso é feito para não gerar uma descontinuidade na ação de controle. Para o modelo de atuação simples serão mostradas as variáveis manipuladas relacionadas ao PID e ao ONFCDw no início do treinamento e após um tempo maior de controle do processo. Resultados Os testes de desempenho são apresentados a seguir. A curva pontilhada (Nfini) representa o resultado do controlador logo após o chaveamento, antes de passar por qualquer processo de aprendizagem. As curvas verdes e azuis representam o resultado obtido pelo controlador ONFCDw treinado e o PID respectivamente. Ressalta-se que a avaliação visa não só a comparação direta dos resultados em relação ao PID, mas principalmente a verificação do comportamento do controlador frente a perturbações comuns a unidades de destilação, permitindo maior segurança na implementação industrial. Da Figura 4.6 à Figura 4.11 é mostrado o comportamento do ONFCDw quando submetido a diversas perturbações. Verifica-se que em nenhum momento o sistema de controle apresentou comportamento estranho ou que pudesse por em risco o processo. Observa-se também que seu desempenho foi equivalente e, às vezes, superior ao do PID. No entanto, apesar do bom desempenho nos testes realizados, essa não é a sua maior vantagem. As características mais interessantes desse controlador são a capacidade de adaptação e a aprendizagem. Esta característica pode ser evidenciada observando os resultados obtidos logo após a inicialização e após expor o controlador ao processo por algum tempo. Isso o torna menos sensível a mudanças do processo. Figura 4.6: Variação de Set-Point no topo de três graus. Figura 4.7: Variação de Set-Point no fundo da torre. Figura 4.8: Variação de pressão no controlador de pressão do topo de 6,8 para 7,4 kg/cm2. 0 100 200 300 400 500 600 700 800 900 1000 64.5 65 65.5 66 66.5 67 67.5 68 SP PV NFIni PV NF PV PID 0 100 200 300 400 500 600 700 800 900 1000 10 11 12 13 14 15 MV NF W1 W2 MV PID 0 100 200 300 400 500 600 138.5 139 139.5 140 140.5 141 SP PV NFIni PV NF PV PID 0 100 200 300 400 500 600 0 1 2 3 4 5 6 7 8 MV NF W1 W2 MV PID 0 200 400 600 800 1000 1200 1400 1600 60 61 62 63 64 65 66 SP PV NFIni PV NF PV PID 0 200 400 600 800 1000 1200 1400 1600 6 8 10 12 14 16 18 MV NF W1 W2 MV PID Variação do sinal de referência e valor de processo Variação do sinal de referência e valor de processo Variação do sinal de referência e valor de processo Variação da ação de controle e pesos Variação da ação de controle e pesos Variação da ação de controle e pesos tempo (s) tempo(s) tempo(s) tempo (s) tempo (s) tempo (s) Temp.(ºC) Abert. (%) Temp.(ºC) Abert. (%) Abert. (%) Temp.(ºC) Figura 4.9: Variação da vazão da carga de 1400 para 900m3/dia. Figura 4.10: Variação da temperatura do fluido quente do refervedor de fundo de 533 para 500K. Figura 4.11: Variação da composição de carga através de um aumento da proporção de propano e butano para 10% do volume total. Outro ponto importante é a capacidade do algoritmo permanecer estável durante um longo período de execução. Simulações de desempenho podem esconder pequenos problemas 0 200 400 600 800 1000 1200 64.4 64.6 64.8 65 65.2 65.4 65.6 65.8 SP PV NFIni PV NF PV PID 0 200 400 600 800 1000 1200 10 11 12 13 14 15 16 17 MV NF W1 W2 MV PID 0 20 40 60 80 100 120 140 160 180 200 64.9 64.95 65 65.05 SP PV NFIni PV NF PV PID 0 20 40 60 80 100 120 140 160 180 200 10 11 12 13 14 15 16 MV NF W1 W2 MV PID 0 500 1000 1500 64 65 66 67 68 69 70 71 SP PV NFIni PV NF PV PID 0 500 1000 1500 10 12 14 16 18 20 22 MV NF W1 W2 MV PID Variação do sinal de referência e valor de processo Variação do sinal de referência e valor de processo Variação do sinal de referência e valor de processo Variação da ação de controle e pesos Variação da ação de controle e pesos Variação da ação de controle e pesos tempo(s) tempo(s) tempo(s) tempo(s) tempo(s) tempo(s) Abert. (%) Temp.(ºC) Abert. (%) Temp.(ºC) Abert. (%) Temp.(ºC) crônicos que, de maneira lenta, levam a uma deteriorização do controle após um período longo de tempo. Um exemplo típico deste problema é a questão do aumento de pesos na implementação inicialmente proposta para o ONFC. Em função disto, um dos testes realizados foi a simulação de operação com o controlador em modo acelerado por um longo período de tempo. A simulação permaneceu estável durante toda a execução dos testes. O simulador dinâmico permaneceu ativo por um período equivalente a seis meses de operação. O processo proposto para implementação real não possui simulação dinâmica e, em função disto, não foi possível testar a implementação no sistema proposto. No entanto, os testes realizados indicam que o sistema de controle tende a ter um comportamento adequado quando instalado em um sistema real. Capítulo 5 5 Implementação do ONFCDw em uma Unidade de Coqueamento Retardado 5.1 Unidade de Coqueamento Retardado A unidade de Coqueamento Retardado é um processo que explora o craqueamento térmico, iniciado em um forno e finalizado em tambores de coque, para produzir produtos mais nobres, como GLP, gasolina e diesel, a partir de uma corrente de hidrocarbonetos pesados. Este processo apresenta grande importância econômica. A Figura 5.1 apresenta uma representação esquemática de uma unidade de Coqueamento Retardado, sem contemplar, entretanto a área de recuperação de gases. Esta figura apresenta uma planta genérica. Figura 5.1: Ilustração esquemática de uma planta genérica de Coqueamento Retardado. Nesta unidade a carga entra em uma fracionadora, cuja corrente de fundo alimenta um forno. A temperatura de saída deste forno pode atingir temperaturas superiores à 500 ºC, iniciando um processo de craqueamento térmico, que será finalizado em um tambor de coque. O coque fica retido no tambor e os gases de reação voltam para a fracionadora. Quando o tambor está cheio de coque é necessário chavear a saída do forno para um tambor vazio. Esta operação, conhecida como switch, provoca uma grande perturbação em todo processo, com variação intensa de vazão de carga, energia e composição. O tambor cheio deve ser resfriado e posteriormente aberto para a retirada do coque com broca hidráulica (descoqueamento). Em seguida, este tambor, já vazio, deve ser aquecido para entrar em operação assim que o outro tambor estiver com o nível de coque alto. Todas estas operações de switch, resfriamento e aquecimento, geram perturbações cíclicas na torre fracionadora. Além das perturbações relatadas, parte dos gases usados para aquecimento do tambor a ser colocado em operação segue para um sistema de coleta de condensados denominado blowdown. Este óleo coletado é retornado à fracionadora gerando também uma perturbação no processo. Na Figura 5.1 apenas a parte hachurada opera de maneira contínua. As demais áreas operam em bateladas. A carga da unidade é alimentada no fundo da torre fracionadora principal, seguindo para o forno. O processo é submetido a intensas variações de carga térmica, condição operacional e muitas perturbações externas. Em função destas características este processo foi escolhido para testar o ONFCDw para o controle das temperaturas desta fracionadora e avaliar sua capacidade de se adaptar a tantas mudanças e perturbações deste processo. O ONFCDW foi implementado para controle de temperatura da região abaixo da panela de GOPK da fracionadora principal de uma unidade de Coqueamento Retardado da Petrobras. Esta região está situada logo acima do ponto de chegada da carga dos tambores, operando com temperatura altas (acima de 300 ºC) e sendo fortemente influenciada por todas as perturbações citadas anteriormente. Situação inicial A temperatura da região de GOPK é um importante parâmetro da torre fracionadora principal. A estabilização desta região favorece a estabilidade da fracionadora, sendo este um dos primeiros pontos impactados pelas perturbações. O controle deste parâmetro é realizado por meio da modulação da vazão de óleo externo na torre. Esta entrada funciona como um refluxo e o aumento desta vazão leva a uma redução na temperatura. O controle de temperatura da região de GOPK anteriormente era executado com o uso de um PID. Este controlador apresentava um resultado insatisfatório. Fez-se então um trabalho de sintonia deste controlador. Os resultados desta sintonia conferiram à este controlador PID um desempenho satisfatório e já trouxe um impacto grande na estabilidade da torre. Usou-se para tal uma estrutura com os termos proporcional, integral e derivativo. Esta estrutura permite antecipar o efeito do erro, mediante o uso da tendência do mesmo. Após o trabalho de sintonia a planta apresentava desempenho conforme mostrado na Figura 5.2. Figura 5.2: Controle de temperatura da região de GOPK usando PID ajustado. Para o sistema em questão, estes resultados já estão em um patamar muito bom. Observando a Figura 5.2, verifica-se algumas variações periódicas comuns em unidades de Coqueamento Retardado, decorrentes das operações de troca de tambor. Considerando a dinâmica do sistema, a intensidade e velocidade da perturbação, uma rejeição completa destes eventos é inviável. Ressalta-se também que este controlador normalmente apresenta saturação de sua ação durante a retirada do tambor para descoqueamento. Neste momento, a carga térmica da torre é reduzida drasticamente (praticamente pela metade) gerando uma redução brusca em todo perfil térmico da fracionadora. O controlador (independentemente da implementação usada) não é capaz de manter a temperatura da região controlada, o que justifica o fato das variações mais intensas serem observadas abaixo do valor de referencia (setpoint) nas Figura 5.2 e Figura 5.3. Logo após a retirada do tambor cheio, durante a operação de switch, realiza-se inicialmente uma purga deste reator com vapor. Este vapor, carreando produto remanescente presente no leito ainda quente de coque, quando chega à torre fracionadora, gera uma elevação rápida das temperaturas ao longo de toda coluna. Nesta condição o controlador sofre uma variação muito grande, sendo uma métrica importante de desempenho avaliar a intensidade deste pico positivo. O controle de temperatura deve garantir um limite superior, uma vez que a elevação desta temperatura pode gerar problemas de coqueamento nas panelas acima da região controlada. Observa-se que o controlador PID apresentou pico de variação máxima de 5ºC. Avaliando a variabilidade do sistema em um período de um mês, o PID apresentou desvio padrão de 1,5 ºC em relação ao valor de referência. 5.2 Resultados da Implementação do ONFCDW O processo descrito apresenta grandes desafios de controle. Em cada etapa do processo de coqueamento, a torre de fracionamento estará sujeita à uma carga térmica distinta, e a um perfil de carga diferente. Em função destas características e do desafio de controle, este processo foi selecionado para receber a implementação do algoritmo ONFCDw. Desde a implementação do algoritmo, o sistema tem operado sem a necessidade de retirada para modo manual por motivos ligados à ação de controle. Os resultados podem ser observados na Figura 5.3. Figura 5.3: Controle de temperatura da região de GOPK antes e depois da implementação do ONFCDw. Após a implementação do ONFCDw observa-se uma melhoria significativa no desempenho do controlador. Segundo as métricas apresentadas nas Tabela 5.1 e Tabela 5.2, Temp. (ºC) verifica-se uma melhoria em todos os indicadores. Conforme mencionado anteriormente, o controle de temperatura quando ocorre o switch continua sendo crítico, sendo verificada uma variação mais intensa no sentido negativo do erro, em função do efeito da saturação da ação de controle neste momento. Tabela 5.1: Avaliação baseada na variável de processo4 Desvio Padrão (ºC) Máximo 4 (ºC) Mínimo 4 (ºC) Antes 1,9 100% 21,1% Depois 0,8 90,8% 0,0% Diferença 58,8% 2,8 6,4 Tabela 5.2: Avaliação baseada no erro entre variável de processo e valor de referência Desvio padrão (ºC) ITAE Desvio positivo Max (ºC) Desvio negativo Max (ºC) Antes 1,5 1866,1 6,5 -19,8 Depois 0,7 777,1 3,5 -12,8 Diferença 53,6% 58,4% 3,0 7,0 Os resultados obtidos mostram que a variação do controlador teve redução superior a 50%. Observa-se também uma redução da faixa de excursão da variável de processo. Avaliando a estatística do erro da variável de processo em relação ao valor de referência, verifica-se uma redução significativa na integral do erro absoluto (ITAE), bem como uma diminuição do desvio máximo observado tanto para erros positivos, quanto para erros negativos. 4 Os valores percentuais apresentados para as condições de máximo e mínimo são referentes aos dados levantados e faixas dos mesmos. Os valores reais foram omitidos em função de sua natureza sigilosa. Ressalta-se que para o processo em questão, o valor de referência (SP) localiza-se à 70,4% da faixa de medição Observou-se uma redução significativa no tempo de estabilização da unidade após perturbação. Valores concretos de redução dependem significativamente do tipo de perturbação e de sua intensidade, sendo difícil uma determinação precisa deste ganho. Entretanto, mesmo baseado em uma análise qualitativa, este é um resultado bastante importante para o processo, permitindo que se estabeleça uma condição estável de operação em um curto período de tempo, após as inevitáveis oscilações decorrentes das operações de switch, aquecimento e purga. A estabilização rápida do processo está diretamente relacionada à capacidade do controlador ONFCDw encontrar o mínimo da função objetivo, que neste caso, é o patamar adequado da ação de saída do controlador para o processo. Na Figura 5.4 observa-se uma ação de controle durante uma mudança de ponto operacional da fracionadora. Nesta figura é ilustrado exatamente um momento de elevação da carga térmica da torre. Observa-se uma variação positiva intensa do erro, na primeira figura, seguida do ajuste da variável ao valor de referência. Na figura inferior é observada a ação de controle sendo percebida uma mudança de estado operacional caracterizado pela mudança de patamar da variável manipulada. Observa- se que o novo patamar da variável de saída do controlador é rapidamente estabelecido e mantido, o que reflete em uma rápida e consistente estabilização da planta controlada. Figura 5.4: Correção de perturbação de processo e saída de controle: A: Variação dos sinais de processo e valor de referência, B: Variação do sinal de controle. 0 1 2 3 4 5 6 7 382 384 386 388 390 tempo(h) te m p (o C ) PV SP 0 1 2 3 4 5 6 7 0 10 20 30 40 50 tempo(h) % OUTPUT A B A Comparando a ação de controle o ONFCDw com o PID convencional, é possível constatar que sua ação foi mais suave e menos sujeita a influência de ruídos. Figura 5.5: Alteração do modo do controlador de PID para ONFC (trecho claro) e retorno para modo PID. A Figura 5.5 mostra a diferença entre a saída do controlador PID e do controlador ONFCDw. Observa-se que a saída do PID (curva em marrom) é mais oscilatória, mostrando-se mais sensível à ruído. O ONFCDw apresenta saída mais suave, o que reflete em menos oscilação na variável de processo. Na ocasião o ONFCDw estava em comissionamento e por isto foi desativado após acompanhamento em horário administrativo. A ação do controlador é definida pela pertinência do erro e pelo ajuste dos pesos do controlador. A variação dos pesos pode ser acompanhada no primeiro gráfico da Figura 5.6. As curvas em azul representam os pesos de cada função de pertinência e a curva em vermelho a ação calculada de controle. No segundo gráfico da Figura 5.6, é apresentado a evolução da diferença entre os pesos das funções de pertinência. Conforme discutido anteriormente, esta diferença é importante para a estabilização do processo, sendo variável em função do ponto de operação. Em função disto, é observado um aumento do Dw durante perturbações mais intensas, quando o controle exige maior ação proporcional, seguida de uma redução gradativa nos momentos onde é necessário menos energia para controlar o sistema. Este processo equilibra o Dw garantindo que ele excursione entre limites adequados para o controle do sistema. Figura 5.6: Efeito do ajuste dos pesos e a otimização da diferença entre os pesos. A: Variação do sinal de controle e dos pesos, B: Variação da diferênça entre os pesos. O ONFCDw mostrou-se eficiente no controle da temperatura da região de GOPK da fracionadora e também se mostrou estável sem a necessidade de uma heurística para limitação dos pesos das funções de pertinência. Os resultados obtidos melhoraram o desempenho do controlador em mais de 50% em relação ao controlador PID, segundo as métricas apresentadas na Tabela 5.1 e na Tabela 5.2. O sucesso desta implementação é um importante passo no desenvolvimento deste controlador, atuando em um ponto crítico de sua estrutura. Ressalta-se que este sistema está em operação há vários meses sem a necessidade de qualquer intervenção, mostrando que os resultados são consistentes com uma aplicação industrial de uso contínuo. 0 5 10 15 20 25 -50 0 50 100 tempo(h) % W1 W2 OU 0 5 10 15 20 25 20 30 40 50 60 70 tempo(h) % DW A B Capítulo 6 6 Proposta de trabalhos futuros O desempenho apresentado pelo ONFCDw nos motiva a avaliar este sistema em outros processos. Nas implementações realizadas os resultados sempre surpreendem, mostrando o grande potencial desta ferramenta. Na unidade de Coqueamento Retardado o sistema está em observação desde setembro de 2009 sem apresentar problemas. O ONFCDw vem sendo utilizado constantemente deste a sua implementação com bons resultados e com evidências de efeitos positivos do uso deste controlador para o processo em questão. O uso do controlador ONFCDW se mostra uma alternativa viável para sistemas em geral, mas em especial, para sistemas onde o emprego de controladores lineares não se mostra adequado. Sistemas fortemente não lineares, seja pela característica do processo ou mesmo pelo efeito de degradação ou mudanças grandes nos pontos operacionais, são candidatos fortes a implementação deste tipo de controlador, que vem demonstrando bons resultados sem grande esforço de implementação e sintonia. Campos (CAMPOS, 2006) apresenta alguns sistemas de controle típicos associados à indústria de petróleo. Dentre estes sistemas pode-se obter bons candidatos a implementação do controlador ONFCDw . Alguns destes sistemas serão apresentados a seguir. 6.1 Estratégia de controle utilizando “Split-Range” Esta estratégia de controle basea-se na utilização de um controlador para atuação em duas ou mais válvulas de controle. Este sistema era mais popular antigamente quando os controladores eram pneumáticos e caros. Mesmo com a redução destes custos, ainda são encontrados controladores com estas características em várias plantas industriais. Em uma implementação típica, divide-se a faixa do sinal de saída (0 – 100%) em duas. De 0 a 50% atua-se na válvula A, e de 50 à 100%, na válvula B. A Figura 6.1 apresenta um sistema de controle de pressão de uma fracionadora utilizando a estrutura split-range. A válvula A controla a pressão por um sistema conhecido como “hot by-pass” (CAMPOS, 2006). A válvula B controla a pressão por meio de alívio de gás para tocha. O sinal de saída do controlador de pressão (PIC) atuará na válvula A até que esta esteja completamente fechada (50% da saída da PIC). A partir deste ponto, caso a pressão na torre ainda esteja elevada, pode-se abrir a válvula B, para controle da mesma. Figura 6.1: Estrutura de controle de pressão de topo baseado em Split-Range. Observando o sistema, vê-se que se trata de dois atuadores com características bastante distintas sendo comandados por um mesmo controlador. O comportamento dinâmico e o ganho observado para uma variação na abertura da válvula A, provavelmente acarretará em uma resposta diferente do que seria observado caso a mesma variação fosse realizada na válvula B. Estas características tornam o ajuste do controlador por meio de algoritmos lineares e não-adaptativos complicado. Uma sintonia boa para uma região de operação pode ser ruim para outra. Para uma visualização do problema exposto, foi desenvolvida uma simulação em Matlab com duas plantas distintas sendo controlada por um único controlador. Foram testadas as implementações ONFCDw e um PID (SILVA, 2009). A equação 6.1 representa dois sistema com características distintas em relação à dinâmica e ganho para tentar simular um comportamento próximo ao esperado em uma implementação do tipo Split- Range com grande variação nas condições de controle após mudança de ponto de atuação. Ressalta-se que este sistema não representará perfeitamente a condição proposta, pois os efeitos dinâmicos durante a transição da válvula são mais suaves do que os apresentados na simulação em função do tipo de chaveamento proposto. No entanto, para efeito de análise preliminar a estrutura nos permitirá visualizar o comportamento geral dos controladores. O sistema O sistema proposto é baseado em duas plantas distintas (eq. 6.1). Quando a saída do controlador apresenta valor superior a 50%, a resposta do sistema é obtida a partir da primeira dinâmica. Quando o sistema opera com saída inferior a 50%, o cálculo da saída é representado pela segunda equação dinâmica. 𝑦 𝑘 = 1,29 𝑦 𝑘 − 1 − 0,85 𝑦 𝑘 − 2 + 1,12 𝑢 𝑘 − 1 + 0,80 𝑢 𝑘 − 2 , 𝑢 < 50% 0,75 𝑦 𝑘 − 1 − 0,45 𝑦 𝑘 − 2 + 1,80 𝑢 𝑘 − 1 + 0,15 𝑢(𝑘 − 2), 𝑢 ≥ 50% 6.1 Os resultados são apresentados nas figuras a seguir. Figura 6.2: Comparação entre o desempenho do PID e do ONFCDw para controle Split-Range simulado A: Resposta do sistema com controlador PID, B: Resposta do sistema com controlador ONFCDw. A Figura 6.2 mostra uma superioridade do ONFCDw durante troca dos atuadores. A perturbação gerada durante a troca é reduzida pelo efeito da aprendizagem e esquecimento 4.7 4.75 4.8 4.85 4.9 4.95 5 x 10 4 100 150 200 Variação da saida em relação ao Setpoint 4.7 4.75 4.8 4.85 4.9 4.95 5 x 10 4 40 50 60 Ação da controle 4.7 4.75 4.8 4.85 4.9 4.95 5 x 10 4 100 150 200 Variação da saida em relação ao Setpoint 4.7 4.75 4.8 4.85 4.9 4.95 5 x 10 4 40 50 60 Ação da controle A B observado no ONFCDw. Observa-se, entretanto, que para conseguir reduzir a variabilidade durante o evento de mudança de válvula, o desempenho nos demais momentos foi prejudicado. Acredita-se que esta característica é dada em função do uso de um termo de taxa de aprendizagem 𝜃 (ou inverso da taxa de esquecimento) baixa. Com isto, o controlador esquece rapidamente a informação aprendida anteriormente, ficando menos sujeito ao aprendizado obtido para uma determinada planta. Como efeito negativo, o sistema terá menor capacidade de se ajustar à planta durante o período onde o controlador operar fora da região de mudança de atuador. Para ilustrar esta situação a Figura 6.3 apresenta os resultados obtidos para diferentes valores de 𝜃. Figura 6.3: Resposta do sistema para controladores ONFCDw com θ = 0.6, 0,4 e 0,2 respectivamente. As características observadas na Figura 6.3 permitem uma definição mais assertiva conforme as características do sistema a ser controlado e suas prioridades em relação ao controle. Caso o efeito de perturbação momentânea da variável não seja crítica, sugere-se o uso de um termo 𝜃 maior. Caso contrário, deve-se estudar a parametrização de 𝜃 de modo a permitir uma condição mais estável da variável controlada durante a troca do ponto de atuação. O uso do ONFCDw pode ser interessante para mitigar este problema. Acredita-se que por apresentar uma estrutura não linear e adaptativa, o ONFCDw apresentará maior capacidade de controle para sistemas com estas características, permitindo uma maior estabilidade durante a alteração dos atuadores de campo. 4.7 4.75 4.8 4.85 4.9 4.95 5 x 10 4 100 150 200 Variação da saida em relação ao Setpoint 4.7 4.75 4.8 4.85 4.9 4.95 5 x 10 4 40 50 60 Ação da controle 4.7 4.75 4.8 4.85 4.9 4.95 5 x 10 4 100 150 200 Variação da saida em relação ao Setpoint 4.7 4.75 4.8 4.85 4.9 4.95 5 x 10 4 40 50 60 Ação da controle 4.7 4.75 4.8 4.85 4.9 4.95 5 x 10 4 100 150 200 Variação da saida em relação ao Setpoint 4.7 4.75 4.8 4.85 4.9 4.95 5 x 10 4 40 50 60 Ação da controle A B C 6.2 Válvulas operando próximo à condição de saturação Não é incomum encontrar válvulas de controle operando próximos à saturação em aplicações industriais. Esta condição é especialmente comum em processos submetidos a variações grandes de objetivos operacionais e carga. Também é comum em sistemas com operação em batelada ou semi-batelada. Em função das mudanças intensas, o dimensionamento adequado da válvula de controle nem sempre é possível, levando então a condição de operação próxima à saturação. Observa-se que mesmo para sistemas estáveis e operando em condições praticamente constantes ainda assim problemas de dimensionamento são comuns. Com o intuito de melhorar os resultados econômicos, atender a demandas de qualidade, demandas de mercado, etc o modo de operação de uma planta industrial tende a se distanciar das condições originais de projeto. Com isto, dimensionamentos de válvulas tendem a não atender mais as condições desejáveis para controle. Nesta situação, a válvula pode apresenta comportamento pouco linear em relação à vazão. Desta forma, para o controlador, o sistema em questão se apresentará como um sistema com ganho variável. Mesmo válvulas com características de igual porcentagem apresentam comportamento não linear em situações de dimensionamento inadequado. Isto decorre do fato de que a válvula de controle é parte integrante de um sistema de escoamento de fluído e sofre a influência dos demais elementos do trecho de escoamento do mesmo. Sabe-se que a perda de carga total do sistema apresenta comportamento não linear em relação à vazão. Observa-se que os controladores PID convencionais apresentam grande deteriorização de desempenho quando operam próximos à saturação. Isto é esperado, uma vez que os mesmos são lineares. A solução atual para este tipo de problema passa pela substituição da válvula. Esta solução pode representar custos significativos e mesmo inviabilidade técnica. O uso de um sistema de controle capaz de identificar o ponto de operação e se ajustar à ele pode representar uma melhoria significativa para o sistema sem implicar em custos elevados. A implementação de um algoritmo ONFCDw em um sistema com esta característica é interessante para avaliar a capacidade de controlar variáveis com esta característica. O aproveitamento de estruturas de válvulas pode apresentar grande impacto em estabilidade, produtividade, segurança operacional e custo. 6.3 Válvulas com características não lineares Válvulas de controle são talvez os dispositivos mais comumente utilizados para controle de processo. Para qualquer tipo de válvula é evidente que a vazão é proporcional ao percentual de abertura. No caso de válvulas de controle, essa relação de interdependência é de extrema importância por se tratar de válvulas destinadas à regulagem de fluxo em qualquer posição. Existem diversos perfis de internos e atuadores projetados para funções distintas. O perfil mais comum são os de igual porcentagem (curva 1 da Figura 6.4) e dos de abertura rápida (curva 2 da Figura 6.4) (TALLES, 2001). Figura 6.4: Curva características de válvulas (TALLES, 2001). Alguns sistemas de controle que atuam em válvulas com características fortemente não lineares podem apresentar desempenho sofrível com a utilização de controladores lineares como o PID. Esta condição é mitigada quando se trabalha dentro de uma faixa de operação onde o comportamento da válvula é aproximadamente linear em relação à vazão. Para alguns processos, entretanto, pode ser necessária a utilização de válvulas com características intrinsecamente não lineares. A avaliação do ONFCDw para um sistema de controle nesta condição seria bastante interessante. Em caso de sucesso, esta pode ser uma aplicação muito útil de um controlador não linear. 6.4 Sistemas multivariáveis O presente trabalho busca o desenvolvimento de um controlador onde se manipula uma variável para o controle de outra em um sistema comumente denominado SISO (single input single output). Porém, a maioria dos processos apresentam muitas variáveis para serem controladas. Sistemas multivariáveis são muito comuns em vários processos industriais. Nestes processos a manipulação de uma variável tem efeito sobre várias outras. Processos químicos, petroquímicos, siderúrgicos, metalúrgicos, minerais etc normalmente apresentam grande grau de interação entre suas diversas variáveis. Sistemas monovariáveis, mesmo adaptativos, podem em alguns casos não serem aplicáveis ou suficientes para alguns processos, uma vez que não possuem informação sobre demais perturbações críticas (WILLIS, 2009). Em função destas características, buscam-se cada vez mais soluções que permitam controlar não apenas uma variável, mas sim processos e sistemas. Técnicas como MPC (Model Predictive Control), Redes Neurais, Lógica Fuzzy entre outras (QIN, 2003) (AVOY, 2002) têm sido utilizadas para controle de processos, através da manipulação de um conjunto de variáveis com o objetivo de controlar outro conjunto. Existem vários trabalhos abordando estas técnicas e uma infinidade de aplicações bem sucedidas. Uma pergunta honesta a ser feita é se seria possível a aplicação de um algoritmo com as características destacadas pelo ONFCDw em um contexto multivariável. Uma resposta consolidada para esta pergunta foge do escopo deste trabalho, porém buscamos avaliar a idéia como um primeiro passo para um futuro desenvolvimento nesta linha. No contexto multi-objetivo, a função objetiva que se deseja otimizar passa a ser a composição de vários objetivos distintos de controle. O erro pode ser então representado como uma combinação ponderada dos erros associados às variáveis controladas do processo. Em um sistema com múltiplas entradas e múltiplas saídas podemos trabalhar basicamente sujeito a três condições: 1. Sistemas com mesmo número de variáveis controladas e variáveis manipuladas, onde o grau de liberdade é igual a zero; 2. Sistemas com mais variáveis manipuladas do que variáveis controladas, onde existe grau de liberdade, o que permite pensar em estratégias de otimização de processos; 3. Sistemas com mais variáveis controladas do que manipuladas, onde a princípio, o problema não tem solução. A estrutura apresentada no item 3, mostra uma condição sem solução, pelos conceitos adotados a priori, onde se busca atender valores de referências (setpoint) de variáveis controladas por meio de manipulação de outras variáveis. Esta idéia, muito natural para um sistema monovariável, quando propagada para sistemas mais complexos pode ser muito restritiva e muitas vezes desnecessária. De fato, algumas variáveis de controle necessitam de ajustes mais precisos, enquanto outras precisam apenas permanecer dentro de alguma faixa operacional. Para ilustrar este conceito vamos imaginar um problema de controle uma unidade de destilação atmosférica. Devido ao acoplamento das diversas variáveis, a ação para controle de uma variável gera perturbações em diversas outras variáveis do sistema. Uma alteração na vazão de refluxo para controle de temperatura de topo aumentará a vazão de refluxo na torre como um todo, refletindo também em qualquer sistema de controle de temperatura ou qualidade em uma retirada lateral. Figura 6.5: Representação de uma unidade de destilação atmosférica com coluna pré-flash (FROZZA, 2005). Em um sistema como este, existem várias restrições operacionais de segurança, confiabilidade e qualidade a serem respeitadas. Em muitos casos, algumas das principais variáveis de controle são inferidas por modelos, ou analisadores virtuais. Exemplos típicos de aplicação de inferências são as estimações de qualidade de correntes (FROZZA, 2005) (DIEHL, 2009). Para este tipo de variável, normalmente busca-se um controle próximo da especificação desejada. Entretanto, é necessário que o processo esteja dentro de uma determinada janela operacional para permitir que seu comportamento seja adequado para a produção desejada. Deve-se garantir então que algumas variáveis não ultrapassem certos limites operacionais. Estas variáveis não precisam necessariamente ser controladas em um ponto de referência. Um exemplo típico é o controle de nível das torres retificadoras. Não há interesse econômico em se controlar o nível em um valor exato, mas é necessário evitar que o sistema seque ou atole para permitir a produção de derivados de maneira segura. Pode-se então definir as variáveis controladas em dois grupos distintos. Um grupo onde o controle deve ser um ponto de referência específico, como uma definição de qualidade e um grupo onde o controle deve apenas garantir a operação dentro de uma região de segurança. Desta forma pode-se pensar em um sistema de controle baseado em alguns valores de referências e outros baseados em faixas que só seriam ativados caso fosse ultrapassado algum limite. Isto permite a implementação de um sistema conforme apresentado no item três, uma vez que, apesar de se existir mais variáveis controladas do que manipuladas, algumas das variáveis controladas não estão ativas durante todo o tempo, reduzindo a dimensão do problema. Em função da natureza estocástica de todas as medições utilizadas em sistemas reais, de fato nem mesmo controles de qualidade deveriam ser operados buscando um valor fixo, uma vez que estatisticamente não existe diferença entre valores dentro da faixa de erro daquela variável. Com isto, o controle passaria a ser realizado totalmente em termos de faixas, sendo algumas mais estreitas do que outras. Outro ponto relevante em um sistema multivariável é que, como a ação para correção em um ponto afeta o ajuste de outro, deve-se de alguma forma pesar a importância de cada variável controlada. Em uma situação de objetivos conflitantes pode ser interessante privilegiar um controle mais crítico em detrimento de outro menos relevante. Por fim, quando o controle estiver com um grau de liberdade igual ou superior à um, pode ser interessante determinar uma direção de otimização do sistema. Esta direção pode ser determinada por métodos heurísticos definidos pelo projetista ou por um otimizador em tempo real (CAMOLESI, 2008). A primeira proposta consiste em definir direções de otimização para as variáveis manipuladas do sistema. Desta forma, se o sistema manipula a vazão de refluxo e vazões de retiradas laterais para controle do perfil térmico de uma torre, deve-se definir qual a direção de otimização de cada variável e qual a magnitude do ganho associado à cada uma delas. Já no caso do otimizador em tempo real, um otimizador baseado em modelos rigorosos dos processos incluindo variáveis econômicas e de mercado, busca uma condição otimizada da planta e envia um valores de referência de otimização à serem buscados por cada variável de processo. Uma primeira idéia Diante dos novos desafios, foi proposta uma primeira idéia do que poderia se chamar de ONFCDw multivariável. A função objetivo buscaria a minimização do erro das diversas variáveis controladas 𝐽 = 1 2 (𝑒1 2𝑕1𝑠𝑡1 + 𝑒2 2𝑕2𝑠𝑡2+. . . 𝑒𝑛𝑐𝑣 2 𝑕𝑛𝑐𝑣 𝑠𝑡𝑛𝑐𝑣 ) 6.2 As variáveis 𝑕𝑖 𝑒 𝑠𝑡𝑖 representam a importância relativa da variável controlada i e sua condição da ativação respectivamente. O termo st pode ser trabalhado de forma binária ou com alguma regra mais sofisticada para situações específicas, em função do ponto onde a variável controlada se encontra em relação à faixa de operação definida para ela. Para efeito de ilustração considera-se um sistema com duas variáveis controladas e duas variáveis manipuladas. Figura 6.6: Representação de uma estrutura multivariável baseada no ONFCDw Assim como no ONFCDw original, a otimização da função objetivo se dá pelo ajuste dos pesos dos controladores. Desta forma, teremos para o caso apresentado na Figura 6.6 as seguintes relações: 𝜕𝐽 𝜕𝑤11 = 𝜕𝐽 𝜕𝑒1 𝜕𝑒1 𝜕𝑦1 𝜕𝑦1 𝜕𝑢1 𝜕𝑢1 𝜕𝑤11 + 𝜕𝐽 𝜕𝑒2 𝜕𝑒2 𝜕𝑦2 𝜕𝑦2 𝜕𝑢1 𝜕𝑢1 𝜕𝑤11 + 1.𝜎𝑟𝑢𝑖𝑑𝑜𝐵 (𝑤11 − 𝑤12) 6.3 𝜕𝐽 𝜕𝑤12 = 𝜕𝐽 𝜕𝑒1 𝜕𝑒1 𝜕𝑦1 𝜕𝑦1 𝜕𝑢1 𝜕𝑢1 𝜕𝑤12 + 𝜕𝐽 𝜕𝑒2 𝜕𝑒2 𝜕𝑦2 𝜕𝑦2 𝜕𝑢1 𝜕𝑢1 𝜕𝑤12 − 1.𝜎𝑟𝑢𝑖𝑑𝑜𝐵 (𝑤11 − 𝑤12) 6.4 𝜕𝐽 𝜕𝑤21 = 𝜕𝐽 𝜕𝑒1 𝜕𝑒1 𝜕𝑦1 𝜕𝑦1 𝜕𝑢2 𝜕𝑢2 𝜕𝑤21 + 𝜕𝐽 𝜕𝑒2 𝜕𝑒2 𝜕𝑦2 𝜕𝑦2 𝜕𝑢2 𝜕𝑢2 𝜕𝑤21 + 1.𝜎𝑟𝑢𝑖𝑑𝑜𝐵 (𝑤21 − 𝑤22) 6.5 𝜕𝐽 𝜕𝑤22 = 𝜕𝐽 𝜕𝑒1 𝜕𝑒1 𝜕𝑦1 𝜕𝑦1 𝜕𝑢2 𝜕𝑢2 𝜕𝑤22 + 𝜕𝐽 𝜕𝑒2 𝜕𝑒2 𝜕𝑦2 𝜕𝑦2 𝜕𝑢2 𝜕𝑢2 𝜕𝑤22 − 1.𝜎𝑟𝑢𝑖𝑑𝑜𝐵 (𝑤21 − 𝑤22) 6.6 Fazendo analogia ao caso monovariável, 𝜕𝐽 𝜕𝑒1 = 𝑕1𝑠𝑡1𝑒1 𝜕𝐽 𝜕𝑒2 = 𝑕1𝑠𝑡1𝑒1 6.7 𝜕𝑒1 𝜕𝑦1 = −1 𝜕𝑒2 𝜕𝑦2 = −1 6.8 𝜕𝑦1 𝜕𝑢1 = 𝛼11 𝜕𝑦2 𝜕𝑢1 = 𝛼12 6.9 𝜕𝑦1 𝜕𝑢2 = 𝛼12 𝜕𝑦1 𝜕𝑢1 = 𝛼12 6.10 𝜕𝑢1 𝜕𝑤11 = 𝜇11 𝜕𝑢1 𝜕𝑤12 = 𝜇12 6.11 A dedução para a segunda ação de controle é análoga e por isto não será explicitada. Com isto, a regra de ajuste dos pesos passa a ser então: 𝑤11 𝑘 + 1 = 𝑤11 𝑘 + 𝑕1𝑠𝑡1𝑒1 −1 𝛼11𝜇11 + 𝑕2𝑠𝑡2𝑒2 −1 𝛼12𝜇11 + 1.𝜎𝑟𝑢𝑖𝑑𝑜𝐵 (𝑤11 − 𝑤12) 6.12 𝑤12 𝑘 + 1 = 𝑤12 𝑘 + 𝑕1𝑠𝑡1𝑒1 −1 𝛼11𝜇12 + 𝑕2𝑠𝑡2𝑒2 −1 𝛼12𝜇12 − 1.𝜎𝑟𝑢𝑖𝑑𝑜𝐵 (𝑤11 − 𝑤12) 6.13 𝑤21 𝑘 + 1 = 𝑤21 𝑘 + 𝑕1𝑠𝑡1𝑒1 −1 𝛼21𝜇21 + 𝑕2𝑠𝑡2𝑒2 −1 𝛼22𝜇21 + 1.𝜎𝑟𝑢𝑖𝑑𝑜𝐵 (𝑤11 − 𝑤12) 6.14 𝑤22 𝑘 + 1 = 𝑤22 𝑘 𝑕1𝑠𝑡1𝑒1 −1 𝛼21𝜇22 + 𝑕2𝑠𝑡2𝑒2 −1 𝛼22𝜇22 + 1.𝜎𝑟𝑢𝑖𝑑𝑜𝐵 (𝑤11 − 𝑤12) 6.15 As funções de pertinência são calculadas de maneira similar à apresentada para o ONFCDw monovariável, porém com a substituição do erro pelo somatório ponderado dos erros. A ação de controle de cada controlador será definida segundo as equações 6.16 e 6.17. 𝑢1 = 𝑤11𝜇11 + 𝑤12𝜇12 6.16 𝑢2 = 𝑤21𝜇21 + 𝑤22𝜇22 6.17 Esta proposta visa apenas instigar a possibilidade de uma implementação multivariável. A idéia é conseguir um controlador capaz de se ajustar a um processo de maneira mais global, buscando o ajuste que melhor adéque às ações de controle conforme objetivo de produção. Obviamente a discussão em um contexto multivariável deve ser mais ampla e responder a outras questões práticas e teóricas sobre o tema. 7 Conclusão O desenvolvimento de novas alternativas práticas para controle monovariável é um importante pilar para implementações de camadas de controles de processo. Após a difusão da aplicação do algoritmo PI e PID, verifica-se poucas aplicações práticas e em larga escala de sistemas controladores novos. Muito do sucesso associado à este algoritmo advém da sua simplicidade e facilidade de implementação. O algoritmo ONFCDw contempla, como mostrado neste trabalho, simplicidade, robustez, versatilidade e eficiência. Em suas aplicações, o desempenho do algoritmo apresentou bons resultados e suas propriedades adaptativas permitem manter este desempenho em detrimento de alterações de condições operacionais e da planta que se pretende controlar. O uso do controlador neurofuzzy ONFCDw para controle de processos sujeitos a perturbações frequentes mostrou-se como alternativa bastante viável, de implementação relativamente simples e de bom desempenho frente ao controle convencional. A análise do mesmo mostra que a partir da inclusão de um termo que leve em consideração a diferença entre os pesos relativos de cada função de pertinência, o algoritmo apresenta condição estável de ganho e ação de controle. Esta importante característica confere ao algoritmo maior confiabilidade e permite uma implementação mais segura do mesmo. Outro importante ponto discutido neste trabalho é a questão da sintonia dos parâmetros associados ao ONFCDw. Neste trabalho, propõe-se a sintonia dos parâmetros EM como igual à 3 vezes o desvio padrão do erro entre a variável de processo e o valor de referência e o termo de banda morta de ajuste dos pesos equivalente ao erro em regime permanente quando não é notada nenhuma perturbação na planta. Para este parâmetro considera-se o erro associado ao ruído de medição inerente ao processo de aquisição da informação. A partir desta última condição, fica pendente a definição de dois parâmetros, α e taxa. O termo taxa, definido de modo à se conseguir manter uma relação adequada entre crescimento dos pesos e eliminação de ganho excessivo, normalmente tem valores configuráveis entre 0,99 e 1. Exceções à esta regra devem ser analisadas para casos específicos como apresentados nas considerações realizadas no capítulo 6. Estas configurações iniciais permitem reduzir os parâmetros de sintonia para praticamente um, sendo este o termo de ajuste dos pesos ou α. O termo α guarda relações não lineares com algumas características das plantas como tempo morto, ganho e constante de tempo. Estas relações são de certa forma, previsíveis e a análise das curvas obtidas permitem uma condição de avaliação deste termo. É apresentada também uma análise do efeito da alteração dos parâmetros do sistema em relação a um valor fixo de sintonia para o α. Observa- se uma boa robustez do controlador quando submetido à esta condição de mudança de processos. Apenas em casos extremos verifica-se uma instabilidade do controlador. Esta característica reflete tanto a robustez do algoritmo para sistemas variantes no tempo, quanto para possíveis falhas de sintonias. Finalizando as questões relativas à sintonia, é proposto um algoritmo de cálculo de α ótimo baseado em uma rede neural simples, capaz de prover uma solução ótima de sintonia uma vez conhecido os parâmetros de constante de tempo, tempo morto e ganho. Ressalta-se neste ponto que, mesmo não se tendo uma informação precisa ou caso o sistema se mostre variante no tempo, a sintonia se mostrou boa para variações em torno deste ponto nos testes realizados. O trabalho apresenta os resultados obtidos da implementação do ONFCDw em simuladores dinâmicos e em uma implementação prática no SDCD 800XA da ABB. A implementação do controlador (ONFCDw) utilizada, de baixo esforço computacional, pode ser implementada com facilidade na grande maioria dos sistemas SDCD disponíveis comercialmente. Na aplicação prática no processo de Coqueamento Retardado os resultados obtidos superaram o desempenho dos controladores PID´s existentes anteriormente, mostrando as vantagens de se trabalhar com sistemas adaptativos e não lineares para o controle de plantas sujeitas à fortes alterações físicas. Observaram-se reduções superiores à 50% em relação ao desvio padrão do erro e integral do erro absoluto (ITAE). O sistema vem operando de maneira adequada e contínua desde sua implementação. Por fim são apresentadas novas propostas e idéias de aplicação do algoritmo. Nestas aplicações busca-se explorar a capacidade adaptativa e sua condição não-linear para tratar de problemas típicos dos processos industriais. Levanta-se também uma primeira idéia sobre uma aplicação multivariável e uma implementação baseada no ajuste de uma composição de erros de várias variáveis que se deseja controlar em um processo. 8 Referências Bibliográficas (ASILTÜRK, 2008) ASILTÜRK, I˙LHAN, ÜNÜVAR, ALI (2008). Intelligent adaptive control and monitoring of band sawing using a neural-fuzzy system. Journal of materials processing, pp.1-12. (AVOY, 2002) AVOY, T. M. (2002). Intelligent “control application in the process industries. Annual Reviews in Control 26, pp. 75-86. (BRAGA, 2000) BRAGA, A., CARVALHO A. P. L. F., LUDERMIR, T. B. (2000). Redes Neurais Artificiais: Teoria e Aplicação. Editora LTC. (CAMINHAS, 1998) CAMINHAS, W. M., TAVARES, H. M. F., GOMIDE, F. A. C., PEREIRA, GUIHERME A. S. (1998). Identificação de Sistemas Dinâmicos: Abordagem Baseada em Neurônio Nebuloso. Simpósio Brasileiro de Redes Neurais, Belo Horizonte, MG. Anais do V Simpósio Brasileiro de Redes Neurais, pp. 105-110. (CAMOLESI, 2008) CAMOLESI, V. J., ZANIN, A. C., MORO, L. F. L (2008). Implantação de um otimizador em tempo real (RTO) no conversor de uma unidade de craqueamento catalítico. Revista Controle & Automação, vol.19 n. 2. (CAMPOS, 2006) CAMPOS, M., TEIXEIRA, H. (2006). Controles Típicos de equipamentos e processos industriais. Editora Edgard Blücher, 1ª Edição. (CARVALHO, 2006) CARVALHO, M. A., GOUVÊA, M. R., SILVA, R. G., CAMINHAS, W. M. (2006). Uso de controlaores neurofuzzy baseado em redes NFN para controle de pH. In: Congresso Brasileiro de Automática, 2006, Salvador, BA. Anais do XVI Congresso Brasileiro de Automática, vol. 1. pp. 1-6. (CASTRUCCI, 1981) CASTRUCCI, P., CURTI, R. (1981). Sistemas Não-Lineares. Editora Edgard Blücher LTDA, vol. 2. (CHATURVEDI, 2008) CHATURVEDI, K. T., PANDIT, M., SRIVASTAVA, L. (2008). Modified neo-fuzzy neuron-based approach for economic and environmental optimal power dispatch Applied Soft Computing 8, pp. 1428–1438. (CHEN, 1999) CHEN, C., PENG, S. (1999) Intelligent process control using neural fuzzy techniques. Journal of Process Control 9, pp. 493- 503. (CHENA, 2007) CHENA J., CHAN, N. (2007). Mining the fuzzy control rules of aeration in a Submerged Biofilm Wastewater Treatment Process. Engineering Applications of Artificial Intelligence 20, pp. 959–969. (DIEHL, 2009) DIEHL, F.C., SECCHI A.R., LUSA L.P., MUNIZ L. A .R., LONGHI L. G. S. (2009). Simulação operacional de uma torre de destilação atmosférica via Aspen Plus e avaliação de modelos de analisadores virtuais. Sba Controle & Automação vol.20, n. 3. (FONSECA, 2004) FONSECA, M. O., CONSTANTINO, S. F., TORRES, S. (2004). Avaliação de desempenho e auditoria de malhas de controle. Intech Brasil 63, pp. 32 -35. (FROZZA, 2005) FROZZA, E., LUZ, L. F. JR (2005). Elaboração de modelo de inferência para controle de unidade de destilação atmosférica de petróleo. 3° Congresso Brasileiro de P&D em Petróleo e Gás. (GOUVÊA, 2005) GOUVÊA, M. R. (2005). Controle Neurofuzzy de Motor de Indução Com Estimação de Parâmetros e Fluxo de Estator. Tese de Doutorado, Programa de Pós-Graduação em Engenharia Elétrica, Universidade Federal de Minas Gerais, Belo Horizonte, MG. (JANG, 1997) JANG, J. S. R., SUN, C. T., MIZUTANI, E. (1997) Neurofuzzy and Soft Computing. Prentice Hall. (KOVÁCS, 1996) KOVÁCS, Z. L. (1996). Redes Neurais Artificiais: Fundamentos e Aplicações. Ed. Collegium Cognitio, 2ª edição. (NARENDRA, 1990) NARENDRA, K.S., PARTHRASARATHY, K. (1990). Identification and control of dynamical systems using neural networks. IEEE Trans. Neural Net. 1. (NIED, 2007) NIED, A. (2007). Treinamento de redes neurais artificiais baseados em sistemas de estrutura variável com taxa de aprendizado adaptativa. Tese de Doutorado, Programa de Pós- Graduação em Engenharia Elétrica, Universidade Federal de Minas Gerais, Belo Horizonte, MG. (OGATA, 2003) OGATA, K.(2003). Engenharia de Controle Moderno. Rio de Janeiro: Prentice-Hall do Brasil Ltda. (PASSINO, 1998) PASSINO, K. M., YURKOVICH, S. (1998). Fuzzy Control. Ed. Addison-Wesley Longman, Inc. (PHAN, 2008) PHAN, P. A., GALE, T. J. (2008). Direct adaptive fuzzy control with a self-structuring algorithm. Fuzzy Sets and Systems 159 pp. 871 – 899. (PHILLIPS, 1995) PHILLIPS, C. L., NAGLE, H. T. JR. (1995). Digital Control System Analysis and Design. Third edition, Prentice-Hall, Englewood Cliffs, N.J., ISBN:0-13-309832-X. (PIRES, 2007) PIRES A. V. (2007). Controladores baseados em técnicas de inteligência computacional: Análise, projeto e aplicação. Dissertação de Mestrado, Programa de Pós-Graduação em Engenharia Elétrica, Universidade Federal de Minas Gerais, Belo Horizonte, MG. (QIN, 2003) QIN, S. J., BADGWELL, T. A. (2003). A survey of industrial model predictive control technology. Control Engineering Practice 11, pp. 733–764. (REZNIK, 2000) REZNIK, L., GHANAYEM, O., BOURMISTROV, A. (2000). PID plus fuzzy controller structures as a design base for industrial applications. Engineering Applications of Artificial Intelligence 13, pp. 419-430. (SALAA, 2005) SALAA, A., GUERRAB, T. M., BABUŠKAC R. (2005). Perspectives of fuzzy systems and control. Fuzzy Sets and Systems 156, pp. 432–444. (SHING, 1993) SHING, J., JANG, R. (1993). ANFIS: Adaptative-Network- Based Fuzzy Inference System. IEEE Transactions on Systems, Man, and Cybernetics, vol. 23, nº 3, pp. 665-685. (SILVA, 2009) SILVA, J. M. (2009). Rotina ID. site : http://www.ece.ufrgs.br/~jmgomes/pid/Apostila/apostila/node37.ht ml dia 21/11/2009, 10h30min. (SJÖBERG, 2009) SJÖBERG, J., PER-OLOFGUTMAN, MUKULAGARWAL, MIKEBAX (2009). Nonlinear controller tuning based on a sequence of identifications of linearized time-varying models. Control Engineering Practice 17, pp. 311–321. (SOUSA, 1999) SOUSA, J. M., BABUIKA, R., VERBRUGGEN H.B. (1997). Fuzzy predictive control applied to an air-conditioning system. ControlEng. Practice, vol. 5, n.10, pp. 1395-1406. (SWIECH, 2005) SWIECH, M. C., OROSKI, E., ARRUDA, V. R. (2005). Sintonia de controladores PID em colunas de destilação através de algoritmos Genéticos. 3º Congresso Brasileiro de P&D em Petróleo e Gas, Salvador, BA. (TALLES, 2001) TALLES, P. (2001). Tubulações industriais, materiais, projeto, montagem. Editora LTC, 10ª edição. (TORRES, 2005) TORRES, S. B., HORI, S. E. (2005). Análise de desempanho de malhas de controle na indústria petroquímica. 4º Seminário Nacional de Controle e Automação, Salvador, BA. (UCHINO, 1994) UCHINO, E., YAMAKAWA, T. (1994). Neo-fuzzy neuron based new approach to system modeling with application to actual system. Proc. VI International Conference on Tools with AI, pp. 564–570. (WILLIS, 2009) WILLIS, M. J., THAM, M. T. (2009). Advanced process control. School of Chemical Engineering and Advanced Materials, site http://lorien.ncl.ac.uk/ming/advcontrl/sect3.htm#b3, dia24/11/2009, 22h. (YAMAKAWA, 1992) YAMAKAWA, T., UCHINO, E., MIKI, YUSANAGI, T. (1992). A Neo Fuzzy Neuron and its Applications to System Identification and Predictions to System Behavior. Proc. Of the 2nd IIZUKA, IIizuka-Japan , pp. 477-483. (YING, 2007) YING, L., YUANCHUN, L. (2007). Neural-fuzzy control of truck backer-upper system using a clustering method. Neurocomputing 70, pp. 680–688. (ZIEGLER, 1942) ZIEGLER, J. G., NICHOLS, N. B. (1942). Optimum Settings for Automatic Controllers. ASME, vol. 64, pp.759-768.