Learning nonlinear differentiable models for signals and systems: with applications

Antônio Horta Ribeiro

Use este identificador para citar ou linkar para este item: http://hdl.handle.net/1843/33922

Tipo:	Tese
Título:	Learning nonlinear differentiable models for signals and systems: with applications
Título(s) alternativo(s):	Aprendendo modelos não-lineares diferenciáveis para sinais e sistemas: com aplicações
Autor(es):	Antônio Horta Ribeiro
Primeiro Orientador:	Luis Antonio Aguirre
Primeiro Coorientador:	Thomas B. Schon
Primeiro membro da banca :	Eduardo Mazoni Andrade Marçal Mendes
Segundo membro da banca:	Frederico Gadelha Guimarães
Terceiro membro da banca:	Guilherme de Alencar Barreto
Quarto membro da banca:	Leandro dos Santos Coelho
Quinto membro da banca:	Maarten Schoukens
Resumo:	Building empirical models from data is of fundamental importance in engineering, and pushing the boundaries of current engineering technology requires us to model and understand nonlinear systems. In this thesis, nonlinear differentiable models and its applications are studied. This class of models has gained traction in machine learning tasks with the introduction of deep learning. Indeed, deep models of stacked differentiable components have recently achieved super-human performance on several tasks, including computer games, image classification, and medical diagnosis. The application of nonlinear differentiable models is studied for modeling signals and systems both for engineering and machine learning applications. One central question is the role of recurrence and the pros and cons of recurrent and feedforward models. The question is approached from more than one angle: 1) by studying the effect of recurrence in neural networks in terms of robustness to noise, computational cost, and convergence; 2) by analyzing the smoothness of the cost function in nonlinear system identification problems and its relation to the model internal dynamics – and proposing the use of a technique called multiple shooting for improving the cost-function smoothness; and, 3) by investigating the interplay between the internal dynamics, the attractors and the expressiveness of the model in deep recurrent neural networks. The more applied part of the thesis consists of the use of deep neural networks to solve complex tasks and to model nonlinear behavior from real data. Data from the Telehealth Center of Minas Gerais is used to train a deep neural network capable of identifying abnormalities in the electrocardiogram exam with performance superior to the medical residents in the studied scenario. Also, a deep neural network is used for modeling an electronic oscillator and an F-16 aircraft using data from ground vibration experiments, obtaining competitive results in both cases.
Abstract:	Construir modelos empíricos a partir de dados é de fundamental importância em engenharia e, além disso, o entendimento e a capacidade de modelar sistemas não lineares são necessários para o desenvolvimento de tecnologias de fronteira. Nesse trabalho, modelos diferenciáveis não lineares e suas aplicações são estudados. Esta classe de modelos tem ganhado força na área de aprendizado de máquina com a introdução do aprendizado profundo. De fato, modelos profundos de componentes diferenciáveis alcançaram, recentemente, desempenho superior ao humano em diversas tarefas, incluindo a competição em jogos digitais, classificação de imagens e diagnóstico de exames médicos. A aplicação de modelos não lineares diferenciáveis é estudada para modelar sinais e sistemas, tanto no contexto de aplicações em engenharia quanto no contexto de aprendizado de máquina. Uma questão central é o papel da recorrência, e os prós e os contras de modelos recorrentes. A questão é abordada de mais de um ângulo: 1) estudando o efeito da recorrência em redes neurais em termos da robustez a ruído, custo computacional e convergência; 2) analisando a suavidade da função de custo na identificação de sistemas não lineares e a relação com a dinâmica interna do modelo – e propondo o uso da técnica de múltiplos tiros para melhorar a suavidade da função custo; e, 3) investigando a relação entre dinâmica interna, atractores e expressividade do modelo em redes neurais recorrentes. A parte mais aplicada desta tese consiste no uso de redes neurais profundas para resolver tarefas complexas e modelar comportamento não linear a partir de dados reais. Dados do Centro de Telessaúde do estado de Minas Gerais são usados para treinar uma rede neural capaz de identificar abnormalidades no eletrocardiograma com desempenho superior ao de residentes de medicina no cenário estudado. Além disso, uma rede neural profunda é usada para modelar um oscilador eletrônico e uma aeronave F-16 usando dados de um ensaio de vibrações, obtendo resultados competitivos nos dois casos.
Assunto:	Engenharia elétrica Aprendizado do computador Aprendizado profundo Identificação de sistemas Sistemas não lineares
Idioma:	eng
País:	Brasil
Editor:	Universidade Federal de Minas Gerais
Sigla da Instituição:	UFMG
Departamento:	ENG - DEPARTAMENTO DE ENGENHARIA ELÉTRICA ENG - DEPARTAMENTO DE ENGENHARIA ELETRÔNICA
Curso:	Programa de Pós-Graduação em Engenharia Elétrica
Tipo de Acesso:	Acesso Aberto
metadata.dc.rights.uri:	http://creativecommons.org/licenses/by-nc-nd/3.0/pt/
URI:	http://hdl.handle.net/1843/33922
Data do documento:	3-Mar-2020
Aparece nas coleções:	Teses de Doutorado

Arquivos associados a este item:

Arquivo	Descrição	Tamanho	Formato
phd-antonio.pdf		17.56 MB	Adobe PDF	Visualizar/Abrir

Mostrar registro completo do item Visualizar estatísticas

Este item está licenciada sob uma Licença Creative Commons