Um novo método de AutoML para séries temporais: decomposição, causalidade, otimização evolutiva multitarefa e agentes
Carregando...
Arquivos
Data
Autor(es)
Título da Revista
ISSN da Revista
Título de Volume
Editor
Universidade Federal de Minas Gerais
Descrição
Tipo
Tese de doutorado
Título alternativo
Primeiro orientador
Membros da banca
Walmir Matos Caminhas
Adriano Alonso Veloso
Bruno Riccelli dos Santos Silva
Péricles Barbosa Cunha de Miranda
Adriano Alonso Veloso
Bruno Riccelli dos Santos Silva
Péricles Barbosa Cunha de Miranda
Resumo
A previsão de séries temporais desempenha um papel fundamental em diversos domínios práticos, auxiliando no planejamento, na tomada de decisão e na identificação antecipada de padrões e anomalias. A eficácia dessas aplicações depende da capacidade de extrair informações relevantes de observações históricas, tornando essencial o desenvolvimento contínuo de metodologias capazes de aprimorar a precisão e a interpretabilidade dos modelos. Embora existam estratégias de automação para esse processo, a criação de soluções verdadeiramente universais permanece desafiadora, especialmente devido à dificuldade de integrar, em uma única abordagem, diferentes tipos de modelos e técnicas adequadas a múltiplos domínios de aplicação. Nesse contexto, esta tese apresenta o AutoDCE-TS, uma nova abordagem de AutoML baseada em Decomposição, Descoberta Causal e Otimização Evolutiva Multitarefa para previsão de séries temporais multivariadas. O AutoDCE-TS adota uma arquitetura de Múltiplas Entradas e Saída Única composta por quatro camadas responsáveis por automatizar a extração e seleção de características, seleção de modelos, otimização de hiperparâmetros e previsão. A metodologia cria fluxos explicáveis ao estruturar subpipelines específicos para cada variável da série multivariada e para os componentes gerados pela decomposição. Para cada variável, um grafo causal é construído e utilizado como entrada para um modelo baseado em árvores de regressão. A similaridade entre as variáveis é explorada por meio de otimização evolutiva multitarefa, permitindo selecionar simultaneamente os modelos e seus hiperparâmetros com maior eficiência computacional. Foram realizados experimentos em 18 conjuntos de dados, envolvendo a comparação com 11 métodos. Os resultados demonstram que o AutoDCE-TS é competitivo e aplicável a diferentes domínios, configurando-se como uma solução eficiente para previsão de séries temporais. Além disso, esta tese introduz o AutoDCE-TS-Agentic, um sistema multiagente baseado em modelos de linguagem (LLMs) projetado para ampliar a automação e facilitar o uso do AutoDCE-TS. O sistema coordena agentes especializados para realizar tarefas como imputação de valores ausentes, análise das séries temporais de entrada, configuração automática dos hiperparâmetros críticos e geração de relatórios explicativos. O AutoDCE-TS-Agentic oferece uma interface mais acessível ao usuário, melhora a interpretabilidade dos fluxos de previsão e torna o processo mais transparente e reprodutível, complementando e estendendo as capacidades do AutoDCE-TS.
Abstract
Time series forecasting plays a fundamental role in several practical domains, supporting planning, decision-making, and the early identification of patterns and anomalies. The effectiveness of these applications depends on the ability to extract relevant information from historical observations, making the continued development of methodologies that enhance model accuracy and interpretability essential. Although automation strategies exist for this process, designing truly universal solutions remains challenging, particularly due to the difficulty of integrating, within a single approach, different types of models and techniques suitable for multiple application domains. In this context, this thesis presents AutoDCE-TS, a novel AutoML approach for multivariate time series forecasting based on Decomposition, Causal Discovery, and Multitask Evolutionary Optimization. AutoDCE-TS adopts a Multiple-Input Single-Output architecture composed of four layers responsible for automating feature extraction and selection, model selection, hyperparameter optimization, and forecasting. The methodology generates explainable pipelines by structuring specific sub-pipelines for each variable in the multivariate series and for the components generated through decomposition. For each variable, a causal graph is constructed and used as input to a regression tree-based model. Variable similarity is leveraged through multitask evolutionary optimization, enabling the simultaneous selection of models and hyperparameters with improved computational efficiency. Experiments were conducted on 18 datasets, involving comparisons with 11 methods. The results demonstrate that AutoDCE-TS is competitive and applicable across different domains, establishing it as a efficient solution for time series forecasting. Furthermore, this thesis introduces AutoDCE-TS-Agentic, a multi-agent system based on large language models (LLMs) designed to extend automation and facilitate the use of AutoDCE-TS. The system coordinates specialized agents to perform tasks such as missing-value imputation, analysis of the input time series, automatic configuration of critical hyperparameters, and generation of explanatory reports. AutoDCE-TS-Agentic provides a more accessible user interface, enhances the interpretability of forecasting pipelines, and makes the process more transparent and reproducible, thereby complementing and extending the capabilities of AutoDCE-TS.
Assunto
Engenharia elétrica, Análise de séries temporais, Previsão
Palavras-chave
Séries temporais, Previsão, AutoML, Multivariadas, Agentes