Análise comparativa da classificação de séries temporais representadas como grafos

Carregando...
Imagem de Miniatura

Título da Revista

ISSN da Revista

Título de Volume

Editor

Universidade Federal de Minas Gerais

Descrição

Tipo

Dissertação de mestrado

Título alternativo

Primeiro orientador

Membros da banca

Martín Goméz Ravetti
Paulo Salgado Gomes de Mattos Neto

Resumo

A classificação de séries temporais é um problema fundamental em diversas áreas, como medicina, finanças e engenharia. Recentemente, abordagens baseadas em grafos vêm se mostrando promissoras para essa tarefa, permitindo capturar padrões e relações complexas nos dados temporais. Este trabalho apresenta um estudo comparativo de diferentes modelos para representação de séries temporais como grafos, investigando: (1) os principais modelos disponíveis; (2) como eles se comparam em termos de concordância e desempenho; (3) sua performance em relação a modelos convolucionais; (4) diferenças estatisticamente significativas entre os modelos; (5) arquiteturas mais eficazes; e (6) a influência das características das séries temporais no desempenho dos classificadores. Os experimentos foram conduzidos em 16 conjuntos de dados, incluindo 10 do UCR Archive e 6 derivados do CODE-15\%, um repositório de eletrocardiogramas. A caracterização dessas séries revelou que força de tendência, sazonalidade, ruído e autocorrelação são fatores determinantes no desempenho dos modelos. Os resultados, avaliados através de testes estatísticos de Friedman com post-hoc de Nemenyi e análise de concordância via Kappa de Fleiss, revelaram que os modelos avaliados possuem desempenhos estatisticamente similares e que existe uma concordância leve a moderada entre os modelos ($\kappa$ = 0.0176), com maior estabilidade para séries previsíveis e menor concordância em séries ruidosas. A seleção do modelo ideal depende do tipo da série temporal, sendo que ROCKET foi mais eficaz para ECG e espectros, SimTSC-GNA para séries com alta autocorrelação e VisibilityGraph-3feat para séries sazonais, conforme detalhado na recomendação de modelos. Este estudo estabelece a primeira análise estatística abrangente da performance de diferentes modelos de CSTG, fornecendo percepções valiosas sobre sua aplicabilidade e orientando futuras pesquisas no uso de aprendizado em grafos para classificação de séries temporais.

Abstract

Time series classification is a fundamental problem in various domains, such as medicine, finance, and engineering. Recently, graph-based approaches have shown promise for this task, enabling the capture of complex patterns and relationships in temporal data. This work presents a comparative study of different models for time series representation as graphs, investigating: (1) the main models available; (2) how they compare in terms of agreement and performance; (3) their effectiveness compared to convolutional models; (4) statistically significant differences among models; (5) the most effective architectures; and (6) the influence of time series characteristics on classifier performance. Experiments were conducted on 16 datasets, including 10 from the UCR Archive and 6 derived from CODE-15\%, a repository of electrocardiograms. The characterization of these datasets revealed that trend strength, seasonality, noise, and autocorrelation are key factors in model performance. The results, evaluated through Friedman statistical tests with Nemenyi post-hoc analysis and agreement assessment via Fleiss' Kappa, showed that the evaluated models exhibit statistically similar performance and that there is a slight to moderate agreement between models ($\kappa$ = 0.0176), with greater stability for structured time series and lower agreement in noisy datasets. The choice of the best model depends on the type of time series: ROCKET performed best for ECG and spectral datasets, SimTSC-GNA was more effective for highly autocorrelated series, and VisibilityGraph-3feat outperformed others in seasonal time series, as detailed in the model recommendations. This study establishes the first comprehensive statistical analysis of different CSTG (Classification of Time Series as Graphs) models, providing relevant insights into their applicability and guiding future research on graph-based learning for time series classification.

Assunto

Computação – Teses, Análise de séries temporais – Teses, Teoria dos grafos – Teses

Palavras-chave

matemática, computação, séries temporais, grafos

Citação

Endereço externo

Avaliação

Revisão

Suplementado Por

Referenciado Por