Análise comparativa da classificação de séries temporais representadas como grafos
Carregando...
Arquivos
Data
Autor(es)
Título da Revista
ISSN da Revista
Título de Volume
Editor
Universidade Federal de Minas Gerais
Descrição
Tipo
Dissertação de mestrado
Título alternativo
Primeiro orientador
Membros da banca
Martín Goméz Ravetti
Paulo Salgado Gomes de Mattos Neto
Paulo Salgado Gomes de Mattos Neto
Resumo
A classificação de séries temporais é um problema fundamental em diversas áreas, como medicina, finanças e engenharia. Recentemente, abordagens baseadas em grafos vêm se mostrando promissoras para essa tarefa, permitindo capturar padrões e relações complexas nos dados temporais. Este trabalho apresenta um estudo comparativo de diferentes modelos para representação de séries temporais como grafos, investigando: (1) os principais modelos disponíveis; (2) como eles se comparam em termos de concordância e desempenho; (3) sua performance em relação a modelos convolucionais; (4) diferenças estatisticamente significativas entre os modelos; (5) arquiteturas mais eficazes; e (6) a influência das características das séries temporais no desempenho dos classificadores. Os experimentos foram conduzidos em 16 conjuntos de dados, incluindo 10 do UCR Archive e 6 derivados do CODE-15\%, um repositório de eletrocardiogramas. A caracterização dessas séries revelou que força de tendência, sazonalidade, ruído e autocorrelação são fatores determinantes no desempenho dos modelos. Os resultados, avaliados através de testes estatísticos de Friedman com post-hoc de Nemenyi e análise de concordância via Kappa de Fleiss, revelaram que os modelos avaliados possuem desempenhos estatisticamente similares e que existe uma concordância leve a moderada entre os modelos ($\kappa$ = 0.0176), com maior estabilidade para séries previsíveis e menor concordância em séries ruidosas. A seleção do modelo ideal depende do tipo da série temporal, sendo que ROCKET foi mais eficaz para ECG e espectros, SimTSC-GNA para séries com alta autocorrelação e VisibilityGraph-3feat para séries sazonais, conforme detalhado na recomendação de modelos. Este estudo estabelece a primeira análise estatística abrangente da performance de diferentes modelos de CSTG, fornecendo percepções valiosas sobre sua aplicabilidade e orientando futuras pesquisas no uso de aprendizado em grafos para classificação de séries temporais.
Abstract
Time series classification is a fundamental problem in various domains, such as medicine, finance, and engineering. Recently, graph-based approaches have shown promise for this task, enabling the capture of complex patterns and relationships in temporal data.
This work presents a comparative study of different models for time series representation as graphs, investigating: (1) the main models available; (2) how they compare in terms of agreement and performance; (3) their effectiveness compared to convolutional models; (4) statistically significant differences among models; (5) the most effective architectures; and (6) the influence of time series characteristics on classifier performance. Experiments were conducted on 16 datasets, including 10 from the UCR Archive and 6 derived from CODE-15\%, a repository of electrocardiograms. The characterization of these datasets revealed that trend strength, seasonality, noise, and autocorrelation are key factors in model performance. The results, evaluated through Friedman statistical tests with Nemenyi post-hoc analysis and agreement assessment via Fleiss' Kappa, showed that the evaluated models exhibit statistically similar performance and that there is a slight to moderate agreement between models ($\kappa$ = 0.0176), with greater stability for structured time series and lower agreement in noisy datasets. The choice of the best model depends on the type of time series: ROCKET performed best for ECG and spectral datasets, SimTSC-GNA was more effective for highly autocorrelated series, and VisibilityGraph-3feat outperformed others in seasonal time series, as detailed in the model recommendations. This study establishes the first comprehensive statistical analysis of different CSTG (Classification of Time Series as Graphs) models, providing relevant insights into their applicability and guiding future research on graph-based learning for time series classification.
Assunto
Computação – Teses, Análise de séries temporais – Teses, Teoria dos grafos – Teses
Palavras-chave
matemática, computação, séries temporais, grafos