Análise comparativa da classificação de séries temporais representadas como grafos

dc.creatorPaulo Henrique de Souza Coelho
dc.date.accessioned2025-08-05T18:02:02Z
dc.date.accessioned2025-09-09T00:23:40Z
dc.date.available2025-08-05T18:02:02Z
dc.date.issued2025-01-29
dc.description.abstractTime series classification is a fundamental problem in various domains, such as medicine, finance, and engineering. Recently, graph-based approaches have shown promise for this task, enabling the capture of complex patterns and relationships in temporal data. This work presents a comparative study of different models for time series representation as graphs, investigating: (1) the main models available; (2) how they compare in terms of agreement and performance; (3) their effectiveness compared to convolutional models; (4) statistically significant differences among models; (5) the most effective architectures; and (6) the influence of time series characteristics on classifier performance. Experiments were conducted on 16 datasets, including 10 from the UCR Archive and 6 derived from CODE-15\%, a repository of electrocardiograms. The characterization of these datasets revealed that trend strength, seasonality, noise, and autocorrelation are key factors in model performance. The results, evaluated through Friedman statistical tests with Nemenyi post-hoc analysis and agreement assessment via Fleiss' Kappa, showed that the evaluated models exhibit statistically similar performance and that there is a slight to moderate agreement between models ($\kappa$ = 0.0176), with greater stability for structured time series and lower agreement in noisy datasets. The choice of the best model depends on the type of time series: ROCKET performed best for ECG and spectral datasets, SimTSC-GNA was more effective for highly autocorrelated series, and VisibilityGraph-3feat outperformed others in seasonal time series, as detailed in the model recommendations. This study establishes the first comprehensive statistical analysis of different CSTG (Classification of Time Series as Graphs) models, providing relevant insights into their applicability and guiding future research on graph-based learning for time series classification.
dc.description.sponsorshipCAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior
dc.identifier.urihttps://hdl.handle.net/1843/84066
dc.languagepor
dc.publisherUniversidade Federal de Minas Gerais
dc.rightsAcesso Aberto
dc.subjectComputação – Teses
dc.subjectAnálise de séries temporais – Teses
dc.subjectTeoria dos grafos – Teses
dc.subject.othermatemática
dc.subject.othercomputação
dc.subject.otherséries temporais
dc.subject.othergrafos
dc.titleAnálise comparativa da classificação de séries temporais representadas como grafos
dc.typeDissertação de mestrado
local.contributor.advisor1Renato Vimieiro
local.contributor.advisor1Latteshttp://lattes.cnpq.br/5736183954752317
local.contributor.referee1Martín Goméz Ravetti
local.contributor.referee1Paulo Salgado Gomes de Mattos Neto
local.creator.Latteshttp://lattes.cnpq.br/6163120762977256
local.description.resumoA classificação de séries temporais é um problema fundamental em diversas áreas, como medicina, finanças e engenharia. Recentemente, abordagens baseadas em grafos vêm se mostrando promissoras para essa tarefa, permitindo capturar padrões e relações complexas nos dados temporais. Este trabalho apresenta um estudo comparativo de diferentes modelos para representação de séries temporais como grafos, investigando: (1) os principais modelos disponíveis; (2) como eles se comparam em termos de concordância e desempenho; (3) sua performance em relação a modelos convolucionais; (4) diferenças estatisticamente significativas entre os modelos; (5) arquiteturas mais eficazes; e (6) a influência das características das séries temporais no desempenho dos classificadores. Os experimentos foram conduzidos em 16 conjuntos de dados, incluindo 10 do UCR Archive e 6 derivados do CODE-15\%, um repositório de eletrocardiogramas. A caracterização dessas séries revelou que força de tendência, sazonalidade, ruído e autocorrelação são fatores determinantes no desempenho dos modelos. Os resultados, avaliados através de testes estatísticos de Friedman com post-hoc de Nemenyi e análise de concordância via Kappa de Fleiss, revelaram que os modelos avaliados possuem desempenhos estatisticamente similares e que existe uma concordância leve a moderada entre os modelos ($\kappa$ = 0.0176), com maior estabilidade para séries previsíveis e menor concordância em séries ruidosas. A seleção do modelo ideal depende do tipo da série temporal, sendo que ROCKET foi mais eficaz para ECG e espectros, SimTSC-GNA para séries com alta autocorrelação e VisibilityGraph-3feat para séries sazonais, conforme detalhado na recomendação de modelos. Este estudo estabelece a primeira análise estatística abrangente da performance de diferentes modelos de CSTG, fornecendo percepções valiosas sobre sua aplicabilidade e orientando futuras pesquisas no uso de aprendizado em grafos para classificação de séries temporais.
local.publisher.countryBrasil
local.publisher.departmentICX - DEPARTAMENTO DE CIÊNCIA DA COMPUTAÇÃO
local.publisher.initialsUFMG
local.publisher.programPrograma de Pós-Graduação em Ciência da Computação

Arquivos

Pacote original

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
versao_final.pdf
Tamanho:
1.66 MB
Formato:
Adobe Portable Document Format

Licença do pacote

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
license.txt
Tamanho:
2.07 KB
Formato:
Plain Text
Descrição: