Exploring explainability in atypical performance regions for time series classifiers with shapelets

Samir Tuffi Saliba Junior

Exploring explainability in atypical performance regions for time series classifiers with shapelets

Arquivos

dissertacao-samir-saliba.pdf (2 MB)

Data

2025-12-01

Autor(es)

Samir Tuffi Saliba Junior

Editor

Universidade Federal de Minas Gerais

Tipo

Dissertação de mestrado

Título alternativo

Explorando a explicabilidade em regiões de desempenho atípicas para classificadores de séries temporais com shapelets

Primeiro orientador

Renato Vimieiro

Membros da banca

Wagner Meira Junior
Gisele Lobo Pappa

Resumo

Understanding when and where machine learning models fail is crucial for deploying trustworthy systems in critical applications. While explainable artificial intelligence (XAI) has advanced significantly in domains like computer vision and natural language processing, systematic error analysis for time series classification remains underexplored. This work addresses the fundamental question: Can shapelet-based patterns be used to identify regions of atypical performance in time series classifiers? We propose a novel subgroup discovery methodology that combines evolutionary programming with shapelet-based pattern recognition to automatically uncover interpretable temporal structures associated with classifier failures. Our approach formulates slice discovery as an optimization problem where shapelets serve as building blocks for defining regions of atypical model error, while an evolutionary algorithm systematically searches for diverse, high-quality subgroups characterized by significant error deviations. Unlike traditional feature-based slice discovery methods that lose temporal semantics, our shapelet-first design preserves interpretability while achieving superior pattern specificity and diversity. Experimental validation on synthetic benchmarks demonstrates perfect recovery of embedded error patterns: our algorithm achieved 100% purity and recall for distinct patterns while maintaining low redundancy (mean Jaccard similarity: 0.161), compared to a feature-based baseline that achieved only 44.7% purity with high redundancy (0.585). Real-world case studies across UCR benchmark datasets reveal classifier-specific vulnerabilities and stable performance regions, with discovered shapelets converging to nearly identical structural patterns across different models for easy-to-classify instances. This model-agnostic approach provides practitioners with automated, interpretable characterizations of error patterns through temporal structures that domain experts can directly examine and validate, addressing critical gaps in time series model auditing and debugging.

Abstract

Compreender quando e onde modelos de aprendizado de máquina falham é crucial para implementar sistemas confiáveis em aplicações críticas. Embora a inteligência artificial explicável (XAI) tenha avançado significativamente em domínios como visão computacional e processamento de linguagem natural, a análise sistemática de erros para classificação de séries temporais permanece pouco explorada. Este trabalho aborda a questão fundamental: Podem padrões baseados em shapelets ser usados para identificar regiões de desempenho atípico em classificadores de séries temporais? Propomos uma metodologia inovadora de descoberta de subgrupos que combina programação evolutiva com reconhecimento de padrões baseado em shapelets para descobrir automaticamente estruturas temporais interpretáveis associadas a falhas de um classificador. Nossa abordagem formula a descoberta de slices como um problema de otimização onde shapelets servem como elementos fundamentais para definir regiões de erro atípico do modelo, enquanto um algoritmo evolutivo busca sistematicamente por subgrupos diversos e de alta qualidade caracterizados por desvios significativos de erro. Diferentemente dos métodos tradicionais de descoberta de slices baseados em características que perdem a semântica temporal, nosso design centrado em shapelets preserva a interpretabilidade enquanto alcança especificidade de padrões e diversidade superiores. A validação experimental em benchmarks sintéticos demonstra recuperação perfeita de padrões de erro embutidos: nosso algoritmo alcançou 100% de pureza e revocação para padrões distintos mantendo baixa redundância (similaridade Jaccard média: 0,161), comparado a um algoritmo baseline baseado em extração de características que alcançou apenas 44,7% de pureza com alta redundância (0,585). Estudos de caso do mundo real em conjuntos de dados benchmark da Universidade da Califórnia (UCR) revelam vulnerabilidades específicas do classificador e regiões de desempenho estável, com shapelets descobertas convergindo para padrões estruturais quase idênticos entre diferentes modelos para instâncias fáceis de classificar. Esta abordagem agnóstica ao modelo fornece aos usuários caracterizações automatizadas e interpretáveis de padrões de erro através de estruturas temporais que especialistas do domínio podem examinar e validar diretamente, abordando lacunas críticas na auditoria e depuração de modelos de séries temporais.

Assunto

Computação – Teses, Aprendizado do computador – Teses, Inteligência artificial – Teses, Análise de sériesTemporais - Teses

Palavras-chave

Slice discovery, Explainable artificial intelligence, Subgroup discovery, Time series, Explainability

URI

https://hdl.handle.net/1843/2440

Departamento

ICX - DEPARTAMENTO DE CIÊNCIA DA COMPUTAÇÃO

Curso

Programa de Pós-Graduação em Ciência da Computação

Coleções

Pós-Graduação em Ciência da Computação - Teses

Licença Creative Commons

Exceto quando indicado de outra forma, a licença deste item é descrita como Acesso aberto

Página do item completo

Exploring explainability in atypical performance regions for time series classifiers with shapelets

Arquivos

Data

Autor(es)

Título da Revista

ISSN da Revista

Título de Volume

Editor

Descrição

Tipo

Título alternativo

Primeiro orientador

Membros da banca

Resumo

Abstract

Assunto

Palavras-chave

Citação

URI

Departamento

Curso

Endereço externo

Coleções

Avaliação

Revisão

Suplementado Por

Referenciado Por

Licença Creative Commons