Exploring explainability in atypical performance regions for time series classifiers with shapelets
Carregando...
Arquivos
Data
Autor(es)
Título da Revista
ISSN da Revista
Título de Volume
Editor
Universidade Federal de Minas Gerais
Descrição
Tipo
Dissertação de mestrado
Título alternativo
Explorando a explicabilidade em regiões de desempenho atípicas para classificadores de séries temporais com shapelets
Primeiro orientador
Membros da banca
Wagner Meira Junior
Gisele Lobo Pappa
Gisele Lobo Pappa
Resumo
Understanding when and where machine learning models fail is crucial for deploying trustworthy systems in critical applications. While explainable artificial intelligence (XAI) has advanced significantly in domains like computer vision and natural language processing, systematic error analysis for time series classification remains underexplored. This work addresses the fundamental question: Can shapelet-based patterns be used to identify regions of atypical performance in time series classifiers? We propose a novel subgroup discovery methodology that combines evolutionary programming with shapelet-based pattern recognition to automatically uncover interpretable temporal structures associated with classifier failures. Our approach formulates slice discovery as an optimization problem where shapelets serve as building blocks for defining regions of atypical model error, while an evolutionary algorithm systematically searches for diverse, high-quality subgroups characterized by significant error deviations. Unlike traditional feature-based slice discovery methods that lose temporal semantics, our shapelet-first design preserves interpretability while achieving superior pattern specificity and diversity. Experimental validation on synthetic benchmarks demonstrates perfect recovery of embedded error patterns: our algorithm achieved 100% purity and recall for distinct patterns while maintaining low redundancy (mean Jaccard similarity: 0.161), compared to a feature-based baseline that achieved only 44.7% purity with high redundancy (0.585). Real-world case studies across UCR benchmark datasets reveal classifier-specific vulnerabilities and stable performance regions, with discovered shapelets converging to nearly identical structural patterns across different models for easy-to-classify instances. This model-agnostic approach provides practitioners with automated, interpretable characterizations of error patterns through temporal structures that domain experts can directly examine and validate, addressing critical gaps in time series model auditing and debugging.
Abstract
Compreender quando e onde modelos de aprendizado de máquina falham é crucial para implementar sistemas confiáveis em aplicações críticas. Embora a inteligência artificial explicável (XAI) tenha avançado significativamente em domínios como visão computacional e processamento de linguagem natural, a análise sistemática de erros para classificação de séries temporais permanece pouco explorada. Este trabalho aborda a questão fundamental: Podem padrões baseados em shapelets ser usados para identificar regiões de desempenho atípico em classificadores de séries temporais? Propomos uma metodologia
inovadora de descoberta de subgrupos que combina programação evolutiva com reconhecimento de padrões baseado em shapelets para descobrir automaticamente estruturas temporais interpretáveis associadas a falhas de um classificador. Nossa abordagem formula a descoberta de slices como um problema de otimização onde shapelets servem como elementos fundamentais para definir regiões de erro atípico do modelo, enquanto um algoritmo evolutivo busca sistematicamente por subgrupos diversos e de alta qualidade caracterizados por desvios significativos de erro. Diferentemente dos métodos tradicionais de descoberta de slices baseados em características que perdem a semântica temporal, nosso design centrado em shapelets preserva a interpretabilidade enquanto alcança especificidade de padrões e diversidade superiores. A validação experimental em benchmarks sintéticos demonstra recuperação perfeita de padrões de erro embutidos: nosso algoritmo alcançou 100% de pureza e revocação para padrões distintos mantendo baixa redundância (similaridade Jaccard média: 0,161), comparado a um algoritmo baseline baseado em extração de características que alcançou apenas 44,7% de pureza com alta redundância (0,585). Estudos de caso do mundo real em conjuntos de dados benchmark da Universidade da Califórnia (UCR) revelam vulnerabilidades específicas do classificador e regiões de desempenho estável, com shapelets descobertas convergindo para padrões estruturais quase idênticos entre diferentes modelos para instâncias fáceis de classificar. Esta abordagem agnóstica ao modelo fornece aos usuários caracterizações automatizadas e interpretáveis de padrões de erro através de estruturas temporais que especialistas do domínio podem examinar e validar diretamente, abordando lacunas críticas na auditoria e depuração de modelos de séries temporais.
Assunto
Computação – Teses, Aprendizado do computador – Teses, Inteligência artificial – Teses, Análise de sériesTemporais - Teses
Palavras-chave
Slice discovery, Explainable artificial intelligence, Subgroup discovery, Time series, Explainability
Citação
Departamento
Endereço externo
Avaliação
Revisão
Suplementado Por
Referenciado Por
Licença Creative Commons
Exceto quando indicado de outra forma, a licença deste item é descrita como Acesso aberto
