Unsupervised drift detection using quadtree spatial mapping

Carregando...
Imagem de Miniatura

Título da Revista

ISSN da Revista

Título de Volume

Editor

Universidade Federal de Minas Gerais

Descrição

Tipo

Dissertação de mestrado

Título alternativo

Primeiro orientador

Membros da banca

Frederico Gadelha Guimarães
Walmir Matos Caminhas
Rodrigo Amador Coelho

Resumo

The analysis of non-stationary data streams poses a significant challenge in machine learning due to changes in data distribution, known as concept drifts. This dissertation introduces the QTS (QuadTree Summarized Drift Detection) method, an unsupervised concept drift detector based on spatial mapping using the quadtree structure. The method monitors changes in multivariate data through spatial occupancy, simplifying the analysis with visual representations and simple statistical tests. The QTS performance was evaluated on synthetic and real-world datasets, demonstrating competitive results compared to state-of-the-art methods, particularly in scenarios with gradual and abrupt drifts. An extension of the method, the IQT (Image Quadtree Drift Detector), was developed to complement the analysis and proved particularly effective in high-dimensional problems and subtle data distribution changes. The results highlight the potential of QTS and IQT for practical applications, such as fault diagnosis in industrial systems, validating their adaptability to dynamic environments.

Abstract

A análise de fluxos de dados não estacionários representa um desafio significativo no campo de aprendizado de máquina devido às mudanças de distribuição de dados, conhecidas como mudanças de conceito. Esta dissertação propõe o método QTS (QuadTree Summarized Drift Detection), um detector de mudanças de conceito não supervisionado baseado no mapeamento espacial utilizando a estrutura de quadtree. O método monitora mudanças em dados multivariados através da ocupação do espaço, simplificando a análise com representações visuais e testes estatísticos simples. O desempenho do QTS foi avaliado em bases de dados sintéticas e reais, apresentando resultados competitivos em comparação com métodos consagrados, com destaque para sua eficiência em cenários de drift gradual e abrupto. Uma extensão visual do método, o IQT (Image QuadTree Drift Detector), foi desenvolvida para complementar a análise e se mostrou especialmente eficaz em problemas de alta dimensionalidade e aqueles com mudanças sutis na distribuição de dados. Os resultados demonstram o potencial do QTS e do IQT em aplicações práticas, como no diagnóstico de falhas em sistemas industriais, validando sua capacidade de adaptação a ambientes dinâmicos.

Assunto

Engenharia elétrica, Processamento eletrônico de dados, Aprendizado do computador

Palavras-chave

Concept drift, Data stream, Concept drift detectors, Quadtree, Unsupervised learning, Data visualization

Citação

Endereço externo

Avaliação

Revisão

Suplementado Por

Referenciado Por