Detectores de mudança de conceito por meio do mapeamento espacial do fluxo de dados usando quadtree

Carregando...
Imagem de Miniatura

Título da Revista

ISSN da Revista

Título de Volume

Editor

Universidade Federal de Minas Gerais

Descrição

Tipo

Tese de doutorado

Título alternativo

Primeiro orientador

Membros da banca

Antônio de Pádua Braga
Roberto Souto Maior de Barros
Luis Enrique Zárate Gálvez
Luiz Carlos Bambirra Torres

Resumo

O aprendizado online é uma tarefa complexa, especialmente quando o fluxo de dados muda sua distribuição ao longo do tempo. É um desafio monitorar e detectar estas mudanças para preservar o desempenho do algoritmo de classificação. Este trabalho apresenta dois novos métodos de detecção de mudança de conceito, o QT e o QTS, construídos a partir de uma perspectiva diferente de outros detectores já existentes. Os novos métodos de detecção analisam o espaço ocupado pelos dados a partir da premissa de que o espaço ocupado pelos dados de classes diferentes é imutável. Os dados são mapeados em estruturas de memória baseada em quadtree, a qual fornece informações sobre a classe (rótulo) dominante em uma determinada região do espaço de características. A detecção de mudança de conceito no método proposto QT acontece ao atribuir um dado a um espaço previamente ocupado na quadtree por dados de classe oposta. Já o QTS detecta a mudança de conceito quando identifica um aumento significativo na quantidade de dados da quadtree de uma das classes. Os métodos propostos foram avaliados em problemas de classificação binária. Os resultados alcançados pelos métodos de detecção propostos foram competitivos comparados aos métodos existentes na literatura.

Abstract

Online learning is a complex task, especially when the data stream changes its distribution over time. It has been a challenge to monitor and detect these changes to preserve the learning algorithm performance. This work presents two novels drift detection methods built from a different perspective of other preexisting detectors from literature.It analyzes the space occupied by the data, assuming that it would be immutable unless changes in this space occur among data of different classes. Data are mapped into a quadtree-based memory structure that provides knowledge about which class (label) is dominant in a given region of the feature space. The proposed method QT detects a drift by checking whether data assigned to a given class occupy spaces considered relevant to the other class. The QTS, on the other hand, detects a concept drift when it identifies a significant increase in the increment of data in one of the classes. The proposed methods were evaluated on binary classification benchmark problems. Results show that our methods were competitive with well-known drift detectors from literature.

Assunto

Engenharia elétrica, Processamento eletrônico de dados, Algoritmos

Palavras-chave

Fluxo de dados, Mudança de conceito, Quadtree, Detector de mudança de conceito, Classificação

Citação

Endereço externo

Avaliação

Revisão

Suplementado Por

Referenciado Por