Detectores de mudança de conceito por meio do mapeamento espacial do fluxo de dados usando quadtree
Carregando...
Data
Autor(es)
Título da Revista
ISSN da Revista
Título de Volume
Editor
Universidade Federal de Minas Gerais
Descrição
Tipo
Tese de doutorado
Título alternativo
Primeiro orientador
Membros da banca
Antônio de Pádua Braga
Roberto Souto Maior de Barros
Luis Enrique Zárate Gálvez
Luiz Carlos Bambirra Torres
Roberto Souto Maior de Barros
Luis Enrique Zárate Gálvez
Luiz Carlos Bambirra Torres
Resumo
O aprendizado online é uma tarefa complexa, especialmente quando o fluxo de dados muda sua distribuição ao longo do tempo. É um desafio monitorar e detectar estas mudanças para preservar o desempenho do algoritmo de classificação. Este trabalho apresenta dois novos métodos de detecção de mudança de conceito, o QT e o QTS, construídos a partir de uma perspectiva diferente de outros detectores já existentes. Os novos métodos de detecção analisam o espaço ocupado pelos dados a partir da premissa de que o espaço ocupado pelos dados de classes diferentes é imutável. Os dados são mapeados em estruturas de memória baseada em quadtree, a qual fornece informações sobre a classe (rótulo) dominante em uma determinada região do espaço de características. A detecção de mudança de conceito no método proposto QT acontece ao atribuir um dado a um espaço previamente ocupado na quadtree por dados de classe oposta. Já o QTS detecta a mudança de conceito quando identifica um aumento significativo na quantidade de dados da quadtree de uma das classes. Os métodos propostos foram avaliados em problemas de classificação binária. Os resultados alcançados pelos métodos de detecção propostos foram competitivos comparados aos métodos existentes na literatura.
Abstract
Online learning is a complex task, especially when the data stream changes its distribution over time. It has been a challenge to monitor and detect these changes to preserve the learning algorithm performance. This work presents two novels drift detection methods built from a different perspective of other preexisting detectors from literature.It analyzes the space occupied by the data, assuming that it would be immutable unless changes in this space occur among data of different classes. Data are mapped into a quadtree-based memory structure that provides knowledge about which class (label) is dominant in a given region of the feature space. The proposed method QT detects a drift by checking whether data assigned to a given class occupy spaces considered relevant to the other class. The QTS, on the other hand, detects a concept drift when it identifies a significant increase in the increment of data in one of the classes. The proposed methods were evaluated on binary classification benchmark problems. Results show that our methods were competitive with well-known drift detectors from literature.
Assunto
Engenharia elétrica, Processamento eletrônico de dados, Algoritmos
Palavras-chave
Fluxo de dados, Mudança de conceito, Quadtree, Detector de mudança de conceito, Classificação