Transduction based approaches for dataset shift problems

Carregando...
Imagem de Miniatura

Título da Revista

ISSN da Revista

Título de Volume

Editor

Universidade Federal de Minas Gerais

Descrição

Tipo

Tese de doutorado

Título alternativo

Primeiro orientador

Membros da banca

Raul Fonseca Neto
Luiz Enrique Zárate
Adriano Vilela Barbosa
Marcelo Azevedo Costa

Resumo

Dataset Drift problems occur in every field that extract or adjust models from data. It is named drift the phenomena which causes the training and testing datasets to differ, and may also appear at any time duringthemodelrealapplication. Inthiscontext,approachesusingTransductivelearningwereproposed to solve classification problems under some Dataset Drift scenarios. Two strategies were defined, and present satisfactory results with some limitations. The first one is based on an Essentially Transductive Approach that uses genetic algorithm to optimize data entropy. The other one is a strategy oriented to two-dimensional spatial datasets based on Gabriel Graphs for the estimation of Gaussian Mixture Models. However, the correct analysis if the model under a drift is not systematically performed, thus the experimentation of the methods was done with study cases.

Abstract

O problema do Dataset Drift ocorre em toda e qualquer área que utilize dados para criar ou ajustar modelos. É chamado de drift o fenômeno que faz com que haja alguma diferença entre os dados de treinamento e os de teste, além de se manisfestar em qualquer momento no ambiente de aplicação real do modelo. Nesse contexto são sugeridas abordagens utilizando aprendizado transdutivo para lidar com o Dataset Drift. Duas estratégias foram definidas e apresentam resultados satisfatórios com algumas limitações. A primeira é baseada em uma Abordagem Essencialmente Transdutiva que utiliza um algoritmo genético para a otimização da entropia dos dados. A outra é uma estratégia orientada a problemas espaciais bidimensionais, baseada em Grafos de Gabriel para a estimação de Modelos de Mistura Gaussiana. No entanto, a análise da qualidade dos modelos perante a presença do drift ainda não é realizada de forma sistemática, dessa forma os experimentos foram feitos com estudos de caso.

Assunto

Engenharia elétrica, Teoria dos grafos, Aprendizado de computador

Palavras-chave

Engenharia elétrica

Citação

Endereço externo

Avaliação

Revisão

Suplementado Por

Referenciado Por