Please use this identifier to cite or link to this item: http://hdl.handle.net/1843/32573
Type: Tese
Title: Transduction based approaches for dataset shift problems
Authors: Carla Caldeira Takahashi
First Advisor: Antônio de Pádua Braga
First Referee: Raul Fonseca Neto
Second Referee: Luiz Enrique Zárate
Third Referee: Adriano Vilela Barbosa
metadata.dc.contributor.referee4: Marcelo Azevedo Costa
Abstract: Dataset Drift problems occur in every field that extract or adjust models from data. It is named drift the phenomena which causes the training and testing datasets to differ, and may also appear at any time duringthemodelrealapplication. Inthiscontext,approachesusingTransductivelearningwereproposed to solve classification problems under some Dataset Drift scenarios. Two strategies were defined, and present satisfactory results with some limitations. The first one is based on an Essentially Transductive Approach that uses genetic algorithm to optimize data entropy. The other one is a strategy oriented to two-dimensional spatial datasets based on Gabriel Graphs for the estimation of Gaussian Mixture Models. However, the correct analysis if the model under a drift is not systematically performed, thus the experimentation of the methods was done with study cases.
Abstract: O problema do Dataset Drift ocorre em toda e qualquer área que utilize dados para criar ou ajustar modelos. É chamado de drift o fenômeno que faz com que haja alguma diferença entre os dados de treinamento e os de teste, além de se manisfestar em qualquer momento no ambiente de aplicação real do modelo. Nesse contexto são sugeridas abordagens utilizando aprendizado transdutivo para lidar com o Dataset Drift. Duas estratégias foram definidas e apresentam resultados satisfatórios com algumas limitações. A primeira é baseada em uma Abordagem Essencialmente Transdutiva que utiliza um algoritmo genético para a otimização da entropia dos dados. A outra é uma estratégia orientada a problemas espaciais bidimensionais, baseada em Grafos de Gabriel para a estimação de Modelos de Mistura Gaussiana. No entanto, a análise da qualidade dos modelos perante a presença do drift ainda não é realizada de forma sistemática, dessa forma os experimentos foram feitos com estudos de caso.
Subject: Engenharia elétrica
Teoria dos grafos
Aprendizado de computador
language: eng
metadata.dc.publisher.country: Brasil
Publisher: Universidade Federal de Minas Gerais
Publisher Initials: UFMG
metadata.dc.publisher.department: ENG - DEPARTAMENTO DE ENGENHARIA ELÉTRICA
metadata.dc.publisher.program: Programa de Pós-Graduação em Engenharia Elétrica
Rights: Acesso Aberto
URI: http://hdl.handle.net/1843/32573
Issue Date: 13-Feb-2019
Appears in Collections:Teses de Doutorado

Files in This Item:
File Description SizeFormat 
CarlaCaldeiraTakahashi_TeseDOUTORADO.pdf6.85 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.