Please use this identifier to cite or link to this item: http://hdl.handle.net/1843/BUOS-8CEE5L
Type: Dissertação de Mestrado
Title: Aprendizagem semi-supervisionada aplicada à engenharia financeira
Authors: Levi Henrique Santana de Lelis
First Advisor: Antonio de Padua Braga
Abstract: A aprendizagem semi-supervisionada se tornou, recentemente, emuma boa alternativa para aumentar a capacidade de generalizaçãode modelos de aprendizagem de máquina. A abordagem é utilizada,geralmente, em problemas que as amostras rotuladas são difíceis de serem obtidas, e as sem rótulo, por sua vez, são abundantes e facilmente coletadas; o algoritmo de treinamento semi-supervisionado busca, então, gerar a superfície de separação entre as classes com base também nas amostras sem rótulo. Um exemplo clássico é o de classificação de sites na web: gasta-se muito tempo para se rotular uma amostra de forma confiável. Entretanto, um crawler é capaz de coletar inúmeras amostras sem rótulo rapidamente. Este trabalho mostra uma aplicação diferenciada do aprendizado semisupervisionado, pois nesse caso, possui-se um extenso conjunto de treinamento rotulado (séries temporais financeiras são facilmente encontradas para download na internet), no entanto, a qualidade desse conjunto é colocada emquestão: a rotulação é confiável? Através da abordagem semi-supervisionada foi possível minimizar os dados ruidosos do conjunto de treinamento, melhorando os resultados obtidos.
Abstract: Semi-supervised learning had become, recently, a good alternative toimprove generalization capacity in machine learning models. The approach is generally used in problems that labeled samples are hard tobe obtained and unlabeled, in turn, are plenty and easily collected; the semisupervised training algorithm tries to generate the separation surface between the two classes based also on unlabeled data. A classic example is the web sites classification: give a trustworthy label to a sample is time consuming. Nonetheless, a crawler can quickly collect a great number of unlabeled samples. This work shows a different application of semi-supervised learning, because in this case, it is possessed a long labeled training set (financial time series can be easily downloaded from internet), however, the quality of this set is put under prove: the labels are trustworthy? Through the semi-supervisedapproach it was possible minimize the noise data from training set, improving the results obtained.
Subject: Engenharia elétrica
language: Português
Publisher: Universidade Federal de Minas Gerais
Publisher Initials: UFMG
Rights: Acesso Aberto
URI: http://hdl.handle.net/1843/BUOS-8CEE5L
Issue Date: 6-Jun-2007
Appears in Collections:Dissertações de Mestrado

Files in This Item:
File Description SizeFormat 
levi_henrique_santana_de_lelis.pdf1.7 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.