Please use this identifier to cite or link to this item:
http://hdl.handle.net/1843/BUOS-8CEE5L
Type: | Dissertação de Mestrado |
Title: | Aprendizagem semi-supervisionada aplicada à engenharia financeira |
Authors: | Levi Henrique Santana de Lelis |
First Advisor: | Antonio de Padua Braga |
Abstract: | A aprendizagem semi-supervisionada se tornou, recentemente, emuma boa alternativa para aumentar a capacidade de generalizaçãode modelos de aprendizagem de máquina. A abordagem é utilizada,geralmente, em problemas que as amostras rotuladas são difíceis de serem obtidas, e as sem rótulo, por sua vez, são abundantes e facilmente coletadas; o algoritmo de treinamento semi-supervisionado busca, então, gerar a superfície de separação entre as classes com base também nas amostras sem rótulo. Um exemplo clássico é o de classificação de sites na web: gasta-se muito tempo para se rotular uma amostra de forma confiável. Entretanto, um crawler é capaz de coletar inúmeras amostras sem rótulo rapidamente. Este trabalho mostra uma aplicação diferenciada do aprendizado semisupervisionado, pois nesse caso, possui-se um extenso conjunto de treinamento rotulado (séries temporais financeiras são facilmente encontradas para download na internet), no entanto, a qualidade desse conjunto é colocada emquestão: a rotulação é confiável? Através da abordagem semi-supervisionada foi possível minimizar os dados ruidosos do conjunto de treinamento, melhorando os resultados obtidos. |
Abstract: | Semi-supervised learning had become, recently, a good alternative toimprove generalization capacity in machine learning models. The approach is generally used in problems that labeled samples are hard tobe obtained and unlabeled, in turn, are plenty and easily collected; the semisupervised training algorithm tries to generate the separation surface between the two classes based also on unlabeled data. A classic example is the web sites classification: give a trustworthy label to a sample is time consuming. Nonetheless, a crawler can quickly collect a great number of unlabeled samples. This work shows a different application of semi-supervised learning, because in this case, it is possessed a long labeled training set (financial time series can be easily downloaded from internet), however, the quality of this set is put under prove: the labels are trustworthy? Through the semi-supervisedapproach it was possible minimize the noise data from training set, improving the results obtained. |
Subject: | Engenharia elétrica |
language: | Português |
Publisher: | Universidade Federal de Minas Gerais |
Publisher Initials: | UFMG |
Rights: | Acesso Aberto |
URI: | http://hdl.handle.net/1843/BUOS-8CEE5L |
Issue Date: | 6-Jun-2007 |
Appears in Collections: | Dissertações de Mestrado |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
levi_henrique_santana_de_lelis.pdf | 1.7 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.