Aprendizagem semi-supervisionada aplicada à engenharia financeira

Carregando...
Imagem de Miniatura

Título da Revista

ISSN da Revista

Título de Volume

Editor

Universidade Federal de Minas Gerais

Descrição

Tipo

Dissertação de mestrado

Título alternativo

Primeiro orientador

Membros da banca

Resumo

A aprendizagem semi-supervisionada se tornou, recentemente, emuma boa alternativa para aumentar a capacidade de generalizaçãode modelos de aprendizagem de máquina. A abordagem é utilizada,geralmente, em problemas que as amostras rotuladas são difíceis de serem obtidas, e as sem rótulo, por sua vez, são abundantes e facilmente coletadas; o algoritmo de treinamento semi-supervisionado busca, então, gerar a superfície de separação entre as classes com base também nas amostras sem rótulo. Um exemplo clássico é o de classificação de sites na web: gasta-se muito tempo para se rotular uma amostra de forma confiável. Entretanto, um crawler é capaz de coletar inúmeras amostras sem rótulo rapidamente. Este trabalho mostra uma aplicação diferenciada do aprendizado semisupervisionado, pois nesse caso, possui-se um extenso conjunto de treinamento rotulado (séries temporais financeiras são facilmente encontradas para download na internet), no entanto, a qualidade desse conjunto é colocada emquestão: a rotulação é confiável? Através da abordagem semi-supervisionada foi possível minimizar os dados ruidosos do conjunto de treinamento, melhorando os resultados obtidos.

Abstract

Semi-supervised learning had become, recently, a good alternative toimprove generalization capacity in machine learning models. The approach is generally used in problems that labeled samples are hard tobe obtained and unlabeled, in turn, are plenty and easily collected; the semisupervised training algorithm tries to generate the separation surface between the two classes based also on unlabeled data. A classic example is the web sites classification: give a trustworthy label to a sample is time consuming. Nonetheless, a crawler can quickly collect a great number of unlabeled samples. This work shows a different application of semi-supervised learning, because in this case, it is possessed a long labeled training set (financial time series can be easily downloaded from internet), however, the quality of this set is put under prove: the labels are trustworthy? Through the semi-supervisedapproach it was possible minimize the noise data from training set, improving the results obtained.

Assunto

Engenharia elétrica

Palavras-chave

Engenharia Elétrica

Citação

Departamento

Curso

Endereço externo

Avaliação

Revisão

Suplementado Por

Referenciado Por