Mineração de padrões frequentes ortogonais e sua aplicação em classificação associativa

Leandro Souza Costa

Please use this identifier to cite or link to this item: http://hdl.handle.net/1843/RVMR-7L3P92

Type:	Dissertação de Mestrado
Title:	Mineração de padrões frequentes ortogonais e sua aplicação em classificação associativa
Authors:	Leandro Souza Costa
First Advisor:	Wagner Meira Junior
First Referee:	Sandra Aparecida de Amo
Second Referee:	Marcos Andre Goncalves
Abstract:	Mineração de padrões freqüentes é um dos temas mais explorados da mineração de dados, assumindo um papel essencial em inúmeras tarefas que possuem, como objetivo, encontrar padrões de determinado interesse numa base. Entretanto, grande parte das soluções propostas nesta linha de pesquisa ainda possui problemas não solucionados, sendo muitos deles relacionados com a explosão do número de padrões freqüentes encontrados na base de dados. Isto acontece pelo fato dos padrões freqüentes obedecerem à propriedade da antimonotonia, que diz que, se um padrão é freqüente, todos os seus sub-padrões também o serão. Como conseqüência, o conjunto-solução, por compreender uma grande quantidade de elementos relacionados, acaba por apresentar informações redundantes, provenientes de padrões de baixa significância, que não adicionam, ao resultado, informações úteis o suficiente para justificar a sua importância.Esta dissertação apresenta uma nova metodologia para obtenção de padrões de interesse numa base de dados que explora o conceito de ortogonalidade - definida como a medida do quanto os elementos de um conjunto contribuem com informações não redundantes para a solução de um problema - e a sua aplicação ao problema da classificação associativa, como forma de aumentar a eficácia de um classificador, diminuindo a redundância e a ambigüidade das regras.
Abstract:	Frequent pattern mining is one of the most exploited subjects in data mining, assuming a key role in numerous tasks that have the goal of finding patterns of interest in a given data set. However, most of the solutions proposed in this line of research still have not solved problems, many of them related to the explosion in the number of frequent patterns found in the data set. This happens because frequent patterns conform to the anti-monotony property, which says that if a pattern is frequent, all its sub-patterns are also. This way the solution, by having redundant information from patterns of low significance, does not add to the result information useful enough to justify its importance.This work presents a new methodology for obtaining patterns of interest in a data set that explores the concept of orthogonality - defined as the measure of how the elements of a set does not contribute with redundant information to the solution of a problem - and its application in associative classification, as a way to increase the effectiveness of a classifier, reducing the redundancy and ambiguity of the rules.
Subject:	Recuperação de dados (Computação) Computação Mineração de dados (Computação)
language:	Português
Publisher:	Universidade Federal de Minas Gerais
Publisher Initials:	UFMG
Rights:	Acesso Aberto
URI:	http://hdl.handle.net/1843/RVMR-7L3P92
Issue Date:	16-Apr-2008
Appears in Collections:	Dissertações de Mestrado

Files in This Item:

File	Description	Size	Format
leandrosouzacosta.pdf		879.77 kB	Adobe PDF	View/Open

Show full item record