Mineração de padrões frequentes ortogonais e sua aplicação em classificação associativa

Leandro Souza Costa

Use este identificador para citar ou linkar para este item: http://hdl.handle.net/1843/RVMR-7L3P92

Tipo:	Dissertação de Mestrado
Título:	Mineração de padrões frequentes ortogonais e sua aplicação em classificação associativa
Autor(es):	Leandro Souza Costa
Primeiro Orientador:	Wagner Meira Junior
Primeiro membro da banca :	Sandra Aparecida de Amo
Segundo membro da banca:	Marcos Andre Goncalves
Resumo:	Mineração de padrões freqüentes é um dos temas mais explorados da mineração de dados, assumindo um papel essencial em inúmeras tarefas que possuem, como objetivo, encontrar padrões de determinado interesse numa base. Entretanto, grande parte das soluções propostas nesta linha de pesquisa ainda possui problemas não solucionados, sendo muitos deles relacionados com a explosão do número de padrões freqüentes encontrados na base de dados. Isto acontece pelo fato dos padrões freqüentes obedecerem à propriedade da antimonotonia, que diz que, se um padrão é freqüente, todos os seus sub-padrões também o serão. Como conseqüência, o conjunto-solução, por compreender uma grande quantidade de elementos relacionados, acaba por apresentar informações redundantes, provenientes de padrões de baixa significância, que não adicionam, ao resultado, informações úteis o suficiente para justificar a sua importância.Esta dissertação apresenta uma nova metodologia para obtenção de padrões de interesse numa base de dados que explora o conceito de ortogonalidade - definida como a medida do quanto os elementos de um conjunto contribuem com informações não redundantes para a solução de um problema - e a sua aplicação ao problema da classificação associativa, como forma de aumentar a eficácia de um classificador, diminuindo a redundância e a ambigüidade das regras.
Abstract:	Frequent pattern mining is one of the most exploited subjects in data mining, assuming a key role in numerous tasks that have the goal of finding patterns of interest in a given data set. However, most of the solutions proposed in this line of research still have not solved problems, many of them related to the explosion in the number of frequent patterns found in the data set. This happens because frequent patterns conform to the anti-monotony property, which says that if a pattern is frequent, all its sub-patterns are also. This way the solution, by having redundant information from patterns of low significance, does not add to the result information useful enough to justify its importance.This work presents a new methodology for obtaining patterns of interest in a data set that explores the concept of orthogonality - defined as the measure of how the elements of a set does not contribute with redundant information to the solution of a problem - and its application in associative classification, as a way to increase the effectiveness of a classifier, reducing the redundancy and ambiguity of the rules.
Assunto:	Recuperação de dados (Computação) Computação Mineração de dados (Computação)
Idioma:	Português
Editor:	Universidade Federal de Minas Gerais
Sigla da Instituição:	UFMG
Tipo de Acesso:	Acesso Aberto
URI:	http://hdl.handle.net/1843/RVMR-7L3P92
Data do documento:	16-Abr-2008
Aparece nas coleções:	Dissertações de Mestrado

Arquivos associados a este item:

Arquivo	Descrição	Tamanho	Formato
leandrosouzacosta.pdf		879.77 kB	Adobe PDF	Visualizar/Abrir

Mostrar registro completo do item Visualizar estatísticas