Please use this identifier to cite or link to this item: http://hdl.handle.net/1843/SLSS-8GRHQ9
Type: Dissertação de Mestrado
Title: Mineração de padrões de correlação estrutural em grandes grafos
Authors: Arlei Lopes da Silva
First Advisor: Wagner Meira Junior
First Referee: Alberto Henrique Frade Laender
Second Referee: Loïc Pascal Gilles Cerf
Abstract: Grafos têm se estabelecido como um poderoso arcabouço teórico para a modelagem de interações em cenários variados. Enquanto a disponibilidade de dados em larga escala motivou o desenvolvimento de tal arcabouço, o enriquecimento desses dados guia a pesquisa em grafos na direção de novos métodos capazes de explorar essa riqueza de forma útil. Uma representação estendida interessante de grafos é a de grafos com atributos nos vértices. Atributos de vértices desempenham um papel importante em diversos grafos reais. Além disso, sabe-se que, em muitos desses grafos, vértices se organizam naturalmente como subgrafos densos. Tais subgrafos possuem signficado relevante em diversos grafos reais, sendo denominados comunidades em redes sociais e identificando complexos proteicos em redes de proteínas, dentre outras aplicações.Neste trabalho, estudamos a correlação entre conjuntos de atributos e a formação de subgrafos densos, o que denominamos mineração de padrões de correlação estrutural. A correlação estrutural mede como umconjunto de atributos induz subgrafos denss em grafos com atributos. Um padrão de correlação estrutural é um subgrafo denso induzido por um conjunto de atributos em particular. Modelamos padrões de correlação estrutural em termos de padrões de mineração de dados existentes. Com base em tal modelagem, propomos técnicas de normalização que avaliam o quanto a correlação estrutural de um conjunto de atributos desvia do esperado. Além disso, propomos algoritmos eficientes e escaláveis para a mineração de padrões de correlação estrutural. Nós mostramos que a mineração de padrões de correlação estrutural é capaz de prover conhecimento relevante sobre a relação entre conjuntos de atributos e subgrafos densos em grafos reais. Em particular, aplicamos os algoritmos propostos na correlação entre palavras-chave associadas a pesquisadores e a formação de grupos de pesquisa em redes de colaboração, no estudo de comunidades induzidas pelo gosto musical em uma rede social, na análise de como grupos conectados de artigos emergem em torno de tópicos de pesquisa em uma rede de citação, e na avaliação da relação entre expressão e funcionalidade em uma rede de interação proteica. Também avaliamos o desempenho de tais algoritmos, verificando que eles possibilitam a análise de grandes bases de dados.
Abstract: Graphs have been established as a powerful theoretical framework for modeling several types of interactions in a variety of scenarios. While the availability of large scale data led to the development of aframework for large scale graph analysis, the enrichment of such data drives the graph research to new methods able to explore such richness in a useful manner. An interesting extended graph representation iscalled attributed graph. Vertex attributes play an important role in several real life graphs. Moreover, it is broadly known that in several of these graphs vertices are organized into dense subgraphs.Such subgraphs have a relevant meaning in several real life graphs, being called communities in social networks and identifying protein complexes in protein-protein interaction networks.In this work, we study the correlation between attribute sets and the formation of dense subgraphs in large attributed graphs, which we call structural correlation pattern mining. The structural correlationmeasures how a set of attributes induces dense subgraphs in attributed graphs. A structural correlation pattern is a dense subgraph induced by a particular attribute set. We model the structural correlationpattern mining in terms of existing data mining patterns. Based on such definitions, we propose normalization approaches in order to assess how the structural correlation of a given attribute set deviates from the expected. Moreover, we propose efficient and scalable algorithms for structural correlation pattern mining.We show that the structural correlation pattern mining is able to provide relevant knowledge about the relation between attribute sets and dense subgraphs in real attributed graphs. In particular, we applythe proposed algorithms to the correlation between keywords associated with researchers and the formation of research groups in collaboration networks, in the study of communities induced by musical taste in asocial network, in the analysis of how well connected groups of papers emerge around research topics in a citation network, and in the evaluation of the relation between expression and functionality in a PPI network. We also evaluate the performance of such algorithms, verifying that they enable the analysis of large datasets.
Subject: Computação
Mineração de dados (Computação)
language: Inglês
Publisher: Universidade Federal de Minas Gerais
Publisher Initials: UFMG
Rights: Acesso Aberto
URI: http://hdl.handle.net/1843/SLSS-8GRHQ9
Issue Date: 5-May-2011
Appears in Collections:Dissertações de Mestrado

Files in This Item:
File Description SizeFormat 
arleilopesdasilva.pdf17.35 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.