Automatic detection of fraudulent behavior in networks using graph learning

Ronald Davi Rodrigues Pereira

Please use this identifier to cite or link to this item: http://hdl.handle.net/1843/41660

Full metadata record

DC Field	Value	Language
dc.contributor.advisor1	Fabrício Murai Ferreira	pt_BR
dc.contributor.advisor1Lattes	http://lattes.cnpq.br/4002187845840872	pt_BR
dc.contributor.referee1	Pedro Olmo Stancioli Vaz de Melo	pt_BR
dc.contributor.referee2	Daniel Sadoc Menasche	pt_BR
dc.creator	Ronald Davi Rodrigues Pereira	pt_BR
dc.creator.Lattes	http://lattes.cnpq.br/3346178706128608	pt_BR
dc.date.accessioned	2022-05-13T21:07:22Z	-
dc.date.available	2022-05-13T21:07:22Z	-
dc.date.issued	2021-10-25	-
dc.identifier.uri	http://hdl.handle.net/1843/41660	-
dc.description.abstract	Redes Neurais baseadas em Grafos (GNNs) são modelos recentes criados para o aprendizado de representações de nós (e de grafos), que alcançaram resultados promissores na detecção de padrões que ocorrem em dados de larga escala que relacionam diferentes entidades. Dentre esses padrões, fraudes financeiras se destacam por sua relevância socioeconômica e por apresentarem desafios particulares, tais como o desbalanceamento extremo entre as classes positivas (fraudes) e negativas (transações legítimas), e o desvio de conceito (i.e., propriedades estatísticas dos dados mudam ao longo do tempo). Como as GNNs são baseadas em propagação de mensagem, a representação de um nó acaba sendo muito impactada pelos seus vizinhos e pelos hubs da rede, amplificando os efeitos do desbalanceamento. Pesquisas recentes tentam adaptar estratégias de subamostragem e sobreamostragem para GNNs a fim de mitigar esse efeito sem, contudo, considerar o desvio de conceito. Neste trabalho, realizamos uma série de experimentos para avaliar técnicas existentes de detecção de fraudes em rede, considerando os dois desafios anteriores. Para isso, utilizamos conjuntos de dados reais, complementados por dados sintéticos criados a partir de uma nova metodologia introduzida aqui. Também propomos um novo framework de modelo denominado GMU-GNN, que realiza a sobre-amostragem dos nós do grafo pertencentes à classe minoritária de forma a melhorar a representatividade e expressividade no espaço latente de características interpretado pelo modelo de classificação de nós. Em novos experimentos realizados com 5 datasets, o GMU-GNN obteve um desempenho superior aos demais modelos tidos atualmente como estado-da-arte sob esses mesmos contextos e propósitos do problema aqui abordado.	pt_BR
dc.description.resumo	Graph-based Neural Networks (GNNs) are recent models created for learning representations of nodes (and graphs), which have achieved promising results when detecting patterns that occur in large-scale data relating different entities. Among these patterns, financial fraud stands out for its socioeconomic relevance and for presenting particular challenges, such as the extreme imbalance between the positive (fraud) and negative (legitimate transactions) classes, and the concept drift (i.e., statistical properties of the data change over time). Since GNNs are based on message propagation, the representation of a node is strongly impacted by its neighbors and by the network's hubs, amplifying the imbalance effects. Recent works attempt to adapt undersampling and oversampling strategies for GNNs in order to mitigate this effect without, however, accounting for concept drift. In this work, we conduct experiments to evaluate existing network fraud detection techniques, considering the two previous challenges. For this, we use real datasets, complemented by synthetic data created from a new methodology introduced here. We also propose a new model framework called GMU-GNN, which performs the oversampling of graph nodes belonging to the minority class in order to improve the representativeness and expressiveness in the latent space of features interpreted by the node classification model. In new experiments carried out with 5 datasets, the GMU-GNN obtained a performance superior to the other models currently considered as state-of-the-art under the same contexts and purposes of the problem addressed here.	pt_BR
dc.language	eng	pt_BR
dc.publisher	Universidade Federal de Minas Gerais	pt_BR
dc.publisher.country	Brasil	pt_BR
dc.publisher.department	ICX - DEPARTAMENTO DE CIÊNCIA DA COMPUTAÇÃO	pt_BR
dc.publisher.program	Programa de Pós-Graduação em Ciência da Computação	pt_BR
dc.publisher.initials	UFMG	pt_BR
dc.rights	Acesso Aberto	pt_BR
dc.subject	Fraud Detection	pt_BR
dc.subject	Fraudulent Behavior	pt_BR
dc.subject	Graph Neural Networks	pt_BR
dc.subject.other	Computação – Teses	pt_BR
dc.subject.other	Redes neurais (Computação) – Teses	pt_BR
dc.subject.other	Detecção de fraude – Teses	pt_BR
dc.title	Automatic detection of fraudulent behavior in networks using graph learning	pt_BR
dc.title.alternative	Detecção automática de comportamentos fraudulentos em redes utilizando aprendizado em grafos	pt_BR
dc.type	Dissertação	pt_BR
Appears in Collections:	Dissertações de Mestrado

Files in This Item:

File	Description	Size	Format
M__Sc__Thesis_Ronald.pdf		1.01 MB	Adobe PDF	View/Open

Show simple item record