Framework para resolução de entidades incremental em sistemas federados baseado em criptografia homomórfica

dc.creatorHenrique Almeida Louzada
dc.date.accessioned2025-08-28T15:10:34Z
dc.date.accessioned2025-09-09T01:26:37Z
dc.date.available2025-08-28T15:10:34Z
dc.date.issued2024-12-03
dc.description.abstractEntity Resolution is the computing topic that studies optimized ways to identify different records in data sources and classify them as representatives of the same element. Performing this operation in real contexts involves a series of subtopics, including issues related to the application scenario, such as the privacy of the entities involved. The Federated Systems architecture proposes moving the processing environment of a specific computational procedure to one or more separate servers, allowing multiple clients to collaborate towards a common goal. This type of architecture is useful for Entity Resolution because some of its applications aim to cross-reference data from multiple sources, which ends up causing the need for secure sharing of this data. This work investigates the use of Homomorphic Encryption for Entity Resolution using Federated Computing, proposing a framework that allows the verification of correspondences between encrypted records without the need to decrypt them. The framework is implemented in a high-level language and even supports encryption blocking techniques, reducing computational complexity without compromising the quality of the analysis. When testing the framework with 11,327 artificially created tuples of demographic data of oncology patients, it is possible to observe that different blocking configurations directly affect the performance and quality metrics of the resolutions, reaching a Reduction Rate of 91% in certain scenarios and a Pairwise Completeness mostly above 80%. It is also possible to note that the Entity Resolution, even limited by the options of homomorphic operations, reaches 63.03% in the Jaccard Coefficient and 77.32% in F1-Score. In terms of performance, the runtime of Entity Resolution is not affected by the Homomorphic Encryption, but shows significant improvement with the blocking strategy. The study also explores possible improvements for the framework.
dc.description.sponsorshipCNPq - Conselho Nacional de Desenvolvimento Científico e Tecnológico
dc.description.sponsorshipFAPEMIG - Fundação de Amparo à Pesquisa do Estado de Minas Gerais
dc.description.sponsorshipCAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior
dc.identifier.urihttps://hdl.handle.net/1843/84676
dc.languagepor
dc.publisherUniversidade Federal de Minas Gerais
dc.rightsAcesso Aberto
dc.rights.urihttp://creativecommons.org/licenses/by-nc-sa/3.0/pt/
dc.subjectComputação – Teses
dc.subjectArquitetura de computador – Teses
dc.subjectArquitetura de Gestão Federada (Arquitetura de Computadores) – Teses
dc.subjectCriptografia de dados (Computação) – Teses
dc.subjectResolução de Entidades - Teses
dc.subject.otherresolução de entidades
dc.subject.otherligação de registros
dc.subject.othersistemas federados
dc.subject.othercriptografia homomórfica
dc.titleFramework para resolução de entidades incremental em sistemas federados baseado em criptografia homomórfica
dc.title.alternativeFramework for incremental entity resolution in federated systems based on homomorphic encryption
dc.typeDissertação de mestrado
local.contributor.advisor1Wagner Meira Júnior
local.contributor.advisor1Latteshttp://lattes.cnpq.br/9092587237114334
local.contributor.referee1Aldri Luiz dos Santos
local.contributor.referee1Altigran Soares da Silva
local.creator.Latteshttp://lattes.cnpq.br/9371826098732665
local.description.resumoA Resolução de Entidades é o tópico da computação que estuda maneiras otimizadas de identificar diferentes registros em fontes de dados e classificá-los como representantes de um mesmo elemento. A realização dessa operação em contextos reais implica em uma série de subtemas, incluindo questões que dizem respeito ao cenário de aplicação, como a privacidade das entidades envolvidas. A arquitetura de Sistemas Federados propõe o deslocamento do ambiente de processamento de um procedimento computacional específico para um ou mais servidores apartados, permitindo que vários clientes colaborem em um objetivo comum. Esse tipo de arquitetura é útil à Resolução de Entidades pois algumas de suas aplicações têm como objetivo o cruzamento de dados de diversas fontes, o que acaba ocasionando a necessidade de um compartilhamento protegido desses dados. Este trabalho investiga o uso da Criptografia Homomórfica para Resolução de Entidades usando Computação Federada, propondo um framework que permite a verificação de correspondências entre registros criptografados sem que seja necessário desencriptá-los. O framework é implementado em linguagem de alto nível, e suporta inclusive técnicas de blocagem sob criptografia, reduzindo a complexidade computacional sem comprometer a qualidade da análise. Ao experimentar o framework com 11.327 tuplas de dados demográficos de pacientes oncológicos criados artificialmente, é possível observar que diferentes configurações de blocagem afetam diretamente as métricas de desempenho e qualidade das resoluções, chegando a apresentar uma Taxa de Redução de 91% em certos cenários e uma Completude de Pares majoritariamente acima dos 80%. É possível notar também que a Resolução de Entidades, mesmo limitada pelas opções de operações homomórficas, chega a 63,03% de Coeficiente de Jaccard e 77,32% de F1-Score. Em termos de desempenho, o tempo de execução da Resolução de Entidades não é afetado pela Criptografia Homomórfica, mas apresenta melhoria significativa com a estratégia de blocagem. O estudo também explora possíveis melhorias para o framework.
local.publisher.countryBrasil
local.publisher.initialsUFMG
local.publisher.programPrograma de Pós-Graduação em Ciência da Computação

Arquivos

Pacote original

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
Incremental_Entity_Resolution_Through_Privacy_concerned_Federated_Architecture.pdf
Tamanho:
1.32 MB
Formato:
Adobe Portable Document Format

Licença do pacote

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
license.txt
Tamanho:
2.07 KB
Formato:
Plain Text
Descrição: