Framework para resolução de entidades incremental em sistemas federados baseado em criptografia homomórfica
Carregando...
Data
Autor(es)
Título da Revista
ISSN da Revista
Título de Volume
Editor
Universidade Federal de Minas Gerais
Descrição
Tipo
Dissertação de mestrado
Título alternativo
Framework for incremental entity resolution in federated systems based on homomorphic encryption
Primeiro orientador
Membros da banca
Aldri Luiz dos Santos
Altigran Soares da Silva
Altigran Soares da Silva
Resumo
A Resolução de Entidades é o tópico da computação que estuda maneiras otimizadas de identificar diferentes registros em fontes de dados e classificá-los como representantes de um mesmo elemento. A realização dessa operação em contextos reais implica em uma série de subtemas, incluindo questões que dizem respeito ao cenário de aplicação, como a privacidade das entidades envolvidas.
A arquitetura de Sistemas Federados propõe o deslocamento do ambiente de processamento de um procedimento computacional específico para um ou mais servidores apartados, permitindo que vários clientes colaborem em um objetivo comum. Esse tipo de arquitetura é útil à Resolução de Entidades pois algumas de suas aplicações têm como objetivo o cruzamento de dados de diversas fontes, o que acaba ocasionando a necessidade de um compartilhamento protegido desses dados.
Este trabalho investiga o uso da Criptografia Homomórfica para Resolução de Entidades usando Computação Federada, propondo um framework que permite a verificação de correspondências entre registros criptografados sem que seja necessário desencriptá-los. O framework é implementado em linguagem de alto nível, e suporta inclusive técnicas de blocagem sob criptografia, reduzindo a complexidade computacional sem comprometer a qualidade da análise.
Ao experimentar o framework com 11.327 tuplas de dados demográficos de pacientes oncológicos criados artificialmente, é possível observar que diferentes configurações de blocagem afetam diretamente as métricas de desempenho e qualidade das resoluções, chegando a apresentar uma Taxa de Redução de 91% em certos cenários e uma Completude de Pares majoritariamente acima dos 80%. É possível notar também que a Resolução de Entidades, mesmo limitada pelas opções de operações homomórficas, chega a 63,03% de Coeficiente de Jaccard e 77,32% de F1-Score. Em termos de desempenho, o tempo de execução da Resolução de Entidades não é afetado pela Criptografia Homomórfica, mas apresenta melhoria significativa com a estratégia de blocagem. O estudo também explora possíveis melhorias para o framework.
Abstract
Entity Resolution is the computing topic that studies optimized ways to identify different records in data sources and classify them as representatives of the same element. Performing this operation in real contexts involves a series of subtopics, including issues related to the application scenario, such as the privacy of the entities involved.
The Federated Systems architecture proposes moving the processing environment of a specific computational procedure to one or more separate servers, allowing multiple clients to collaborate towards a common goal. This type of architecture is useful for Entity Resolution because some of its applications aim to cross-reference data from multiple sources, which ends up causing the need for secure sharing of this data.
This work investigates the use of Homomorphic Encryption for Entity Resolution using Federated Computing, proposing a framework that allows the verification of correspondences between encrypted records without the need to decrypt them. The framework is implemented in a high-level language and even supports encryption blocking techniques, reducing computational complexity without compromising the quality of the analysis.
When testing the framework with 11,327 artificially created tuples of demographic data of oncology patients, it is possible to observe that different blocking configurations directly affect the performance and quality metrics of the resolutions, reaching a Reduction Rate of 91% in certain scenarios and a Pairwise Completeness mostly above 80%. It is also possible to note that the Entity Resolution, even limited by the options of homomorphic operations, reaches 63.03% in the Jaccard Coefficient and 77.32% in F1-Score. In terms of performance, the runtime of Entity Resolution is not affected by the Homomorphic Encryption, but shows significant improvement with the blocking strategy. The study also explores possible improvements for the framework.
Assunto
Computação – Teses, Arquitetura de computador – Teses, Arquitetura de Gestão Federada (Arquitetura de Computadores) – Teses, Criptografia de dados (Computação) – Teses, Resolução de Entidades - Teses
Palavras-chave
resolução de entidades, ligação de registros, sistemas federados, criptografia homomórfica
Citação
Departamento
Endereço externo
Avaliação
Revisão
Suplementado Por
Referenciado Por
Licença Creative Commons
Exceto quando indicado de outra forma, a licença deste item é descrita como Acesso Aberto
