CFI-Blocking: uma estratégia eficaz para blocagem em pareamento probabilístico de registros

Carregando...
Imagem de Miniatura

Título da Revista

ISSN da Revista

Título de Volume

Editor

Universidade Federal de Minas Gerais

Descrição

Tipo

Dissertação de mestrado

Título alternativo

Primeiro orientador

Membros da banca

Augusto Afonso Guerra Junior
Adriano Alonso Veloso
Altigran Soares da Silva
Antonio Luiz Pinho Ribeiro
Osvaldo Sergio Farhat de Carvalho

Resumo

CFI Blocking é uma estratégia proposta para otimizar a enumeração de blocos através da mineração de padrões frequentes e do conhecimento intrínseco das instâncias dos atributos no pareamento probabilístico de registros. A blocagem é responsável por pré selecionar e agrupar registros com maior probabilidade de pertencerem à mesma entidade no mundo real. As estratégias de blocagem atuais são definidas pelo conhecimento prévio do pesquisador. Para eliminar essa dependência e otimizar o processo de blocagem, foram utilizadas propriedades de conjuntos fechados para enumeração automatizada dos blocos. A avaliação foi realizada em uma base de dados real do sistema público de saúde do Brasil (SUS) e permitiu concluir que CFI Blocking apresenta melhor desempenho que outras abordagens existentes.

Abstract

Assunto

Saúde pública Brasil Estatística, Computação, Big data, Mineração de dados (Computação)

Palavras-chave

Pareamento de registros, Banco de dados, Mineração de Dados

Citação

Departamento

Curso

Endereço externo

Avaliação

Revisão

Suplementado Por

Referenciado Por