CFI-Blocking: uma estratégia eficaz para blocagem em pareamento probabilístico de registros
Carregando...
Arquivos
Data
Autor(es)
Título da Revista
ISSN da Revista
Título de Volume
Editor
Universidade Federal de Minas Gerais
Descrição
Tipo
Dissertação de mestrado
Título alternativo
Primeiro orientador
Membros da banca
Augusto Afonso Guerra Junior
Adriano Alonso Veloso
Altigran Soares da Silva
Antonio Luiz Pinho Ribeiro
Osvaldo Sergio Farhat de Carvalho
Adriano Alonso Veloso
Altigran Soares da Silva
Antonio Luiz Pinho Ribeiro
Osvaldo Sergio Farhat de Carvalho
Resumo
CFI Blocking é uma estratégia proposta para otimizar a enumeração de blocos através da mineração de padrões frequentes e do conhecimento intrínseco das instâncias dos atributos no pareamento probabilístico de registros. A blocagem é responsável por pré selecionar e agrupar registros com maior probabilidade de pertencerem à mesma entidade no mundo real. As estratégias de blocagem atuais são definidas pelo conhecimento prévio do pesquisador. Para eliminar essa dependência e otimizar o processo de blocagem, foram utilizadas propriedades de conjuntos fechados para enumeração automatizada dos blocos. A avaliação foi realizada em uma base de dados real do sistema público de saúde do Brasil (SUS) e permitiu concluir que CFI Blocking apresenta melhor desempenho que outras abordagens existentes.
Abstract
Assunto
Saúde pública Brasil Estatística, Computação, Big data, Mineração de dados (Computação)
Palavras-chave
Pareamento de registros, Banco de dados, Mineração de Dados