Building the National Database of Health Centred on the Individual: Adminis-trative and Epidemiological Record Linkage - Brazil, 2000-2015

Augusto Afonso Guerra Júnior; Ramon Gonçalves Pereira; Eli Iola Gurgel Andrade; Mariangela Leal Cherchiglia; Leonardo Vinícius Dias da Silva; Juliano Ávila; Núbia Santos; Afonso Reis; Francisco de Assis Acurcio; Wagner Meira Junior

doi:https://doi.org/10.23889/ijpds.v3i1.446

Building the National Database of Health Centred on the Individual: Adminis-trative and Epidemiological Record Linkage - Brazil, 2000-2015

dc.creator	Augusto Afonso Guerra Júnior
dc.creator	Ramon Gonçalves Pereira
dc.creator	Eli Iola Gurgel Andrade
dc.creator	Mariangela Leal Cherchiglia
dc.creator	Leonardo Vinícius Dias da Silva
dc.creator	Juliano Ávila
dc.creator	Núbia Santos
dc.creator	Afonso Reis
dc.creator	Francisco de Assis Acurcio
dc.creator	Wagner Meira Junior
dc.date.accessioned	2023-03-14T21:43:02Z
dc.date.accessioned	2025-09-09T01:15:21Z
dc.date.available	2023-03-14T21:43:02Z
dc.date.issued	2018
dc.description.abstract	Objetivo: Descrever os métodos e resultados de parametrização necessários para realizar a desduplicação probabilística de grandes bancos de dados administrativos e epidemiológicos no Brasil e criar um Banco Nacional de Dados de Saúde Centrado no indivíduo. Métodos: Este artigo apresenta os resultados de um modelo de vinculação de registros para integrar dados do SIH, SIA, SIM e SINAN, que possuem diferentes formatos e atributos entre si e ao longo do tempo. Esses dados consistem em 1,3 bilhão de registros de 2000-2015. Ligações de registros probabilísticas e determinísticas foram usadas para desduplicar esses dados. A estatística Kappa e a revisão clerical foram usadas para garantir a qualidade da ligação. O algoritmo do grafo e a busca em profundidade foram usados para gerar os identificadores. Resultados: O processo de deduplicação determinística resultou em um banco de dados com 403.113.527 possíveis indivíduos únicos. Após a realização do processo de desduplicação probabilística da base de dados anterior, foram identificados 159.703.805 indivíduos únicos. Este resultado teve uma taxa de erro falso positivo estimada de 3,3%, e o erro falso negativo foi estimado em 12,3%. Conclusões: O Banco de Dados Nacional de Saúde centrado no indivíduo foi gerado e permitirá aos pesquisadores usar evidências do mundo real para realizar estudos clínicos, epidemiológicos, econômicos e outros. Este banco de dados representa uma coorte significativa, abrangendo 15 anos de dados históricos e preservando a privacidade do paciente. O sucesso do processo descrito permitirá repetir e anexar os dados para anos futuros e viabilizar estudos importantes para promover a eficiência do SUS e proporcionar melhores tratamentos aos pacientes.
dc.format.mimetype	pdf
dc.identifier.doi	https://doi.org/10.23889/ijpds.v3i1.446
dc.identifier.issn	2399-4908
dc.identifier.uri	https://hdl.handle.net/1843/50902
dc.language	eng
dc.publisher	Universidade Federal de Minas Gerais
dc.relation.ispartof	The International Journal of Population Data Science (IJPDS)
dc.rights	Acesso Aberto
dc.subject	Sistema Único de Saúde
dc.subject	Banco de dados - Saúde
dc.subject	Medicina - Processamento de dados
dc.subject.other	Data linkage
dc.subject.other	Record linkage
dc.subject.other	Brazilian health database
dc.subject.other	SUS deduplication
dc.title	Building the National Database of Health Centred on the Individual: Adminis-trative and Epidemiological Record Linkage - Brazil, 2000-2015
dc.title.alternative	Construindo o Banco Nacional de Dados de Saúde Centrada no Indivíduo: Relacionamento Administrativo e Ficha Epidemiológica - Brasil, 2000-2015
dc.type	Artigo de periódico
local.citation.issue	1
local.citation.volume	3
local.description.resumo	Objective: To describe the methods and results of parameter setting that are needed to execute the probabilistic deduplication of large administrative and epidemiological databases in Brazil and to create a National Health Database Centred on the individual. Methods: This paper shows the results of a record linkage model to integrate data from SIH, SIA, SIM, and SINAN, which have different formats and attributes between them and over time. These data consistof 1.3 billion records from 2000-2015. Probabilistic and deterministic record linkages were used to deduplicate these data. The Kappa statistic and clerical review were used to ensure the quality ofthe linkage. The graph algorithm and depth-first search were used to generate the identifiers. Results: The deterministic deduplication process resulted in a database with 403,113,527 possible unique individuals. After the probabilistic deduplication process of the former database was performed,159,703,805 unique individuals were identified. This result had an estimated a false positive error rate of 3.3%, and the false negative error was estimated at 12.3%. Conclusions: The National Health Database centred on the individual was generated and will allow researchers to use real-world evidence to conduct clinical, epidemiological, economic and other studies. This database represents a significant cohort, spanning 15 years of historical data and preserving patient privacy. The success of the process described will allow repeating and appending the data for future years and enable important studies to promote SUS efficiency and provide better treatments for patients.
local.identifier.orcid	https://orcid.org/0000-0001-5256-0577
local.identifier.orcid	https://orcid.org/0000-0002-0206-2462
local.identifier.orcid	https://orcid.org/0000-0001-5622-567X
local.identifier.orcid	https://orcid.org/0000-0003-1956-5100
local.identifier.orcid	https://orcid.org/0000-0002-5880-5261
local.identifier.orcid	https://orcid.org/0000-0002-2614-2723
local.publisher.country	Brasil
local.publisher.department	FAR - DEPARTAMENTO DE FARMÁCIA SOCIAL
local.publisher.department	FARMACIA - FACULDADE DE FARMACIA
local.publisher.department	ICX - DEPARTAMENTO DE CIÊNCIA DA COMPUTAÇÃO
local.publisher.department	MED - DEPARTAMENTO DE MEDICINA PREVENTIVA SOCIAL
local.publisher.initials	UFMG
local.url.externa	https://ijpds.org/article/view/446

Arquivos

Pacote original

Agora exibindo 1 - 1 de 1

Nome:: Building the National Database of Health Centred on the Individual Adminis-trative and Epidemiological Record Linkage - Brazil, 2000-2015.pdf
Tamanho:: 684 KB
Formato:: Adobe Portable Document Format

Baixar

Licença do pacote

Agora exibindo 1 - 1 de 1

Nome:: License.txt
Tamanho:: 1.99 KB
Formato:: Plain Text
Descrição:

Baixar

Coleções

Artigo de Periódico