Please use this identifier to cite or link to this item: http://hdl.handle.net/1843/50902
Full metadata record
DC FieldValueLanguage
dc.creatorAugusto Afonso Guerra Júniorpt_BR
dc.creatorRamon Gonçalves Pereirapt_BR
dc.creatorEli Iola Gurgel Andradept_BR
dc.creatorMariangela Leal Cherchigliapt_BR
dc.creatorLeonardo Vinícius Dias da Silvapt_BR
dc.creatorJuliano Ávilapt_BR
dc.creatorNúbia Santospt_BR
dc.creatorAfonso Reispt_BR
dc.creatorFrancisco de Assis Acurciopt_BR
dc.creatorWagner Meira Juniorpt_BR
dc.date.accessioned2023-03-14T21:43:02Z-
dc.date.available2023-03-14T21:43:02Z-
dc.date.issued2018-
dc.citation.volume3pt_BR
dc.citation.issue1pt_BR
dc.identifier.doihttps://doi.org/10.23889/ijpds.v3i1.446pt_BR
dc.identifier.issn2399-4908pt_BR
dc.identifier.urihttp://hdl.handle.net/1843/50902-
dc.description.abstractObjetivo: Descrever os métodos e resultados de parametrização necessários para realizar a desduplicação probabilística de grandes bancos de dados administrativos e epidemiológicos no Brasil e criar um Banco Nacional de Dados de Saúde Centrado no indivíduo. Métodos: Este artigo apresenta os resultados de um modelo de vinculação de registros para integrar dados do SIH, SIA, SIM e SINAN, que possuem diferentes formatos e atributos entre si e ao longo do tempo. Esses dados consistem em 1,3 bilhão de registros de 2000-2015. Ligações de registros probabilísticas e determinísticas foram usadas para desduplicar esses dados. A estatística Kappa e a revisão clerical foram usadas para garantir a qualidade da ligação. O algoritmo do grafo e a busca em profundidade foram usados ​​para gerar os identificadores. Resultados: O processo de deduplicação determinística resultou em um banco de dados com 403.113.527 possíveis indivíduos únicos. Após a realização do processo de desduplicação probabilística da base de dados anterior, foram identificados 159.703.805 indivíduos únicos. Este resultado teve uma taxa de erro falso positivo estimada de 3,3%, e o erro falso negativo foi estimado em 12,3%. Conclusões: O Banco de Dados Nacional de Saúde centrado no indivíduo foi gerado e permitirá aos pesquisadores usar evidências do mundo real para realizar estudos clínicos, epidemiológicos, econômicos e outros. Este banco de dados representa uma coorte significativa, abrangendo 15 anos de dados históricos e preservando a privacidade do paciente. O sucesso do processo descrito permitirá repetir e anexar os dados para anos futuros e viabilizar estudos importantes para promover a eficiência do SUS e proporcionar melhores tratamentos aos pacientes.pt_BR
dc.description.resumoObjective: To describe the methods and results of parameter setting that are needed to execute the probabilistic deduplication of large administrative and epidemiological databases in Brazil and to create a National Health Database Centred on the individual. Methods: This paper shows the results of a record linkage model to integrate data from SIH, SIA, SIM, and SINAN, which have different formats and attributes between them and over time. These data consistof 1.3 billion records from 2000-2015. Probabilistic and deterministic record linkages were used to deduplicate these data. The Kappa statistic and clerical review were used to ensure the quality ofthe linkage. The graph algorithm and depth-first search were used to generate the identifiers. Results: The deterministic deduplication process resulted in a database with 403,113,527 possible unique individuals. After the probabilistic deduplication process of the former database was performed,159,703,805 unique individuals were identified. This result had an estimated a false positive error rate of 3.3%, and the false negative error was estimated at 12.3%. Conclusions: The National Health Database centred on the individual was generated and will allow researchers to use real-world evidence to conduct clinical, epidemiological, economic and other studies. This database represents a significant cohort, spanning 15 years of historical data and preserving patient privacy. The success of the process described will allow repeating and appending the data for future years and enable important studies to promote SUS efficiency and provide better treatments for patients.pt_BR
dc.format.mimetypepdfpt_BR
dc.languageengpt_BR
dc.publisherUniversidade Federal de Minas Geraispt_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.departmentFAR - DEPARTAMENTO DE FARMÁCIA SOCIALpt_BR
dc.publisher.departmentFARMACIA - FACULDADE DE FARMACIApt_BR
dc.publisher.departmentICX - DEPARTAMENTO DE CIÊNCIA DA COMPUTAÇÃOpt_BR
dc.publisher.departmentMED - DEPARTAMENTO DE MEDICINA PREVENTIVA SOCIALpt_BR
dc.publisher.initialsUFMGpt_BR
dc.relation.ispartofThe International Journal of Population Data Science (IJPDS)-
dc.rightsAcesso Abertopt_BR
dc.subjectData linkagept_BR
dc.subjectRecord linkagept_BR
dc.subjectBrazilian health databasept_BR
dc.subjectSUS deduplicationpt_BR
dc.subject.otherSistema Único de Saúdept_BR
dc.subject.otherBanco de dados - Saúdept_BR
dc.subject.otherMedicina - Processamento de dadospt_BR
dc.titleBuilding the National Database of Health Centred on the Individual: Adminis-trative and Epidemiological Record Linkage - Brazil, 2000-2015pt_BR
dc.title.alternativeConstruindo o Banco Nacional de Dados de Saúde Centrada no Indivíduo: Relacionamento Administrativo e Ficha Epidemiológica - Brasil, 2000-2015pt_BR
dc.typeArtigo de Periódicopt_BR
dc.url.externahttps://ijpds.org/article/view/446pt_BR
dc.identifier.orcidhttps://orcid.org/0000-0001-5256-0577pt_BR
dc.identifier.orcidhttps://orcid.org/0000-0002-0206-2462pt_BR
dc.identifier.orcidhttps://orcid.org/0000-0001-5622-567Xpt_BR
dc.identifier.orcidhttps://orcid.org/0000-0003-1956-5100pt_BR
dc.identifier.orcidhttps://orcid.org/0000-0002-5880-5261pt_BR
dc.identifier.orcidhttps://orcid.org/0000-0002-2614-2723pt_BR
Appears in Collections:Artigo de Periódico



Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.