Geração e análise de dados sintéticos via Redes Bayesianas: uma abordagem robusta para quantificação de incerteza via paradigma Bayesiano

dc.creatorLarissa Natany Almeida Martins
dc.date.accessioned2024-10-30T17:14:50Z
dc.date.accessioned2025-09-08T23:28:21Z
dc.date.available2024-10-30T17:14:50Z
dc.date.issued2024-02-29
dc.description.abstractThe disclosure of confidential data represents an area of great interest, and among the various existing methodologies, the synthetic data approach stands out for its ability to generate information discreetly. This methodology is highly flexible, aiming to disclose data with distributions very similar to those of the original data, thus also preserving the security of sensitive information. The Bayesian network model, in turn, is designed to efficiently estimate the joint distribution of relevant data. This method is an intriguing choice for generating synthetic data as it provides a flexible and robust approach to describing relationships between variables present in the original database. By adopting the Bayesian paradigm, we can create a robust model not only to estimate the network and simulated data but also to quantify the intrinsic uncertainty in the process of generating this new data. This thesis proposes a study that utilizes a state-of-the-art Markov chain Monte Carlo (MCMC) model for generating synthetic data. Additionally, we introduce an innovative approach to disseminating relevant information to the end user, aiming to reduce the uncertainty associated with the estimation process. The main contributions of this work include a comprehensive analysis using the Bayesian paradigm to generate synthetic data through Bayesian networks, incorporating a robust study on quantifying uncertainty in the process of generating this new data. We also introduce a general class of penalizing priors for the network. The thesis comprises three simulation studies as well as an application to real data that illustrates the analysis of the proposed model.
dc.description.sponsorshipCNPq - Conselho Nacional de Desenvolvimento Científico e Tecnológico
dc.description.sponsorshipFAPEMIG - Fundação de Amparo à Pesquisa do Estado de Minas Gerais
dc.description.sponsorshipCAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior
dc.identifier.urihttps://hdl.handle.net/1843/77732
dc.languagepor
dc.publisherUniversidade Federal de Minas Gerais
dc.rightsAcesso Restrito
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/pt/
dc.subjectEstatística - Teses
dc.subjectInferência Bayesiana - Teses
dc.subjectMarkov, Processos de - Teses
dc.subjectDados Sintéticos - Teses
dc.subject.otherdados sintéticos
dc.subject.otherredes Bayesianas
dc.subject.otherinferência Bayesiana
dc.subject.otherquantificação de incerteza
dc.titleGeração e análise de dados sintéticos via Redes Bayesianas: uma abordagem robusta para quantificação de incerteza via paradigma Bayesiano
dc.title.alternativeSynthetic data generation and analysis via Bayesian Networks: a robust approach for uncertainty quantification via Bayesian paradigm
dc.typeTese de doutorado
local.contributor.advisor-co1Thais Paiva Galletti
local.contributor.advisor1Flávio Bambirra Gonçalves
local.contributor.advisor1Latteshttp://lattes.cnpq.br/2015101359463631
local.contributor.referee1Vinícius Diniz Mayrink
local.contributor.referee1Guilherme Lopes de Oliveira
local.contributor.referee1Lívia Maria Dutra
local.contributor.referee1Kelly Cristina Mota Gonçalves
local.creator.Latteshttps://lattes.cnpq.br/9133103825732566
local.description.embargo2026-03-01
local.description.resumoA divulgação segura de dados confidenciais representa uma área de grande interesse, e dentre as diversas metodologias existentes, a abordagem de dados sintéticos destaca-se por sua capacidade de gerar informações de forma sigilosa. Essa metodologia é altamente flexível, visando a divulgação de dados com distribuições muito semelhantes às dos dados originais e assim preservando também a segurança de informações sensíveis. O modelo de rede Bayesiana, por sua vez, tem como propósito estimar de forma eficiente a distribuição conjunta de dados de interesse. Este método é uma escolha interessante para a geração de dados sintéticos, pois é um método flexível e robusto para a descrição das relações entre variáveis presentes no banco de dados original. Ao adotarmos o paradigma Bayesiano, conseguimos criar um modelo robusto não apenas para estimar a rede e os dados simulados, mas também para quantificar a incerteza intrínseca ao processo de geração desses novo dados. Esta tese propõe um estudo que utiliza um modelo estado da arte Markov chain Monte Carlo (MCMC) para geração de dados sintéticos. Além disso, apresentamos uma abordagem inovadora para a divulgação de informações relevantes ao usuário final, com o intuito de reduzir a incerteza associada ao processo de estimação. As principais contribuições deste trabalho incluem uma análise abrangente utilizando o paradigma Bayesiano para gerar dados sintéticos por meio de redes Bayesianas, incorporando um estudo robusto sobre a quantificação da incerteza no processo de geração desses novos dados. Introduzimos também uma classe geral de prioris penalizadoras para a rede. A tese compreende três estudos de simulação, bem como uma aplicação a dados reais que ilustra a análise do modelo proposto.
local.publisher.countryBrasil
local.publisher.departmentICX - DEPARTAMENTO DE ESTATÍSTICA
local.publisher.initialsUFMG
local.publisher.programPrograma de Pós-Graduação em Estatística

Arquivos

Pacote original

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
Tese_Larissa_Martins2.pdf
Tamanho:
2.45 MB
Formato:
Adobe Portable Document Format

Licença do pacote

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
license.txt
Tamanho:
2.07 KB
Formato:
Plain Text
Descrição: