Use este identificador para citar ou linkar para este item: http://hdl.handle.net/1843/39050
Tipo: Tese
Título: Modelos aproximados e exatos para geoestatística com amostragem preferencial
Título(s) alternativo(s): Approximate and exact models for geostatistics under preferential sampling
Autor(es): Douglas Mateus da Silva
Primeiro Orientador: Dani Gamerman
Primeiro Coorientador: Lourdes Coral Contreras Montenegro
Primeiro membro da banca : Marcos Oliveira Prates
Segundo membro da banca: Flávio Bambirra Gonçalves
Terceiro membro da banca: Hélio dos Santos Migon
Quarto membro da banca: Raquel Menezes
Resumo: Modelos geoestatísticos são utilizados para analisar dados espacialmente correlacionados sob um domínio contínuo. A metodologia tradicional de geoestatística supõe que o desenho amostral é realizado de forma independente do fenômeno em estudo e denominamos esse processo de amostragem como não preferencial. Quando o desenho amostral é construído com base em informações da variável de interesse, certos locais tem maior chance de serem escolhidos em detrimento à outros. A esse tipo de amostragem denominamos preferencial. Sob essa amostragem, o processo latente que modela os dados e o processo pontual que modela a configuração espacial da amostra não são independentes. Não podemos ignorar a distribuição conjunta desses processos, pois obteremos resultados viesados na estimação e na predição. Sendo o algoritmo EM um método que trata o problema de dados faltantes, é natural pensar em utilizar essa ferramenta como um método de estimação para esse modelo. Dessa forma, o primeiro ponto abordado nesta tese é o desenvolvimento de um algoritmo SAEM para estimação dos parâmetros do modelo, sob abordagem clássica. Além disso, na presença de dados atípicos, o modelo Gaussiano não é adequado e temos que recorrer a distribuições de caudas mais pesadas que a normal. Desenvolvemos o modelo com amostragem preferencial com distribuição t-Student para lidar com esse problema, sendo o segundo ponto abordado nesta tese. Na literatura existente, é assumida como função de intensidade para o processo pontual a função exponencial, tendo como consequência a intratabilidade da função de verossimilhança. Nesse caso, a inferência é realizada através de aproximações por discretização da região de estudo, o que pode levar a erros difíceis de serem mensurados. Dessa forma, como terceiro ponto abordado nessa tese, desenvolvemos o modelo Bayesiano exato para os dados de geoestatística com amostragem preferencial. Estudos de simulações são realizados para avaliar a metodologia proposta pelos três pontos considerados, assim como a aplicação em conjunto de dados reais, sendo um deles os dados de poluição em Galícia, conjunto de dados bastante conhecido na literatura. Os modelos propostos apresentaram melhor estimação dos parâmetros do modelo e melhor predição da variável de interesse em locais não observados comparados aos métodos já existentes, principalmente em regiões distantes de pontos da amostra cuja quantidade de informação é baixa.
Abstract: Geostatistical models are used to analyze spatially correlated data under a continuous domain. The traditional methodology of geostatistics supposes that the sampling design is constructed independently of the phenomena in the study and we denominate this sampling process as non preferential. When the sampling design is constructed with information about the variable of interest, some locals have more chance of being selected in comparison to others. This kind of sampling we denominate preferential. Under the preferential sampling, the latent process that models data and the pontual process that models the spacial configuration of the sample are not independent. We can not ignore the join distribution of those processes, because we will obtain biased results under estimation and prediction. Since the EM algorithm is a method that deals with latent data, it is natural to consider it as a tool of estimation for this model. In this way, the first aim in this thesis is the development of an SAEM algorithm for parameter estimation of the model under preferential sampling, in the classic approach. Besides this, in presence of outliers, the Gaussian model is not adequate and we have to consider heavier tails distributions. We developed a geostatistical model under preferential sampling with t-Student distribution to deal with this problem, beign this the second aim of this thesis. In the existent literature, it assumes the exponential function as the intensity function of the pontual process, which has intractable likelihood function. In this case, the inference is realized considering discrete approximation of the region in study, which can lead to errors that are difficult to measure. In this way, as the third aim of this thesis, we developed an exact Bayesian model for geostatistical data under preferential sampling. Simulated examples are considered to evaluate the methodology proposed for the three aims of this thesis, as well application on real data, one of them being the moss data of Galicia, a dataset well known in the literature. The proposed models provided better results in parameter estimation and prediction of the variable of interest on locals that were not sampled compared to the existing methods, mainly in regions that are distant of locals sampled which the quantity of information is low.
Assunto: Estatística – Teses
Geologia – Métodos estatísticos – Tese
Amostragem (Estatística) – Teses
Teoria bayesiana de decisão estatística – Teses
Idioma: por
País: Brasil
Editor: Universidade Federal de Minas Gerais
Sigla da Instituição: UFMG
Departamento: ICX - DEPARTAMENTO DE ESTATÍSTICA
Curso: Programa de Pós-Graduação em Estatística
Tipo de Acesso: Acesso Aberto
URI: http://hdl.handle.net/1843/39050
Data do documento: 3-Set-2021
Aparece nas coleções:Teses de Doutorado

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
Modelos aproximados e exatos para geoestatistica com amostragem preferencial.pdf13.54 MBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.