Use este identificador para citar o ir al link de este elemento: http://hdl.handle.net/1843/BIRC-BB4QPF
Tipo: Tese de Doutorado
Título: On spatial statistical methods and applications for large datasets
Autor(es): Zaida Jesus Quiroz Cornejo
primer Tutor: Marcos Oliveira Prates
primer miembro del tribunal : Vinicius Diniz Mayrink
Segundo miembro del tribunal: Håvard Rue
Tercer miembro del tribunal: Sudipto Banerjee
Cuarto miembro del tribunal: Flavio Bambirra Goncalves
Resumen: O foco deste trabalho está na aplicação de modelos inovadores para a análise espaçotemporal da biomassa de anchova em um grande banco de dados e no desenvolvimento de um novo campo aleatório Gaussiano adequado para a análise de grandes conjuntos de dados. O primeiro artigo apresenta uma aplicação avançada da modelagem espaço-temporal através da Equação Diferencial Parcial Estocástica (SPDE) para estimar e prever a biomassa de anchova na costa do Peru. Foi introduzido um modelo espaço-temporal hierárquico Bayesiano completo, levando em consideração as possíveis dependências espaciais ou espaço-temporais dos dados. Estes modelos, computacionalmente eficientes e flexíveis, são também capazes de realizar previsões tanto da presença quanto da abundância de anchovas, em particular, quando o conjunto de locais é grande (> 500) e diferente ao longo do tempo. Eles são baseados em que os campos Gaussianos Matérn podem ser vistos como soluções de uma determinada SPDE que, em combinação com o INLA (Aproximação Integrada Aninhada de Laplace), tem uma melhora na eficiência computacional. O segundo trabalho é dedicado a estender o Processo de vizinho mais próximo Gaussiano (NNGP), recentemente proposto. Uma nova classe de processos de campo aleatório Gaussiano foi construída e, também, mostrada sua aplicabilidade a dados com pequenas ou grandes dependências espaciais. A idéia-chave por trás do novo processo espacial é subdividir o domínio espacial em vários blocos, que são dependentes de alguns dos blocos passados. A redução na complexidade computacional é obtida através da dispersão das matrizes de precisão e e na paralelização de extensos cálculos através de blocos de dados. Estes modelos são úteis para grandes conjuntos de dados espaciais, no qual os métodos tradicionaissão computacionalmente intensivos, tendo um alto custo para serem utilizados. Finalmente, para realizar a inferência, foi adotado o enfoque Bayesiano, no qual utilizou-se algoritmos de Monte Carlo via cadeias de Markov (MCMC). Além de demonstradas as capacid
Abstract: The focus of this work is on the application of novelty models for the spatio-temporal analysis of large anchovy biomass dataset, and the development of a new Gaussian random field suitable for the analysis of large datasets. The first paper presents an advance application of spatio-temporal modeling through the Stochastic Partial Differential Equation (SPDE) for estimating and predicting anchovy biomass off the coast of Peru. We introduce a complete, and computationally efficient, flexible Bayesian hierarchical spatio-temporal modeling for zero-inflated positive continuous, accounting for spatial or spatio-temporal dependencies in the data. The models are capable of performing predictions of anchovy presence and abundance, in particular,in particular, when the set of observed sites is large (> 500) and different across the temporal domain. They are based on the fact that Gaussian Matérn field can be viewed as solutions to a certain SPDE, which combined with Integrated Nested Laplace Approximations (INLA) improves the computational efficiency. The second paper is devoted to extend the newly proposed Nearest Neighbor Gaussian Process (NNGP). A new class of Gaussian random field process is constructed and, it is showed its applicability to simulated data with small or large spatial dependences. The key idea behind this new spatial process (or random field) is to subdivide the spatial domain into several blocks which are dependent on some of the past blocks. The new spatial process recovers the NNGP and independent blocks approach. Moreover, The reduction in computational complexity is achieved through the sparsity of the precision matrices and parallelization of many computations for blocks of data. It is useful for large spatial data sets where traditional methods are too computationally intensive to be used efficiently. Finally, to perform inference we adopt a Bayesian framework, we use Markov chain Monte Carlo (MCMC) algorithms and demonstrate the full inferential capabilities of the modeling including the new
Asunto: Estatística
Geologia Métodos estatísticos
Análise espacial (Estatística)
Idioma: Inglês
Editor: Universidade Federal de Minas Gerais
Sigla da Institución: UFMG
Tipo de acceso: Acesso Aberto
URI: http://hdl.handle.net/1843/BIRC-BB4QPF
Fecha del documento: 6-mar-2018
Aparece en las colecciones:Teses de Doutorado

archivos asociados a este elemento:
archivo Descripción TamañoFormato 
tese_quiroz.pdf4.46 MBAdobe PDFVisualizar/Abrir


Los elementos en el repositorio están protegidos por copyright, con todos los derechos reservados, salvo cuando es indicado lo contrario.