Please use this identifier to cite or link to this item: http://hdl.handle.net/1843/62051
Type: Monografia (especialização)
Title: Ajuste de modelo de regressão linear múltipla em dados de δ15N do solo para o Bioma Cerrado
Other Titles: Adjustment of multiple linear regression model on soil δ15N data for the Cerrado Biome
Authors: João Paulo Sena Souza
First Advisor: Thais Rotsen Correa
First Referee: Marcelo Azevedo Costa
Second Referee: Guilherme Lopes de Oliveira
Abstract: O nitrogênio desempenha um papel fundamental na produtividade primária e na estrutura dos ecossistemas terrestres. Em alguns biomas, como o Cerrado, o nitrogênio é um nutriente limitante da produtividade. Portanto, é essencial compreender os processos que afetam sua disponibilidade e transformações. Isótopos estáveis de nitrogênio (δ15N) fornecem uma medida integradora desses processos, permitindo a avaliação da contribuição relativa de diferentes fontes de nitrogênio para o ambiente, como a deposição atmosférica e a fixação biológica. Entender a variação do δ15N no solo fornece uma compreensão abrangente do ciclo do nitrogênio e seus efeitos nos ecossistemas terrestres. Neste contexto, o objetivo do presente trabalho é propor um modelo preditivo e explicativo para o δ15N do solo do bioma Cerrado. Foram coletadas 97 amostras de solo em diversas localidades do bioma. Para cada localidade, foram extraídos valores de variáveis preditoras climáticas e biofísicas provenientes de dados espaciais secundários; e variáveis edáficas provenientes de análises laboratoriais das amostras de solo. No total, 46 variáveis preditoras do δ15N foram inseridas no banco de dados. Um modelo de regressão linear múltipla foi ajustado considerando todas as variáveis que apresentaram correlação com a variável dependente. Posteriormente, modelos de regressão foram ajustados seguindo as suposições da regressão. Para isso, matrizes de correlação foram usadas para eliminar variáveis preditoras correlacionadas, evitando multicolinearidade. O modelo final foi ajustado após seleção das melhores variáveis pelo método stepwise AIC (Critério de Informação de Akaike). Os resíduos do modelo final foram testados para normalidade, homoscedasticidade, autocorreção e autocorrelação espacial. Para avaliar o desemprenho preditivo, foi realizada uma validação cruzada Leave-One-Out. O primeiro modelo (Modelo 1), ajustado com todas as variáveis, obteve o R2adj de 0,66 e o R2 de 0,81 após validação cruzada. Apesar do alto poder preditivo, o Modelo 1 não respeita os pressupostos da regressão múltipla, o que impede a interpretação dos coeficientes do modelo. O modelo final seguiu todas as suposições da regressão linear múltipla e obteve o R2adj de 0,57 e o R2 de 0,59 após validação cruzada. Apesar do menor coeficiente de determinação, os coeficientes do modelo podem ser interpretados. As variáveis que contribuíram para o ajuste do modelo final foram concentração Ca2+, δ13C do solo, sazonalidade de temperatura, amplitude anual da temperatura e precipitação pluviométrica do trimestre mais úmido. Todas estas variáveis foram significativas para o modelo final e apresentaram coeficientes coerentes com sua contribuição esperada para a variação do δ15N do solo. O modelo ajustado traz avanços no estudo do ciclo biogeoquímico do nitrogênio para o bioma Cerrado, pois acrescenta dados edáficos e indica uma influência positiva e ainda pouco explorada do Ca2+ no δ15N do solo. Apesar do avanço, o modelo final pode ter excluído variáveis preditoras importantes na explicação do fenômeno devido aos critérios de seleção de variáveis e ao método utilizado. Futuros trabalhos devem aplicar métodos que identifiquem relações não lineares entre as variáveis.
Abstract: Nitrogen plays a fundamental role in primary productivity and the structure of terrestrial ecosystems. In some biomes, such as the Cerrado, nitrogen is a limiting nutrient for productivity. Therefore, it is essential to understand the processes that affect its availability and transformations. Stable nitrogen isotopes (δ15N) provide an integrated measure of these processes, allowing for the assessment of the relative contribution of different nitrogen sources to the environment, such as atmospheric deposition and biological fixation. Understanding the variation of δ15N in soil provides a comprehensive understanding of the nitrogen cycle and its effects on terrestrial ecosystems. In this context, the objective of this study was to propose a predictive and explanatory model for soil δ15N in the Cerrado biome. A total of 97 soil samples were collected from various locations within the biome. Values of climatic and biophysical predictor variables were extracted from secondary spatial data for each location, and soil variables were obtained from laboratory analyses. In total, 46 predictor variables of δ15N were included in the database. A multiple linear regression model was fitted including all predictive variables with some significant correlation with the dependent variable. Subsequently, regression models were adjusted following the assumptions of regression analysis. Correlation matrices were used to eliminate correlated predictor variables, avoiding multicollinearity. The final model was adjusted after selecting the best variables using the stepwise AIC method. The residuals of the final model were tested for normality, homoscedasticity, autocorrelation, and spatial autocorrelation. Leave-One-Out cross-validation was applied to assess predictive performance. The first model (Model 1), adjusted with all variables, achieved an R2adj of 0,66 and an R2 of 0,81 after cross-validation. Despite its high predictive power, Model 1 did not meet the assumptions of multiple linear regression, which hinders the interpretation of the model coefficients. The final model followed all assumptions of multiple linear regression and achieved an R2adj of 0,57 and an R2 of 0,59 after cross-validation. Despite its lower predictive power, the coefficients of the model can be interpreted. The variables that contributed to the adjustment of the final model were Ca2+ concentration, soil δ13C, temperature seasonality, annual temperature range, and precipitation in the wettest quarter. All these variables were significant for the final model and exhibited coefficients consistent with their expected contribution to the variation of soil δ15N. The adjusted model brings advancements in the study of the nitrogen biogeochemical cycle for the Cerrado biome, as it incorporates soil data and indicates a positive and yet underexplored influence of Ca2+ on soil δ15N. Despite the progress, the final model may have excluded important predictor variables in explaining the phenomenon due to variable selection criteria and the method used. Future studies should apply methods that identify non-linear relationships among variables.
Subject: Estatística
Isótopos – Nitrogênio
Modelo preditivo
language: por
metadata.dc.publisher.country: Brasil
Publisher: Universidade Federal de Minas Gerais
Publisher Initials: UFMG
metadata.dc.publisher.department: ICX - DEPARTAMENTO DE ESTATÍSTICA
metadata.dc.publisher.program: Curso de Especialização em Estatística
Rights: Acesso Restrito
URI: http://hdl.handle.net/1843/62051
Issue Date: 27-Jun-2023
metadata.dc.description.embargo: 27-Jun-2025
Appears in Collections:Especialização em Estatística

Files in This Item:
File Description SizeFormat 
TCC_especializaçãoEst_JoãoPauloSenaSouza_formatacaoUFMG_versao_corrigida.pdf
???org.dspace.app.webui.jsptag.ItemTag.restrictionUntil??? 2025-06-27
3.94 MBAdobe PDFView/Open    Request a copy


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.