Abordagens de biologia computacional para o estudo da diversidade genômica dos brasileiros

dc.creatorThiago Peixoto Leal
dc.date.accessioned2021-03-01T15:45:11Z
dc.date.accessioned2025-09-08T23:22:04Z
dc.date.available2021-03-01T15:45:11Z
dc.date.issued2015-04-01
dc.description.abstractBrazil is the largest and the most populous Latin American country. It has more than 200 millions inhabitants, which are the product of post-Columbian admixture between Native American, European and Africans. Latin Americans are classical models for the studies of the effect of admixture on human populations, but they are underrepresented in modern studies on the human genomic diversity. This Master thesis is part of the EPIGEN-Brasil initiative, the largest Latin American initiative aimed to study the genomic diversity of this part of the world. Two goals of the EPIGEN project are: (i) to identify and quantify for the first time, biogeographic components of ancestry of the Brazilian population at a sub-continental level, (ii) to infer admixture dynamics of the Brazilian population. To achieve these goals, we implemented two computational approaches. The first approach uses complex network theory to identify sets of relatives departing from a matrix of kinship coefficients, and suggest a heuristic methodology to reduce the level of kinship in a populational sample, minimizing the number of individuals to be excluded from the sample. This is a relevant problem because the presence of related individuals generate artifacts in the analysis of biogeographic ancestry, and related individuals have to be retired from the analysis. The second approach develops and implements a new methodology based on Approximate Bayesian Calculation to infer the a posteriori distribution of parameter that characterize the dynamics of the historical process of admixture. This method is applied to the Brazilian population, revealing the signature of more recent European gene flow in Southeast/South Brazil than in Northeast.
dc.identifier.urihttps://hdl.handle.net/1843/35086
dc.languagepor
dc.publisherUniversidade Federal de Minas Gerais
dc.rightsAcesso Aberto
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/pt/
dc.subjectBiologia computacional
dc.subjectTeoria dos grafos
dc.subjectGenômica
dc.subject.otherBioinformática
dc.subject.otherRedes complexas
dc.subject.otherTeoria de grafos
dc.subject.otherComputação bayesiana aproximada
dc.titleAbordagens de biologia computacional para o estudo da diversidade genômica dos brasileiros
dc.typeDissertação de mestrado
local.contributor.advisor1Maíra Ribeiro Rodrigues
local.contributor.advisor1Latteshttp://lattes.cnpq.br/1035025419267366
local.creator.Latteshttp://lattes.cnpq.br/1908814778674963
local.description.resumoO Brasil é o maior e o mais populoso país da America-Latina. São mais de 200 milhões de habitantes que são produtos de miscigenação Pós-Colombiana entre ameríndios, europeus, sejam esses colonizadores ou imigrantes, e escravos africanos. Apesar disso, Latino-Americanos, que são um modelo clássico de efeitos de miscigenação em populações humanas, permanecem sub-representados em estudos de diversidade genômica. A presente dissertação é parte do o projeto EPIGEN-Brasil, a iniciativa Latino Americana mais abrangente para o estudo da diversidade genômica da América do Sul. Dois objetivos do projeto EPIGEN são: (i) identificar e quantificar pela primeira vez componentes de ancestralidade da população brasileira no nível sub-continental e (ii) inferir a dinâmica da miscigenação de populações brasileiras. Para atingir estes objetivos foram implementadas duas abordagens computacionais. O primeiro utiliza teoria de redes complexas para identificar conjuntos de indivíduos aparentados de uma amostra a partir da matriz de coeficientes de parentescos, e sugere uma metodologia heurística para diminuir o nível de parentesco em uma amostra minimizando o número de indivíduos a serem retirados das amostras. Este problema é relevante porque a presença de indivíduos aparentados gera artefatos nas análises de ancestralidade biogeográficas, pelo que indivíduos aparentados devem que ser identificados e retirados das amostras. A segunda abordagem desenvolve e implementa uma nova metodologia baseada em Computação Bayesiana Aproximada para inferir as distribuições a posteriori de parâmetros que caracterizam a dinâmica de um processo histórico de miscigenação, a que é aplicada à população brasileira, revelando a assinatura de fluxo gênico mais recente no Sudeste/Sul que no Nordeste.
local.publisher.countryBrasil
local.publisher.departmentICB - INSTITUTO DE CIÊNCIAS BIOLOGICAS
local.publisher.initialsUFMG
local.publisher.programPrograma de Pós-Graduação em Bioinformatica

Arquivos

Pacote original

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
Dissertação.pdf
Tamanho:
3.37 MB
Formato:
Adobe Portable Document Format

Licença do pacote

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
license.txt
Tamanho:
2.07 KB
Formato:
Plain Text
Descrição: