Abordagens de biologia computacional para o estudo da diversidade genômica dos brasileiros
Carregando...
Arquivos
Data
Autor(es)
Título da Revista
ISSN da Revista
Título de Volume
Editor
Universidade Federal de Minas Gerais
Descrição
Tipo
Dissertação de mestrado
Título alternativo
Primeiro orientador
Membros da banca
Resumo
O Brasil é o maior e o mais populoso país da America-Latina. São mais de 200 milhões
de habitantes que são produtos de miscigenação Pós-Colombiana entre ameríndios,
europeus, sejam esses colonizadores ou imigrantes, e escravos africanos. Apesar disso,
Latino-Americanos, que são um modelo clássico de efeitos de miscigenação em
populações humanas, permanecem sub-representados em estudos de diversidade
genômica. A presente dissertação é parte do o projeto EPIGEN-Brasil, a iniciativa
Latino Americana mais abrangente para o estudo da diversidade genômica da América
do Sul. Dois objetivos do projeto EPIGEN são: (i) identificar e quantificar pela primeira
vez componentes de ancestralidade da população brasileira no nível sub-continental e
(ii) inferir a dinâmica da miscigenação de populações brasileiras. Para atingir estes
objetivos foram implementadas duas abordagens computacionais. O primeiro utiliza
teoria de redes complexas para identificar conjuntos de indivíduos aparentados de uma
amostra a partir da matriz de coeficientes de parentescos, e sugere uma metodologia
heurística para diminuir o nível de parentesco em uma amostra minimizando o número
de indivíduos a serem retirados das amostras. Este problema é relevante porque a
presença de indivíduos aparentados gera artefatos nas análises de ancestralidade
biogeográficas, pelo que indivíduos aparentados devem que ser identificados e retirados
das amostras. A segunda abordagem desenvolve e implementa uma nova metodologia
baseada em Computação Bayesiana Aproximada para inferir as distribuições a
posteriori de parâmetros que caracterizam a dinâmica de um processo histórico de
miscigenação, a que é aplicada à população brasileira, revelando a assinatura de fluxo
gênico mais recente no Sudeste/Sul que no Nordeste.
Abstract
Brazil is the largest and the most populous Latin American country. It has more than
200 millions inhabitants, which are the product of post-Columbian admixture between
Native American, European and Africans. Latin Americans are classical models for the
studies of the effect of admixture on human populations, but they are underrepresented
in modern studies on the human genomic diversity. This Master thesis is part of the
EPIGEN-Brasil initiative, the largest Latin American initiative aimed to study the
genomic diversity of this part of the world. Two goals of the EPIGEN project are: (i) to
identify and quantify for the first time, biogeographic components of ancestry of the
Brazilian population at a sub-continental level, (ii) to infer admixture dynamics of the
Brazilian population. To achieve these goals, we implemented two computational
approaches. The first approach uses complex network theory to identify sets of relatives
departing from a matrix of kinship coefficients, and suggest a heuristic methodology to
reduce the level of kinship in a populational sample, minimizing the number of
individuals to be excluded from the sample. This is a relevant problem because the
presence of related individuals generate artifacts in the analysis of biogeographic
ancestry, and related individuals have to be retired from the analysis. The second
approach develops and implements a new methodology based on Approximate
Bayesian Calculation to infer the a posteriori distribution of parameter that characterize
the dynamics of the historical process of admixture. This method is applied to the
Brazilian population, revealing the signature of more recent European gene flow in
Southeast/South Brazil than in Northeast.
Assunto
Biologia computacional, Teoria dos grafos, Genômica
Palavras-chave
Bioinformática, Redes complexas, Teoria de grafos, Computação bayesiana aproximada
Citação
Departamento
Endereço externo
Avaliação
Revisão
Suplementado Por
Referenciado Por
Licença Creative Commons
Exceto quando indicado de outra forma, a licença deste item é descrita como Acesso Aberto
