Please use this identifier to cite or link to this item: http://hdl.handle.net/1843/BUOS-97YF66
Type: Dissertação de Mestrado
Title: Estimação de proporções alélicas e genotípicas individuais de dados CNVs (Copy Number Variations)
Authors: Silvana Schneider
First Advisor: Denise Duarte Scarpa Magalhaes Alves
First Co-advisor: Maíra Ribeiro Rodrigues
First Referee: Maíra Ribeiro Rodrigues
Second Referee: Glaura da Conceicao Franco
Third Referee: Ralph dos Santos Silva
Abstract: Copy Number Variation (CNVs) são segmentos de DNA que apresentam variações do número de cópias de uma sequência (gene), em relação ao número usual de duas cópias por indivíduo, podendo variar de um kilobase a três megabases de tamanho. E, inúmeras pesquisas já identificaram a associação de variações no número de cópias de alguns genes com diversas doenças genéticas complexas, tais como o lúpus, artrite reumatoide e diabetes do tipo 1, infecções por HIV e malária. A maioria dos métodos disponíveis para a identificação de CNVs são capazes de descrever apenas o número total de cópias de um gene ou segmento de DNA por indivíduo, deixando subjacente o número de cópias por cromossomo. Gaunt et al. (2010) desenvolveram um programa chamado CoNVEM, baseado no Algoritmo EM (Expectation-Maximization) para determinar a proporção alélica em dados haploides de CNV, supondo que os dados estão em Equilíbrio de Hardy-Weinberg (EHW). No entanto, quando os dados estão em Desequilíbrio de Hardy-Weinberg não há ferramentas estatísticas para estimarmos as proporções alélicas e genotípicas de dados de CNVs. Propomos um método capaz de estimar essas proporções quando existe endogamia na população (desequilíbrio), baseado no Algoritmo EM e na abordagem da função de verossimilhança perfilada. Os cálculos foram implementados em um programa que denominamos por CNVice (Inbreeding Coefficients Estimation for CNV data), utilizando linguagem de programação R, realizado em parceria com o Laboratório de Diversidade Genética Humana, http://ldgh.com.br/, da Universidade Federal de Minas Gerais.
Abstract: Copy Number Variation (CNV) are DNA segments that exhibit variations in the number of copies of a sequence (gene), in relation to the usual number of two copies per individual, ranging from one kilobase to three megabases in size. Numerous studies have identified an association of the variations in the number of copies of some genes with various complex genetic diseases such as lupus, rheumatoid arthritis and type 1 diabetes, HIV infection and malaria. Most methods available for identifying CNVs are able to describe only the total number of copies of a gene or DNA segment per individual, leaving behind the number of copies per chromosome. Gaunt et al. (2010) developed a program called CoNVEM, which is based on the EM algorithm (Expectation-Maximization) to determine the allele frequencies in haploids of CNV data, assuming the data are in Hardy-Weinberg equilibrium (HWE). However, when the data are in Hardy-Weinberg Disequilibrium there aren´t any statistical tools to estimate the proportions of allelic and genotypic data CNVs. We propose a method to estimate these proportions when there is inbreeding in the population (imbalance), based on the EM algorithm and the approach of the profiled likelihood function. The calculations have been implemented in a program that we call by CNVice (Inbreeding Coefficients Estimation for CNV data), using R programming language, developed in partnership with the Laboratory of Human Genome Diversity, http://ldgh.com.br/, of Federal University of Minas Gerais.
Subject: Estatistica
language: Português
Publisher: Universidade Federal de Minas Gerais
Publisher Initials: UFMG
Rights: Acesso Aberto
URI: http://hdl.handle.net/1843/BUOS-97YF66
Issue Date: 18-Feb-2013
Appears in Collections:Dissertações de Mestrado

Files in This Item:
File Description SizeFormat 
disserta__o_silvana_schneider.pdf444.25 kBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.