Please use this identifier to cite or link to this item: http://hdl.handle.net/1843/55104
Type: Dissertação
Title: Análise global e gene a gene do GC% de vírus grandes e gigantes pertencentes ao filo Nucleocytoviricota
Authors: Amanda Stéphanie Arantes Witt
First Advisor: Jônatas Santos Abrahão
Abstract: O filo Nucleocytoviricota (ou NCLDV) é um dos grupos taxonômicos mais diversos, incluindo representantes com os maiores genomas observados na virosfera conhecida. Uma das métricas de estudo genômico em composição de sequências é a proporção percentual de guaninas e citosinas, também conhecida por porcentagem de conteúdo GC, que traz importantes informações acerca da biologia dos organismos, como aspectos relacionados à co-evolução de parasitas e hospedeiros, tendências evolutivas de linhagens de organismos, dentre outras. No presente trabalho, o GC% de 61 genomas de vírus pertencentes a Nucleocytoviricota foi analisado, gene a gene. Dentre estes, estão representantes de Phycodnaviridae, Mimiviridae, Iridoviridae, Marseilleviridae, Asfarviridae e Poxviridae, bem como linhagens ainda não classificadas. Os genomas de referência foram obtidos a partirdo banco de dados genômicos público GenBank (NCBI), e foram criados arquivos multifasta contendo somente as sequências codificantes anotadas para cada genoma. Estes arquivos foram submetidos ao programa de livre acesso InfoSeq do EMBOSS (EMBL-EBI) e assim obteve-se a porcentagem de conteúdo GC de cada CDS (sequência de DNA codificante), para cada genoma. De posse destes dados, foram avaliadas as distribuições e variações de GC% em relação a CDS ao longo dos genomas individualmente, dentro de cada grupo taxonômico e globalmente em Nucleocytoviricota. Nossos resultados revelaram que NCLDV é um filo diverso, não somente na biologia viral de seus integrantes – como na vasta gama de hospedeiros, mecanismo de infecção viral, nichos aos quais estes organismos pertencem, etc. - mas também na composição dos seus genomas, mais especificamente em relação ao conteúdo GC percentual de regiões codificadoras dos genomas.. A amplitude dos valores de GC% observados em Nucleocytoviricota é significativa, e membros de algumas famílias, como Mimiviridae e Poxviridae, ganham destaque. Embora a maioria dos genes analisados apresentem GC% próximo à média das CDS, foi observado um importante número de genes com GC% notavelmente elevado ou abaixo da média. Também foram observados, emdiferentes genomas, agrupamentos de genes em regiões variáveis, cujos valores percentuais de GC eram significativamente mais elevados que a média. Foram selecionados, posteriormente, genes considerados outliers, de valores máximos e mínimos observados em cada genoma, afim de caracterizar as CDS de valores extremos e verificar possíveis tendências evolutivas dos grupos ou conservação de genes ortólogos. Este trabalho trouxe, pela primeira vez, uma análise global e gene-a-gene da distribuição e o perfil da variação percentual GC nos genomas de Nucleocytoviricota, ilustrando uma parte da diversidade deste grupo e identificando novos alvos para estudos futuros.
Abstract: Nucleocytoviricota (or NCLDV) is one of the most diverse taxonomic groups, including representatives with the largest genomes observed in the known virosphere. Genomic studies on sequence composition counts with many different approaches, one of which calculates the proportion of guanines and cytosines within the sequence, known as GC content. The GC% content can lead to important information about the organism’s biology and various biological aspects. In the present work, the GC% of 61 genomes belonging to Nuclecytoviricota was calculated gene by gene. Among these genomes are the representatives of Phycodnaviridae, Mimiviridae, Iridoviridae, Marseilleviridae, Asfaridae, Poxviridae and “Pithoviridae”, as well as unclassified lineages. Reference genomes were obtained from the public genomic database GenBank (NCBI), and multifasta files were created containing only coding sequences annotated for each genome. These files were submitted to the sequence content analysis and free access program InfoSeq, by EMBOSS (EMBL-EBI). We then obtained the GC% content of each CDS, for each genome individually, within each group and globally in Nucleocytoviricota. Our results revealed how NCLDV is diverse, not only considering the viral biology of its members, but also in the GC% composition of its genomes. The range of GC% values observed in Nucleocytoviricota is significant, and some families, such as Mimiviridae and Poxviridae, gain prominence. Although most of the analyzed genes presented GC% values close to the CDS mean, an important number of genes with GC% significantly over or below the mean was observed. Furthermore, different genomes presented clusters of genes in defined regions with percentage values of GC significantly above the average. Outlier gene sequences of each group were evaluated in order to determine presence of orthologs or potential evolutionary tendencies shared among these groups. This work brings, for the first time, a global and gene-by-gene analysis of the distribution and profile of the GC content percentage within genomes, illustrating part of the diversity within Nucleocytoviricota, and identifying possible new targets for future studies.
Subject: Microbiologia
Genômica
Vírus gigantes
Composição de Bases
Poxvírus
language: por
metadata.dc.publisher.country: Brasil
Publisher: Universidade Federal de Minas Gerais
Publisher Initials: UFMG
metadata.dc.publisher.program: Programa de Pós-Graduação em Microbiologia
Rights: Acesso Restrito
URI: http://hdl.handle.net/1843/55104
Issue Date: 2-May-2022
metadata.dc.description.embargo: 2-May-2024
Appears in Collections:Dissertações de Mestrado

Files in This Item:
File Description SizeFormat 
Dissertação final Amanda Witt Microbiologia.pdf
???org.dspace.app.webui.jsptag.ItemTag.restrictionUntil??? 2024-05-02
4.74 MBAdobe PDFView/Open    Request a copy


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.