Análise global e gene a gene do GC% de vírus grandes e gigantes pertencentes ao filo Nucleocytoviricota
Carregando...
Data
Autor(es)
Título da Revista
ISSN da Revista
Título de Volume
Editor
Universidade Federal de Minas Gerais
Descrição
Tipo
Dissertação de mestrado
Título alternativo
Primeiro orientador
Membros da banca
Resumo
O filo Nucleocytoviricota (ou NCLDV) é um dos grupos taxonômicos mais diversos,
incluindo representantes com os maiores genomas observados na virosfera conhecida.
Uma das métricas de estudo genômico em composição de sequências é a proporção
percentual de guaninas e citosinas, também conhecida por porcentagem de conteúdo
GC, que traz importantes informações acerca da biologia dos organismos, como
aspectos relacionados à co-evolução de parasitas e hospedeiros, tendências evolutivas
de linhagens de organismos, dentre outras. No presente trabalho, o GC% de 61 genomas
de vírus pertencentes a Nucleocytoviricota foi analisado, gene a gene. Dentre estes,
estão representantes de Phycodnaviridae, Mimiviridae, Iridoviridae, Marseilleviridae,
Asfarviridae e Poxviridae, bem como linhagens ainda não classificadas. Os genomas de
referência foram obtidos a partirdo banco de dados genômicos público GenBank (NCBI),
e foram criados arquivos multifasta contendo somente as sequências codificantes
anotadas para cada genoma. Estes arquivos foram submetidos ao programa de livre
acesso InfoSeq do EMBOSS (EMBL-EBI) e assim obteve-se a porcentagem de conteúdo
GC de cada CDS (sequência de DNA codificante), para cada genoma. De posse destes
dados, foram avaliadas as distribuições e variações de GC% em relação a CDS ao longo
dos genomas individualmente, dentro de cada grupo taxonômico e globalmente em
Nucleocytoviricota. Nossos resultados revelaram que NCLDV é um filo diverso, não
somente na biologia viral de seus integrantes – como na vasta gama de hospedeiros,
mecanismo de infecção viral, nichos aos quais estes organismos pertencem, etc. - mas
também na composição dos seus genomas, mais especificamente em relação ao
conteúdo GC percentual de regiões codificadoras dos genomas.. A amplitude dos valores
de GC% observados em Nucleocytoviricota é significativa, e membros de algumas
famílias, como Mimiviridae e Poxviridae, ganham destaque. Embora a maioria dos genes
analisados apresentem GC% próximo à média das CDS, foi observado um importante
número de genes com GC% notavelmente elevado ou abaixo da média. Também foram
observados, emdiferentes genomas, agrupamentos de genes em regiões variáveis, cujos
valores percentuais de GC eram significativamente mais elevados que a média. Foram
selecionados, posteriormente, genes considerados outliers, de valores máximos e
mínimos observados em cada genoma, afim de caracterizar as CDS de valores extremos
e verificar possíveis tendências evolutivas dos grupos ou conservação de genes
ortólogos. Este trabalho trouxe, pela primeira vez, uma análise global e gene-a-gene da
distribuição e o perfil da variação percentual GC nos genomas de Nucleocytoviricota,
ilustrando uma parte da diversidade deste grupo e identificando novos alvos para estudos
futuros.
Abstract
Nucleocytoviricota (or NCLDV) is one of the most diverse taxonomic groups, including
representatives with the largest genomes observed in the known virosphere. Genomic
studies on sequence composition counts with many different approaches, one of which
calculates the proportion of guanines and cytosines within the sequence, known as GC
content. The GC% content can lead to important information about the organism’s biology
and various biological aspects. In the present work, the GC% of 61 genomes belonging
to Nuclecytoviricota was calculated gene by gene. Among these genomes are the
representatives of Phycodnaviridae, Mimiviridae, Iridoviridae, Marseilleviridae, Asfaridae,
Poxviridae and “Pithoviridae”, as well as unclassified lineages. Reference genomes were
obtained from the public genomic database GenBank (NCBI), and multifasta files were
created containing only coding sequences annotated for each genome. These files were
submitted to the sequence content analysis and free access program InfoSeq, by
EMBOSS (EMBL-EBI). We then obtained the GC% content of each CDS, for each
genome individually, within each group and globally in Nucleocytoviricota. Our results
revealed how NCLDV is diverse, not only considering the viral biology of its members, but
also in the GC% composition of its genomes. The range of GC% values observed in
Nucleocytoviricota is significant, and some families, such as Mimiviridae and Poxviridae,
gain prominence. Although most of the analyzed genes presented GC% values close to
the CDS mean, an important number of genes with GC% significantly over or below the
mean was observed. Furthermore, different genomes presented clusters of genes in
defined regions with percentage values of GC significantly above the average. Outlier
gene sequences of each group were evaluated in order to determine presence of
orthologs or potential evolutionary tendencies shared among these groups. This work
brings, for the first time, a global and gene-by-gene analysis of the distribution and profile
of the GC content percentage within genomes, illustrating part of the diversity within
Nucleocytoviricota, and identifying possible new targets for future studies.
Assunto
Microbiologia, Genômica, Vírus gigantes, Composição de Bases, Poxvírus
Palavras-chave
Nucleocytoviricota, Conteúdo GC, Vírus, GuaninaCitosina, Poxvírus, Genômica