Identificação de novo e citogenômica comparativa de DNAs satélites em espécies de Drosophila dos grupos virilis e montium
Carregando...
Data
Autor(es)
Título da Revista
ISSN da Revista
Título de Volume
Editor
Universidade Federal de Minas Gerais
Descrição
Tipo
Dissertação de mestrado
Título alternativo
De novo identification and comparative cytogenomics of satellite DNAs in Drosophila species from the virilis and montium groups
Primeiro orientador
Membros da banca
Mateus Mondin
Francisco Pereira Lobo
Francisco Pereira Lobo
Resumo
Os DNAs repetitivos são os componentes mais abundantes dos genomas de eucariotos,
podendo ser classificados como dispersos, como é o caso dos elementos transponíveis
(TEs), ou em tandem, como no caso dos microssatélites, minissatélites e DNAs satélites
(satDNAs). Os estudos de DNAs repetitivos durante a era pré-genômica eram muitas
vezes demorados, trabalhosos e limitados. O desenvolvimento de técnicas de
sequenciamento massivo de DNA e a disponibilidade de várias ferramentas de
bioinformática propiciam atualmente o acesso e anotação automatizada de
praticamente todos os DNAs repetitivos presentes em um genoma. Desta forma, tornase
necessário testar a capacidade destas ferramentas para a correta identificação e
classificação destas sequências repetitivas. No presente projeto, utilizamos os pipelines
RepeatExplorer e TAREAN para a identificação de novo de satDNAs em duas espécies
próximas de Drosophila do grupo virilis (D. virilis e D. americana) e em 23 espécies
recém sequenciadas do grupo montium. Enquanto D. virilis e D. americana já foram
muito estudadas no contexto de DNAs repetitivos na era pré-genômica, nenhuma
espécie do grupo montium havia sido investigada nesse contexto. Em nossas análises,
identificamos seis famílias de elementos repetitivos em tandem (TRs) com
características de satDNAs nas espécies do grupo virilis e 142 clusters de satDNAs nas
espécies do grupo montium. Para D. virilis e D. americana, estudamos em detalhe cada
uma destas famílias, combinando dados da literatura, dados gerados pelos pipelines
testados e dados novos sobre localização cromossômica. Para o grupo montium,
realizamos a identificação de novo com o TAREAN e uma investigação mais detalhada
das famílias de satDNAs compartilhadas entre as espécies. Conseguimos identificar e
caracterizar os “reais” satDNAs de D. virilis e D. americana, além de analisar relações
evolutivas entre satDNAs e elementos transponíveis. Para o grupo montium, fizemos
pela primeira vez uma identificação de sequências de satDNAs, demonstramos que
alguns satélites compartilham sequências com elementos transponíveis, e que famílias
de satDNAs podem ser utilizadas como marcadores taxonômicos e filogenéticos dentro
do grupo. Sendo assim, confirmamos a eficácia dos pipelines RepeatExplorer e
TAREAN na identificação de novo de satDNAs em Drosophila, mostramos a importância
do uso combinado de abordagens in silico e experimentais para a identificação e
caracterização de satDNAs, relatamos exemplos, dentro do grupo montium, onde
satDNAs podem ser úteis como marcadores filogenéticos e, por último, relatamos vários
tipos de associações interessantes entre satDNAs e TEs.
Abstract
Repetitive DNAs are the most abundant components of the eukaryotic genomes and can
be classified as dispersed, as in the case of transposable elements (TEs), or in tandem,
as in the case of microsatellites, minisatellites and satellite DNAs (satDNAs). During the
pre-genomic era, repetitive DNA studies were often time-consuming, laborious and
limited. Currently, the development of massive DNA sequencing techniques and the
availability of several bioinformatics tools provide access and automated annotation of
virtually all repetitive DNAs present in a genome. Thus, it is necessary to test the capacity
of these tools for the correct identification and classification of these repetitive
sequences. In the present project, we used the RepeatExplorer and TAREAN pipelines
for de novo identification of satDNAs in two closely species of Drosophila from the virilis
group (D. virilis and D. americana) and in 23 newly sequenced species from the montium
group. While D. virilis and D. americana have been extensively studied in the context of
repetitive DNA in the pre-genomic era, no species from the montium group had been
previously investigated in this context. In our analyzes, we identified six families of
repetitive tandem repeats (TRs) with satDNA features in the virilis group species and
142 satDNA clusters in the montium group species. For D. virilis and D. americana, we
studied each of these families in detail, combining data from the literature, data
generated by the tested pipelines and new data on chromosomal localization. For the
montium group, we carried out the identification with TAREAN and a more detailed
investigation of the satDNA families shared between species. We were able to identify
and characterize the “real” satDNAs of D. virilis and D. americana, in addition to analyze
evolutionary relationships between satDNAs and transposable elements. For the
montium group, we did an unprecedented identification of satDNA sequences,
demonstrating that some satellites share sequences with transposable elements and
that satDNA families can be used as taxonomic and phylogenetic markers within the
group. Thus, we confirmed the effectiveness of the RepeatExplorer and TAREAN
pipelines for de novo identification of satDNAs in Drosophila, we showed the importance
of combining in silico and experimental approaches for the identification and
characterization of satDNAs, we reported examples, within the montium group, where
satDNAs may be useful as phylogenetic markers and lastly, we reported several types
of interesting associations between satDNAs and TEs.
Assunto
Genética, Citogenética, Drosophila, DNA satélite, Elementos de DNA transponíveis, Biologia computacional
Palavras-chave
DNAs repetitivos, DNAs satélites, Elementos transponíveis, Citogenômica, Drosophila, Repeat explorer, TAREAN, Grupo virilis, Grupo montium