Assembly of highly repetitive genomes using short reads: the genome of discrete typing unit III Trypanosoma cruzi strain 231

dc.creatorRodrigo de Paula Baptista
dc.creatorJoao Luis Reis-Cunha
dc.creatorJeremy DeBarry
dc.creatorEgler Chiari
dc.creatorJessica Kissinger
dc.creatorDaniella Castanheira Bartholomeu
dc.creatorAndrea Mara Macedo5
dc.date.accessioned2026-03-02T22:19:32Z
dc.date.issued2018
dc.description.abstractNext-generation sequencing (NGS) methods are low-cost high-throughput technologies that produce thousands to millions of sequence reads. Despite the high number of raw sequence reads, their short length, relative to Sanger, PacBio or Nanopore reads, complicates the assembly of genomic repeats. Many genome tools are available, but the assembly of highly repetitive genome sequences using only NGS short reads remains challenging. Genome assembly of organisms responsible for important neglected diseases such as Trypanosoma cruzi, the aetiological agent of Chagas disease, is known to be challenging because of their repetitive nature. Only three of six recognized discrete typing units (DTUs) of the parasite have their draft genomes published and therefore genome evolution analyses in the taxon are limited. In this study, we developed a computational workflow to assemble highly repetitive genomes via a combination of de novo and reference-based assembly strategies to better overcome the intrinsic limitations of each, based on Illumina reads. The highly repetitive genome of the human-infecting parasite T. cruzi 231 strain was used as a test subject. The combined-assembly approach shown in this study benefits from the reference-based assembly ability to resolve highly repetitive sequences and from the de novo capacity to assemble genome-specific regions, improving the quality of the assembly. The acceptable confidence obtained by analyzing our results showed that our combined approach is an attractive option to assemble highly repetitive genomes with NGS short reads. Phylogenomic analysis including the 231 strain, the first representative of DTU III whose genome was sequenced, was also performed and provides new insights into T. cruzi genome evolution.
dc.identifier.doihttp://dx.doi.org/10.1099/mgen.0.000156
dc.identifier.issn2057-5858
dc.identifier.urihttps://hdl.handle.net/1843/1852
dc.languageInglêspt_BR
dc.publisherUniversidade Federal de Minas Gerais
dc.relation.ispartofMicrobial Genomics
dc.rightsAcesso aberto
dc.subjectTrypanosoma cruzi
dc.subjectDoença de chagas
dc.subjectGenoma
dc.subject.otherTrypanosoma cruzi
dc.subject.otherGenome assembly
dc.subject.otherEvolution
dc.subject.otherDTUs
dc.titleAssembly of highly repetitive genomes using short reads: the genome of discrete typing unit III Trypanosoma cruzi strain 231
dc.title.alternativeMontagem de genomas altamente repetitivos usando leituras curtas: o genoma da unidade de tipagem discreta III da cepa 231 de Trypanosoma cruzi
dc.typeArtigo de periódico
local.citation.epage11
local.citation.issue4
local.citation.spage1
local.citation.volume4
local.description.resumoOs métodos de sequenciamento de nova geração (NGS) são tecnologias de baixo custo e alto rendimento que produzem de milhares a milhões de sequências de leitura. Apesar do grande número de sequências de leitura brutas, seu curto comprimento, em comparação com as sequências de Sanger, PacBio ou Nanopore, complica a montagem de repetições genômicas. Muitas ferramentas genômicas estão disponíveis, mas a montagem de sequências genômicas altamente repetitivas usando apenas sequências curtas de NGS permanece um desafio. A montagem do genoma de organismos responsáveis ​​por importantes doenças negligenciadas, como o Trypanosoma cruzi , agente etiológico da doença de Chagas, é reconhecidamente desafiadora devido à sua natureza repetitiva. Apenas três das seis unidades de tipagem discreta (DTUs) reconhecidas do parasita têm seus genomas preliminares publicados e, portanto, as análises de evolução genômica nesse táxon são limitadas. Neste estudo, desenvolvemos um fluxo de trabalho computacional para montar genomas altamente repetitivos por meio de uma combinação de estratégias de montagem de novo e baseadas em referência, visando superar as limitações intrínsecas de cada uma, com base em sequências de leitura Illumina. O genoma altamente repetitivo da cepa 231 do parasita *T. cruzi*, causador de infecções em humanos , foi utilizado como modelo. A abordagem de montagem combinada apresentada neste estudo se beneficia da capacidade da montagem baseada em referência para resolver sequências altamente repetitivas e da capacidade de montagem *de novo* de regiões específicas do genoma, melhorando a qualidade da montagem. A confiabilidade aceitável obtida pela análise dos nossos resultados demonstrou que nossa abordagem combinada é uma opção atraente para a montagem de genomas altamente repetitivos com sequências curtas de sequenciamento de nova geração (NGS). Uma análise filogenômica incluindo a cepa 231, o primeiro representante da Unidade de Tratamento Distúrbio (DTU) III cujo genoma foi sequenciado, também foi realizada e fornece novas informações sobre a evolução do genoma do *T. cruzi* .
local.publisher.countryBrasil
local.publisher.departmentICB - DEPARTAMENTO DE PARASITOLOGIA
local.publisher.departmentICB - DEPARTAMENTO DE BIOQUÍMICA E IMUNOLOGIA
local.publisher.initialsUFMG
local.subject.cnpqCIENCIAS BIOLOGICAS::IMUNOLOGIA
local.url.externahttps://www.microbiologyresearch.org/content/journal/mgen/10.1099/mgen.0.000156

Arquivos

Pacote original

Agora exibindo 1 - 2 de 2
Carregando...
Imagem de Miniatura
Nome:
license.txt
Tamanho:
2.15 KB
Formato:
Plain Text
Descrição:
License file
Carregando...
Imagem de Miniatura
Nome:
Assembly of highly repetitive genomes using short reads the genome of discrete typing unit III Trypanosoma cruzi strain 231.pdf
Tamanho:
882.41 KB
Formato:
Adobe Portable Document Format

Licença do pacote

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
license.txt
Tamanho:
2.07 KB
Formato:
Item-specific license agreed to upon submission
Descrição: