Please use this identifier to cite or link to this item: http://hdl.handle.net/1843/55611
Full metadata record
DC FieldValueLanguage
dc.contributor.advisor1Douglas Eduardo Valente Pirespt_BR
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/2675409574553301pt_BR
dc.contributor.advisor-co1David Benjamin Asherpt_BR
dc.contributor.advisor-co2Tulio de Oliveirapt_BR
dc.contributor.referee1Aristóteles Góes Netopt_BR
dc.contributor.referee2Marta Giovanettipt_BR
dc.contributor.referee3Sandro Carvalho Izidoropt_BR
dc.contributor.referee4Lucianna Helene Silva dos Santospt_BR
dc.contributor.referee5Valdete Maria Gonçalves de Almeidapt_BR
dc.creatorJoicymara Santos Xavierpt_BR
dc.creator.Latteshttp://lattes.cnpq.br/3513284440886930pt_BR
dc.date.accessioned2023-06-30T15:40:22Z-
dc.date.available2023-06-30T15:40:22Z-
dc.date.issued2023-10-27-
dc.identifier.urihttp://hdl.handle.net/1843/55611-
dc.description.abstractThe exponential growth in the generation and availability of biological data, including experimental data and genome sequences of diverse organisms, has boosted, in recent decades, the emergence of computational tools that seek to predict and understand biological phenomena. In addition, some initiatives seek to inform and assist general public health and sanitary decision-making. In order to make it possible to develop these and many other relevant works and analyses, several databases have been maintained as a resource to guide innovation and the generation of new biological insights. In this context, the paradigm shift from quantity to quality of data and information has been proven increasingly necessary and crucial. However, different challenges are encountered according to the data maintenance policy. Databases used for research in Bioinformatics, and also in other areas, can be open, where the community is responsible for maintenance and verification, or maintained by institutions that regulate the use of this data. In this work, we proposed to evaluate two relevant problems in different areas of activity of Bioinformatics to understand how biological data can be annotated and integrated in a sustainable and optimized way to answer relevant scientific questions and also inform the population. As a result, we present two approaches that deal with two different contexts, ThermoMutDB and SARS-CoV-2 Africa dashboard, with data quality and scientific information delivery as a central focus. ThermoMutDB is a public, manually curated database of protein thermodynamic data. The SARS-CoV-2 Africa dashboard is an interactive tool for visualizing and analyzing COVID-19 genomic data from the African continent. ThermoMutDB proposes a collaborative data verification paradigm for building curated databases with data from the biomedical literature. The dashboard uses data from GISAID (an initiative that maintains and regulates the genomic data of this disease worldwide) through an agreement between the institutions. It allows the general public access to real-time data in order to guide decision-making in response to the current pandemic. Results show that the tools have been widely used and have the potential to impact future research in protein engineering and genomic surveillance, in addition to the possibility of being replicated in other contexts.pt_BR
dc.description.resumoO crescimento exponencial na geração e disponibilização de dados biológicos, incluindo dados experimentais e genomas dos mais diversos organismos, impulsionou, nas últimas décadas, o surgimento de ferramentas computacionais que buscam predizer e entender uma variedade de fenômenos biológicos. Além disso, algumas iniciativas buscam informar e auxiliar na tomada de decisões sanitárias e de saúde. Para que seja possível o desenvolvimento desses e outros tantos trabalhos e análises relevantes, diversos bancos de dados têm sido mantidos como um recurso para orientar a inovação e a geração de novos insights biológicos. Nesse contexto, a mudança do paradigma de quantidade para qualidade de dados e informações têm sido cada vez mais necessária e crucial. No entanto, diferentes desafios são encontrados de acordo com a política de manutenção desses dados. As bases de dados utilizadas para pesquisas em Bioinformática, e também em outras áreas, podem ser abertas, onde a comunidade é responsável pela manutenção e verificação, ou mantidas por instituições que regulamentam a utilização desses dados. Neste trabalho, propusemos avaliar dois problemas relevantes em diferentes áreas de atuação da Bioinformática para entender como dados biológicos podem ser anotados e integrados de forma sustentável e otimizada a responder questões científicas relevantes e também informar a população. Como resultado, apresentamos duas abordagens que lidam com dois contextos diferentes, ThermoMutDB e SARS-CoV-2 Africa dashboard, tendo a qualidade de dados e entrega de informação científica como foco central. O ThermoMutDB é uma base de dados pública, manualmente curada, com dados termodinâmicos de proteínas. O SARS-CoV-2 Africa dashboard é uma ferramenta interativa para visualização e análises de dados genômicos de COVID-19 do continente africano. O ThermoMutDB propõe um paradigma colaborativo para verificação de dados para construção de bases de dados curadas com dados da literatura biomédica. O dashboard utiliza dados do GISAID (iniciativa que mantém e regula os dados genômicos dessa doença no mundo todo) através de um acordo entre as instituições e possibilita o acesso do público em geral a dados em tempo real que permitem a tomada de decisões em resposta à pandemia vigente. Resultados mostram que as ferramentas têm sido largamente utilizadas e têm potencial para impactar pesquisas futuras nas áreas de engenharia de proteínas e vigilância genômica, além da possibilidade de serem replicadas para outros contextos.pt_BR
dc.description.sponsorshipFAPEMIG - Fundação de Amparo à Pesquisa do Estado de Minas Geraispt_BR
dc.description.sponsorshipCAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superiorpt_BR
dc.languageporpt_BR
dc.publisherUniversidade Federal de Minas Geraispt_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.departmentICB - INSTITUTO DE CIÊNCIAS BIOLOGICASpt_BR
dc.publisher.programPrograma de Pós-Graduação em Bioinformaticapt_BR
dc.publisher.initialsUFMGpt_BR
dc.relationPrograma Institucional de Internacionalização – CAPES - PrIntpt_BR
dc.rightsAcesso Abertopt_BR
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/pt/*
dc.subjectbioinformáticapt_BR
dc.subjectmutações missensept_BR
dc.subjecttermodinâmicapt_BR
dc.subjectSARS-CoV-2pt_BR
dc.subjectciência de dadospt_BR
dc.subjectbancos de dadospt_BR
dc.subjectproteômicapt_BR
dc.subject.otherBioinformáticapt_BR
dc.subject.otherMutação de Sentido Incorretopt_BR
dc.subject.otherTermodinâmicapt_BR
dc.subject.otherBetacoronaviruspt_BR
dc.subject.otherCiência de Dadospt_BR
dc.subject.otherBase de Dadospt_BR
dc.subject.otherProteômicapt_BR
dc.titleThermoMutDB e SARS-COV-2 Africa Dashboard: abordagens de ciência de dados para integração, análise e vigilância de dados biológicospt_BR
dc.title.alternativeThermoMutDB and SARS-CoV-2 Africa Dashboard: data science approaches for biological data integration, analytics, and surveillance.pt_BR
dc.typeTesept_BR
dc.identifier.orcidhttps://orcid.org/0000-0002-4649-6270pt_BR
Appears in Collections:Teses de Doutorado

Files in This Item:
File Description SizeFormat 
Tese_Joicymara_paginacao_corrigida.pdfTese12.16 MBAdobe PDFView/Open


This item is licensed under a Creative Commons License Creative Commons