Padronização e automação de dados da coleção acarológica do centro de coleções taxonômicas da UFMG: Um enfoque na gestão de metadados e modelagem de distribuição de espécies

dc.creatorMário Henrique de Assis Silva
dc.date.accessioned2025-12-10T15:52:27Z
dc.date.issued2025-06-24
dc.description.abstractThe digitization and standardization of biological data are essential for the efficient management of scientific collections, enabling their integration into global repositories and expanding their potential for ecological and biogeographical research. This dissertation sought to standardize and automate data from the UFMG-AC Acarological Collection to address challenges concerning data fragmentation and inconsistency. The study implemented computational methodologies for data conversion and organization, ensuring compliance with the Darwin Core (DwC) standard. Scripts and pipelines were developed to structure metadata, correct taxonomic and geospatial inconsistencies, and integrate records into international platforms such as the Global Biodiversity Information Facility (GBIF) and the Brazilian Biodiversity Information System (SiBBr). Concurrently, Species Distribution Modeling (SDM) was applied to infer biogeographical patterns and predict potential occurrence areas for cataloged species. The EcoDistrib library was used to optimize environmental variable selection and machine learning based model execution, while cross-validation techniques and statistical metrics ensured result robustness. Comparative analysis of data before and after standardization revealed significant improvements in quality, consistency, and accessibility, including taxonomic redundancy correction and enhanced spatial accuracy. The integration of enhanced data into GBIF and SiBBr increased the collection’s visibility, facilitating its use in biogeographical and conservation studies. Distribution models identified relevant spatial patterns, highlighting gaps in records and suggesting new areas for future sampling. The research demonstrates that combining computational techniques with traditional curation approaches can significantly improve biological collection management, emphasizing the importance of automation and standardization for preserving, sharing, and applying biodiversity data. The findings reinforce the relevance of digitization and computational tools in modernizing scientific collections, advancing biogeography, ecology, and biodiversity conservation.
dc.description.sponsorshipCAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior
dc.identifier.urihttps://hdl.handle.net/1843/1127
dc.languagepor
dc.publisherUniversidade Federal de Minas Gerais
dc.rightsAcesso aberto
dc.rightsAttribution-NonCommercial-NoDerivs 3.0 Brazilen
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/br/
dc.subjectBioinformática
dc.subjectBiodiversidade
dc.subjectEcologia
dc.subjectAprendizado de Máquina
dc.subjectPadrões de Referência
dc.subject.otherDigitalização de coleções biológicas
dc.subject.otherModelagem de distribuição de espécies
dc.subject.otherDarwin Core
dc.subject.otherAprendizado de máquinas
dc.subject.otherIntegração de dados
dc.titlePadronização e automação de dados da coleção acarológica do centro de coleções taxonômicas da UFMG: Um enfoque na gestão de metadados e modelagem de distribuição de espécies
dc.title.alternativeData Standardization and Automation for the Acarological Collection of the Centro de Coleções Taxonômicas (CCT-UFMG) at UFMG: An Approach to Metadata Management and Species Distribution Modeling
dc.typeDissertação de mestrado
local.contributor.advisor-co1Almir Rogério Pepato
local.contributor.advisor-co1Latteshttp://lattes.cnpq.br/6323551517347442
local.contributor.advisor1Aristóteles Góes Neto
local.contributor.advisor1Latteshttp://lattes.cnpq.br/6134133834289438
local.creator.Latteshttp://lattes.cnpq.br/9093900589560786
local.description.resumoA digitalização e padronização de dados biológicos são fundamentais para a gestão eficiente de coleções científicas, permitindo sua integração a repositórios globais e ampliando seu potencial para pesquisas ecológicas e biogeográficas. Esta dissertação buscou a padronização e automação dos dados da Coleção Acarológica UFMG-AC, visando solucionar problemas de fragmentação e inconsistência dos registros. O estudo implementou metodologias computacionais para a conversão e organização dos dados, garantindo conformidade com o padrão Darwin Core (DwC). Foram desenvolvidos scripts e pipelines para a estruturação de metadados, correção de inconsistências taxonômicas e geoespaciais, e integração dos registros a plataformas internacionais como o Global Biodiversity Information Facility (GBIF) e o Sistema de Informação sobre a Biodiversidade Brasileira (SiBBr). Paralelamente, a modelagem de distribuição de espécies (Species Distribution Modeling – SDM) foi aplicada para inferir padrões biogeográficos e prever áreas potenciais de ocorrência das espécies catalogadas. A biblioteca EcoDistrib foi utilizada para otimizar a seleção de variáveis ambientais e a execução de modelos baseados em aprendizado de máquina, enquanto técnicas de validação cruzada e métricas estatísticas asseguraram a robustez dos resultados. A análise comparativa dos dados antes e após a padronização evidenciou um aumento significativo na qualidade, consistência e acessibilidade das informações, com a correção de redundâncias taxonômicas e a melhoria da precisão espacial dos registros. A integração dos dados aprimorados às plataformas GBIF e SiBBr conferiu maior visibilidade à coleção, facilitando seu uso em estudos biogeográficos e de conservação. Os modelos de distribuição revelaram padrões espaciais relevantes, identificando lacunas nos registros e sugerindo novas áreas de ocorrência para futuras coletas. A pesquisa demonstra que a combinação de técnicas computacionais com abordagens tradicionais de curadoria pode aprimorar significativamente a gestão de coleções biológicas, destacando a importância da automação e padronização para a preservação, compartilhamento e aplicabilidade científica dos dados de biodiversidade. Os resultados reforçam a relevância da digitalização e do uso de ferramentas computacionais na modernização de acervos científicos, contribuindo para o avanço da biogeografia, ecologia e conservação da biodiversidade.
local.identifier.orcidhttps://orcid.org/0009-0005-2280-4522
local.publisher.countryBrasil
local.publisher.initialsUFMG
local.publisher.programPrograma de Pós-Graduação em Bioinformatica
local.subject.cnpqCIENCIAS BIOLOGICAS::ZOOLOGIA

Arquivos

Pacote original

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
dissertacao_Mario - PADRONIZAÇÃO E AUTOMAÇÃO DE DADOS DA COLEÇÃO ACAROLÓGICA DO CENTRO DE COLEÇÕES TAXONÔMICAS DA UFMG.pdf
Tamanho:
2.51 MB
Formato:
Adobe Portable Document Format

Licença do pacote

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
license.txt
Tamanho:
2.07 KB
Formato:
Item-specific license agreed to upon submission
Descrição: