Big data architectures for FAIR-compliant repositories: a systematic review

Carregando...
Imagem de Miniatura

Data

Título da Revista

ISSN da Revista

Título de Volume

Editor

Universidade Federal de Minas Gerais

Descrição

Tipo

Artigo de evento

Título alternativo

Arquiteturas de big data para repositórios compatíveis com FAIR: uma revisão sistemática

Primeiro orientador

Membros da banca

Resumo

The FAIR Principles state that scientific data should be Findable, Ac- cessible, Interoperable, and Reusable in order to adhere to the Open Science movement. However, designing a FAIR-compliant repository can be a challenge due to the complexity of managing a huge volume and variety of research data and metadata, which can also be generated at a high velocity. This complexity calls for a Software Reference Architecture (SRA) to guide data engineers dur- ing the implementation process. In this paper, we conduct a systematic review that encompasses research efforts regarding architectural solutions for imple- menting FAIR-compliant repositories. We analyze 323 references from Scopus, ACM, IEEEXplore, and specialists recommendations. From this analysis, we discover 7 studies that describe general purpose big data SRAs, 13 pipelines that implement the FAIR Principles to specific contexts, and 3 FAIR-compliant big data SRAs. We describe their key characteristics and discuss their limita- tions, highlighting tendencies and research opportunities

Abstract

Os Princípios FAIR afirmam que os dados científicos devem ser Localizáveis, Acessíveis, Interoperáveis ​​e Reutilizáveis ​​para aderir ao movimento Open Science. No entanto, projetar um repositório compatível com FAIR pode ser um desafio devido à complexidade de gerenciar um grande volume e variedade de dados de pesquisa e metadados, que também podem ser gerados em alta velocidade. Essa complexidade exige uma Arquitetura de Referência de Software (SRA) para orientar engenheiros de dados durante o processo de implementação. Neste artigo, conduzimos uma revisão sistemática que abrange esforços de pesquisa sobre soluções arquitetônicas para implementar repositórios compatíveis com FAIR. Analisamos 323 referências do Scopus, ACM, IEEEXplore e recomendações de especialistas. A partir dessa análise, descobrimos 7 estudos que descrevem SRAs de big data de propósito geral, 13 pipelines que implementam os Princípios FAIR em contextos específicos e 3 SRAs de big data compatíveis com FAIR. Descrevemos suas principais características e discutimos suas limitações, destacando tendências e oportunidades de pesquisa.

Assunto

Big Data, Repositórios Institucionais, Ciência Aberta, Software, Arquitetura

Palavras-chave

Big Data, Repositórios institucionais, Science, Software architecture

Citação

Curso

Endereço externo

https://sol.sbc.org.br/index.php/sbbd/article/view/25518

Avaliação

Revisão

Suplementado Por

Referenciado Por