Extensão de um ambiente de computação de alto desempenho para o processamento de dados massivos
| dc.creator | Lucas Miguel Simões Ponce | |
| dc.creator | Walter Dos Santos Filho | |
| dc.creator | Wagner Meira Junior | |
| dc.creator | Dorgival Olavo Guedes Neto | |
| dc.date.accessioned | 2024-08-12T21:06:47Z | |
| dc.date.accessioned | 2025-09-09T00:36:21Z | |
| dc.date.available | 2024-08-12T21:06:47Z | |
| dc.date.issued | 2018 | |
| dc.description.abstract | High performance computing (HPC) and massive data processing (Big Data) are two trends in computing systems that are beginning to con- verge. This paper presents our experience on this path of convergence, exten- ding COMP Superscalar (COMPSs), a parallel and distributed programming model already known in the world of HPC, for the processing of massive data. For this, it has been integrated to HDFS, the most widely used distributed file system for Big Data, and to Lemonade, a data mining and analysis tool deve- loped at UFMG. The results show that the integration with HDFS benefits the COMPSs by the data abstraction provided and the integration with Lemonade facilitates its use and popularization in the area of Data Science. | |
| dc.format.mimetype | ||
| dc.identifier.doi | https://doi.org/10.5753/sbrc.2018.2486 | |
| dc.identifier.uri | https://hdl.handle.net/1843/73811 | |
| dc.language | por | |
| dc.publisher | Universidade Federal de Minas Gerais | |
| dc.relation.ispartof | Simposio Brasileiro de Redes de Computadores | |
| dc.rights | Acesso Aberto | |
| dc.subject | Processamento Eletrônico de Dados | |
| dc.subject | Mineração de dados (Computação) | |
| dc.subject.other | Integrated Data Processing | |
| dc.subject.other | Mining, Data | |
| dc.title | Extensão de um ambiente de computação de alto desempenho para o processamento de dados massivos | |
| dc.title.alternative | Extending a high-performance computing environment for processing massive data | |
| dc.type | Artigo de evento | |
| local.description.resumo | A computacao de alto desempenho (HPC) e o processamento de da- dos massivos (Big Data) sao duas tendencias em sistemas de computacao que estao comecando a convergir. Este trabalho apresenta nossa experiencia nesse caminho de convergencia, estendendo o COMP Superscalar (COMPSs), um mo- delo de programacao paralela e distribuıda ja conhecido no mundo de HPC, para o processamento de dados massivos. Para isso, ele foi integrado ao HDFS, sistema de arquivos distribuıdo mais usado para Big Data, e ao Lemonade, uma ferramenta de analise e mineracao de dados desenvolvida na UFMG. Os resultados mostram que a integracao com o HDFS beneficia o COMPSs pela abstracao de dados fornecida e a integracao com o Lemonade facilita sua utilizacao e popularizacao na ́area de Ciencia dos Dados. | |
| local.publisher.country | Brasil | |
| local.publisher.department | ICX - DEPARTAMENTO DE CIÊNCIA DA COMPUTAÇÃO | |
| local.publisher.initials | UFMG | |
| local.url.externa | https://sol.sbc.org.br/index.php/sbrc/article/view/2486 |