Um ambiente de programação para sistemas distribuídos com grande volume de dados

dc.creatorMatheus Ferreira Ribeiro
dc.date.accessioned2019-08-12T16:04:24Z
dc.date.accessioned2025-09-08T23:49:40Z
dc.date.available2019-08-12T16:04:24Z
dc.date.issued2005-09-28
dc.description.abstractAnthill is an implementation of a parallel programming environment, based on filter-stream model. Filter-stream is an efficient model for processing large ammounts of data and works as a network pipeline, where each stage processes data and transmits the result for the next one. Stages heavily loaded can be replicated, balancing the load among the pipeline components and having a constant data flow. In this work, the features of the programming model and the environment are presented: filters and transparent copies, data parallelism interface, stream communication, distributed state through labeled streams and system usage. Results of two real applications that make use of our system will also be presented, showing. Anthill can reach superlinear speedups. Anthill implementation is based on DataCutter, a system developed by University of Maryland and the Ohio State University. The addition of new features, like labeled stream and work division interface, makes it possible for a greater range of applications to be run in the environment.
dc.identifier.urihttps://hdl.handle.net/1843/SLBS-6GVG4D
dc.languagePortuguês
dc.publisherUniversidade Federal de Minas Gerais
dc.rightsAcesso Aberto
dc.subject.otherDados
dc.subject.otherSistemas
dc.titleUm ambiente de programação para sistemas distribuídos com grande volume de dados
dc.typeDissertação de mestrado
local.contributor.advisor1Renato Antonio Celso Ferreira
local.contributor.referee1Walfredo da Costa Cirne Filho
local.contributor.referee1Dorgival Olavo Guedes Neto
local.contributor.referee1Wagner Meira Junior
local.description.resumoFormigueiro é uma implementação de um ambiente de programação paralelo baseado no modelo de fluxo de dados. O fluxo de dados é um modelo comprovadamente eficiente para o processamento de grandes volumes de dados e funciona como uma linha de processamento, onde cada estágio processa o dado e o modela para o estágio seguinte, seguindo o fluxo da linha. Estágios sobrecarregados podem ser replicados, obtendo-se uma linha uniforme, onde o fluxo de dados é constante.Neste trabalho, são apresentadas as principais características do modelo e do ambiente de programação: filtros e cópias transparentes, divisão dos dados por cópias, comunicação por fluxo, estados distribuídos através de fluxo rotulado e utilização do sistema. Também serão apresentados resultados de duas aplicações desenvolvidas sobre o Formigueiro, mostrando que o sistema é escalável, podendo alcançar desempenhos superlineares.A implementação e o modelo de programação do Formigueiro são baseados no DataCutter, um sistema desenvolvido pela University of Maryland e Ohio State University. A adição de novas características, como o fluxo rotulado e a interface de divisão de tarefas, permite que uma categoria maior de aplicações possa ser trabalhada no ambiente.
local.publisher.initialsUFMG

Arquivos

Pacote original

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
dissertacao.pdf
Tamanho:
851.66 KB
Formato:
Adobe Portable Document Format