Please use this identifier to cite or link to this item: http://hdl.handle.net/1843/SLSS-7XGFF4
Type: Dissertação de Mestrado
Title: FD-Sensi: um detector de falhas adaptativo e sua aplicação a um sistema distribuído em larga escala
Authors: Everthon Valadao dos Santos
First Advisor: Dorgival Olavo Guedes Neto
First Co-advisor: Ricardo de Oliveira Duarte
First Referee: Francisco Vilar Brasileiro
Second Referee: Jussara Marques de Almeida
Abstract: Os detectores de falhas consistem num componente essencial em qualquer sistema distribuído tolerante a falhas. Um detector de falhas ideal deve adaptar-se a variadas condições de rede e carga do sistema, de maneira a prover informações rápidas e precisas sobre processos falhos aos outros módulos do sistema tolerante a falhas. Este trabalho apresenta a avaliação de um novo algoritmo de detecção de falhas, FD-Sensi, que é capaz de lidar com sistemas distribuídos altamente sobrecarregados e redes de comunicação com grandes variações de latência de mensagens. Foi realizada a avaliação do FD-Sensi tanto em cenários com cargas sintéticas quanto cenários com cargas reais da Internet, utilizando dados coletados em uma centena de nós do PlanetLab. Os dados foram utilizados para comparar seu desempenho com um dos melhores algoritmos de detecção da atualidade, Adaptive Accrual. Os resultados mostram que o FD-Sensi teve um desempenho superior ao Adaptive Accrual, apresentando uma significativa redução da emissão de falso-positivos com a manutenção de um baixo tempo médio de detecção. O trace coletado no PlanetLab poderá ser utilizado na avaliação de novos algoritmos de detecção de falhas e, através de sua análise, este trabalho fornece também as distribuições estatísticas mais apropriadas para a modelagem de atrasos de rede em ambientes globalmente distribuídos. Por fim, propomos uma técnica de aperfeiçoamento para algoritmos de detecção que, baseando-se na correlação entre a carga do nó monitorado e os atrasos percebidos possibilitou-nos melhorar significativamente a precisão e velocidade da detecção de falhas.
Abstract: The failure detector is an essential component of any distributed dependable system solution. An ideal failure detector must adapt to varying network/system conditions in order to provide fast and accurate information about faulty nodes to other modules of a dependable system. This work presents a new adaptive failure detection algorithm, FD-Sensi, which is able to cope with heavily loaded distributed systems and networks in a wide range of message delay scenarios. We evaluated our failure detector algorithm in an Internet scenario, using data collected in one hundred PlanetLab nodes. The data were used to compare the performance of our algorithm with one of the best failure detection algorithms of the present day, Adaptive Accrual. Our results show FD-Sensi outperformed Adaptive Accrual, presenting a significant reduction in the emission of false-positives with the maintenance of a low average detection time. The trace collected on PlanetLab may be used in the evaluation of new algorithms for failure detection and through its analysis this work also provides the best fitted statistical distributions to model network delays in globally distributed environments. Finally, we propose a technique for improving detection algorithms that, based on the correlation between the resource load of the monitored node and the observed delays allowed us to significantly improve the accuracy and speed of failure detection.
Subject: Computação
Sistemas distribuídos
language: Português
Publisher: Universidade Federal de Minas Gerais
Publisher Initials: UFMG
Rights: Acesso Aberto
URI: http://hdl.handle.net/1843/SLSS-7XGFF4
Issue Date: 29-Sep-2009
Appears in Collections:Dissertações de Mestrado

Files in This Item:
File Description SizeFormat 
everthon_valadao_santos.pdf1.36 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.