Modelo de mistura de processos pontuais estocásticos para tempos entre eventos de serviços na Web

Carregando...
Imagem de Miniatura

Título da Revista

ISSN da Revista

Título de Volume

Editor

Universidade Federal de Minas Gerais

Descrição

Tipo

Dissertação de mestrado

Título alternativo

Primeiro orientador

Membros da banca

Pedro Olmo Stancioli Vaz de Melo
Ana Paula Couto da Silva
Daniel Ratton Figueiredo

Resumo

Neste trabalho é proposto um modelo de mistura de processos pontuais, distintos e estocasticamente independentes, para tempos entre eventos de serviços na Web. Um deles é o Self-Feeding Process (SFP) e o outro é um processo de Poisson homogêneo (PP). O modelo SFP tem se mostrado um excelente descritor para os tempos aleatórios de ocorrências de eventos na Web. A motivação para a utilização do PP é a verificação empírica de que os longos períodos de inatividade preditos pelo SFP costumam não ocorrer em alguns exemplos. Para a separação dos processos foi utilizado o Algoritmo EM. Um teste de hipótese foi aplicado a fim de verificar se a variável adicionada no modelo mistura é realmente necessária. Os resultados foram satisfatórios pois o modelo proposto ajusta-se bem à maioria das bases reais de dados consideradas. Ademais, duas aplicações, baseadas no nosso modelo, foram propostas: detecção de anomalias e detecção de bursts.

Abstract

In the present work we propose a mixture of point processes models, distinct and stochastically independent, for Internet services inter-event times. One is the Self-Feeding Process (SFP) and the other is the homogeneous Poisson process (PP). The SFP model is an excellent descriptor for Web random event times. The motivation for the use of the PP is the empirical verification that the long periods of inactivity predicted by the SFP do not occur in some instances. To disentagle the two processes, we use the EM algorithm. In the E step we approximate the maximum of the likelihood function by its expected value because the events labels are not known. A hypothesis test was applied to check either the additional free variable in the mixture model is actually needed or a single pure process, SFP or PP, is sufficient to describe the observed stochastic process. The results were satisfactory since the topics are well fitted by the proposed model for nine real data sets. In addition, two applications were proposed: anomaly detection and bursts detection.

Assunto

Processo estocástico, Computação, Operadores aleatórios

Palavras-chave

Mistura de processos pontuais, Tempos entre eventos, Modelo generativo, Dinâmica de comunicações

Citação

Departamento

Curso

Endereço externo

Avaliação

Revisão

Suplementado Por

Referenciado Por