Minerando padrões reais em tensores incertos

dc.creatorLucas José Carneiro Maciel
dc.date.accessioned2021-04-13T18:59:43Z
dc.date.accessioned2025-09-09T00:02:41Z
dc.date.available2021-04-13T18:59:43Z
dc.date.issued2018-04-04
dc.description.abstractUncertain tensors encode to what extent n-ary predicates are satisfied. For instance, the times users spent on different websites week after week can be turned into degrees of interest of the users (1st dimension) for the sites (2nd dimension) during the weeks (3rd dimension). In the resulting 3-way uncertain tensor, sub-tensors that are both large and dense are often interesting to an analyst. They are users who all showed much interest for the same sites during the same weeks. Mirkin and Kramarenko proposed the disjunctive box cluster model, a regression model where such patterns are explanatory variables for the values in the uncertain tensor. In this dissertation, two approaches are proposed to fit a disjunctive box cluster model to an uncertain tensor. A complete algorithm first provides fragments of the desired patterns. In the first approach, a hill-climbing procedure individually grows them. At every iteration of that procedure, integer linear programming is used to compute the larger pattern. In the second approach, the input fragments are hierarchically agglomerated. In both cases, greedy pre-processes are proposed to speed up the subsequent computation. Finally, a stepwise regression technique, the forward selection, chooses among the discovered patterns a non-redundant subset that fits, but does not overfit, the tensor. Experiments on both synthetic and real-world tensors show the proposals discovers high-quality patterns in uncertain tensors and outperforms state-of-the-art approaches when applied to 0/1 tensors, a special case.
dc.identifier.urihttps://hdl.handle.net/1843/35673
dc.languageeng
dc.publisherUniversidade Federal de Minas Gerais
dc.rightsAcesso Aberto
dc.subjectComputação — Teses.
dc.subjectMineração de Dados (Computação) — Teses.
dc.subjectProgramação Linear — Teses.
dc.subjectModelo de Regressão — Teses.
dc.subjectReconhecimento de Padrões — Teses.
dc.subject.otherMineração de padrões
dc.subject.otherTensores incertos
dc.subject.otherDisjunctive box cluster model
dc.subject.otherHill-climbing
dc.subject.otherProgramação linear inteira
dc.subject.otherAglomeração hierárquica
dc.subject.otherAlgoritmos de seleção
dc.titleMinerando padrões reais em tensores incertos
dc.title.alternativeMining real patterns in uncertain tensors
dc.typeDissertação de mestrado
local.contributor.advisor-co1Vinícius Fernandes dos Santos
local.contributor.advisor1Loic Pascal Gilles Cerf
local.contributor.advisor1Latteshttp://lattes.cnpq.br/1425457857618919
local.contributor.referee1Flavio Vinicius Diniz de Figueiredo
local.contributor.referee1Thiago Ferreira de Noronha
local.contributor.referee1Robson Leonardo Ferreira Cordeiro
local.creator.Latteshttp://lattes.cnpq.br/0268329943649766
local.description.resumoTensores incertos codificam o quanto são satisfeitos predicados n-ários. Por exemplo, o tempo que usuários gastam em diferentes sites da web em cada semana podem ser transformados em graus de interesse que os usuários (1a dimensão) tem pelos sites (2a dimensão) durante as semanas (3a dimensão). No resultante tensor incerto tridimensional, sub-tensores que são grandes e densos frequentemente são interessantes para um analista. Eles representam usuários que têm mostrado muito interesse nos mesmos sites durante as mesmas semanas. Mirkin and Kramarenko propuseram um modelo disjuntivo de box cluster (disjunctive box cluster model), que é um modelo de regressão onde os padrões são variáveis explicativas dos valores no tensor incerto. Nesta dissertação, duas abordagens são propostas de acordo com tal modelo. Fragmentos dos padrões de interesse são primeiramente providos por algoritmos completos. Estes fragmentos são então crescidos, na primeira abordagem, usando um procedimento conhecido como hillclimbing. Em cada iteração deste procedimento, um problema de programação linear inteira é resolvido para encontrar um padrão maior. Já na segunda abordagem, os fragmentos são hierárquicamente aglomerados. Em ambas abordagens, pré-processamentos são propostos para acelerar a subsequente computação. Finalmente, uma técnica de regressão gradual, forward selection, seleciona entre os padrões descobertos, um subconjunto não redundante que melhor descreve o tensor sem causar overfit. Experimentos em ambos tensores sintéticos e reais mostram que as propostas descobrem padrões de alta qualidade em tensores incertos e superam o estado da arte quando aplicados a tensores 0/1, um caso específico.
local.publisher.countryBrasil
local.publisher.departmentICX - DEPARTAMENTO DE CIÊNCIA DA COMPUTAÇÃO
local.publisher.initialsUFMG
local.publisher.programPrograma de Pós-Graduação em Ciência da Computação

Arquivos

Pacote original

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
LucasJoséCarneiroMaciel_finalSubst.pdf
Tamanho:
1.25 MB
Formato:
Adobe Portable Document Format

Licença do pacote

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
license.txt
Tamanho:
2.07 KB
Formato:
Plain Text
Descrição: