Um Arcabouço escalável, eficiente e adaptativo para busca aproximada em conteúdo multimídia

Carregando...
Imagem de Miniatura

Título da Revista

ISSN da Revista

Título de Volume

Editor

Universidade Federal de Minas Gerais

Descrição

Tipo

Tese de doutorado

Título alternativo

Membros da banca

Wagner Meira Júnior
Lúcia Maria de Assumpção Drummond
Mario Antônio Ribeiro Dantas
Ricardo Ribeiro dos Santos

Resumo

Aplicações Content-based multimedia retrieval (CBMR) vem se tornando cada vez mais populares em diversos serviços online que manipulam grandes volumes de dados e estão sujeitos à intensos fluxos de consultas e inserções de novos objetos (descritores multimídia). Embora sejam aplicações complexas, encontrar os objetos mais próximos à uma consulta é tipicamente a sua operação mais onerosa. Para resolver esse problema, diversos trabalhos recentes propõe a paralelização em memória distribuída da busca aproximada por vizinhos mais próximos (ANNS). Observou-se que as soluções destaque presentes na literatura empregam estratégias de paralelização que conduzem à uma distribuição do conjunto de dados propícia à criar gargalos de processamento e também mostram-se subótimas ao uso de recursos computacionais, presentes em cada nó de processamento, para tratar os fluxos intensos e variáveis de consultas e inserções de novos descritores. Assim, neste trabalho de tese foram propostas estratégias que superam as limitações apontadas e estendem a capacidade da paralelização de abordagens ANNS em memória distribuída para lidar eficientemente com demandas variáveis de consultas em grandes volumes crescentes de objetos multimídia.

Abstract

Content-based multimedia retrieval (CBMR) applications are becoming increasingly popular in several online services which handle large volumes of data and are submitted to high query and objects insertions (multimedia descriptors) rate. Although the complexity of these applications is in different aspects, find the objects closest to a query one, is undoubtedly one of the most costly operations. To solve this problem, several recent work proposes the parallelization in distributed memory of Approximate nearest neighbors (ANN) search. It was observed that the highlighted solutions present in the literature employ parallelization strategies that lead to a dataset partitioning creating processing bottlenecks and also show upsuboptimal to the use of computational resources, present in each processing node,to handle the high variables queries and insertions streans. Thus, in this thesis work, strategies were proposed that overcome the limitations pointed out and extend the ability of ANNS distributed memory parallelization approaches to efficiently handle intense and variable query demands in large and growing volumes of multimedia objects.

Assunto

Computação – Teses, Computação de Alto Desempenho – Teses, Sistemas Distribuídos – Teses, Recuperação da Informação - Teses, Sistemas Multimídia - Teses

Palavras-chave

computação de alto desempenho, sistemas, sistemas distribuídos, busca por similaridade

Citação

Endereço externo

Avaliação

Revisão

Suplementado Por

Referenciado Por

Licença Creative Commons

Exceto quando indicado de outra forma, a licença deste item é descrita como Acesso Aberto