Um Arcabouço escalável, eficiente e adaptativo para busca aproximada em conteúdo multimídia
Carregando...
Data
Autor(es)
Título da Revista
ISSN da Revista
Título de Volume
Editor
Universidade Federal de Minas Gerais
Descrição
Tipo
Tese de doutorado
Título alternativo
Primeiro orientador
Membros da banca
Wagner Meira Júnior
Lúcia Maria de Assumpção Drummond
Mario Antônio Ribeiro Dantas
Ricardo Ribeiro dos Santos
Lúcia Maria de Assumpção Drummond
Mario Antônio Ribeiro Dantas
Ricardo Ribeiro dos Santos
Resumo
Aplicações Content-based multimedia retrieval (CBMR) vem se tornando cada vez mais populares em diversos serviços online que manipulam grandes volumes de dados e estão sujeitos à intensos fluxos de consultas e inserções de novos objetos (descritores multimídia). Embora sejam aplicações complexas, encontrar os objetos mais próximos à uma consulta é tipicamente a sua operação mais onerosa. Para resolver esse problema, diversos trabalhos recentes propõe a paralelização em memória distribuída da busca aproximada por vizinhos mais próximos (ANNS). Observou-se que as soluções destaque presentes na literatura empregam estratégias de paralelização que conduzem à uma distribuição do conjunto de dados propícia à criar gargalos de processamento e também mostram-se subótimas ao uso de recursos computacionais, presentes em cada nó de processamento, para tratar os fluxos intensos e variáveis de consultas e inserções de novos descritores. Assim, neste trabalho de tese foram propostas estratégias que superam as limitações apontadas e estendem a capacidade da paralelização de abordagens ANNS em memória distribuída para lidar eficientemente com demandas variáveis de consultas em grandes volumes crescentes de objetos multimídia.
Abstract
Content-based multimedia retrieval (CBMR) applications are becoming increasingly popular in several online services which handle large volumes of data and are submitted to high query and objects insertions (multimedia descriptors) rate. Although the complexity of these applications is in different aspects, find the objects closest to a query one, is undoubtedly one of the most costly operations. To solve this problem, several recent work proposes the parallelization in distributed memory of Approximate nearest neighbors (ANN) search. It was observed that the highlighted solutions present in the literature employ parallelization strategies that lead to a dataset partitioning creating processing bottlenecks and also show upsuboptimal to the use of computational resources, present in each processing node,to handle the high variables queries and insertions streans. Thus, in this thesis work, strategies were proposed that overcome the limitations pointed out and extend the ability of ANNS distributed memory parallelization approaches to efficiently handle intense and variable query demands in large and growing volumes of multimedia objects.
Assunto
Computação – Teses, Computação de Alto Desempenho – Teses, Sistemas Distribuídos – Teses, Recuperação da Informação - Teses, Sistemas Multimídia - Teses
Palavras-chave
computação de alto desempenho, sistemas, sistemas distribuídos, busca por similaridade
Citação
Departamento
Endereço externo
Avaliação
Revisão
Suplementado Por
Referenciado Por
Licença Creative Commons
Exceto quando indicado de outra forma, a licença deste item é descrita como Acesso Aberto
