Um Arcabouço escalável, eficiente e adaptativo para busca aproximada em conteúdo multimídia

Guilherme Neri Andrade

Um Arcabouço escalável, eficiente e adaptativo para busca aproximada em conteúdo multimídia

Arquivos

tese_final_GuilhermeNeriAndrade_atualizada_completa_pdfa.pdf (3.31 MB)

Data

2022-03-18

Autor(es)

Guilherme Neri Andrade

Editor

Universidade Federal de Minas Gerais

Tipo

Tese de doutorado

Primeiro orientador

Renato Antônio Celso Ferreira

Membros da banca

Wagner Meira Júnior
Lúcia Maria de Assumpção Drummond
Mario Antônio Ribeiro Dantas
Ricardo Ribeiro dos Santos

Resumo

Aplicações Content-based multimedia retrieval (CBMR) vem se tornando cada vez mais populares em diversos serviços online que manipulam grandes volumes de dados e estão sujeitos à intensos fluxos de consultas e inserções de novos objetos (descritores multimídia). Embora sejam aplicações complexas, encontrar os objetos mais próximos à uma consulta é tipicamente a sua operação mais onerosa. Para resolver esse problema, diversos trabalhos recentes propõe a paralelização em memória distribuída da busca aproximada por vizinhos mais próximos (ANNS). Observou-se que as soluções destaque presentes na literatura empregam estratégias de paralelização que conduzem à uma distribuição do conjunto de dados propícia à criar gargalos de processamento e também mostram-se subótimas ao uso de recursos computacionais, presentes em cada nó de processamento, para tratar os fluxos intensos e variáveis de consultas e inserções de novos descritores. Assim, neste trabalho de tese foram propostas estratégias que superam as limitações apontadas e estendem a capacidade da paralelização de abordagens ANNS em memória distribuída para lidar eficientemente com demandas variáveis de consultas em grandes volumes crescentes de objetos multimídia.

Abstract

Content-based multimedia retrieval (CBMR) applications are becoming increasingly popular in several online services which handle large volumes of data and are submitted to high query and objects insertions (multimedia descriptors) rate. Although the complexity of these applications is in different aspects, find the objects closest to a query one, is undoubtedly one of the most costly operations. To solve this problem, several recent work proposes the parallelization in distributed memory of Approximate nearest neighbors (ANN) search. It was observed that the highlighted solutions present in the literature employ parallelization strategies that lead to a dataset partitioning creating processing bottlenecks and also show upsuboptimal to the use of computational resources, present in each processing node,to handle the high variables queries and insertions streans. Thus, in this thesis work, strategies were proposed that overcome the limitations pointed out and extend the ability of ANNS distributed memory parallelization approaches to efficiently handle intense and variable query demands in large and growing volumes of multimedia objects.

Assunto

Computação – Teses, Computação de Alto Desempenho – Teses, Sistemas Distribuídos – Teses, Recuperação da Informação - Teses, Sistemas Multimídia - Teses

Palavras-chave

computação de alto desempenho, sistemas, sistemas distribuídos, busca por similaridade

URI

https://hdl.handle.net/1843/83191

Departamento

ICX - DEPARTAMENTO DE CIÊNCIA DA COMPUTAÇÃO

Curso

Programa de Pós-Graduação em Ciência da Computação

Coleções

Pós-Graduação em Ciência da Computação - Teses

Licença Creative Commons

Exceto quando indicado de outra forma, a licença deste item é descrita como Acesso Aberto

Página do item completo

Um Arcabouço escalável, eficiente e adaptativo para busca aproximada em conteúdo multimídia

Arquivos

Data

Autor(es)

Título da Revista

ISSN da Revista

Título de Volume

Editor

Descrição

Tipo

Título alternativo

Primeiro orientador

Membros da banca

Resumo

Abstract

Assunto

Palavras-chave

Citação

URI

Departamento

Curso

Endereço externo

Coleções

Avaliação

Revisão

Suplementado Por

Referenciado Por

Licença Creative Commons