Please use this identifier to cite or link to this item: http://hdl.handle.net/1843/ESBF-9Q3HSZ
Type: Tese de Doutorado
Title: Sketch-finder: uma abordagem efetiva e eficiente para recuperação de imagens com base em rascunho para grandes bases de imagens
Authors: Carlos Alberto Fraga Pimentel Filho
First Advisor: Arnaldo de Albuquerque Araujo
First Referee: Benjamin Bustos
Second Referee: Guillaume Gravier
Third Referee: Neucimar Jerônimo Leite
metadata.dc.contributor.referee4: William Robson Schwartz
metadata.dc.contributor.referee5: Adriano Alonso Veloso
Abstract: O barateamento dos dispositivos de armazenamento de grandes volumes de dados tem contribuído com o surgimento de grande bases, todavia, ter a informação armazenada não é o suficiente, pois é importante acessá-la de forma rápida e precisa para que essa informação seja de fato útil. Neste cenário, dentro do conjunto de informações multimídia, o volume de informação visual também vem crescendo e carece de métodos apropriados e eficientes de recuperação. Embora seja possível indexar e recuperar imagens com métodos tradicionalmente utilizados para texto, com base em palavras-chave ou rótulos'', a mídia visual pode ser melhor recuperada a partir também de informação visual, uma vez que esta é a sua natureza. Desse modo, a presente tese vem propor um novo método para recuperação de imagens feitas a partir de um rascunho que pode ser rapidamente confeccionado pelo usuário. Dentre as várias abordagens visuais de recuperação de imagens existentes, o uso de uma imagem de rascunho permite que o usuário expresse a imagem que deseja buscar de forma visual, simples e rápida. O maior desafio desta forma de busca consiste em encontrar uma representação para o conteúdo visual que permita comparar de forma eficiente, a similaridade entre o rascunho e as imagens da base de dados, mantendo ainda a precisão dos resultados e tendo uma solução escalonável para grandes bases. A presente tese propõe uma abordagem para recuperação de imagens com base em rascunho onde, tanto o rascunho quanto os contornos das imagens da base de dados são representados e comparados no domínio comprimido da transformada wavelet. Assim, apenas os dados mais relevantes, provenientes do rascunho e das imagens são usados na representação e comparação dos mesmos. O uso comprimido da informação é similar aos tradicionais métodos de compressão de imagens com perda e traz como vantagem um reduzido volume de dados para indexar grandes bases de imagens. Consequentemente, um índice pequeno e robusto torna a resposta às consultas mais rápidas. Para melhorar a eficácia do método, este trabalho também propõe uma comparação dos contornos das imagens mais relevantes da busca fora do domínio comprimido. Essa comparação verifica a consistência espacial entre os traços do rascunho e os contornos das imagens. A indexação da base de imagens utiliza índices invertidos, tanto para as informações comprimidas quanto para os contornos das imagens. O uso de índices invertidos melhora ainda mais a eficiência da abordagem proposta. Além do mais, a solução permite que seja possível ajustar o tamanho do índice com base na taxa de compressão de dados, de modo similar ao ajuste que o usuário faz na compressão de imagens, reduzindo a qualidade para ganhar espaço de armazenamento. No índice, esse ajuste afeta seu tamanho e reflete o balanço entre eficiência e precisão das buscas, podendo o seu tamanho ser facilmente adequado aos recursos computacionais disponíveis. Uma avaliação comparativa entre abordagens tradicionais usando a base de imagens de Paris e um subconjunto da base do ImageNet com 535 mil amostras, revela que a presente solução é superior à abordagem da mesma categoria, porém sendo ao menos uma ordem de magnitude mais rápida. A presente abordagem também é comparada com outros métodos de recuperação de imagem com base em rascunho na base Flickr15K. Embora essas outras abordagens utilizem técnicas de histogramas de características visuais e objetivos de busca diferentes do nosso, essa comparação situa a precisão da nossa abordagem entre esses métodos. Ao final, é apresentada uma aplicação prática de recuperação de imagem com base em rascunho para dispositivos móveis na plataforma Android. A aplicação utiliza o método de busca proposto nesta tese e tem uma interface de busca e visualização dos resultados bastante simples e intuitiva.
Abstract: The cheapening of storage devices for large data volumes has contributed to the emergence of large datasets. However, to have stored information is not enough and to make it really useful. It is important to access needed data quickly and accurately. On this scenario, within the set of multimedia information, the amount of visual information has also been growing and it lacks appropriate and efficient recovery methods. While it is possible to index and retrieve images with traditional methods used for text, based on keywords or tags, the visual media can be best recovered from visual information, since it is the image nature. Thus, this dissertation proposes a new method for sketchbased image retrieval, once that the sketch can be quickly and easily drawn by the user. Among various image retrieval approaches, the use of sketches lets one express a precise visual query with simple and widespread means. The challenge consists on representing the image dataset features on a structure that allows one to efficiently and effectively retrieve images on a scalable system. We put forward a sketch-based image retrieval solution where both sketches and selected contours extracted from the images are represented and compared on the wavelet domain. The relevant information regarding to query sketches and image content has thus, a compact representation that can be readily employed by an efficient index for retrieval by similarity. The use of compressed information is similar to traditional lossy image compression methods and it brings as advantage a small size for the dataset index enabling the indexing of big data. Consequently a smaller and robust index provided by compression makes the answer of the queries faster. To improve the effectiveness of the method, this work also proposes a comparison of the most relevant image contours provided by the query performed in the compressed-domain. This comparison verifies the spatial consistency among the image contours and the sketch. The dataset indexing uses inverted lists either for the compressed information either for the image contours. The use of inverted lists improves even more the efficiency of the proposed approach. Furthermore, with this solution, it is possible to adjust the index size based on the compression rate, in a similar way it is used on traditional lossy image compression reducing quality to gain space. This adjustment affects the index size and reflects on the balance between effectiveness and efficiency that can be easily modified in order to adapt to available resources. A comparative evaluation with a traditional method on the Paris dataset and a subset with 535 thousand samples issued from ImageNet dataset shows that our solution overcame effectiveness of traditional methods while being more than one order of magnitude faster. The approach proposed in this dissertation is also compared to other retrieval methods that use bag of visual features on the Flickr15K dataset. Although these methods have different query objectives and techniques, this comparison places our approach among them. Finally, we put forward a practical mobile application for sketch-based image retrieval for Andoid platform. The application uses the proposed approach of this dissertation and presents an easy and intuitive interface to create a sketch and visualize the results.
Subject: Computação
Sistemas multimídia
Processamento de imagens
language: Português
Publisher: Universidade Federal de Minas Gerais
Publisher Initials: UFMG
Rights: Acesso Aberto
URI: http://hdl.handle.net/1843/ESBF-9Q3HSZ
Issue Date: 8-Oct-2014
Appears in Collections:Teses de Doutorado

Files in This Item:
File Description SizeFormat 
carlosalbertofragapimentel.pdf36.79 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.