Um descritor robusto e eficiente de pontos de interesse: desenvolvimento e aplicações
Carregando...
Arquivos
Data
Autor(es)
Título da Revista
ISSN da Revista
Título de Volume
Editor
Universidade Federal de Minas Gerais
Descrição
Tipo
Tese de doutorado
Título alternativo
Primeiro orientador
Membros da banca
Renato Cardoso Mesquita
William Robson Schwartz
Flávio Luis Cardeal Pádua
Thomas Maurice LEWINER
William Robson Schwartz
Flávio Luis Cardeal Pádua
Thomas Maurice LEWINER
Resumo
Diferentes metodologias para reconhecimento de objetos, reconstrução e alinhamento tridimensional, possuem no cerne de seu desenvolvimento o problema de correspondência. Devido à ambiguidade em nosso mundo e à presença de ruídos nos processos de aquisições de dados, obter correspondências de qualidade é umdos maiores desafios em Robótica e Visão Computacional. Dessa maneira, a criação de descritores que identifiquem os elementos a serem correspondidos e que sejam capazes de gerar pares correspondentes corretamente é de grande importância. Nesta tese, introduzimos três novos descritores que combinam de maneira eficiente aparência e informação geométrica de images RGB-D. Os descritores apresentados neste trabalho são largamente invariantes a rotação, mudanças de iluminação e escala. Além disso, para aplicações cujo principal requisito é o baixo consumo computacional em detrimento de alta precisão na correspondência, a invariância a rotação e escala podem ser facilmente desabilitadas sem grande perda na qualidadede discriminância dos descritores. Os resultados dos experimentos realizados nesta tese demonstram que nossos descritores, quando comparados a três descritores padrões da literatura, SIFT, SURF(para images com texturas) e Spin-Images (para dados geométricos) e ao estado da arte CSHOT, foram mais robustos e precisos. Foram também realizados experimentos com os descritores em duas aplicações distintas. Nós os utilizamos para a detecção e reconhecimento de objetos sob diferentes condições de iluminação para a construção de mapas com informações semânticas e para o registro de múltiplos mapas com profundidade e textura. Em ambas as aplicações, nossos descritores demonstraram-se mais adequados do que outras abordagens, tendo sido superiores em tempo de processamento, consumo de memória, taxa de reconhecimento e qualidade do registro.
Abstract
At the core of a myriad of tasks such as object recognition, tridimensional recon-struction and alignment resides the critical problem of correspondence. Due to the ambiguity in our world and the presence of noise in the data aquisition process, per-forming high quality correspondence is one of themost challenging tasks in roboticsand computer vision. Hence, devising descriptors, which identify the entities to be matched and that are able to correctly and reliably establish pairs of corresponding points is of central importance. In this thesis, we introduce three novel descriptors that efficiently combine appearance and geometrical shape information from RGB-D images, and are largelyinvariant to rotation, illumination changes and scale transformations. For applica-tions that demand speed performance in lieu of a sophisticated and more precise matching process, scale and rotation invariance may be easily disabled. Results of several experiments described here demonstrate that as far as precision and robust-ness are concerned, our descriptors compare favorably to three standard descrip-tors in the literature, namely: SIFT, SURF (for textured images) and Spin-Images(for geometrical shape information). In addition, they outperfom the state-of-the-art CSHOT, which, as well as our descriptors, combines texture and geometry. We use these new descriptors to detect and recognize objects under different illumination conditions to provide semantic information in a mapping task. Fur-thermore, we apply our descriptors for registering multiple indoor textured depth maps, and demonstrate that they are robust and provide reliable results even forsparsely textured and poorly illuminated scenes. In these two pplications we com-pare the performance of our descriptors against the standard ones in the literature and the state-of-the-art. Experimental results show that our descriptors are supe-rior to the others in processing time, memory consumption, recognition rate and alignment quality.
Assunto
Computação
Palavras-chave
Imagens RGB-D, Descritores, Pontos de interesse, Visão computacional