Um descritor robusto e eficiente de pontos de interesse: desenvolvimento e aplicações

Erickson Rangel do Nascimento

Um descritor robusto e eficiente de pontos de interesse: desenvolvimento e aplicações

Arquivos

ericksonrangel.pdf (9.19 MB)

Data

2012-08-21

Autor(es)

Erickson Rangel do Nascimento

Editor

Universidade Federal de Minas Gerais

Tipo

Tese de doutorado

Primeiro orientador

Mario Fernando Montenegro Campos

Membros da banca

Renato Cardoso Mesquita
William Robson Schwartz
Flávio Luis Cardeal Pádua
Thomas Maurice LEWINER

Resumo

Diferentes metodologias para reconhecimento de objetos, reconstrução e alinhamento tridimensional, possuem no cerne de seu desenvolvimento o problema de correspondência. Devido à ambiguidade em nosso mundo e à presença de ruídos nos processos de aquisições de dados, obter correspondências de qualidade é umdos maiores desafios em Robótica e Visão Computacional. Dessa maneira, a criação de descritores que identifiquem os elementos a serem correspondidos e que sejam capazes de gerar pares correspondentes corretamente é de grande importância. Nesta tese, introduzimos três novos descritores que combinam de maneira eficiente aparência e informação geométrica de images RGB-D. Os descritores apresentados neste trabalho são largamente invariantes a rotação, mudanças de iluminação e escala. Além disso, para aplicações cujo principal requisito é o baixo consumo computacional em detrimento de alta precisão na correspondência, a invariância a rotação e escala podem ser facilmente desabilitadas sem grande perda na qualidadede discriminância dos descritores. Os resultados dos experimentos realizados nesta tese demonstram que nossos descritores, quando comparados a três descritores padrões da literatura, SIFT, SURF(para images com texturas) e Spin-Images (para dados geométricos) e ao estado da arte CSHOT, foram mais robustos e precisos. Foram também realizados experimentos com os descritores em duas aplicações distintas. Nós os utilizamos para a detecção e reconhecimento de objetos sob diferentes condições de iluminação para a construção de mapas com informações semânticas e para o registro de múltiplos mapas com profundidade e textura. Em ambas as aplicações, nossos descritores demonstraram-se mais adequados do que outras abordagens, tendo sido superiores em tempo de processamento, consumo de memória, taxa de reconhecimento e qualidade do registro.

Abstract

At the core of a myriad of tasks such as object recognition, tridimensional recon-struction and alignment resides the critical problem of correspondence. Due to the ambiguity in our world and the presence of noise in the data aquisition process, per-forming high quality correspondence is one of themost challenging tasks in roboticsand computer vision. Hence, devising descriptors, which identify the entities to be matched and that are able to correctly and reliably establish pairs of corresponding points is of central importance. In this thesis, we introduce three novel descriptors that efficiently combine appearance and geometrical shape information from RGB-D images, and are largelyinvariant to rotation, illumination changes and scale transformations. For applica-tions that demand speed performance in lieu of a sophisticated and more precise matching process, scale and rotation invariance may be easily disabled. Results of several experiments described here demonstrate that as far as precision and robust-ness are concerned, our descriptors compare favorably to three standard descrip-tors in the literature, namely: SIFT, SURF (for textured images) and Spin-Images(for geometrical shape information). In addition, they outperfom the state-of-the-art CSHOT, which, as well as our descriptors, combines texture and geometry. We use these new descriptors to detect and recognize objects under different illumination conditions to provide semantic information in a mapping task. Fur-thermore, we apply our descriptors for registering multiple indoor textured depth maps, and demonstrate that they are robust and provide reliable results even forsparsely textured and poorly illuminated scenes. In these two pplications we com-pare the performance of our descriptors against the standard ones in the literature and the state-of-the-art. Experimental results show that our descriptors are supe-rior to the others in processing time, memory consumption, recognition rate and alignment quality.

Assunto

Computação

Palavras-chave

Imagens RGB-D, Descritores, Pontos de interesse, Visão computacional

URI

https://hdl.handle.net/1843/ESBF-8XFJT6

Coleções

Pós-Graduação em Ciência da Computação - Teses

Página do item completo

Um descritor robusto e eficiente de pontos de interesse: desenvolvimento e aplicações

Arquivos

Data

Autor(es)

Título da Revista

ISSN da Revista

Título de Volume

Editor

Descrição

Tipo

Título alternativo

Primeiro orientador

Membros da banca

Resumo

Abstract

Assunto

Palavras-chave

Citação

URI

Departamento

Curso

Endereço externo

Coleções

Avaliação

Revisão

Suplementado Por

Referenciado Por