Um descritor robusto e eficiente de pontos de interesse: desenvolvimento e aplicações

Erickson Rangel do Nascimento

Use este identificador para citar o ir al link de este elemento: http://hdl.handle.net/1843/49029

Tipo:	Tese
Título:	Um descritor robusto e eficiente de pontos de interesse: desenvolvimento e aplicações
Autor(es):	Erickson Rangel do Nascimento
primer Tutor:	Mario Fernando Montenegro Campos
primer miembro del tribunal :	Flávio Luis Cardeal Pádua
Segundo miembro del tribunal:	Renato Cardoso Mesquita
Tercer miembro del tribunal:	Thomas Maurice Lewiner
Cuarto miembro del tribunal:	William Robson Schwartz
Resumen:	Diferentes metodologias para reconhecimento de objetos, reconstrução e alinhamento tridimensional, possuem no cerne de seu desenvolvimento o problema de correspondência. Devido à ambiguidade em nosso mundo e à presença de ruídos nos processos de aquisições de dados, obter correspondências de qualidade é um dos maiores desafios em Robótica e Visão Computacional. Dessa maneira, a criação de descritores que identifiquem os elementos a serem correspondidos e que sejam capazes de gerar pares correspondentes corretamente é de grande importância. Nesta tese, introduzimos três novos descritores que combinam de maneira eficiente aparência e informação geométrica de images RGB-D. Os descritores apresentados neste trabalho são largamente invariantes a rotação, mudanças de iluminação e escala. Além disso, para aplicações cujo principal requisito é o baixo consumo computacional em detrimento de alta precisão na correspondência, a invariância a rotação e escala podem ser facilmente desabilitadas sem grande perda na qualidade de discriminância dos descritores. Os resultados dos experimentos realizados nesta tese demonstram que nossos descritores, quando comparados a três descritores padrões da literatura, SIFT, SURF (para images com texturas) e Spin-Images (para dados geométricos) e ao estado da arte CSHOT, foram mais robustos e precisos. Foram também realizados experimentos com os descritores em duas apli cações distintas. Nós os utilizamos para a detecção e reconhecimento de objetos sob diferentes condições de iluminação para a construção de mapas com informações semânticas e para o registro de múltiplos mapas com profundidade e textura. Em ambas as aplicações, nossos descritores demonstraram-se mais adequados do que outras abordagens, tendo sido superiores em tempo de processamento, consumo de memória, taxa de reconhecimento e qualidade do registro.
Abstract:	At the core of a myriad of tasks such as object recognition, tridimensional reconstruction and alignment resides the critical problem of correspondence. Due to the ambiguity in our world and the presence of noise in the data aquisition process, performing high quality correspondence is one of the most challenging tasks in robotics and computer vision. Hence, devising descriptors, which identify the entities to be matched and that are able to correctly and reliably establish pairs of corresponding points is of central importance. In this thesis, we introduce three novel descriptors that efficiently combine appearance and geometrical shape information from RGB-D images, and are largely invariant to rotation, illumination changes and scale transformations. For applications that demand speed performance in lieu of a sophisticated and more precise matching process, scale and rotation invariance may be easily disabled. Results of several experiments described here demonstrate that as far as precision and robustness are concerned, our descriptors compare favorably to three standard descriptors in the literature, namely: SIFT, SURF (for textured images) and Spin-Images (for geometrical shape information). In addition, they outperfom the state-of-theart CSHOT, which, as well as our descriptors, combines texture and geometry. We use these new descriptors to detect and recognize objects under different illumination conditions to provide semantic information in a mapping task. Furthermore, we apply our descriptors for registering multiple indoor textured depth maps, and demonstrate that they are robust and provide reliable results even for sparsely textured and poorly illuminated scenes. In these two applications we compare the performance of our descriptors against the standard ones in the literature and the state-of-the-art. Experimental results show that our descriptors are superior to the others in
Asunto:	Computação - Teses Visão computacional - Teses Descritores - Teses Imagens digitais - Teses
Idioma:	por
País:	Brasil
Editor:	Universidade Federal de Minas Gerais
Sigla da Institución:	UFMG
Departamento:	ICX - DEPARTAMENTO DE CIÊNCIA DA COMPUTAÇÃO
Curso:	Programa de Pós-Graduação em Ciência da Computação
Tipo de acceso:	Acesso Aberto
metadata.dc.rights.uri:	http://creativecommons.org/licenses/by-nc-nd/3.0/pt/
URI:	http://hdl.handle.net/1843/49029
Fecha del documento:	21-ago-2012
Aparece en las colecciones:	Teses de Doutorado

archivos asociados a este elemento:

archivo	Descripción	Tamaño	Formato
EricksonRangel.pdf		9.42 MB	Adobe PDF	Visualizar/Abrir

Mostrar registro completo del elemento Visualizar estadísticas

Este elemento está licenciado bajo una Licencia Creative Commons