Vocábularios visuais aplicados à detecção de edifícios em fotografias históricas

Carregando...
Imagem de Miniatura

Título da Revista

ISSN da Revista

Título de Volume

Editor

Universidade Federal de Minas Gerais

Descrição

Tipo

Dissertação de mestrado

Título alternativo

Membros da banca

Eduardo Alves do Valle Jrunior
Marcos Andre Goncalves
Guillermo Camara Chavez

Resumo

Neste trabalho é proposta uma abordagem baseada na representação de histograma de palavras visuais para detectar imagens que contém edifícios na coleção de fotografias digitalizadas do Arquivo Público Mineiro (APM). As imagens utilizadas na avaliação do trabalho proposto provêm da digitalização dos originais, que é um procedimento efetivo para torná-los publicamente disponíveis e ao mesmo tempo preservá-los da degradação. A digitalização, porém, não resolve todos os problemas do acesso, que também envolve a necessidade de fornecer aos usuários meios para localizar os documentos desejados. A aplicação de técnicas de Recuperação de Imagens com Base no Conteúdo (RIBC) poderia ser de grande utilidade na descrição e indexação de grandes acervos históricos, que requer bastante tempo e esforço. Contudo, essas imagens tendem a ser mais desafiadoras para a aplicação de técnicas de RIBC do que as fotografias recentes, devido à perda de qualidade dos originais e diversos efeitos causados pela degradação. A técnica proposta utiliza um vocabulário visual como meio de construir um vetor de características para uma imagem e tem se mostrado eficaz além de robusta à oclusão e a variações devido à posição, escala, iluminação e várias outras transformações. Os resultados mostraram que, apesar da baixa qualidade das imagens, a abordagem é capaz de obter, para as imagens que contém edifícios, taxas médias de acerto próximas de 73%, indicando o potencial do método proposto para a tarefa de detecção.

Abstract

In this work, we propose a technique based on a bag-of-keypoints representation to identify images containing buildings in the photographic collection of Arquivo Público Mineiro (APM), the Archives of the State of Minas Gerais. We evaluate the proposed work using digitized versions of the original. Digitization is an effective procedure to make collections publicly available, while preserving them from deterioration, but it does not solve, by itself, all the problem of access, which are also related to allowing the user to locate the desired items among thousands. The application of techniques of Image Retrieval Based on Content (RIBC) could be very useful in describing and indexing of large historical collections, which requires considerable time and effort. However, Archive images tend to be more challenging to implement RIBC techniques than recent photos, due to loss of quality of the original source and several effects caused by degradation. The proposed technique is based on a visual vocabulary which is used to build a feature vector for an image. This representation has been proved robust to occlusion and variations due to pose, scale, illumination and several transformations. Results show that, despite of the poor quality of the images, the bag-of-keypoints representation is able to provide detection rates around 73% for images containing buildings, indicating the suitability of the proposed method for the task of detection.

Assunto

Recuperacao Imagem, Edifícios históricos, Computação, Fotografia documentária

Palavras-chave

recuperação de imagem, Fotografia

Citação

Departamento

Curso

Endereço externo

Avaliação

Revisão

Suplementado Por

Referenciado Por