Vocábularios visuais aplicados à detecção de edifícios em fotografias históricas
Carregando...
Arquivos
Data
Autor(es)
Título da Revista
ISSN da Revista
Título de Volume
Editor
Universidade Federal de Minas Gerais
Descrição
Tipo
Dissertação de mestrado
Título alternativo
Primeiro orientador
Membros da banca
Eduardo Alves do Valle Jrunior
Marcos Andre Goncalves
Guillermo Camara Chavez
Marcos Andre Goncalves
Guillermo Camara Chavez
Resumo
Neste trabalho é proposta uma abordagem baseada na representação de histograma de palavras visuais para detectar imagens que contém edifícios na coleção de fotografias digitalizadas do Arquivo Público Mineiro (APM). As imagens utilizadas na avaliação do trabalho proposto provêm da digitalização dos originais, que é um procedimento efetivo para torná-los publicamente disponíveis e ao mesmo tempo preservá-los da degradação. A digitalização, porém, não resolve todos os problemas do acesso, que também envolve a necessidade de fornecer aos usuários meios para localizar os documentos desejados. A aplicação de técnicas de Recuperação de Imagens com Base no Conteúdo (RIBC) poderia ser de grande utilidade na descrição e indexação de grandes acervos históricos, que requer bastante tempo e esforço. Contudo, essas imagens tendem a ser mais desafiadoras para a aplicação de técnicas de RIBC do que as fotografias recentes, devido à perda de qualidade dos originais e diversos efeitos causados pela degradação. A técnica proposta utiliza um vocabulário visual como meio de construir um vetor de características para uma imagem e tem se mostrado eficaz além de robusta à oclusão e a variações devido à posição, escala, iluminação e várias outras transformações. Os resultados mostraram que, apesar da baixa qualidade das imagens, a abordagem é capaz de obter, para as imagens que contém edifícios, taxas médias de acerto próximas de 73%, indicando o potencial do método proposto para a tarefa de detecção.
Abstract
In this work, we propose a technique based on a bag-of-keypoints representation to identify images containing buildings in the photographic collection of Arquivo Público Mineiro (APM), the Archives of the State of Minas Gerais. We evaluate the proposed work using digitized versions of the original. Digitization is an effective procedure to make collections publicly available, while preserving them from deterioration, but it does not solve, by itself, all the problem of access, which are also related to allowing the user to locate the desired items among thousands. The application of techniques of Image Retrieval Based on Content (RIBC) could be very useful in describing and indexing of large historical collections, which requires considerable time and effort. However, Archive images tend to be more challenging to implement RIBC techniques than recent photos, due to loss of quality of the original source and several effects caused by degradation. The proposed technique is based on a visual vocabulary which is used to build a feature vector for an image. This representation has been proved robust to occlusion and variations due to pose, scale, illumination and several transformations. Results show that, despite of the poor quality of the images, the bag-of-keypoints representation is able to provide detection rates around 73% for images containing buildings, indicating the suitability of the proposed method for the task of detection.
Assunto
Recuperacao Imagem, Edifícios históricos, Computação, Fotografia documentária
Palavras-chave
recuperação de imagem, Fotografia