Use este identificador para citar o ir al link de este elemento: http://hdl.handle.net/1843/33533
Tipo: Tese
Título: Correspondência entre pessoas em uma rede de câmeras de vigilância
Título(s) alternativo(s): Matching people across surveillance cameras
Autor(es): Raphael Felipe de Carvalho Prates
primer Tutor: William Robson Schwartz
primer miembro del tribunal : Moacir Antonelli Ponti
Segundo miembro del tribunal: Adriano Alonso Veloso
Tercer miembro del tribunal: Erickson Rangel do Nascimento
Cuarto miembro del tribunal: Guillermo Camara Chavez
Resumen: The number of surveillance camera networks is increasing as a consequence of the escalation of the security concerns. The large amount of data collected demands intelligent surveillance systems to extract information that is useful to security officers. In order to achieve this goal, this system must be able to correlate information captured by different surveillance cameras. In this scenario, re-identification of people is of central importance in establishing a global identity for individuals captured by different cameras using only visual appearance. However, this is a challenging task, since the same person when captured by different cameras undergoes a drastic change of appearance as a consequence of the variations in the point of view, illumination and pose. Recent work addresses the person re-identification by proposing robust visual descriptors or cross-view matching functions, which are functions that learn to match images from different cameras. However, most of these works are impaired by problems such as ambiguity among individuals, scalability, and reduced number of labeled images in the training set. In this thesis, we address the problem of matching individuals between cameras in order to address the aforementioned problems and, therefore, obtain better results. Specifically, we propose two directions: the learning of subspaces and the models of indirect identification. The first learns a common subspace that is scalable with respect to the number of cameras and robust in relation to the amount of training images available. we match probe and gallery images indirectly by computing their similarities with training samples. Experimental results validate both approaches in the person re-identification problem considering both only one pair of cameras and more realistic situations with multiple cameras.
Abstract: O número de redes de câmeras de vigilância é cada vez maior como consequência da crescente preocupação com segurança. A grande quantidade de dados coletados demanda sistemas de vigilância inteligentes para extrair informações que sejam úteis aos oficiais de segurança. De forma a alcançar esse objetivo, esse sistema deve ser capaz de correlacionar as informações capturadas por diferentes câmeras de vigilância. Nesse cenário, a re-identificação de pessoas é de central importância para estabelecer uma identidade global para indivíduos capturados por diferentes câmeras usando apenas a aparência visual. No entanto, trata-se de uma tarefa desafiadora, uma vez que a mesma pessoa quando capturada por câmeras distintas sofre uma drástica mudança de aparência como consequência das variações no ponto-de-vista, iluminação e pose. Trabalhos recentes abordam a re-identificação de pessoas propondo descritores visuais robustos ou funções de correspondência entre câmeras, as quais são funções que aprendem a calcular a identidade correta de imagens capturadas por diferentes câmeras. Porém, a maior parte desses trabalhos é prejudicada por problemas como ambiguidade entre indivíduos, a escalabilidade e o número reduzido de imagens rotuladas no conjunto de treino. Nesta tese, abordamos o problema de correspondência de indivíduos entre câmeras de forma a tratar os problemas já mencionados e, portanto, obter melhores resultados. Especificamente, propomos duas direções: o aprendizado de subespaços e os modelos de identificação indireta. O primeiro aprende um subespaço comum que é escalável com respeito ao número de câmeras e robusto em relação à quantidade de imagens de treino disponíveis. Na identificação indireta, identificamos imagens de prova e galeria baseado na similaridade com as amostras de um conjunto de treino. Resultados experimentais validam ambas as abordagens no problema de re-identificação de pessoas considerando tanto apenas um par de câmeras como situações mais realísticas com múltiplas câmeras.
Asunto: Computação - Teses
Visão por computador
Processamento de imagens
Aprendizado do computador
Idioma: eng
País: Brasil
Editor: Universidade Federal de Minas Gerais
Sigla da Institución: UFMG
Departamento: ICX - DEPARTAMENTO DE CIÊNCIA DA COMPUTAÇÃO
Curso: Programa de Pós-Graduação em Ciência da Computação
Tipo de acceso: Acesso Aberto
metadata.dc.rights.uri: http://creativecommons.org/licenses/by/3.0/pt/
URI: http://hdl.handle.net/1843/33533
Fecha del documento: 29-mar-2019
Aparece en las colecciones:Teses de Doutorado

archivos asociados a este elemento:
archivo Descripción TamañoFormato 
prates_tese_final.pdfVersão final da tese20.65 MBAdobe PDFVisualizar/Abrir


Este elemento está licenciado bajo una Licencia Creative Commons Creative Commons