Please use this identifier to cite or link to this item: http://hdl.handle.net/1843/33533
Full metadata record
DC FieldValueLanguage
dc.contributor.advisor1William Robson Schwartzpt_BR
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/0704592200063682pt_BR
dc.contributor.referee1Moacir Antonelli Pontipt_BR
dc.contributor.referee2Adriano Alonso Velosopt_BR
dc.contributor.referee3Erickson Rangel do Nascimentopt_BR
dc.contributor.referee4Guillermo Camara Chavezpt_BR
dc.creatorRaphael Felipe de Carvalho Pratespt_BR
dc.creator.Latteshttp://lattes.cnpq.br/7142194382779877pt_BR
dc.date.accessioned2020-05-25T18:13:37Z-
dc.date.available2020-05-25T18:13:37Z-
dc.date.issued2019-03-29-
dc.identifier.urihttp://hdl.handle.net/1843/33533-
dc.description.abstractO número de redes de câmeras de vigilância é cada vez maior como consequência da crescente preocupação com segurança. A grande quantidade de dados coletados demanda sistemas de vigilância inteligentes para extrair informações que sejam úteis aos oficiais de segurança. De forma a alcançar esse objetivo, esse sistema deve ser capaz de correlacionar as informações capturadas por diferentes câmeras de vigilância. Nesse cenário, a re-identificação de pessoas é de central importância para estabelecer uma identidade global para indivíduos capturados por diferentes câmeras usando apenas a aparência visual. No entanto, trata-se de uma tarefa desafiadora, uma vez que a mesma pessoa quando capturada por câmeras distintas sofre uma drástica mudança de aparência como consequência das variações no ponto-de-vista, iluminação e pose. Trabalhos recentes abordam a re-identificação de pessoas propondo descritores visuais robustos ou funções de correspondência entre câmeras, as quais são funções que aprendem a calcular a identidade correta de imagens capturadas por diferentes câmeras. Porém, a maior parte desses trabalhos é prejudicada por problemas como ambiguidade entre indivíduos, a escalabilidade e o número reduzido de imagens rotuladas no conjunto de treino. Nesta tese, abordamos o problema de correspondência de indivíduos entre câmeras de forma a tratar os problemas já mencionados e, portanto, obter melhores resultados. Especificamente, propomos duas direções: o aprendizado de subespaços e os modelos de identificação indireta. O primeiro aprende um subespaço comum que é escalável com respeito ao número de câmeras e robusto em relação à quantidade de imagens de treino disponíveis. Na identificação indireta, identificamos imagens de prova e galeria baseado na similaridade com as amostras de um conjunto de treino. Resultados experimentais validam ambas as abordagens no problema de re-identificação de pessoas considerando tanto apenas um par de câmeras como situações mais realísticas com múltiplas câmeras.pt_BR
dc.description.resumoThe number of surveillance camera networks is increasing as a consequence of the escalation of the security concerns. The large amount of data collected demands intelligent surveillance systems to extract information that is useful to security officers. In order to achieve this goal, this system must be able to correlate information captured by different surveillance cameras. In this scenario, re-identification of people is of central importance in establishing a global identity for individuals captured by different cameras using only visual appearance. However, this is a challenging task, since the same person when captured by different cameras undergoes a drastic change of appearance as a consequence of the variations in the point of view, illumination and pose. Recent work addresses the person re-identification by proposing robust visual descriptors or cross-view matching functions, which are functions that learn to match images from different cameras. However, most of these works are impaired by problems such as ambiguity among individuals, scalability, and reduced number of labeled images in the training set. In this thesis, we address the problem of matching individuals between cameras in order to address the aforementioned problems and, therefore, obtain better results. Specifically, we propose two directions: the learning of subspaces and the models of indirect identification. The first learns a common subspace that is scalable with respect to the number of cameras and robust in relation to the amount of training images available. we match probe and gallery images indirectly by computing their similarities with training samples. Experimental results validate both approaches in the person re-identification problem considering both only one pair of cameras and more realistic situations with multiple cameras.pt_BR
dc.description.sponsorshipCNPq - Conselho Nacional de Desenvolvimento Científico e Tecnológicopt_BR
dc.description.sponsorshipFAPEMIG - Fundação de Amparo à Pesquisa do Estado de Minas Geraispt_BR
dc.description.sponsorshipCAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superiorpt_BR
dc.languageengpt_BR
dc.publisherUniversidade Federal de Minas Geraispt_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.departmentICX - DEPARTAMENTO DE CIÊNCIA DA COMPUTAÇÃOpt_BR
dc.publisher.programPrograma de Pós-Graduação em Ciência da Computaçãopt_BR
dc.publisher.initialsUFMGpt_BR
dc.rightsAcesso Abertopt_BR
dc.rights.urihttp://creativecommons.org/licenses/by/3.0/pt/*
dc.subjectComputer Visionpt_BR
dc.subjectSmart Surveillancept_BR
dc.subjectPerson Re-Identificationpt_BR
dc.subject.otherComputação - Tesespt_BR
dc.subject.otherVisão por computadorpt_BR
dc.subject.otherProcessamento de imagenspt_BR
dc.subject.otherAprendizado do computadorpt_BR
dc.titleCorrespondência entre pessoas em uma rede de câmeras de vigilânciapt_BR
dc.title.alternativeMatching people across surveillance cameraspt_BR
dc.typeTesept_BR
dc.identifier.orcidhttps://orcid.org/0000-0003-2099-9256pt_BR
Appears in Collections:Teses de Doutorado

Files in This Item:
File Description SizeFormat 
prates_tese_final.pdfVersão final da tese20.65 MBAdobe PDFView/Open


This item is licensed under a Creative Commons License Creative Commons