Semantic Hyperlapse for egocentric videos

dc.creatorWashington Luis de Souza Ramos
dc.date.accessioned2022-05-05T21:07:48Z
dc.date.accessioned2025-09-08T23:57:32Z
dc.date.available2022-05-05T21:07:48Z
dc.date.issued2017-03-03
dc.description.abstractO surgimento de dispositivos móveis pessoais de baixo custo e câmeras portáteis, e a crescente capacidade de armazenamento de sites de compartilhamento de vídeos têm impulsionado o interesse em vídeos em primeira pessoa, também conhecidos como vídeos egocêntricos. Câmeras vestíveis, em particular, podem operar por horas sem a necessidade de manuseio contínuo. Isso leva os vídeos egocêntricos a serem de longa duração com conteúdo não editado, o que os torna entediantes e visualmente desagradáveis, pois os movimentos naturais do corpo fazem com que o vídeo fique instável, causando até mesmo enjoos. Os algoritmos de hyperlapse visam transformar vídeos longos e monótonos em vídeos de curta duração e sem transições abruptas entre os quadros. No entanto, um aspecto importante é que algumas partes dos vídeos podem ser mais importantes do que outras, portanto devem ter a sua atenção adequada. Neste trabalho, propomos uma metodologia inovadora capaz de resumir e estabilizar vídeos egocêntricos extraindo e analisando a informação semântica nos quadros. Este trabalho também descreve um novo conjunto de dados com vários vídeos rotulados e introduz uma nova métrica de avaliação de suavidade para vídeos egocêntricos. Diversos experimentos são conduzidos para mostrar a superioridade de nossa técnica sobre os algoritmos de hyperlapse do estado da arte no que diz respeito à informação semântica. De acordo com os resultados obtidos, nosso método é, em média, 10,67 pontos percentuais superior ao melhor competidor em relação à máxima quantidade semântica que pode ser obtida dado a taxa de aceleração desejada.
dc.description.sponsorshipCNPq - Conselho Nacional de Desenvolvimento Científico e Tecnológico
dc.description.sponsorshipFAPEMIG - Fundação de Amparo à Pesquisa do Estado de Minas Gerais
dc.description.sponsorshipCAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior
dc.identifier.urihttps://hdl.handle.net/1843/41412
dc.languageeng
dc.publisherUniversidade Federal de Minas Gerais
dc.rightsAcesso Aberto
dc.subjectComputação - Teses
dc.subjectVisão por computador - Teses
dc.subjectSemântica - Processamento de Dados - Teses
dc.subjectVídeos em primeira pessoa - Teses
dc.subject.otherHyperlapse
dc.subject.otherfast-forward
dc.subject.othersemantic information
dc.subject.otherfirst-person video
dc.titleSemantic Hyperlapse for egocentric videos
dc.title.alternativeHyperlapse semântico para vídeos egocêntricos
dc.typeDissertação de mestrado
local.contributor.advisor-co1Mário Fernando Montenegro Campos
local.contributor.advisor1Erickson Rangel do Nascimento
local.contributor.advisor1Latteshttp://lattes.cnpq.br/6900352659470721
local.contributor.referee1Flávio Luis Cardeal Pádua
local.contributor.referee1Luciana Porcher Nedel
local.contributor.referee1William Robson Schwartz
local.creator.Latteshttp://lattes.cnpq.br/6804726942992059
local.description.resumoThe emergence of low-cost personal mobile devices and wearable cameras, and the increasing storage capacity of video-sharing websites have pushed forward a growing interest in first-person videos. Wearable cameras, in particular, can operate for hours without the need for continuous handling. That leads these videos to be generally long-running streams with unedited content, which makes them boring and visually unpalatable since the natural body movements cause the videos to be jerky and even nauseating. Hyperlapse algorithms aim to downsize long and monotonous videos into short fast-forward watchable videos with no abrupt transitions between the frames. However, an important aspect of such videos is that some parts of them may be more important than others, so they should have their proper attention. In this work, we propose a novel methodology capable of summarizing and stabilizing egocentric videos by extracting and analyzing the semantic information in the frames. This work also describes a dataset collection with several labeled videos and introduces a new smoothness evaluation metric for egocentric videos. Several experiments are conducted to show the superiority of our approach over the state-of-the-art hyperlapse algorithms as far as semantic information is concerned. According to the results obtained, our method is, on average, 10.67 percentage points higher than the best competitor with respect to the maximum amount of semantics that can be obtained given the required speed-up.
local.identifier.orcidhttps://orcid.org/ 0000-0002-0411-8677
local.publisher.countryBrasil
local.publisher.departmentICX - DEPARTAMENTO DE CIÊNCIA DA COMPUTAÇÃO
local.publisher.initialsUFMG
local.publisher.programPrograma de Pós-Graduação em Ciência da Computação

Arquivos

Pacote original

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
WashingtonRamos-DissertacaoMestrado-PosAprovacao-PDFA.pdf
Tamanho:
12.62 MB
Formato:
Adobe Portable Document Format

Licença do pacote

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
license.txt
Tamanho:
2.07 KB
Formato:
Plain Text
Descrição: