Please use this identifier to cite or link to this item: http://hdl.handle.net/1843/41412
Type: Dissertação
Title: Semantic Hyperlapse for egocentric videos
Other Titles: Hyperlapse semântico para vídeos egocêntricos
Authors: Washington Luis de Souza Ramos
First Advisor: Erickson Rangel do Nascimento
First Co-advisor: Mário Fernando Montenegro Campos
First Referee: Flávio Luis Cardeal Pádua
Second Referee: Luciana Porcher Nedel
Third Referee: William Robson Schwartz
Abstract: The emergence of low-cost personal mobile devices and wearable cameras, and the increasing storage capacity of video-sharing websites have pushed forward a growing interest in first-person videos. Wearable cameras, in particular, can operate for hours without the need for continuous handling. That leads these videos to be generally long-running streams with unedited content, which makes them boring and visually unpalatable since the natural body movements cause the videos to be jerky and even nauseating. Hyperlapse algorithms aim to downsize long and monotonous videos into short fast-forward watchable videos with no abrupt transitions between the frames. However, an important aspect of such videos is that some parts of them may be more important than others, so they should have their proper attention. In this work, we propose a novel methodology capable of summarizing and stabilizing egocentric videos by extracting and analyzing the semantic information in the frames. This work also describes a dataset collection with several labeled videos and introduces a new smoothness evaluation metric for egocentric videos. Several experiments are conducted to show the superiority of our approach over the state-of-the-art hyperlapse algorithms as far as semantic information is concerned. According to the results obtained, our method is, on average, 10.67 percentage points higher than the best competitor with respect to the maximum amount of semantics that can be obtained given the required speed-up.
Abstract: O surgimento de dispositivos móveis pessoais de baixo custo e câmeras portáteis, e a crescente capacidade de armazenamento de sites de compartilhamento de vídeos têm impulsionado o interesse em vídeos em primeira pessoa, também conhecidos como vídeos egocêntricos. Câmeras vestíveis, em particular, podem operar por horas sem a necessidade de manuseio contínuo. Isso leva os vídeos egocêntricos a serem de longa duração com conteúdo não editado, o que os torna entediantes e visualmente desagradáveis, pois os movimentos naturais do corpo fazem com que o vídeo fique instável, causando até mesmo enjoos. Os algoritmos de hyperlapse visam transformar vídeos longos e monótonos em vídeos de curta duração e sem transições abruptas entre os quadros. No entanto, um aspecto importante é que algumas partes dos vídeos podem ser mais importantes do que outras, portanto devem ter a sua atenção adequada. Neste trabalho, propomos uma metodologia inovadora capaz de resumir e estabilizar vídeos egocêntricos extraindo e analisando a informação semântica nos quadros. Este trabalho também descreve um novo conjunto de dados com vários vídeos rotulados e introduz uma nova métrica de avaliação de suavidade para vídeos egocêntricos. Diversos experimentos são conduzidos para mostrar a superioridade de nossa técnica sobre os algoritmos de hyperlapse do estado da arte no que diz respeito à informação semântica. De acordo com os resultados obtidos, nosso método é, em média, 10,67 pontos percentuais superior ao melhor competidor em relação à máxima quantidade semântica que pode ser obtida dado a taxa de aceleração desejada.
Subject: Computação - Teses
Visão por computador - Teses
Semântica - Processamento de Dados - Teses
Vídeos em primeira pessoa - Teses
language: eng
metadata.dc.publisher.country: Brasil
Publisher: Universidade Federal de Minas Gerais
Publisher Initials: UFMG
metadata.dc.publisher.department: ICX - DEPARTAMENTO DE CIÊNCIA DA COMPUTAÇÃO
metadata.dc.publisher.program: Programa de Pós-Graduação em Ciência da Computação
Rights: Acesso Aberto
URI: http://hdl.handle.net/1843/41412
Issue Date: 3-Mar-2017
Appears in Collections:Dissertações de Mestrado

Files in This Item:
File Description SizeFormat 
WashingtonRamos-DissertacaoMestrado-PosAprovacao-PDFA.pdf12.92 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.