Semantic Hyperlapse: a sparse coding based and multi-importance approach for first-person videos

Michel Melo da Silva

Please use this identifier to cite or link to this item: http://hdl.handle.net/1843/30433

Full metadata record

DC Field	Value	Language
dc.contributor.advisor1	Erickson Rangel do Nascimento	pt_BR
dc.contributor.advisor1Lattes	http://lattes.cnpq.br/6900352659470721	pt_BR
dc.contributor.advisor-co1	Mario Fernando Montenegro Campos	pt_BR
dc.contributor.referee1	André Vital Saúde	pt_BR
dc.contributor.referee2	Cláudio Rosito Jung	pt_BR
dc.contributor.referee3	Ricardo da Silva Torres	pt_BR
dc.contributor.referee4	Silvio Jamil Ferzoli Guimarães	pt_BR
dc.creator	Michel Melo da Silva	pt_BR
dc.creator.Lattes	http://lattes.cnpq.br/2312146508617497	pt_BR
dc.date.accessioned	2019-10-17T00:48:01Z	-
dc.date.available	2019-10-17T00:48:01Z	-
dc.date.issued	2019-07-02	-
dc.identifier.uri	http://hdl.handle.net/1843/30433	-
dc.description.abstract	O surgimento de câmeras pessoais portáteis de baixo custo, combinado com a alta qualidade dos sensores e a quase ilimitada capacidade de armazenamento em sites de compartilhamento de vídeos despertou um crescente interesse pelos vídeos em primeira pessoa. Tais vídeos são geralmente compostos de gravações de longa duração sem qualquer edição, capturadas por um dispositivo acoplado ao corpo do gravador, o que os tornam tediosos e visualmente desagradáveis de assistir. Com isso, surgiu a necessidade de prover acesso rápido à informação neles contida. Para suprir essa necessidade, esforços vem sendo aplicados para o desenvolvimento de técnicas como Hyperlapse, na qual o objetivo é acelerar o vídeo em primeira pessoa criando um vídeo reduzido visualmente agradável de se assistir, e Hyperlapse Semântico, que além de acelerar o vídeo, cria ênfase em trechos importantes, dado algum critério de semântica previamente definido. Contudo, o método estado da arte em Hyperlapse Semântico, FFSE, negligencia o grau de importância da informação relevante, considerando apenas se a mesma é importante ou não. Outras limitações do método FFSE são o número de parâmetros, a escalabilidade no número de características visuais, e a mudança brusca nos fatores de aceleração entre segmentos de vídeo consecutivos. Nesta tese, propomos uma metodologia livre de parâmetros baseada em Codificação Esparsa para acelerar vídeos em primeira pessoa de forma adaptativa e enfatizar as partes relevantes através de uma abordagem multi-importância. O uso da abordagem proposta resultou na criação de vídeos reduzidos mantendo uma maior quantidade de informação semântica, com menos transições bruscas nas taxas de aceleração, e mais suaves em relação ao resultado do método FFSE.	pt_BR
dc.description.resumo	The emergence of low-cost, high-quality personal wearable cameras combined with the unlimited storage capacity of video-sharing websites have evoked a growing interest in First-Person Videos. Such videos are usually composed of long-running unedited streams captured by a device attached to the user body, which makes them tedious and visually unpleasant to watch. Consequently, rise the need to provide quick access to the information therein. To address this need, efforts have been applied to the development of techniques such as Hyperlapse and Semantic Hyperlapse, which aims to create visually pleasant shorter videos and emphasize semantic portions of the video respectively. The state-of-the-art Semantic Hyperlapse method FFSE, negligees the level of importance of the relevant information, by only evaluating if it is significant or not. Other limitations of FFSE are the number of input parameters, the scalability in the number of visual features to describe the frames, the abrupt change in the speed-up rate of consecutive video segments. In this dissertation, we propose a parameter-free Sparse Coding based methodology to adaptively fast-forward First-Person Videos, that emphasize the semantic portions applying a multi-importance approach. Experimental evaluations show that the proposed method creates shorter version video retaining more semantic information, with fewer abrupt transitions of speed-up rates, and more stable final videos than the output of FFSE.	pt_BR
dc.description.sponsorship	CNPq - Conselho Nacional de Desenvolvimento Científico e Tecnológico	pt_BR
dc.description.sponsorship	CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior	pt_BR
dc.language	eng	pt_BR
dc.publisher	Universidade Federal de Minas Gerais	pt_BR
dc.publisher.country	Brasil	pt_BR
dc.publisher.department	ICEX - INSTITUTO DE CIÊNCIAS EXATAS	pt_BR
dc.publisher.program	Programa de Pós-Graduação em Ciência da Computação	pt_BR
dc.publisher.initials	UFMG	pt_BR
dc.rights	Acesso Aberto	pt_BR
dc.rights.uri	http://creativecommons.org/licenses/by-nc-nd/3.0/pt/	*
dc.subject	First-person videos	pt_BR
dc.subject	Semantic fast-forward	pt_BR
dc.subject	Sparse coding	pt_BR
dc.subject	Minimum sparse reconstruction problem	pt_BR
dc.subject	Vídeo em primeira pessoa	pt_BR
dc.subject	Aceleração semântica	pt_BR
dc.subject	Codificação esparsa	pt_BR
dc.subject	Problema de reconstrução mínima esparsa	pt_BR
dc.subject.other	Computação	pt_BR
dc.subject.other	Visão por computador	pt_BR
dc.subject.other	Sistema multimídia	pt_BR
dc.subject.other	Semântica - processamento de dados	pt_BR
dc.title	Semantic Hyperlapse: a sparse coding based and multi-importance approach for first-person videos	pt_BR
dc.title.alternative	Hyperlapse Semântico para vídeos em primeira pessoa: uma abordagem multi-importância baseada em codificação esparsa	pt_BR
dc.type	Tese	pt_BR
dc.identifier.orcid	https://orcid.org/0000-0002-2499-9619	pt_BR
Appears in Collections:	Teses de Doutorado

Files in This Item:

File	Description	Size	Format
Semantic_Hyperlapse_a_Sparse_Coding_based_and_Multi_Importance_Approach_for_First_Person_Videos.pdf	Tese	21.9 MB	Adobe PDF	View/Open

Show simple item record

This item is licensed under a Creative Commons License