Metodologia para recomendação de vídeos baseada em descritores de conteúdo visuais e textuais

dc.creatorFelipe Leandro Andrade da Conceição
dc.creatorFlávio Luis Cardeal Pádua
dc.creatorAdriano Cesar Machado Pereira
dc.creatorAnisio Mendes Lacerda
dc.creatorDaniel Hasan Dalip
dc.date.accessioned2024-05-22T21:55:04Z
dc.date.accessioned2025-09-08T22:55:38Z
dc.date.available2024-05-22T21:55:04Z
dc.date.issued2016-01-04
dc.description.abstractThis work addresses the development of a new multimodal approach to deal with the cold-start problem in video recommender systems. Given a video document, which usually consists of a sequence of images, audio and related information (such as title, tags and description), video recommendation is formulated as finding a list of the most relevant videos to target users. The cold-start problem is caused when there is no information about the user (cold-start user) or the item (cold-start item) when recomending an item. More specifically, our approach considers two information modalities: (i) visual (color and facial information) and (ii) textual (tags, title, and description) information. To qualify the recommendation performed, we extend a Sparse linear method with side information (SSLIM), which takes into account the aforementioned information modalities. In this work, we propose an approach that exploits visual and textual information to properly describe videos in our recommender system. Experimental results obtained on a real dataset containing 207.154 videos from Youtube shows that we could improve up to 7% when comparing to a single modality model and up to 12% when compared to the baseline, demonstrating the effectiveness of the proposed approach and highlighting the usefulness of multimodal information when dealing with the cold-start problem.
dc.format.mimetypepdf
dc.identifier.issn1983-5116
dc.identifier.urihttps://hdl.handle.net/1843/68558
dc.languagepor
dc.publisherUniversidade Federal de Minas Gerais
dc.relation.ispartofTendências da Pesquisa Brasileira em Ciência da Informação
dc.rightsAcesso Aberto
dc.subjectCiência da Computação
dc.subjectWeb 2.0
dc.subjectSistemas de Recomendação (Filtragem de informações)
dc.subject.otherSistemas de Recomendação
dc.subject.otherVídeos Online
dc.subject.otherWeb
dc.subject.otherCold Start
dc.subject.otherAbordagem Multimodal
dc.titleMetodologia para recomendação de vídeos baseada em descritores de conteúdo visuais e textuais
dc.title.alternativeMethodology for video recommendation based on descriptors visual content and textual
dc.typeArtigo de periódico
local.citation.epage225
local.citation.issue1
local.citation.spage208
local.citation.volume9
local.description.resumoEste trabalho aborda o desenvolvimento de uma nova abordagem multimodal para lidar com o problema de cold-start em sistemas de vídeo de recomendação. Dado um documento de vídeo, que geralmente consiste de uma sequência de imagens, áudio e informações relacionadas – como o título, tags (rótulos) e descrição –, a recomendação de vídeos visa encontrar uma lista dos vídeos mais relevantes para direcionar os usuários. O problema de cold-start é ocasionado quando, ao recomendar um item, não se possui informações sobre o usuário (cold-start user) ou sobre o item (cold-start item). Mais especificamente, nossa abordagem considera duas modalidades de informação: (i) visual (informações de cor e facial) e (ii) textual (tags, título e descrição) de informação. Para avaliar a recomendação realizada, estendemos o método Sparse linear method with side information (SSLIM), que considera as modalidades de informação acima mencionadas e o comparamos com o KNN que aqui representa o baseline a ser superado. Neste trabalho, propomos uma abordagem que explora a informação visual e textual para descrever adequadamente vídeos no nosso sistema de recomendação. Os resultados experimentais obtidos em uma coleção real de vídeos, com 207.154 vídeos do Youtube mostra que foi possível melhorar até 7%, quando comparado com uma única modalidade e de 13% sobre o baseline, demonstrando a eficácia da abordagem proposta e destacando a utilidade da informação multimodal quando se lida com o problema de Cold-Start.
local.publisher.countryBrasil
local.publisher.departmentICEX - INSTITUTO DE CIÊNCIAS EXATAS
local.publisher.departmentICX - DEPARTAMENTO DE CIÊNCIA DA COMPUTAÇÃO
local.publisher.initialsUFMG
local.url.externahttps://revistas.ancib.org/index.php/tpbci/article/view/382

Arquivos

Pacote original

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
Metodologia para recomendação de vídeos baseada em descritores de conteúdo visuais e textuais.pdf
Tamanho:
345.72 KB
Formato:
Adobe Portable Document Format

Licença do pacote

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
License.txt
Tamanho:
1.99 KB
Formato:
Plain Text
Descrição: