Inferência da localização de residência de usuários de redes sociais a partir de dados públicos

Carregando...
Imagem de Miniatura

Título da Revista

ISSN da Revista

Título de Volume

Editor

Universidade Federal de Minas Gerais

Descrição

Tipo

Dissertação de mestrado

Título alternativo

Primeiro orientador

Membros da banca

Clodoveu Augusto Davis Junior
Marcos Andre Goncalves
Virgilio Augusto Fernandes Almeida
maria da Graça Campos Pimentel
Ponnurangam Kumaraguru

Resumo

A crescente acessibilidade às mídias sociais atrelada à facilidade de uso dos serviços de compartilhamento têm propiciado a geração voluntária de um grande volume de dados pessoais nesses ambientes. As informações compartilhadas, que variam de fotos do cotidiano a associações profissionais, podem ser exploradas para os mais diversos fins. Ao mesmo tempo em que esses dados criam oportunidades para os usuários fortalecerem seus laços nas redes sociais, eles também favorecem o desenvolvimento de mecanismos personalizados e estratégias de recomendação mais eficientes. Entretanto, esses mesmos dados podem ser manipulados de forma maliciosa e indesejada para promover marketing viral ou acessar informações confidenciais sobre os usuários. A violação de privacidade ocorre frequentemente devido ao desconhecimento e descuido das pessoas em relação àquilo que divulgam e tornam público. Com o aumento de serviços baseados em localização, um aspecto adicional é incluído ao dado referente à informação geográfica, o que torna a discussão sobre privacidade ainda mais incisiva, visto que tais dados podem colocar em risco a integridade física dos usuários, permitindo que eles sejam rastreados. Neste trabalho, analisamos uma das mais populares redes sociais baseadas em localização, o Foursquare, com o intuito de investigar como os seus membros exploram os recursos públicos do sistema (especificamente os atributos que possuem informação geográfica associada). A caracterização do comportamento humano no Foursquare consiste de um estudo que agrega cerca de 13 milhões de usuários e visa observar o potencial dos atributos geográficos do sistema em agir como fontes de vazamento de informação. Nesse contexto, propomos variados modelos de inferência na tentativa de revelar a localização da residência dos usuários a partir de dados geográficos publicamente disponibilizados. Apesar dos modelos serem genéricos e poderem gerar inferências em diferentes níveis espaciais, focamos nas inferências mais refinadas, nas granularidades de cidade e de coordenada geográfica, que, se bem sucedidas, representam riscos maiores à privacidade individual. Nossa avaliação experimental indica que os modelos propostos são capazes de inferir facilmente a cidade onde os usuários moram com uma precisão de cerca de 78% dentro de um raio de 50 quilômetros. Num grau ainda mais fino, acertamos a localização exata da casa dos usuários no nível de coordenada geográfica com aproximadamente 60% de acurácia em um raio de 5 quilômetros.

Abstract

The increasing access to social media, associated to the ease of use of sharing services, have fostered the voluntary generation of a large amount of personal data in these environments. The shared information, which vary from photos of everyday life to professional associations, can be exploited for various purposes. While these data provide opportunities for users to strengthen their ties in social networks, they also favour the development of personalised mechanisms and more efficient recommendation strategies. However, the same data can also be manipulated to promote malicious and unwanted viral marketing or access sensitive information about users. The privacy breach frequently occurs due to unawareness and carelessness of people about making information publicly available. With the rise of the location-based services, an additional aspect is added to the data related to geographic information, which makes the discussion about privacy even more incisive, since such data can endanger the physical safety of users, allowing them to be tracked. In this dissertation, we explore one of the most popular location-based social networks, Foursquare, aiming at investigating how its members exploit public system resources (specifically the attributes that are associated to geographic information). The characterisation of human behaviour in Foursquare consists of a study which aggregates about 13 million users and aims to observe the potential of geographic attributes in the system to act as sources of information leakage. In this context, we propose various inference models in an attempt to reveal the home location of users through their geographic data publicly available. Although the models are generic, being able to produce inferences at various scales, we focus on finer-grained inferences at the city and geographic coordinate levels that, if successful, represent greater risks to individual privacy. Our experimental evaluation indicates that the proposed models can easily infer the city where users live with an accuracy of about 78% within a radius of 50 kilometres. At an even finer scale, we correctly infer the coordinates of the users home with approximately 60% accuracy within a 5 kilometres radius.

Assunto

Computação, Redes sociais on-line, Foursquare

Palavras-chave

Redes sociais, Localização, Residência, Inferência, Privacidade, Foursquare

Citação

Departamento

Curso

Endereço externo

Avaliação

Revisão

Suplementado Por

Referenciado Por