Please use this identifier to cite or link to this item: http://hdl.handle.net/1843/ESBF-97GJWS
Type: Dissertação de Mestrado
Title: Inferência da localização de residência de usuários de redes sociais a partir de dados públicos
Authors: Tatiana Pontes Soares Rocha
First Advisor: Jussara Marques de Almeida
First Co-advisor: Ponnurangam Kumaraguru
First Referee: Clodoveu Augusto Davis Junior
Second Referee: Marcos Andre Goncalves
Third Referee: Virgilio Augusto Fernandes Almeida
metadata.dc.contributor.referee4: maria da Graça Campos Pimentel
metadata.dc.contributor.referee5: Ponnurangam Kumaraguru
Abstract: A crescente acessibilidade às mídias sociais atrelada à facilidade de uso dos serviços de compartilhamento têm propiciado a geração voluntária de um grande volume de dados pessoais nesses ambientes. As informações compartilhadas, que variam de fotos do cotidiano a associações profissionais, podem ser exploradas para os mais diversos fins. Ao mesmo tempo em que esses dados criam oportunidades para os usuários fortalecerem seus laços nas redes sociais, eles também favorecem o desenvolvimento de mecanismos personalizados e estratégias de recomendação mais eficientes. Entretanto, esses mesmos dados podem ser manipulados de forma maliciosa e indesejada para promover marketing viral ou acessar informações confidenciais sobre os usuários. A violação de privacidade ocorre frequentemente devido ao desconhecimento e descuido das pessoas em relação àquilo que divulgam e tornam público. Com o aumento de serviços baseados em localização, um aspecto adicional é incluído ao dado referente à informação geográfica, o que torna a discussão sobre privacidade ainda mais incisiva, visto que tais dados podem colocar em risco a integridade física dos usuários, permitindo que eles sejam rastreados. Neste trabalho, analisamos uma das mais populares redes sociais baseadas em localização, o Foursquare, com o intuito de investigar como os seus membros exploram os recursos públicos do sistema (especificamente os atributos que possuem informação geográfica associada). A caracterização do comportamento humano no Foursquare consiste de um estudo que agrega cerca de 13 milhões de usuários e visa observar o potencial dos atributos geográficos do sistema em agir como fontes de vazamento de informação. Nesse contexto, propomos variados modelos de inferência na tentativa de revelar a localização da residência dos usuários a partir de dados geográficos publicamente disponibilizados. Apesar dos modelos serem genéricos e poderem gerar inferências em diferentes níveis espaciais, focamos nas inferências mais refinadas, nas granularidades de cidade e de coordenada geográfica, que, se bem sucedidas, representam riscos maiores à privacidade individual. Nossa avaliação experimental indica que os modelos propostos são capazes de inferir facilmente a cidade onde os usuários moram com uma precisão de cerca de 78% dentro de um raio de 50 quilômetros. Num grau ainda mais fino, acertamos a localização exata da casa dos usuários no nível de coordenada geográfica com aproximadamente 60% de acurácia em um raio de 5 quilômetros.
Abstract: The increasing access to social media, associated to the ease of use of sharing services, have fostered the voluntary generation of a large amount of personal data in these environments. The shared information, which vary from photos of everyday life to professional associations, can be exploited for various purposes. While these data provide opportunities for users to strengthen their ties in social networks, they also favour the development of personalised mechanisms and more efficient recommendation strategies. However, the same data can also be manipulated to promote malicious and unwanted viral marketing or access sensitive information about users. The privacy breach frequently occurs due to unawareness and carelessness of people about making information publicly available. With the rise of the location-based services, an additional aspect is added to the data related to geographic information, which makes the discussion about privacy even more incisive, since such data can endanger the physical safety of users, allowing them to be tracked. In this dissertation, we explore one of the most popular location-based social networks, Foursquare, aiming at investigating how its members exploit public system resources (specifically the attributes that are associated to geographic information). The characterisation of human behaviour in Foursquare consists of a study which aggregates about 13 million users and aims to observe the potential of geographic attributes in the system to act as sources of information leakage. In this context, we propose various inference models in an attempt to reveal the home location of users through their geographic data publicly available. Although the models are generic, being able to produce inferences at various scales, we focus on finer-grained inferences at the city and geographic coordinate levels that, if successful, represent greater risks to individual privacy. Our experimental evaluation indicates that the proposed models can easily infer the city where users live with an accuracy of about 78% within a radius of 50 kilometres. At an even finer scale, we correctly infer the coordinates of the users home with approximately 60% accuracy within a 5 kilometres radius.
Subject: Computação
Redes sociais on-line
Foursquare
language: Português
Publisher: Universidade Federal de Minas Gerais
Publisher Initials: UFMG
Rights: Acesso Aberto
URI: http://hdl.handle.net/1843/ESBF-97GJWS
Issue Date: 11-Mar-2013
Appears in Collections:Dissertações de Mestrado

Files in This Item:
File Description SizeFormat 
tatianapontes.pdf2.46 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.