Mapeando seguidores do Twitter usando o R

Hey galeris,

Depois de alguns posts voltados para música, está na hora de cair a fundo no tema que eu mais gosto de trabalhar no R: mapas e geolocalização. O R trouxe me possibilidades em estudo de comportamento de usuários com base em geolocalização que eu não tinha dimensão, seja para trabalhar no quesito profissional(mapeando divergências linguísticas entre regiões), no acadêmico (voltado para o estudos de circulação científica entre estados e/ou países) e no pessoal (descobrindo onde encontrar pizzarias perto da minha casa!).

Focado em criar/estudar tutoriais voltados para essa temática, disponibilizo aqui um tutorial que ensina como mapear os seguidores do Twitter( aka melhor rede social) e plotar esses dados em um mapa interativo.

 

 

Neste outro tutorial, que mostra uma análise textual sobre a Anitta no Twitter, tem a explicação de como gerar sua aplicação para extrair dados direto da API do Twitter:

 

 

Próximo passo é definir qual usuário você deseja obter os dados para mapear os seguidores. Nesse tutorial, usei os meus seguidores (aliás, me segue lá no twitter: @trifenol).

 

 

Caso o usuário de busca tenha colocado a localização disponível, é possível ver digitando  dados_usuario$location no console. Para buscar os seguidores iremos usar a função get_followers, essa função retorna um dataframe com todos os IDs dos seguidores(uma vez que os usuários podem mudar o username mas nunca o ID). Outro ponto importante dessa função é que ela tem um limite de 75 mil buscas, mas usando o argumento retryonratelimit = TRUE  é possível realizar buscas de 75 mil seguidores a cada 15 minutos facilmente.

 

 

Usando a função lookup_users será feita a busca pelos dados dos seguidores disponibilizados no Twitter.

 

 

Não será utilizado os dados de usuários que estão com o campo de localização em branco, sendo assim, usaremos a função subset para deixar no dataframe apenas os usuários que possuem esse campo preenchido(mesmo que erroneamente, como frases, abreviações sem sentido etc).

 

O próximo passo é um pouco mais complicado e é onde a mágica acontece. Primeiramente é criado um novo dataframe com os dados dos seguidores, como username e a localização que o usuário colocou, acessado diretamente pelas colunas 3 e 4 do dataframe dados_usuario_followers. Posteriormente inseri uma barra de progresso para acompanhar o processo de geocodificação (transformação de endereços dos seguidores, no nosso caso, em latitude/longitude), próxima função executada neste código.

 

 

Neste passo, visando dar maior interatividade ao mapa gerado, foi adicionado um processo de criação de uma coluna de rótulo com dados em formato html que mostre a foto do usuário, o username, o link para o perfil e qual era a localização mostrada.

 

 

Agora é só plotar no mapa, aqui usei os pacotes  leaflet e  leaflet.extras.

 

 

Após rodar esse último passo, o resultado será um mapa interativo como esse na sua área de viewer do RStudio.

 

 

Com algumas pequenas modificações é possível também mapear tweets sobre algum tema/hashtag, pessoas que você segue, listas de usuários etc. Caso tenha dúvidas ou sugestões, é só comentar abaixo ou mandar um tweet! A inspiração (e o que me ajudou com algumas dificuldades) foi o post do blog do Fellipe Gomes sobre o mapeamento dos blocos de carnaval do Rio.

 

 

Momento Shame: Como vocês perceberam, a minha rede de seguidores é bem espalhada pelo mundo, mas… isso devesse a um pacote de 10 mil seguidores que eu comprei no Fiverr por 1 dólar uns 4 anos atrás e a maioria é fake. 🙁

Escrito por Janderson Toth

Meu nome é Janderson, tenho 24 anos e sou graduando em Estudos de Mídia/UFF. Vivo fazendo tutorias, me perco nos animes e meu super-herói favorito é o John Constantine. Escrevo para aprender a escrever(?) e para desenvolver meus estudos em análise de redes sociais e programação em R.