Análises Automatizadas de tweets e posts: filtrando textos no twitter e no facebook

7
Análises Automatizadas de tweets e posts: filtrando textos no twitter e no facebook. JEAN MEDEIROS E MARCUS LEITE

description

Labic :: 11 de junho de 2013

Transcript of Análises Automatizadas de tweets e posts: filtrando textos no twitter e no facebook

Page 1: Análises Automatizadas de tweets e posts: filtrando textos no twitter e no facebook

Análises Automatizadas de tweets e posts:

filtrando textos no twitter e no facebook.

JEAN MEDEIROS E MARCUS LEITE

Page 2: Análises Automatizadas de tweets e posts: filtrando textos no twitter e no facebook

Começo.

Script de RTs e @s (Retweets e menções)

Linguagem R

Python

Page 3: Análises Automatizadas de tweets e posts: filtrando textos no twitter e no facebook

Twitter.

Twitter: Script de narrativa ou parse_tweets.py

Entrada: Retirada do yourTwapperKeeper.

Saídas em pipe_delimeted CSVs:

Dates.csv: Número de tweets por dia.

Hashtags.csv: hashtags e o número de usuários que as utilizaram.

Locations.csv: São as coordenadas geográficas dos tweets.

Mentions.csv: Perfis mais mencionados.

Top_tweets.csv: Lista de tweets ordenados pelo número de RTs recebidos.

Urls.csv: URLs e o número de usuários que as mencionaram.

Users_activity.csv: Número de tweets por usuário.

Users_by_date.csv: Número de usuários ativos por dia.

Words_per_period: Tabela com as 10 palavras mais usadas.

Page 4: Análises Automatizadas de tweets e posts: filtrando textos no twitter e no facebook

Twitter.

Saída em comma_separated CSVs:

Hashtags_networks.csv: Feito para importação no Gephi.

Saída em texte txt:

Top_words_wordle.txt: Feito para gerar uma Word Cloud das palavras

mais mencionadas no Wordle.

Top_hashtags_wordle.txt: O mesmo que a anterior, porém para

hashtags.

Page 5: Análises Automatizadas de tweets e posts: filtrando textos no twitter e no facebook

Facebook.

Facebook: Script de narrativa ou parse_posts.py

Entrada: Retirada do netvizz

Saídas em pipe_delimeted CSVs:

Comments_per_day.csv: Número de comentários por dia.

Comments_per_hour.csv: Número de comentários por hora.

Interactions_summary.csv: Quantidade e porcentagens de comentários, likes e shares por tipo de post.

Post_comments.csv: Data, tipo de posts, texto dos posts e números de comentários de cada.

Post_comments_by_type.csv: Número de comentários de acordo com o tipo do post.

Post_likes.csv: Data, tipo de posts, texto dos posts e números de likes de cada.

Page 6: Análises Automatizadas de tweets e posts: filtrando textos no twitter e no facebook

Facebook.

Saídas em pipe_delimeted CSVs:

Post_likes_by_type.csv: Número de likes de acordo com o tipo do post.

Post_shares.csv:Data, tipo de posts, texto dos posts e números de shares de cada.

Post_shares_by_type.csv: Número de shares de acordo com o tipo do post.

Posts_per_day.csv: Números posts por dia.

Post_type_distribution.csv: Quantidade e porcentagem de tipos de posts.

Top_hashtags.csv: Lista em ordem descrescente de hashtags presentes em mais posts.

Top_urls.csv: Lista em ordem descrescente de urls presentes em mais posts.

Top_words.csv: Lista em ordem descrescente de palavras presentes em mais posts.

Page 7: Análises Automatizadas de tweets e posts: filtrando textos no twitter e no facebook

Referências.

yourTwapperKeeper:

http://www.github.com/540co/yourTwapperKeeper

Netvizz: https://apps.facebook.com/netvizz/

Wordle: http://www.wordle.net/

Tagxido: http://www.tagxedo.com/

Python: http://www.python.org/