#MasterchefBrasil: Dados da última semana no Twitter


Vi uma grande mobilização na internet nos últimos dias em torno da edição brasileira do Masterchef. Coletei na última semana (dois programas, mais ou menos) os tweets que continham a tag "MasterchefBrasil" (36831 tweets e 25257 contas individuais). O programa realmente bomba bastante no Twitter nas noites de terça-feira. E o que é interessante, há um grupo de fãs que fala bastante do assunto, com poucos "famosos" e grandes influenciadores. O grafo abaixo mostra a rede em geral, com um grande cluster (que não está em torno das contas principais do programa), que representa, num mesmo cluster, a conversação. O grafo mostra os grupos por cores e o tamanho dos nós pela quantidade de tweets sobre o programa. Ao centro do grafo, vemos que estão realmente os nós que mais falaram do programa. (Clique no grafo p/ ver em tamanho maior.)

outmod.png

O mais interessante ainda está no grafo da análise de contingência do que está sendo dito no Twitter. No grafo a seguir, vemos quais conceitos foram mais associados aos participantes. Vemos que os participantes mais falados são Jiang, que está fortemente relacionada a "melhor" e a "amo". Fernando, eliminado esta semana, está fortemente associado a Lucas que foi eliminado na semana anterior. Em menor presença, estão Cristiano e Izabel. Interessante que Cristiano é citado em contextos onde Jiang também foi (provavelmente relacionados a mesma equipe), enquanto Izabel está mais isolada em outro cluster. Além disso, outros elementos relacionados ao programa são "torcida", "comida", "fome", diversos tipos de alimentos. (Clique para ver o grafo em tamanho maior.)
 
discurso.png
Ao observar o grafo normalizado, essas diferenças ficam mais claras. Tirando os participantes eliminados. Jiang lidera as citações e as associações. (Clique no grafo para ver em tamanho maior.)




discursonorm.png
Finalmente, no próximo grafo, dos dados normalizados, conseguimos ver as associações mais frequentes. Jiang é "fofa", "#ficajiang", "campeã", "perdida" etc. Essas associações mostram que a competidora tem sim uma torcida já, que está associando seu nome a vários adjetivos e conceitos positivos. Izabel, por outro lado, é "falsiane", está diretamente relacionada a "Raul", "boa", "aula", "raposa" etc. Fernando está associado a Lucas, Marcos e Cristiano. Fernando, o único associado a #ficafernando, o que também mostra uma torcida. Entre as associações mais fortes "programa" e "melhor". (Clique no grafo para ver em tamanho maior.)

discursonorm2.png

Lançamento: Análise de Redes para Mídia Social



capalivro.jpgEntão, depois de cerca de dois anos de trabalho e três anos de parceria trabalhando conjuntamente com a perspectiva de análise de dados - e de modo particular, análise de redes- em mídia social, eu, o Marco Toledo Bastos e a Gabriela Zago estamos lançando um livro que é resultado disso tudo. Chama-se Análise de Redes para Mídia Social  e acabou de sair pela Sulina.

O livro, escrito a seis mãos, nasceu de várias discussões que tínhamos lá em 2013, percebendo que nós, das áreas sociais e humanas, tínhamos uma dificuldade muito grande de trabalhar com análise de redes, o que resultava em inúmeras confusões conceituais, terminológicas e dificuldade de interpretação dos dados. Então nasceu a idéia de fazermos uma obra introdutória, que falasse de modo bastante acessível e textual (não usamos, por exemplo, definições matemáticas dos algoritmos) sobre as variáveis de rede e como usá-las, dando exemplos e mostrando o que a análise de redes (ARS) pode fazer com os dados de mídia social. Nosso objetivo não foi ensinar a usar softwares (como o Gephi, ou o NodeXL) pois pra isso há inúmeros tutoriais no Youtube. O que queríamos era explicar o que as variáveis que são utilizadas significam e como podem ser aplicadas. Assim, trata-se de um livro introdutório, focado na discussão e aplicação dessas métricas. 

O livro abre com um prefácio do Marc Smith, um pesquisador americano que trabalha com análise de redes há muitos anos, ex-Microsoft Research, que é um dos fundadores do Connected Action e um dos fundadores e desenvolvedores do NodeXL. O Marc fez um prefácio ressaltando a importância do estudo da análise de redes, e do uso desses dados para a pesquisa nas áreas sociais.

Como a gente queria dar uma perspectiva interdisciplinar e mostrar que outras áreas também estão pensando sobre essas coisas (acreditamos que temos muito a ganhar trabalhando com dados e grupos de pesquisa interdisciplinares), convidamos o Fabrício Benevenuto, da UFMG, da área da Computação, um dos grandes pesquisadores brasileiros que está focando dados de mídia social (e que também é precursor no trabalho de estudo de redes da midia social). O Fabrício muito gentilmente aceitou fazer um pequeno texto sobre a importância desse diálogo, que encerra o livro.

O livro também deve sair em uma versão ebook, nas próximas semanas, para quem prefere ler num dispositivo móvel. Assim que tivermos novidades a respeito, repassamos. 

Este livro também é resultado de trabalho desenvolvido com apoio da FAPERGS e do CNPq.

ISBN: 978-85-205-0733-9
Categoria: Mídias Sociais, Comunicação, Cibercultura
Edição: 1ª - 2015
Formato: 14 x 21 cm
Nº de Pag.: 182
Peso: 0,232 Kg
Preço: R$ 41,00

A Mídia e a Narrativa dos Protestos


Coletamos, esta semana, dados sobre os protestos de domingo (16) e de quinta (20) no Twitter. Aqui estou mostrando um grafo referente aos tweets entre os dias 16 e 21, com a palavra-chave "protestos" (96071 nós e 139017 tweets). Em verde, vemos o grupo anti-governo, ou seja, contas que tuitaram nesses dias tendendo a criticar o governo. Em vermelho, vemos o grupo pró-governo, ou seja, contas que tuitaram tendendo a apoiar/elogiar o governo. Os nós em tamanho maior mostram contas (foquei principalmente em veículos de mídia) que mais repercutiram em um grupo ou no outro. (Atenção: Isso não significa que o veículo tuitou informações de apoio ou oposição, mas que repercutiu nestes grupos e, portanto, está colorido no mesmo tom por questões de visualização.)

midiaprotestos.png

É interessante primeiramente perceber a formação de dois clusters distintos, separados, onde há tendência de apoio ou oposição. Basicamente, isso mostra que há mobilização de ambos os lados, tanto para repercutir o que é elogio como para repercutir o que é crítica. Mas também é igualmente interessante observar que, quanto mais longe da "fronteira" entre os dois grupos, menos um determinado veículo conseguiu "falar" para ambos e mais repercutiu apenas naquele cluster. Vejam, por exemplo, que o @Estadão está mais na fronteira, o que significa que, embora tenha sido mais citado no cluster de oposição, ele repercutiu também no cluster de apoio. Na mesma situação está a @BBCBrasil, embora ela tenha repercutido mais no grupo de apoio. Mas há veículos, como @veja, o @jornaloglobo, @cartacapital e etc. que estão bem distantes da fronteira, ou seja, que repercutiram quase exclusivamente dentro desses clusters, mas não fora deles.  Será interessante analisar isso no médio prazo, se a polarização continuar, se as narrativas jornalísticas também tendem a ser polarizadas ou se aproximam-se da fronteira.

Protestos 16/08 - A conversação em torno de "protesto"


Sobre o monitoramento dos protestos marcados para hoje, em todo o Brasil, alguns dados. Primeiramente, grafos em torno da palavra "protesto", no Twitter, durante alguns dias da semana. Coletamos também algumas hashtags mas como tenho dito (e outros pesquisadores também), há muita articulação de robôs em torno das tags, o que dificulta observar efetivamente seu espalhamento na rede. O risco da palavra-chave "protesto" é que pegamos também outras articulações, que não a de hoje. Por outro lado, acredito que há, aqui, uma importante medida. Nos grafos a seguir, as cores representam modularidade (tendência dos nós a pertencerem a um mesmo grupo) e o tamanho dos nós, seu número total de citações e retweets. 

O primeiro grafo mostra a palavra "protesto" no dia 10/08, às 22h. Há pouca repercussão, mas já se vê (em vermelho, em cima) alguns nós mais articulados focados no protesto deste domingo. São 2842 tweets e 2668 nós individuais. (Clique na imagem para ver em tamanho maior.)

protesto1008tudo.png
No segundo grafo, do dia 14/08, às 09 da manhã (pegando, portanto, a movimentação do dia 13), há mais densidade na rede, muito mais participação e a articulação em torno do evento começando a formar um cluster (grupo) ao centro do grafo. É interessante também que vários veículos midiáticos começam a ser bastante relevantes na conversa. Aqui temos já 5528 contas e 6116 tweets. (Clique na imagem para ver em tamanho maior.)

protesto1408tudo.png
Finalmente, no grafo de ontem (15/08), em torno de 17h, já vemos o Twitter ferver muito mais. Já conseguimos 62948 tweets, com a participação de 48290 contas. Há mais articulação, com um aumento do número de tweets por ator, chegando a 1,30 (dia 14 foi de 1,1 e no dia 10, 1,06). Isso indica que há mais gente retuitando e mencionando outras contas várias vezes (o que aumenta a média como um todo), além de mais gente participando da conversa. É interessante observar que agora já vemos muito claramente grupos de nós (clusters) formados (ao centro do grafo). Bem embaixo, dois grandes grupos em torno de nós que já apareciam no dia 10, mobilizando outros. (Clique na imagem para ver em tamanho maior.)

protesto150817htudo.png
Os grandes clusters podem ser vistos de modo mais claro no zoom da imagem (a seguir). Vejam que nós que nos primeiros mapas não estavam juntos, passam a ser citados junto. Também destaque para os tweets da imprensa, que começa a aparecer com força na narrativa do evento. (Clique na imagem para ver em tamanho maior.)

protesto150817h.png
Embora a busca pela palavra "protesto" fuja um pouco da articulação dos bots, é preciso ter cuidado em analogias em torno do número de pessoas participando na mídia social e a o número de pessoas nas ruas. Primeiro, porque, como muitos já apontaram, articulações com comportamento de robôs estão muito presentes, especialmente após as eleições do ano passado. Segundo, porque o Twitter não é representativo em termos populacionais, hoje, do Brasil. Além disso, muito das manifestações anteriores (março e abril) foram muito articuladas em outros espaços diversos (Facebook e Whatsapp). Entretanto, a articulação que vemos aqui sugere sim um crescimento da conversação e da atenção em torno do assunto. Vamos ver como será hoje ao longo do dia.

O caso do épico vídeo do #Rockin1000 p/ o Foo Fighters


Muita gente fala de viralização e virais. A grande questão é que é absolutamente difícil conseguir viralizar qualquer coisa na Internet hoje em dia, especialmente por conta das famosas "bolhas", ou seja, da separação de grupos que ferramentas como o Facebook têm suportado com cada vez mais força. Assim, as informações tendem a circular em pequenos grupos e raramente ultrapassarem as fronteiras desses, passando a falsa impressão para quem está dentro de que "todo mundo está falando disso", quando na verdade é apenas a sua rede. Pois bem, ontem a Internet foi sacudida por um viral daqueles que mais rapidamente eu vi se espalhar nos últimos tempos. Um grupo da cidade de Cesena, na Itália, criou um projeto chamado "Rockin 1000", onde por mais de um ano os caras buscaram apoio, selecionaram músicos e etc, para fazer um vídeo no qual pediam aos Foo Fighters que viessem tocar na cidade (não tocam na região desde 1997). O projeto, baseado em apoios e crowdfunding, então, juntou mil músicos que tocaram juntos a música da banda "Learn to Fly" num parque local no dia 26/07. O vídeo épico foi gravado, editado e publicado ontem (dia 30/07) e imediatamente, viralizou. 

cesena.png
Em algumas horas, a banda respondeu oficialmente, primeiro comentando que tinham visto:
foofighters1.png


E depois prometendo a visita.
foofighters2.png


A conta do projeto, no Twitter, conta com menos de dois mil seguidores. A conta do youtube, pouco mais de dez mil subscribers (a maioria pós divulgação do vídeo). Mesmo no Facebook, a página do evento conta com menos de três mil confirmações. Como é que esse vídeo viralizou, então, tão rapidamente?

A resposta, acredito, tem dois pontos. O primeiro, é claro, é que o vídeo é épico.Viralizar conteúdo épico é muito mais fácil do que viralizar qualquer conteúdo. O segundo, é que é um vídeo de fãs, que, mais do que atingir a banda, atinge outros fãs, que vão replicar a mensagem até que ela seja vista pelos Foo Fighters. Essa segunda hipótese é reforçada pela análise da rede em torno da hashtag proposta pelo projeto #rockin1000 na figura a seguir. (Dados coletados via NodeXL.) O grafo mostra os nós (contas) marcados por grau de entrada (número de citações e retuites que um nó recebe indicam o seu tamanho no mapa.). Ao centro do grafo, vemos a conta do @foofighters, cercada por uma nuvem azul de fãs que citaram a banda quando repassaram o vídeo. Vejam que a conta da banda é muito mais citada que a conta do projeto (que está mais embaixo, em azul claro, bem menor). Ou seja, mais do que falar do projeto, os demais fãs contribuiram diretamente para que o vídeo fosse viralizado e a banda o visse. (Na imagem, vemos apenas o cluster principal do grafo de pouco mais de dez mil tweets e 8 mil contas envolvidas.)

rockin1000gephicluster.png
(Clique na imagem para ver em tamanho maior.)

Claro, a divulgação dos fãs alcançou também vários veículos que deram muito rapidamente a informação, contribuindo para a visibilidade do projeto. No mapa a seguir, vemos as contas com mais de 2 mil seguidores e já vemos vários veículos informativos.
rockin1000gephirevistas.png
(Clique na imagem para ver em tamanho maior.)

O caso ainda deve repercutir bastante hoje. E é incrivelmente legal, do ponto de vista da difusão de informações, também. A divulgação pelos fãs rompe a "bolha" do Facebook de forma muito mais contundente, porque é algo em comum que pessoas muito diferentes têm. E o vídeo é tão legal que repercute em outros grupos que nem fãs da banda são. A música realmente transcende as fronteiras sociais.

Análise de Redes Sociais: #Plutoflyby e Capital Social


Há alguns dias atrás a New Horizons passou por Plutão, enviando à Terra algumas das primeiras imagens com boa resolução do planeta anão. A nave está há dez anos na missão. O evento, histórico, repercutiu bastante na Internet e entre alguns outros trabalhos, fiz alguns mapas para observar a repercussão, através da hashtag #plutoflyby. Neste post, discuto alguns detalhes interessantes que podemos observar através da análise de redes. Coletei os dados com o auxílio de alguns scripts e do NodeXL na quarta-feira (dia 15/07) e por isso, os dados referem-se aos dias anteriores (13, 14 e 15/07). Coletei 27.536 tweets com a hashtag, de 19.442 contas únicas. Os mapas a seguir foram construídos no Gephi (que funciona melhor com arquivos grandes).

O mapa geral vemos a seguir. Ele mostra todos os usuários que retuitaram ou citaram outro usuário representado pelas conexões. Cada bolinha (nó) representa uma conta no Twitter que tuitou usando a hashtag #plutoflyby. Cada conexão indica uma menção ou retuíte entre duas contas. As cores indicam vizinhança (modularidade), ou seja, nós que estão mais próximos seja porque se retuitam entre si ou porque retuitam a mesma conta. O tamanho dos nós, neste mapa, indica indegree (grau de entrada), ou seja, o número de conexões (menções e retuítes) que um determinado nó recebeu. (Clique nas imagens para ver em tamanho maior.)

plutoflybyindegree10.png

Credibilidade (ou capital social)  é mais importante que o número de seguidores. Embora isso seja uma releitura do famoso artigo do "1 million follower falacy", é um dado interessante. No primeiro close do mapa, abaixo, vemos os nós com maior número de seguidores (o tamanho do nó representa o número de seguidores). Vejam como os nós com maior número de seguidores são @barackobama, @kimkardashian, @google, @nytimes, @facebook e etc.

plutoflybyzoomcentro2.png
Agora comparemos o mapa acima com o mapa dos nós com maior número de citações a seguir (maior número de menções e retuítes). O mapa é bastante diferente, com um centro forte nas contas oficiais da @nasa e da @nasanewhorizons.

plutoflybyindegree10centro.png

Uma das maiores contas é a do @barabckobama (conta da assessoria do presidente dos EUA - a pessoal é a @POTUS). Obama tem 61,9 milhões de seguidores. Entretanto, observem, há pouquíssimos tweets que referenciam o seu tweet sobre a New Horizons. Isso significa que, embora seu tweet tenha dado visibilidade para o evento, as pessoas prefereriram retuitar a conta da @nasa (na bola roxa). Mesma coisa a conta da @kimkardashian, do @facebook e outros. Vejam que as pessoas preferiram retuitar veículos jornalísticos (@bbcbreaking, @natgeo, @bbcworld - cada um deles forma uma pequena árvore de retweets em torno de si) e a fonte oficial (@nasa e contas afins) do que aqueles usuários com maior número de seguidores. Isso é um importante indicativo do impacto que o capital social tem na circulação de informações na ferramenta. Os mapas, assim, dão um indício de que mais importante do que o número de seguidores é quem dá a informação e como as pessoas negociam capital social no processo de circulação de informações na mídia social.

Scholar Metrics de Revistas da Comunicação


Agora em junho, o Google Scholar divulgou as métricas de citações medidas pela ferramenta de 2015. Basicamente, é possível procurar ali o número de citações medidas pelo Scholar para qualquer revista. 

Como funcionam as métricas? O h-index é uma das métricas mais usadas para medir impacto de publicações no mundo (embora ainda usemos pouco nas nossas áreas de Humanas e Sociais no Brasil). A métrica indica o número "h", que é o maior número em que, pelo menos, um número "h" de artigos foi citado um número "h" de vezes cada um. Ou seja, se uma revista tem cinco artigos citados 10, 8, 5, 4 e 2 vezes, o h-index vai ser 4 (pelo menos quatro artigos citados quatro vezes).

Os artigos mais citados de uma revista constituem seu h-core (que o Scholar não mapeia para a maior parte das publicações). A h-median (mediana) é a mediana de publicações dos artigos mais citados. Além disso, o Scholar só contabiliza as citações dos artigos publicados nos últimos 5 anos (h-index 5). 

O Scholar como mecanismo já foi objeto de análise por vários pesquisadores. Alguns mostraram uma correlação positiva com outras métricas de impacto,  outros discutiram seus pontos fracos, salientando a relevância especialmente p/ as ciências humanas, que carecem de mais referenciais bibliométricos, outros ainda falaram da facilidade de manipulação dos resultados por conta, principalmente, da falta de controle das fontes . Entretanto, eu ainda acho particularmente útil porque 1) é livre e gratuito (ao contrário de mecanismos como o Web of Science e o Scopus); 2) não adiciona apenas citações de veículos cadastrados, mas tem um espectro maior de abrangência; 3) parece que tem menos erros de autoria (eu tenho problemas sérios com citações no Scopus, por exemplo, que não pega vários artigos que eu tenho publicados em periódicos cadastrados e me confunde com outros "Recueros" e eu preciso deletar manualmente essas citações), 4) tem muito mais espectro de coleta em publicações de humanas e sociais (inclusive em outras línguas que não inglês) do que as ferramentas anteriores e 5) a mim parece uma ferramenta interessante particularmente para avaliar as citações de revistas (mais do que de pesquisadores), mostrando quais periódicos têm impacto na área.

Tendo isso em vista, fiz um cruzamento rápido (e não exaustivo) entre periódicos das áreas de Comunicação. Basicamente acessei o Webqualis, peguei as revistas brasileiras ou em Português do extrato 1 (A1, A2, B1 e B2) e fiz uma busca no Scholar para medir o impacto delas. O resultado é a tabela a seguir. Para fins comparativos, coloquei algumas revistas A1 (também apenas nacionais e em PT), uma vez que a Comunicação, como subárea, não tem revistas com qualis A1. Além disso, várias revistas não aparecem porque: 1) Algumas eu realmente não achei no Scholar; 2) Algumas têm nomes que são iguais a outras revistas e eu não consegui separar o h-index de cada uma.  (Atenção: A lista não é exaustiva! Não pequei todas as revistas.)

revistascomunicacao2.png

Evidentemente, o h-index das publicações nacionais não é comparável com aquele de publicações internacionais. Apenas para fins comparativos, o h-index da First Monday, uma revista open, dedicada à área de sociais e humanas, que tem tido grande impacto na chamada Ciência Social Computacional, área que atuo, é avaliada pelo nosso Qualis como B3. Entretanto, seu h-index é 31, com uma mediana de 65. Possivelmente uma das revistas de maior impacto, comparável ao ICWSM (International Conference on Weblogs and Social Media), um dos eventos de maior impacto na área, que tem um h-index de 55 e uma mediana de 105 e o Journal of Computer Mediated Communication, h-index de 32 uma mediana de 53. Além disso, podemos ver que revistas que não estão online e que têm apenas publicação impressa são muito pouco ou nada citadas (ou seja, a dificuldade de acesso online pode ser um fator importante para reduzir o índice de impacto). 

É claro que as publicações em Português tendem a ser menos citadas simplesmente porque a parcela da população de pesquisadores que a lê é muito menor do que em inglês. Mas mesmo assim, acredito que também tem impacto nessas métricas o fato de que, na área da Comunicação, as pessoas citam pouco seus conterrâneos no Brasil. Parece-me que sempre se procura citar autores estrangeiros mais do que artigos publicados em periódicos da área por aqui, mesmo que o trabalho em PT tenha igual ou maior relevância para o que se está discutindo. Já me deparei várias vezes com situações de review onde o autor não cita NADA do que já foi publicado no País, mesmo com várias dezenas de publicações relevantes anteriores. É uma questão cultural, mas tem um impacto muito grande no modo como fazemos ciência por aqui e, evidentemente, no índice de impacto de nossas revistas.

Sobre Avatares Coloridos, Facebook e Difusão de Informação


fotocolorida.pngEstava há algum tempo para escrever sobre isso, mas não tinha tido, ainda, tempo. Desde sexta-feira (26), quem logou no Facebook deve ter visto uma avalanche de cores nos avatares das pessoas. A ferramenta, denominada "Celebrate Pride", foi disponibilizada pelo próprio Facebook naquele dia, para celebrar as paradas LGBT que acontecem no final do Junho no País. Ao mesmo tempo, no mesmo dia, a Suprema Corte americana, numa decisão histórica por lá, decidiu que casais gays tinham o direito de se casar em qualquer estado da União. A união das duas coisas gerou um fenômeno que foi bastante explorado pela mídia nos últimos dias, onde milhares de pessoas mudaram suas fotos por avatares coloridos em celebração ou apoio (não apenas no Facebook, mas principalmente por lá).

Diante disso, muita gente comentou que há uma falsa percepção de apoio por conta dos filtros do Facebook (ou seja, "parece" que todo mundo está colorido porque sua rede está colorida), que isso não importava porque o filtro da ferramenta não permitia que outras pessoas vissem as fotos "coloridas" ou mesmo, que apenas 26 milhões de pessoas tinham mudado a foto, o que era nada diante do mais de 1 bilhão de usuários do Facebook. Acabei comentando algumas coisas sobre a importância desse "ativismo de sofá", que vou explorar um pouco melhor aqui.

O Impacto maior da Foto de Perfil
O primeiro ponto que acho que é importante é que pouca gente falou no impacto que a foto de perfil tem no processo de difusão de informações no Facebook. Isso porque a foto de perfil é uma informação pública por natureza. Ou seja, independentemente de seus settings de privacidade, sua foto de perfil é a informação mais pública que se tem. Qualquer pessoa que procurar por outra pessoa no Facebook verá sua foto de perfil. Se você instalar qualquer aplicativo que funciona via Facebook (joguinhos como Candy Crush, ferramentas como Swarm, enfim, qualquer coisa que use o Facebook login) vai mostrar sua foto de perfil para a rede que você tem lá. Qualquer comentário que você faça em outra ferramenta via Facebook login, mostra sua foto de perfil. Se você usar o Facebook chat, outro exemplo, lá estará sua foto para quem falar com você. Além disso, o algoritmo do Facebook privilegia a mudança de foto de perfil, tornando essa informação mais visível para sua rede. Então, a foto de perfil transita de modo diferente na rede. Ela tem muito mais impacto no processo de difusão de informações porque é muito mais visível do que qualquer outra informação que você publique lá (por isso, acho que não dá para comparar com posts, por exemplo). Ela "fura" muito mais os filtros do Facebook, circula mais livremente e atinge sim, uma rede muito mais distante do "ego" (ou seja, do ator central) do que outras informações. 

Isso é importante porque o Facebook tem uma estrutura mais clusterizada do que se imagina. O trabalho de Backstrom et al. (2011), por exemplo, encontrou a distância média entre dois usuários da ferramenta como sendo de 4,74 (4 conexões). Isso significa que, em média, você está separado de qualquer outro usuário do Facebook por até três pessoas. O estudo, que é baseado no popular trabalho do Milgram sobre seis graus de separação, mostrou que o site de rede social aproxima, sim, as pessoas. Na teoria, isso também daria ao Facebook um potencial de circular as informações muito mais rapidamente em sua rede, porque os nós estão mais próximos. Na prática, em geral, essa circulação é "desacelerada" pelos filtros de relevância. A exceção, aqui, seria a informação da foto de perfil, que tem mais visibilidade e transita mais pela ferramenta. Isso explicaria a velocidade da adoção da foto colorida e o fato de atingir 26 milhões em poucos dias. Como as pessoas estão mais próximas e a informação circula mais livremente, ela tem mais impacto na rede. Portanto, mais do que a "impressão" causada pelo algoritmo de concordância do Facebook, você teve a impressão porque sua rede mudou a foto, sim. E sua rede influenciou outras redes (o Malini, do Labic, falou em algo como mais de 320 mil tweets em poucas horas com a hashtag #LoveWins). 

graus.png
Imagem: Graus de separação

Ativismo de Sofá
Embora muita gente tenha criticado o "ativismo de sofá" de apenas mudar sua foto, como falei acima, essa é uma ação muito significativa, pois deu visibilidade sim para o apoio aos direitos LGBT, o que, em tempos de intolerância, é muito importante. Outro ponto relevante é que muitas pessoas famosas, celebridades, políticos, órgãos governamentais e etc. também apoiaram de forma explícita o movimento. Isso tem um impacto muito grande nas demais pessoas, pois mostra um discurso oposto ao que tem sido majoritariamente divulgado em muitos espaços (especialmente no Brasil). Neste caso, de modo específico, a viralização do ativismo tem um impacto relevante, a meu ver, na sociedade, pois houve um apoio "pessoalizado".  E esse apoio pessoalizado, público, parece-me relevante.

26 milhões... é pouco?
Na verdade, todos os números de usuários do Facebook (e de qualquer outra ferramenta) são geralmente baseados em MAU (monthly active users), ou seja, número de usuários ativos no mês (1,5 bilhão). Isso significa que um "usuário ativo" é considerado qualquer pessoa que logou na ferramenta (inclusive usando um aplicativo de terceiro) uma única vez durante o mês. Isso significa que, na verdade, o número de usuários que passa pela ferramenta diariamente não é nem perto do mais de 1 bilhão de usuários. Em fenômenos localizados como este, isso é bastante importante, porque a tendência na mídia social é um menor movimento durante o final de semana (vejam que eu falei que "Celebrate Pride" começou na sexta-feira). O único número de DAU (daily active users/usuários ativos por dia) do Facebook que eu encontrei é este aqui - 800 milhões. De novo, isso significa que em média, até 800 mi de pessoas utilizam o login do Facebook em um dado dia. No final de semana, provavelmente, esse número seja bem menor. Além disso, temos todos os limites de ação que impedem as pessoas de tomar partido de movimentos como esse, tal como "não entrar na modinha", não querer participar de um experimento do Facebook, manifestar apoio na timeline, mas não mudar a foto e etc. Finalmente, tem a questão do fuso horário, que também influencia a difusão de informações. Assim, se um movimento do tipo atinge seu ápice num horário onde a rede está morta em outro lado do mundo, há uma tendência a essa difusão estar reduzida naquela localidade.  Por isso, considero que 26 milhões em apenas 3 dias é, sim, um número considerável. 

Enfim, acredito que este foi um fenômeno bastante relevante de viralização e que salienta a importância da foto de perfil como informação e como informação que circula de modo diferente na rede. Seria muito interessante se o Facebook divulgasse a geolocalização dos números, para que pudéssemos ver se há outras influências (como fuso horário, por exemplo) e o próprio processo de difusão das imagens. De qualquer modo, suspeito que o Facebook Data Science Team deva divulgar alguma coisa sobre esse movimento (uma vez que apenas eles têm esses dados, que são absolutamente fechados p/ outros pesquisadores. Algumas matérias já estão, inclusive, especulando sobre isso.).