Conversações sobre a "baleia azul" no Twitter


É bastante interessante verificar como a população do Twitter, atualmente constituída em larga escala por gente muito jovem comentou o caso da "baleia azul" nos últimos 15 dias de abril. Embora os primeiros tweets que fazem menção ao "jogo" começam ainda em no início do mês e se propagam por todo o mês, aumentando a frequência. O total gira em torno de quase 300 mil tweets de 280 mil contas diferentes. No primeiro grafo, a seguir, vemos o conjunto de dados. As cores representam módulos (grupos), provavelmente em torno de usuários que retuitaram as mesmas pessoas. Entretanto, não há nós centrais que receberam ou propagaram uma grande quantidade de tweets, ainda há poucos tweets por usuário. De modo geral, os grupos giram em torno de piadas que foram repassadas por grupos específicos. Há um grande cluster ao centro do grafo, que também mostra a viralidade e a amplificação do assunto junto ao público.

baleiaazul4.png
(Figura 1: Tweets e contas e suas relações.)

Quando observamos os conceitos mais usados e suas relações, é possível ver a forte associação entre a série "13 reasons why", do Netflix (em rosa forte, abaixo a direita). Também vemos um tema muito frequente, que é associado ao grupo rosa. Nesse grupo, vemos tweets comentando que as mães acreditavam que estavam "jogando" o perguntavam sobre isso. Nos grupos marrom e verde claro, vemos as associações entre o tratamento recebido pelos jovens com relação aos seus problemas ("ironia" e "preocupação", "fase" e "dificuldades"). Os grupos azul escuro, laranja e bege fazem menção à piadas feitas com a "baleia azul" (Reforma de previdência, vaca amarela e etc.) Também h. É interessante observar, entretanto, que o conceito "depressão" e de outras doenças não aparece entre os conceitos mais utilizados. Ou seja, há piadas, mas há comentários críticos e há muito muitas críticas dos jovens ao modo como os adultos abordam seus problemas.

baleiaazul2.png
(Figura 2: Principais conceitos associados)

A Nova Vinheta da Globeleza e o Discurso no Twitter


Eu não sou uma pessoa muito carnavalesca, mas um dos assuntos da semana na internet foi a nova vinheta da Rede Globo para o Carnaval. Tradicionalmente, essa vinheta apresenta uma mulher negra nua (ou semi nua) sambando, chamada popularmente de "globeleza", às vezes acompanhada, às vezes sozinha. Entretanto, este ano, a vinheta apareceu diferente. Não apenas a globeleza aparece vestida, como ainda em seu figurino apresenta representação do Carnaval das várias regiões do Brasil (veja o vídeo). A vinheta gerou polêmica na mídia social. Capturei uma parte das várias mensagens sobre o assunto através da palavra-chave "globeleza". Foram cerca de 25 mil tweets e 20 mil contas que atuaram na rede. Meu objetivo aqui era analisar, através de um combo de análise de contingência e análise de redes, quais argumentos foram mais centrais na discussão.

Vou discutir neste post apenas os grafos. Os dados brutos vão ficar para um possível artigo. No grafo a seguir (clique para ver em tamanho maior), vemos os principais conceitos associados (co-ocorrência) na discussão (tomando como unidade o tweet). As cores indicam tendência a co-ocorrer (ou seja, dos conceitos a pertencerem a um mesmo grupo) e o tamanho dos conceitos indica sua frequencia de associação no conjunto de dados.

globeleza2.png
Há quatro conceitos centrais: "globeleza", "roupa", "nudez" e "globo". Esses quatro conceitos representam o cerne da discussão, ou seja, a maior parte da conversação girou em torno do fato da globeleza estar vestida. As co-ocorrências mais comuns neste cluster rosa aparecem acima, a direita. Ali vemos os conceitos "mulher", "Brasil", "vinheta"e "cultura". Em meio a este cluster, vemos também o conceito "corpo"e "exposição". O debate, assim, esteve centrado também na questão do corpo da mulher, associado à uma questão cultural no Brasil. À esquerda, outro conceito importante é "carnaval". Nesse grupo rosa, vemos também principalmente conceitos associados à "gostei", "amei" e "adorei". É interessante notar, entretanto, que embora a maioria dos conceitos associados seja positivo, há também conceitos negativos associados a "politicamente" e "correto", "conservadorismo", "direita" e etc. Também é interessante observar que o termo "mulata" é o único associado neste grupo. Poderíamos dizer que este cluster sumariza os argumentos favoráveis à mudança da maioria dos tweets (gostaram da mudança da mulher de roupa, sem "exposição" do "corpo"; ou reclamaram da vinheta como um exemplo de "conservadorismo" argumentando que a mulher sem roupa é "cultura" do "carnaval"). No grupo azul, temos a questão ativista. Ali, por exemplo, vemos a palavra "negra"  como central, ou seja, associando a vinheta à "objetificação", "sexualização" da mulher negra (inclusive com um "temer" ali no meio que não vi como entrou na discussão). O grupo verde, do outro lado, associou a nova vinheta à representação e ao folclore do Brasil. Esses dois grupos representam posicionamentos positivos em torno da vinheta. Os posicionamentos negativos são representados pelo grupo laranja (associando a nova vinheta ao "bela", "recatada" como um discurso conservador, exigindo outros tipos de mulheres na vinheta) e o grupo vermelho ("símbolo" e "chatice", associando a nova vinheta também ao conservadorismo).

globelezamod2.png
No grafo anterior (clique na imagem para ver em tamanho maior), observamos os dados normalizados, para apresentar de modo mais claro as diversas associações que mais circularam. Há argumentos negativos grupos amarelo, rosa claro, laranja, verde musgo e rosa) e positivos (azul, verde escuro, verde bandeira, vermelho, azul claro, azul escuro e rosa escuro). De modo geral, entretanto, como vimos no primeiro grafo, embora tenhamos uma pluralidade de argumentos (indicando a polêmica e o debate), há uma predominância de um discurso positivo com relação à vinheta em si. É interessante acompanhar esta polêmica para ver se esta predominância se mantém, mas achei bastante interessante a presença do discurso ativista contra a objetificação da mulher negra que, no grafo geral, praticamente desaparece, em detrimento de elogios associados à presença da roupa (portanto, mais conservadores).

2017 - Projetos


2016 foi um ano intenso pra mim. Muitas coisas aconteceram e eu acabei tendo outras prioridades e não consegui manter o blog atualizado com coisas que estivesse pesquisando no momento. Vou tentar levar mais adiante o blog este ano e também recolocar no ar o blog do MIDIARS, que por conta de algumas (outras) mudanças, perdeu seu servidor. Dentre os projetos que estou trabalhando este ano: 

  • Projeto "O Discurso de Gênero na Mídia Social: Mapeamento da Violência contra as Mulheres no Twitter"- Faz algum tempo que o pessoal do MIDIARS vem estudando a questão do discurso de gênero e a violência simbólica. Ao "apagar das luzes" de 2016, recebemos a notícia de que tínhamos (finalmente) sido contemplados no Edital Universal do CNPq e que receberíamos uma verba importante para prosseguir com este trabalho. Essa verba não tem data para chegar, pois o CNPq ainda não entrou em contato, mas espero que chegue um dia e que nos permita fazer esse mapeamento. A questão do discurso de gênero será uma das mais centrais.
  • Projeto Discurso Político e Mídia Social - Este é o segundo projeto que também quero tocar este ano, dando continuidade ao que vínhamos trabalhando no MIDIARS no último ano. O foco aqui é observar como o discurso político reverbera e como pode moldar o voto através da mídia social.
  • Livro introdutório sobre análise de redes sociais - Este é outro projeto que deve sair este ano. O livro será especificamente um estilo de "manual", sintético, para ser usado em sala de aula e para o pessoal da UFBA. Vamos ver se vai sair conforme o planejado.
  • Disciplina de Métodos de Pesquisa para Internet na UFRGS - Este ano também vou dar a disciplina de métodos de pesquisa, mas com métodos específicos e adaptados para objetos online no PPGCOM/UFRGS. Será uma disciplina em caráter concentrado, ou seja, em poucos, mas intensos, dias.
  • Grupo de Pesquisa MIDIARS - Devo começar as atividades do grupo em Porto Alegre e possivelmente vamos mudar de "casa" aqui em Pelotas. Depois falarei mais sobre isso.

#PokemonGoVemProBR: Uma rede ativista


Hoje de manhã estava crawleando algumas coisas e peguei a rede da hashtag #PokemonGoVemProBR, que estava em primeiro lugar nos TTs do Twitter. Na hora, cerca de 34 mil tweets (em torno de 10:30 da manhã). Capturei em torno de 25 mil. O que é interessante, nesta rede, é que ela tem todas as características das redes de ativismo que vimos online em vários momentos (incluindo eleições): Redes densas, com graus de entrada e saída bastante elevados (indicando usuários que repetem várias vezes a hashtag ao longo do dia - média de 4,98 no grau de entrada e 3 no de saída). Além disso, é uma rede com poucos grupos e bastante clusterizada (vide o cluster central, bastante interconectado). 

grafointeiroindegreemod.png
Rede delimitada por módulos (cores) e grau de entrada (tamanho dos nós). Clique para ver a imagem em tamanho maior.



nucleografoindegreemod.png
Esses dados indicam que há uma nuvem de nós retuitando e citando outros nós (notadamente @nianticlabs e @pokemongoapp, vide grafo a seguir), tentando fazer a mensagem chegar ao destino. Esse cluster central de pessoas que se citam entre si e referenciam os tweets umas das outras é bastante semelhante ao que temos (o Midiars) observando com redes ativistas. E é relevante observar que as estratégias para ganhar visibilidade são muito semelhantes, o que vai mostrando como o Twitter é um espaço de "voz" por excelência, onde os usuários utilizam a rede como forma de mobilização, seja em torno de um game, seja em torno de um protesto.

NODEXL para estudos de Mídia Social: Vantagens e Desvantagens


iie2011.pngComo quem acompanha o blog aqui deve saber, eu sou fã do NodeXL para trabalhar com análise de redes e mídia social, especialmente para quem está começando. Como todo mundo me pergunta isso toda hora, aqui vai um inventário rápido das vantagens e desvantagens da ferramenta do meu ponto de vista. O NodeXL costumava ter uma única versão, gratuita. Entretanto, por uma série de questões de suporte, o time acabou tendo que criar uma versão simples gratuita e quase todas as ferramentas legais ficaram disponíveis apenas na versão PRO. Ainda assim, considero que é uma ferramenta com várias vantagens. 


Vantagens:

  • Como o Node tem uma interface criada em cima do Excel, é bem mais familiar ao usuário de Windows e muitas das coisas que você precisa ficam claramente demarcadas. Basicamente, o Node cria uma aba a mais em cima do Excel, que onde ficam os seus comandos e permite a interação com os comandos do Excel, o que facilita bastante a vida e reduz muito a curva de aprendizado da ferramenta.
  • Outra boa vantagem do Node é a possibilidade de análise semântica conjunta com a análise de redes, ou seja, o programa permite que você analise também o conteúdo do material que coletou, e tem vários filtros que podem ajudar a ter uma visão mais contextual dos dados. Essa vantagem, entretanto, só está disponível na versão PRO.
  • A principal vantagem do NodeXL, na minha opinião, é que ele tem um crawler (parte do programa que faz a busca) embutido, que serve para Facebook, Youtube, Twitter e etc. A coleta de dados é uma das maiores dificuldades de quem trabalha com dados de mídia social e o fato do Node fazer essa coleta é uma grande mão na roda. Entretanto, é preciso atentar para alguns fatos:
          • No Twitter, o Node não acessa o streaming, mas a outra API (REST), o que faz com que sua busca só funcione para trás (para o passado). Ou seja, quando você está crawleando alguma coisa que está acontecendo agora, o Node vai coletando conforme o Twitter arquiva o material (do momento onde se iniciou a busca para trás) e não daquele momento em diante. Isso faz com que ele seja útil para coletar coisas durante ou após o acontecido e não coisas no futuro. É importante lembrar que o Twitter limita o acesso aos dados desta API(se não me engano, são 30 dias ou 20 mil tweets, o que vier primeiro) e limita em geral o acesso a mais ou menos 1% do volume de dados global . Portanto, se você quer coletar algo que aconteceu há muito tempo, não vai conseguir com o NodeXL. A possibilidade de coletar o passado é bem complicada e, em geral, a melhor opção neste caso é comprar os dados de alguma empresa (há várias que vendem dados, como a DataSift).
          • No Facebook, a possibilidade de coleta é limitadíssima pela própria ferramenta. Atualmente se consegue coletar automaticamente pouquíssima coisa, notadamente apenas dados de páginas e grupos abertos ou alguns dados de sua própria conta. Ainda assim, também há limites para volume de dados (embora não explicitamente, eu sempre encontro o limite quando crawleio grandes volumes).
  • Outra coisa bem útil é o modo como o NodeXL permite visualizar grupos (separados no grafo), que é muito bom para quem quer focar esse tipo de coisa na sua análise. Diria que essa é uma das features mais legais da ferramenta. Outros modos de visualização, com imagens e etc. também são bem legais.
  • Finalmente, o NodeXL também tem uma boa ferramenta de visualização dos grafos (não é um Gephi, mas ajuda bastante quem está iniciando e é bem simples de usar) e o fato da visualização e dos dados ficarem lado a lado na interface ajuda muito a compreender o que se está vendo, mesmo conhecendo pouco de análise de redes. Gosto muito do fato de poder ver os dados no grafo (você pode selecionar na imagem e ver no material dos dados o que está sendo representado ali).
export-nodexl.png
  • A grande vantagem da ferramenta é ter coleta e análise no mesmo lugar, concentrando uma série de coisas que, de outra sorte, você teria que usar vários softwares para conseguir resolver.

Desvantagens:

  • Como o Node roda em cima do Excel, ele é adequado para uma quantidade limitada de dados. Se você vai trabalhar com 80, 100 mil tweets, por exemplo, já vai ter problemas com o Node. O ideal para trabalhar com ele é ficar abaixo deste limite. Há estratégias para aumentar um pouquinho a memória do Excel, mas crashs serão frequentes.
  • O Node é capaz de auxiliar em análises bem complexas, mas a ferramenta de visualização roda com poucos algoritmos, não sendo comparável a outras ferramentas de visualização, como o Gephi. Mas considerando que você pode exportar os dados e utilizar outra ferramenta de visualização quando desejar, acho que é uma desvantagem bem pequena.
  • A ferramenta de análise semântica, embora sendo melhorada, também é limitada. Ela permite vários insights, mas não permite que você faça, por exemplo, uma análise de conteúdo automatizada com base em parâmetros escolhidos.
  • Limitações do crawler: Para ter acesso completo, sóna versão PRO.
  • Não funciona no OS X.

Portanto, o NodeXL é adequado para estudos de caso pontuais e focados, com questões com foco estrutural (por exemplo, relacionadas aos formatos da rede) na mídia social. É bastante fácil de usar se você já tem algumas noções básicas de análise de redes e compreender o que está visualizando e a análise que está criando.

Hello: O orkut 2.0


hello.pngSemana passada conversei com a reportagem da BBC Brasil sobre o Hello, novo site de rede social que está sendo lançado pelo Orkut, o mesmo cara que fez a popular ferramenta do Google (orkut). Com base na discussão com o repórter, pensei bastante sobre a ferramenta e decidi escrever algumas considerações aqui, levando em conta a minha experiência com o orkut (ferramenta). (Trabalhei pesquisando o orkut para o Google por vários anos e tive oportunidade de conversar bastante com o próprio criador sobre a criatura -Para fins de discussão, vou usar sempre Orkut - com maiúscula- como a pessoa; e orkut, com minúscula, como a ferramenta.) 

Um orkut melhorado
Fiquei com a impressão de que o Hello é, em parte, uma atualização da idéia central do orkut. A ferramenta, que nasceu como "Six Degrees" enquando ele trabalhava no Google, tinha como estrutura central a reunião de pessoas por interesses e hobbies. A idéia central das comunidades era servir como um espaço para pessoas com interesses semelhantes se encontrarem. Claro, essa idéia foi rapidamente modificada quando a ferramenta foi apropriada pelos usuários (algo que o próprio Orkut se ressentia um pouco) e virou um espaço de manifestação identitária (quem eu sou, do que eu gosto), de jogos/brincadeiras (quem, dentre os early users do orkut, não lembra da "Como ou não como" ou outras comunidades semelhantes?) e etc. Com o crescimento do site, a idéia de reunir pessoas com interesses semelhantes passou a ser secundária, existindo não mais como plano principal. Ao mesmo tempo, outras apropriações foram modificando mais o uso imaginado da ferramenta, como a gamificação das avaliações (no início do orkut, as pessoas eram avaliadas pelos amigos como "cool" (legal, que era representado por cubinhos de gelo), "sexy" (corações), e tinha "fãs" e etc. A brincadeira foi rapidamente apropriada pelos usuários e "bombada", servindo como fator motivador para convidar todo mundo que conheciam, com a promessa e a troca de que fossem bem avaliados por esses usuários. Originalmente, tinha até um top 10 de usuários em cada categoria. Claro,isso fez também com que as pessoas passassem a adicionar todo mundo (inclusive quem não conheciam) aos seus perfis, na tentativa de entrar na famigerada lista dos 10 mais e de se destacarem entre os amigos. Isso também contrariava a ideia original do Orkut, que era muito mais próxima de que as pessoas se apresentassem "verdadeiramente" e mostrassem realmente seus amigos.

Todo o projeto do orkut era muito interessante e revolucionário para a época, no universo dos sites de rede social. Além de um design infinitamente superior que seus concorrentes (na época, o Friendster principalmente) e fácil de ser compreendido pelos newbies, o orkut inovava permitindo que se navegasse pela rede social dos amigos, vendo quem era amigo de quem. As idéias centrais da ferramenta eram ótimas e, justamente por isso, ela explodiu rapidamente (o crescimento mais rápido no Brasil, entretanto, inibiu o crescimento em outros países, mas isso é assunto para outro post). Mas o crescimento do orkut também significou usos novos, apropriações inesperadas e para funções que não eram necessariamente aquelas pensadas pelo criador. E é fácil ver vários desses elementos na descrição do Hello (a questão do "amor", dos interesses, dos "ementos de gamificação" descritos pelo Orkut na reportagem da BBC e etc.). É interessante que quase todas essas idéias iniciais parecem estar presentes (talvez numa versão 2.0) no Hello. 

Desafios
Por conta disso, fico com a impressão de que o Hello é um novo orkut (o Orkut sempre detestou que o Google lançou a ferramenta com o seu nome), mas com um foco mais direcionado para a questão de encontrar outras pessoas e conhecer aqueles que têm interesses semelhantes aos seus. Embora quase todos os sites de rede social tenham flertado com essa proposta, nenhum conseguiu efetivamente concretizá-la direito equilibrando interação (que é a base do uso da ferramenta), conteúdo e interesses, formando "comunidades" e não apenas redes. Os valores constituídos foram sendo modificados: O Twitter, por exemplo, virou uma rede de conversação e informação(interação); o Facebook virou um espaço social (mas para socializar com quem você conhece, principalmente)(interação); o Instagram é conteúdo e interação etc. Mas aquelas ferramentas que conseguiram focar nos interesses comuns (Pinterest, por exemplo) acabaram perdendo no quesito interação (ou seja, são pouco "sociais"). Fico com a impressão, pela descrição do Hello, que ele terá como foco ser um espaço de comunidade virtual, mais do que de outras redes de pessoas pouco conhecidas. A comunidade é baseada na confiança, na interação e no interesse coletivo, além do compartilhamento. E construir esses valores em escala, hoje, é um grande desafio. 

Primeiro porque hoje há muito mais medo da exposição online (principalmente por culpa do Facebook) e as pessoas são mais cuidadosas nisso, reduzindo a interação a nichos mais privados (por exemplo, Whatsapp). Há uma preocupação para com a privacidade que não existia antes, que tende a fazer com que as pessoas se escondam mais para interagir. No tempo do orkut, a privacidade foi uma preocupação secundária, que só apareceu com força no seu declínio. Ou seja, será que o Hello vai conseguir inspirar as pessoas a compartilharem mais? Para isso, é preciso confiança no ambiente e confiança no grupo (ou seja, conseguir tornar a experiência no site positiva, retirando trolls e com uma política para o comportamento desviante, o que não é fácil - vejam que o Facebook até hoje não consegue aplicar essas políticas de modo global).

Outro desafio é a questão da confiança e da "verdade". A expectativa no Hello, nas palavras do Orkut é  "On Hello, I just want you to be you!" Necessariamente, as pessoas criam e utilizam máscaras nos sites de rede social. Essa é uma expectativa meio contraditória, porque há uma tendência a criar versões de si mesmo que não necessariamente são "reais". A questão da confiança só advém com a emergência de uma comunidade de suporte, o que é um estágio, digamos, avançado de capital social e de interação, que não pré-existe à ferramenta

Há espaço para outro site de rede social?
Depende do valor que essa ferramenta vai acrescentar para as pessoas em termos de capital social e como vai lidar com interação e interesse como motor principal. Se esses elementos forem interessantes e a apropriação representar valores que outras ferramentas não oferecem, é bem possível que roube usuários e tempo de outras ferramentas. A migração de usuários entre ferramentas diferentes já foi vista várias vezes na história dos sites de rede social. E com a migração de parte da rede, a rede inteira acaba também migrando. Veremos o que acontecerá quando o Hello for liberado para cá. Mas tenho a impressão de que, se a ferramenta conseguir focar efetivamente em "comunidades", há possibilidade.





Season Finale de Game of Thrones


Tenho acompanhado há algum tempo a movimentação na mídia social em geral com relação a produtos culturais e de modo específico, a série Game of Thrones. Ontem foi a season finale (último episódio da temporada) e, embora não siga a série na TV, tenho acompanhado o roteiro e as reações. O que me chamou a atenção nos dados que olhei hoje de manhã foi a questão da grande participação do Brasil nas discussões no Twitter. A imagem a seguir mostra a rede de mais de 100 mil tweets de ontem a noite, que utilizaram as hashtags #gameofthrones e #got. As cores representam a língua identificada nos tweets. Em azul temos o inglês, majoritário, o que era esperado. Em vermelho, temos, entretanto, o português. Achei interessante porque é um cluster bastante separado do restante (vejam o verde, que é espanhol, que aparece em bem menor escala e muito mais conectado ao cluster - grupo - azul) e bem demarcado (o que indica que as pessoas que tuítam em português tendem a retuitar quem também tuita em português em muito maior escala do que quem tuita em inglês). Os nós nomeados são aquelas contas com mais de 50 retweets, ou seja, contas que tiveram maior audiência e influência na discussão. O tamanho do nome indica a força dessa influência (indegree). 

gotlinguagem.png
(Clique na imagem para ver em tamanho maior.)

O segundo mapa embora bastante parecido, demarca a localização dos tweets por timezone. Fiz esse mapa para ver se havia alguma coincidência entre língua e localização (esperado). E realmente há. Vejam que, em azul, temos principalmente os tweets localizados na América do Norte (principalmente EUA) e, em vermelho, aqueles localizados na América do Sul (principalmente Brasil, mas também Argentina). Em verde, vemos a Europa e em cinza, tweets que não consegui localizar.

gotlocalizacao2.png
(Clique na imagem para ver em tamanho maior.)

Ainda estou olhando para esses dados (e observando os tweets, que é a parte que me interessa mais), mas acho interessante observar a relação de segunda tela com o Twitter e, de modo especial, a presença de um cluster de tweets do Brasil em português, bastante separado do cluster em inglês e bastante denso. Não sei se há essa separação porque há algo particular nos tweets em português que chama outros brasileiros a retuitarem (uma hipótese relacionada à cultura memética, por exemplo, do humor na internet por aqui) ou por questões relacionadas à própria língua (as pessoas entendem melhor o português, então dão preferência a este). Suspeito que seja um conjunto de ambos. De qualquer modo, os mapas mostram que há uma certa barreira entre os grupos, que somente é transposta com a ajuda de alguns grupos de usuários. Interessante investigar as razões disso e ver se há uma repetição deste padrão durante outros episódios da temporada.

** Dados acima coletados com o NodeXL, entre as 20h do dia 26 e as 07h do dia 27. Mapas gerados com o Gephi.

Discurso sobre Dilma no Twitter - 17/03


Como é de se esperar, dada a situação atual do País, há polvorosa em todos os sites de rede social e a política tornou-se uma pauta relevante para todos os atores. Estamos coletando os termos "Dilma" e "Lula" para entender um pouco melhor o impacto que esses debates online têm na situação e na construção dos discursos no País. Por ora, não consegui postar no blog do MIDIARS esses dados preliminares de ontem, mas acho que vale a pena compartilhar aqui. 

Esses dados são um recorte de 62.215 tweets e 47.337 atores que falaram sobre o assunto apenas hoje (17/03) pela manhã. Como nos mapas anteriores, sobre "Lula", vemos polarização, mas uma polarização mais difusa. Os dois principais grupos (em rosa e preto) convergem contas pró governo federal (preto) e contra o governo federal (rosa). É importante notar que nem todos os atores dentro de cada grupo necessariamente assumem uma posição pró ou contra, mas são retuitados principalmente em conjunto com contas que se posicionam desta forma. O grupo verde claro, mais difuso, representa principalmente reverberação da mídia internacional. Os grupos coloridos, abaixo, notadamente compreendem contas com retweets humorísticos. 

dilmanucleos1703menoszoom.png
No mapa a seguir podemos observar melhor os núcleos principais e as principais contas mencionadas. É possível ver a intersecção de contas humorísticas junto aos dois principais núcleos.

dilmanucleos1703.png
O que acho mais relevante, entretanto, são os discursos em torno da presidenta. O mapa a seguir mostra o que está sendo dito nos tweets de modo mais geral. Grupos de conceitos mais relevantemente associados aparecem da mesma cor. O tamanho do conceito indica sua frequencia nos dados. É importante notar como esses grupos aparecem conectados, formando nuvens de sentido e associações. Mantive hashtags e palavras de ordem. É interessante observar que há conjuntos de conceitos que são típicos de apoiadores e outros, de detratores do governo federal. Mas na maioria, o discurso em torno do governo e da presidenta é agressivo e negativo. É importante também notar a forte associação entre os discursos e  os termos "Dilma", "Lula" e "ministro". 

dilma1703discurso.png