5 e 6/11 – ESPM SÃO PAULO
Dados linguísticos com Twitter e R
Nesta atividade, facilitada pelos linguistas computacionais Agnes Sofia Guimarães e Rodrigo Esteves, participantes aprenderam como descobrir o alinhamento político de parlamentares a partir da análise de seus tweets e das bolhas de engajamento que mobilizam no Twitter.
O Twitter é uma plataforma especialmente interessante para análise. Ele oferece uma API limitada, mas acessível a quem tem conta na rede social, o que facilita a utilização dos dados. Pesquisadores acadêmicos podem solicitar acesso diferenciado à API, com um limite maior, ampliando o conjunto de dados para estudo. Outra vantagem é que, por restringir os tweets a poucos caracteres, a rede social torna mais objetiva a análise semântica do discurso.
E, para trabalhar esse material, há um pacote específico disponível na linguagem de programação R, o rtweet. Utilizando esta ferramenta no ambiente de desenvolvimento RStudio, Agnes e Rodrigo deram início ao workshop mostrando como acessar a API e fazer requisições básicas, como coletar dados de tendências internacionais, nacionais e locais.
Em uma segunda etapa, os participantes aprenderam a buscar usuários que postam sobre determinado tópico pesquisando por tweets que contêm palavras específicas. Nesses primeiros exercícios, alguns conceitos de programação em R também foram relembrados.
Os instrutores mostraram ainda como extrair os tweets de um único perfil e analisar sua frequência mensal de postagens. Para isso, utilizaram como exemplo as contas da senadora eleita Damares Alves (REP-DF) e da deputada federal Tereza Cristina (PP-MS). Investigando os aspectos semânticos de suas publicações, os participantes analisaram a matriz de palavras que as parlamentares usam, em especial palavras usadas em conjunto e quais verbetes Damares e Tereza Cristina relacionam ao citar o termo “Brasil”.
Apontamentos sobre como expor as informações obtidas, criando gráficos de barra, de bolhas e de redes, além de como melhorá-los, foram tópicos transversais da atividade. Durante todo workshop, os participantes foram instigados a refletirem sobre os dados coletados, as relações criadas e o que eles indicam sobre o que as parlamentares pensam e como se articulam.
AGNES SOFIA GUIMARÃES CRUZ
Jornalista, pesquisadora e educadora. É mestre em Comunicação pela UNESP e doutoranda em Linguística Aplicada pela UNICAMP, em pesquisa sobre Ativismo de Dados e Justiça Reprodutiva com o apoio da CAPES. Foi repórter de dados da Gênero e participou da equipe de comunicação do UNFPA/ONU. Atua como consultora de comunicação para projetos de direitos humanos e orientado por dados e, nas horas vagas, escreve sobre gênero, raça, dados e cibercultura na sua newsletter Filo.
Rodrigo Esteves de Lima-Lopes
Rodrigo Esteves de Lima Lopes é linguista, tradutor e comunicólogo, Livre-Docente em Linguagem e Tecnologia e Doutor em Linguística Aplicada pela UNICAMP onde trabalha. É bolsista produtividade do CNPq, sendo que seus interesses de pesquisa incluem Humanidades Digitais, Linguística do Corpus, Linguística Sistêmico-Funcional, ativismo e letramento de dados.
REALIZAÇÃO
DESENVOLVIDO COM
APOIO
Nosso conteúdo está disponível sob a licença Creative Commons Atribuição 4.0 Internacional, e pode ser compartilhado e reutilizado para trabalhos derivados, desde que citada a fonte.