31/10 A 3/11 – ONLINE
5 e 6/11 – ESPM SÃO PAULO

Dados linguísticos com Twitter e R

DIA:
06/11

HORÁRIO:
11:00h

DURAÇÃO:
1:30h

Sala:
C504

Nível:
Básico

Sobre o workshop

Nesta atividade, facilitada pelos linguistas computacionais Agnes Sofia Guimarães e Rodrigo Esteves, participantes aprenderam como descobrir o alinhamento político de parlamentares a partir da análise de seus tweets e das bolhas de engajamento que mobilizam no Twitter.

O Twitter é uma plataforma especialmente interessante para análise. Ele oferece uma API limitada, mas acessível a quem tem conta na rede social, o que facilita a utilização dos dados. Pesquisadores acadêmicos podem solicitar acesso diferenciado à API, com um limite maior, ampliando o conjunto de dados para estudo. Outra vantagem é que, por restringir os tweets a poucos caracteres, a rede social torna mais objetiva a análise semântica do discurso. 

E, para trabalhar esse material, há um pacote específico disponível na linguagem de programação R, o rtweet. Utilizando esta ferramenta no ambiente de desenvolvimento RStudio, Agnes e Rodrigo deram início ao workshop mostrando como acessar a API e fazer requisições básicas, como coletar dados de tendências internacionais, nacionais e locais. 

Em uma segunda etapa, os participantes aprenderam a buscar usuários que postam sobre determinado tópico pesquisando por tweets que contêm palavras específicas. Nesses primeiros exercícios, alguns conceitos de programação em R também foram relembrados. 

Os instrutores mostraram ainda como extrair os tweets de um único perfil e analisar sua frequência mensal de postagens. Para isso, utilizaram como exemplo as contas da senadora eleita Damares Alves (REP-DF) e da deputada federal Tereza Cristina (PP-MS). Investigando os aspectos semânticos de suas publicações, os participantes analisaram a matriz de palavras que as parlamentares usam, em especial palavras usadas em conjunto e quais verbetes Damares e Tereza Cristina relacionam ao citar o termo “Brasil”. 

Apontamentos sobre como expor as informações obtidas, criando gráficos de barra, de bolhas e de redes, além de como melhorá-los, foram tópicos transversais da atividade. Durante todo workshop, os participantes foram instigados a refletirem sobre os dados coletados, as relações criadas e o que eles indicam sobre o que as parlamentares pensam e como se articulam.

Referências da atividade

agnes_serenas

AGNES SOFIA GUIMARÃES CRUZ

Jornalista, pesquisadora e educadora. É mestre em Comunicação pela UNESP e doutoranda em Linguística Aplicada pela UNICAMP, em pesquisa sobre Ativismo de Dados e Justiça Reprodutiva com o apoio da CAPES. Foi repórter de dados da Gênero e participou da equipe de comunicação do UNFPA/ONU. Atua como consultora de comunicação para projetos de direitos humanos e orientado por dados e, nas horas vagas, escreve sobre gênero, raça, dados e cibercultura na sua newsletter Filo.

rodrigoesteves

Rodrigo Esteves de Lima-Lopes

Rodrigo Esteves de Lima Lopes é linguista, tradutor e comunicólogo, Livre-Docente em Linguagem e Tecnologia e Doutor em Linguística Aplicada pela UNICAMP onde trabalha. É bolsista produtividade do CNPq, sendo que seus interesses de pesquisa incluem Humanidades Digitais, Linguística do Corpus, Linguística Sistêmico-Funcional, ativismo e letramento de dados.

REALIZAÇÃO

DESENVOLVIDO COM

APOIO

Visite os sites das edições anteriores: 20162017201820192020 e 2021.

Nosso conteúdo está disponível sob a licença Creative Commons Atribuição 4.0 Internacional, e pode ser compartilhado e reutilizado para trabalhos derivados, desde que citada a fonte.