18 e 19/11 – ESPM SÃO PAULO (CAMPUS ÁLVARO ALVIM)
R. DR. ÁLVARO ALVIM, 123 – VILA MARIANA
Inteligência Artificial e OSINT para investigar fake news no YouTube e Telegram
DIA:
19/11
HORÁRIO:
09:30h
DURAÇÃO:
1:30h
Nível:
Intermediário
Sobre o workshop
Texto por Natália Leão
A DFRLab é uma organização ligada à The Atlantic Council, startup norte-americana no campo das relações internacionais. O grupo é baseado nos pilares de democracia, segurança e tecnologia, e tem o objetivo de identificar narrativas de desinformação, expor notícias falsas, documentar violações dos direitos humanos e construir resiliência digital ao redor do mundo. No workshop, os jornalistas Beatriz Farrugia, Daniel Suárez Pérez e Esteban Ponce de León ensinaram como identificar narrativas no Telegram e no YouTube.
A primeira parte da atividade focou em analisar as narrativas em grupos no Telegram. Por meio de código em Python, o grupo de jornalistas criou um script a partir do Telegram Tracker, um pacote da API do aplicativo que gera arquivos JSON com dados dos canais na plataforma, incluindo mensagens e postagens. O canal escolhido para a análise foi o “VanLiberdadeOficial”, grupo bolsonarista nas redes sociais. Vale ressaltar que para utilizar o Telegram Tracker, é necessário fazer um cadastro no aplicativo e o passo a passo também está no código utilizado no workshop.
Como o objetivo era analisar os dados para resgatar históricos e identificar padrões de narrativas, o grupo também ensinou como usar um modelo de aprendizado de máquina, o Processamento de Linguagem Natural (NLP, na sigla em inglês), para classificar de forma automática os temas das mensagens enviadas no canal do Telegram escolhido. Para essa tarefa, foi utilizado o modelo de código aberto chamado “Maritaca”. O grupo informou que, caso os participantes desejassem usar o ChatGPT, também seria possível – mas com um custo.
A segunda parte do workshop tinha como objetivo identificar vídeos no YouTube que possuem algum termo específico no título. Outros parâmetros foram utilizados nessa coleta como, por exemplo, a data de publicação do conteúdo. Por meio de outro código, o grupo ensinou como identificar os engajamentos na publicação e comentários registrados na plataforma.
Diferente do primeiro código de coleta, que usou Python, a segunda coleta utilizou o Google App Script, uma extensão no próprio Planilhas Google para inserção de código. Ao ativar essa extensão, é possível adicionar o código compartilhado pelos instrutores e conectar o conteúdo com a tabela. Para as orientações funcionarem é necessário identificar, na aba “Serviço” do App Script, o aplicativo que se pretende conectar (YouTube Data API v3).
Referências
Inteligência Artificial e OSINT para investigar fake news no YouTube e Telegram
Código em Python utilizado (Telegram)
Pré-requisitos da atividade
Conta do Google, para o uso de Google Colab e API do YouTube. Também será necessário acesso à API do Telegram: basta preencher um formulário e se autenticar em: https://my.telegram.org/auth
BEATRIZ FARRUGIA
Pesquisadora associada no Brasil do Digital Forensic Research Lab (DFRLab), jornalista de dados e professora universitária. Tem mais de 10 anos de experiência como repórter e editora em veículos de imprensa do Brasil e do exterior, com passagens e colaborações com a agência ANSA, Brazilian Report e Estadão. É coautora do livro 1950: O Preço de Uma Copa e fundadora do site “O Preço de Uma Copa” (www.oprecodeumacopa.com), que publica dados sobre as edições da Copa do Mundo no Brasil de 1950 e 2014.
DANIEL SUÁREZ PÉREZ
Pesquisador associado para a América Latina do Digital Forensic Research Lab (DFRLab). Como jornalista colombiano, Daniel tem experiência em pesquisas de conflito armado e projetos de jornalismo que investigam a violência contra lideranças locais e comunidades na América Latina. Daniel trabalha em colaboração com organizações para promover o jornalismo de dados e empoderar mulheres na imprensa, como Chicas Poderosas, Hacks/Hackers e School of Data.
ESTEBAN PONCE DE LEÓN
Pesquisador associado na Colômbia do Digital Forensic Research Lab (DFRLab). Esteban já atuou como cientista de dados e é apaixonado por deep learning, inteligência artificial e pesquisas digitais. Sua área de atuação é desinformação na América Latina, assim como o desenvolvimento de ferramentas de código aberto e métodos de pesquisa.
Nosso conteúdo está disponível sob a licença Creative Commons Atribuição 4.0 Internacional, e pode ser compartilhado e reutilizado para trabalhos derivados, desde que citada a fonte.