Vire um Digital Sherlock: Investigue vídeos e identifique campanhas de desinformação nas redes sociais

SOBRE O WORKSHOP

Texto por Nayan Silva
Revisado pela Escola de Dados

 

Na era das redes sociais e das mídias digitais, um novo agente tem sido imprescindível para a disseminação em larga escala de conteúdos falsos no mundo digital: a inteligência artificial. Apesar de oferecer muitos benefícios e ajudar no desenvolvimento de projetos importantes, há também quem se utilize dessa tecnologia para propagar mentiras e conteúdos enganosos nas redes. Nos últimos anos, o termo fake news se popularizou para referir-se à propagação de informações falsas, sejam elas propositais ou não. Para combater essas ações danosas, foram criadas diversas agências do chamado “fact-checking”, que têm a missão de analisar conteúdos para compreender o que é verdade e o que é mentira no mundo digital.

No entanto, para além do simples repasse de informações falsas – muitas vezes feito de forma não proposital –, existe também um fenômeno entendido como “campanhas de desinformação e propaganda”, que compreendem ações conjuntas e/ou coordenadas com o objetivo de tirar proveito de alguém ou alguma situação. Foi pensando nisso que a Atlantic Council Digital Forense Research Lab (DFRLab), neste workshop ministrado pela jornalista e pesquisadora Beatriz Farrugia, desenvolveu uma técnica de investigação focada nessas campanhas para encontrar os períodos, os atores, as plataformas e os métodos utilizados, com o objetivo de expor essas ações maléficas para a sociedade.

 

 

Diferentemente do que é feito no fact-checking, em que a análise se concentra diretamente no fato apresentado para descobrir se ele é verdadeiro ou não, os trabalhos desenvolvidos pela DFRLab analisam todos os elementos que fazem com que a campanha de desinformação aconteça, cruzando dados como os IPs de computadores, a data de criação e publicação de conteúdos, e as contas que estão publicando/compartilhando essas informações.

Nesse processo, o primeiro passo apresentado foi a coleta de vídeos, que pode ser feita por meio de diversas plataformas. A primeira foi a Chrome Dev Tools, um conjunto de ferramentas integradas ao navegador para inspecionar qualquer página da web e que permite fazer download de arquivos de vídeo e metadados. A segunda foi a Pytube, uma biblioteca em Python usada para fazer download de vídeos do Youtube, e que permite fazer download de maneira automática, além de extrair informações específicas, como listas, títulos, URL do Thumbnail e metadados. Já a plataforma YT-DPL tem uma interface de linha de comando (command-line) para fazer download de vídeos e áudios de diferentes plataformas, sites e redes sociais (Youtube, TikTok, Facebook, sites de notícias, repositórios, games, dentre outros). Depois de fazer a coleta dos conteúdos, vem a análise. Para isso, duas plataformas foram apresentadas.

 

 

O Whisper é um modelo de aprendizado de máquina para reconhecimento de fala da OpenAI – empresa que gerencia o ChatGPT –, treinado em um grande conjunto de dados de áudio diversificados. Ele permite realizar reconhecimento de fala multilíngue, tradução de fala e identificação de idioma, além de fazer transcrições de vídeos baixados na web e em redes sociais. É possível salvar as transcrições em diferentes formatos para análises, como planilhas (CSV), áudio, legenda. Ele auxilia principalmente para que o tempo gasto na análise de vídeos longos seja diminuído com a transcrição do áudio.

A segunda plataforma foi a InVid, um kit aberto de ferramentas online, disponível também como plug-in, para análise de vídeos e fotos. Ela permite analisar vídeos e fotos, detectar edições e extrair metadados. Por meio dessa plataforma, é possível observar conteúdos publicados em páginas na internet, e assim identificar conteúdos falsos disparados em massa por diferentes contas nas redes sociais.

Com essas ferramentas, as análises podem compreender vídeos postados em datas idênticas ou próximas, vídeos patrocinados em uma ou mais plataformas por contas iguais, além de identificar as principais contas/perfis envolvidos, verificar quais assuntos estão sendo abordados nas campanhas e quem seriam as principais pessoas beneficiadas por elas. 

Dessa forma, é possível denunciar as ameaças e as campanhas para as plataformas, que poderão corrigir as vulnerabilidades exploradas, além de identificar e expor os atores envolvidos e suas táticas.

LOCAL

Laboratório 106

NÍVEL

Básico.

PRÉ-REQUISITOS

beatrizf

Beatriz Farrugia

Jornalista de dados e pesquisadora associada do DFRLab. Utiliza OSINT para investigações sobre desinformação, Info Ops, discurso de ódio e polarização política. Também atua com investigações sobre mega eventos esportivos. É coautora do livro “1950: O Preço de uma Copa” e fundadora do website “O Preço de uma Copa”, que divulga dados sobre os mundiais da FIFA no Brasil. Beatriz tem mestrado em jornalismo de dados pela Birmingham City University (BCU) e é professora da University of Derby, na Inglaterra.

Nosso conteúdo está disponível sob a licença Creative Commons Atribuição 4.0 Internacional, e pode ser compartilhado e reutilizado para trabalhos derivados, desde que citada a fonte.