#55 Desinformação, deepfake de áudio, OSINT e mais
Maio/2024
AGENDA
Oportunidades e prazos para não perder de vista
• 05/05 – Prazo para se inscrever no curso Introdução à Ciência de Dados, organizado pela Escola Nacional de Ciências Estatísticas (ENCE), do IBGE.
• 07/05 – Acontece o painel Deepfakes & Deep Election Troubles, organizado pela Fundação Mozilla.
• 08/05 – Prazo para se inscrever no curso Verificação e checagem de fatos nas eleições municipais – ênfase em Inteligência Artificial, organizado pela Associação Brasileira de Jornalismo Investigativo (Abraji).
• 09/05 – Acontece a palestra Research software as a key element of open science, com Prof. Daniel Katz, organizado pela Universidade de São Paulo (USP), com transmissão online pelo Youtube.
• 10/05 – Último dia para inscrever trabalhos na OSM Science 2024, trilha acadêmica dentro da State of the Map conference, híbrido em Nairobi – KE.
• 26/05 – Prazo para jornalistas investigativos experientes – freelancers ou de redação – se inscreverem no grupo da Ocean Reporting Network, do Pulitzer Center.
• 03 a 06/6 – Acontece o VIII International Seminar on Statistics with R AI in Data Science. Inscrições abertas para artigos e resumos.
• 17/06 – Prazo para envio de reportagens ambientais para o concurso da Society of Environmental Journalists.
• 27 a 29/06 – Acontece a Conferência Regional de Jornalismo de Dados e Métodos Digitais (CodaAM), em Belém-PA e Marajó-PA. Inscrições abertas.
• 11 a 14/07 – 19º Congresso Internacional de Jornalismo Investigativo da Abraji.
• 9 a 11/08 – Python Nordeste (PyNE), em Natal – RN. Inscrições abertas.
• 12 a 14/08 – Acontece a posit::conf(2024), em Seattle – WA.
• 18 e 19/09 – PyTorch Conference 2024, em San Francisco – CA.
• 16 a 21/10 – Python Brasil (PyBR), no Rio de Janeiro – RJ. Inscrições abertas.
NO MUNDO DOS DADOS
Notícias e discussões quentes
DESINFORMAÇÃO AINDA É UM TEMA QUENTE (E PREOCUPANTE)
Já faz alguns boletins que estamos conversando sobre desinformação e seus impactos. Em março, a Escola de Dados também realizou um webinar sobre o tema E se as redes que propagam desinformação já causaram danos graves à sociedade anteriormente, multiplique essa capacidade destrutiva com o uso da inteligência artificial. Em segundos, cria-se pornografia não consensual, conteúdo falso durante eleições e até promoção de produtos nas redes sociais usando a imagem não autorizada de celebridades, aponta Gerrit De Vynck em seu artigo ao Washington Post.
Em sua reportagem, Gerrit aponta que a qualidade de algumas imagens falsas é tão boa que é quase impossível distingui-las das reais. Um exemplo é o caso de um gerente financeiro de um banco de Hong Kong que transferiu cerca de $25,6 milhões para golpistas que se passavam pelos chefes do trabalhador em uma chamada de vídeo.

Uma imagem falsa gerada por IA da OpenAI, que fixa cinco pequenas caixas coloridas no canto inferior direito de
seu conteúdo de IA. (Fonte: Washington Post; OpenAI)
Para manter a esperança acesa, ele sinaliza que um grupo crescente de pesquisadores, acadêmicos e fundadores de startups estão trabalhando em maneiras de rastrear e rotular o conteúdo de IA. Eles acreditam que isso irá melhorar a capacidade do público de entender o que é verdadeiro e o que não é. Algumas das principais técnicas incluem a marca d’água em imagens de IA e a rotulagem de imagens reais. No entanto, essas soluções ainda têm suas limitações e desafios técnicos.
Além disso, empresas e organizações estão desenvolvendo softwares de detecção de deepfakes, baseados na tecnologia usada pelos geradores de imagens de IA. Algumas até com o objetivo de apoiar jornalistas, como é o caso da Proof News. Essas ferramentas podem destacar elementos que indicam que uma imagem é falsa, mas também enfrentam desafios contínuos de adaptação às mudanças na tecnologia de IA.
Em última análise, Gerrit alerta que mesmo que esses métodos sejam bem-sucedidos e as grandes empresas de tecnologia adotem plenamente essas soluções, as pessoas ainda precisarão ser críticas em relação ao que vêem online. Com eleições se aproximando em vários países, inclusive no Brasil, é crucial que o público seja alertado para não acreditar em tudo que vê e ouve.
SAIBA MAIS
Para aprender mais e aprender sempre
ANALISANDO DEEPFAKE DE ÁUDIO
Pensando em como lidar com deepfakes de áudio nas eleições do México e da Espanha, a jornalista Olalla Novoa, junto a sua equipe, criaram a ferramenta VerificAudio, voltada para jornalistas verificarem o áudio e detectarem deepfakes criados com vozes sintéticas em espanhol. A plataforma realiza a normalização e a preparação dos arquivos de áudio antes de aplicar algoritmos de machine learning e redes neurais para detecção de deepfakes.
A interface do VerificAudio permite que os jornalistas enviem arquivos de áudio suspeitos para análise. O sistema oferece dois modos de verificação: modo comparativo e modo de identificação. Os usuários recebem resultados que indicam se os áudios são do mesmo falante, de falantes diferentes ou se são sintéticos.
NOVAS FERRAMENTAS DE INVESTIGAÇÃO NO TELEGRAM
O serviço de mensagens multiplataforma Telegram ultrapassou recentemente 900 milhões de usuários ativos mensais e está a caminho de alcançar um bilhão antes do final de 2025. Embora seja uma fonte vital para informações, também se tornou um espaço para atividades ilícitas, grupos extremistas e desinformação. Para ajudar no processo de investigações, a jornalista Alexa van Sickle indicou as ferramentas mais recentes para utilizar na plataforma, como o TelepathyDB, que coleta e arquiva dados do Telegram, tornando-os pesquisáveis . Porém, ela alerta para tomar cuidado ao usar a plataforma, porque “o Telegram é moderado de forma muito leve, e há riscos de segurança e privacidade ao usar a plataforma.”
SNIPPETS
Dicas curtas e certeiras
Jesse McCrosky conduziu um estudo que analisa os riscos de decisões racistas em modelos de Large Language Model (LLM).
•
Silvio Lemos escreveu um tutorial sobre séries temporais utilizando tecnologias Google.
•
Disponível a live DataPusher+ – Towards Automagical Metadata, organizada pelo CKAN Association em março.
•
Authentic8 oferece acesso gratuito a Silo for Research – a sua plataforma de investigações digitais – para jornalistas, acadêmicos e grupos de ajuda humanitária e organizações sem fins lucrativos.
•
Jonathan Soma disponibilizou no seu canal no Youtube uma série de vídeos relacionados a IA Prática para Jornalismo Investigativo.
•
Nina da Hora e Silvandro Pedrozo escreveram o capítulo Beyond Algorithmic Bias, do livro MItigating Bias in Machine Learning, com pré-venda disponível.
INSPIRA
Trabalhos e iniciativas inovadoras para te inspirar
Se levantarmos as cidades, o que encontraremos embaixo? Se for no Recife, será o mar, mas se for no Canadá encontraremos rios. Em algumas cidades do Canadá, eles estão escondidos em um labirinto de túneis e tubulações de esgoto. “Será que vamos revivê-los ou deixar que os cursos d’água desapareçam da memória?” Esta é a pergunta que as jornalistas Jaela Bernstien e Emily Chung, da CBC News, fizeram e resolveram mostrar onde eles estão através de uma visualização maravilhosa.
Na imagem, visualização de onde os rios estavam embaixo da cidade de Toronto
Utilizando recursos de interações visuais, vídeos e fotos, as jornalistas contam a história de construção de algumas cidades, como Toronto, e como os rios estavam distribuídos antes e como eles estão agora. Neste caminho, elas também explicam o motivo deles estarem enterrados e os impactos que isso gera atualmente nas cidades.
NOVOS DADOS
Plataforma Fortaleza em Mapas conta agora com dados sobre edificações, incluindo a altura dos prédios.
•
Ibama cria a Plataforma de Acompanhamento da Recuperação Ambiental (Recooperar), com dados sobre áreas degradadas ou alteradas para desenvolvimento de projetos ambientais
•
Universidade Federal do Paraná (UFPR) lançou a plataforma IDE LAGEAMB, com dados de referência geoespaciais e seus metadados, incluindo especialmente dados do litoral do Paraná.
•
Ambiental Media lançou a Loja de Dados, disponibilizando de maneira gratuita dados e metadados ambientais tratados.
UPDATE
Atualize-se com as novidades de softwares e bases de dados
Metabase 4.9 inclui novas maneiras de personalizar a ferramenta, possibilidade de acrescentar dados a arquivos CSV já carregados, entre outros.
•
MapBiomas atualizou os dados dos módulos desmatamento, vegetação e fogo.