Julho/2023

AGENDA

Oportunidades e prazos para não perder de vista


01  a 03/08 – Minicurso de Jornalismo de Dados, gratuito e online, oferecido pelo Instituto Brasileiro de Ensino, Desenvolvimento e Pesquisa (IDP).

02/08 – O data_labe organiza uma edição carioca do Cerveja com Dados, na Maré, no Rio de Janeiro.

03/08 – Último dia para se inscrever no curso Jornalismo investigativo: da hipótese à construção da narrativa, oferecido pela Abraji com o apoio da Embaixada e Consulados dos Estados Unidos no Brasil. 

07 a 11/08 – Instituto Aaron Swartz oferece curso gratuito Desbravando Pandas.

15/08 – Prazo para inscrições e sugestões de atividades para a 8ª edição da Conferência Brasileira de Jornalismo de Dados e Métodos Digitais, Coda.Br. 

15 a 17/0814º Seminário de Proteção à Privacidade e aos Dados Pessoais, organizado pelo CGI.br e pelo NIC.br, será realizado na Amcham Brasil, em São Paulo.

• 18/08 – Último dia para votar na coordenadora da Escola de Dados, Jamile Santana, que concorre ao Troféu Mulher Imprensa na categoria Sudeste.

21/08 a 17/09 – Curso online “Jornalismo de Dados Avançado“, organizado pelo Knight Center for Journalism in the Americas.

31/08 a 02/09 – 2ª edição do Coda Amazônia, no Pará. 

17/09 a 20/09 – Período da posit::conf2023, oportunidade de integração da comunidade de ciência de dados. 

22/09 – Prazo limite para inscrever projetos relacionados a conhecimento livre na Wiki Movimento Brasil, com bolsas de até R$2500.  

30/09 – Prazo final para envio de sugestões de atividades para o NICAR24.

12/10News Impact Summit: Elevating Climate Journalism, do European Journalism Centre será realizado em Lisboa. 

17 a 18/10 – Data de realização da SRCCON 2023, conferência liderada por jornalistas que desejam transformar seu trabalho, suas organizações e suas comunidades.

07 a 09/11Festival de Datos em Punta del Este, no Uruguai.

06 a 10/1111º Congresso Nacional de Design da Informação, com trilha sobre visualização de dados.

18 e 19/11 – 8ª edição da Conferência Brasileira de Jornalismo de Dados e Métodos Digitais, Coda.Br, em São Paulo.

13 a 16/12Cultural Data Analytics Conference 2023, em Talís, na Estônia. 

NO MUNDO DOS DADOS

Notícias e discussões quentes


Desarmando a desinformação

A Associação Médicos pela Vida (MPV), condenada pela Justiça a pagar R$ 10 milhões por danos à saúde pública por promover medicamentos ineficazes contra a covid-19, agora promove desinformação científica, por meio do discurso antivacina. ​​A notícia foi revelada por Fabiana Cambricoli, na editoria de Saúde do Estadão, por meio de investigação feita em parceria com a equipe do podcast Ciência Suja, análise de dados de Álvaro Justen e colaboração de Natasha Madov. O processo de apuração da reportagem, produzida no contexto do programa Disarming Disinformation, do International Center for Journalists (ICFJ), contou com técnicas como transcrição de vídeos por meio de IA, sumarização de conteúdo e busca em plataforma própria (feita com PostgreSQL, Python e Django). Dados abertos do cadastro de empresas e sócios da Receita Federal disponíveis no Brasil.IO e a plataforma CruzaGrafos também possibilitaram encontrar as relações societárias.

Experiência pessoal versus estatística
Embora nossas experiências pessoais sirvam para informar nossas visões de mundo, não podemos contar somente com elas para compreender a sociedade na qual vivemos. Em artigo recente, Max Roser demonstra (e desenha!) os limites de nossa experiência pessoal – quantas pessoas conhecemos, qual a fração que isso representa em relação à quantidade de pessoas que existem no mundo? –,  e aponta a importância da estatística global para obter uma visão mais ampla e precisa da realidade. Roser nos lembra que a mídia é uma fonte de informação que oferece uma perspectiva limitada e fragmentada do mundo, focando em eventos incomuns ou poderosos e negligenciando questões diárias relevantes e a realidade de pessoas pobres e menos privilegiadas. Para uma visão mais completa de nosso mundo, ele defende o uso da estatística global e enfatiza a necessidade da valorização de uma compreensão estatística do mundo.

Os dados da população quilombola
Nesta semana, o IBGE divulgou dados do Censo 2022 sobre a população quilombola do Brasil. A notícia foi motivo de comemoração para alguns, com diversos mapas e visualizações sendo produzidos por diferentes veículos de imprensa, desde alternativos até os de maior porte. No entanto, para a pesquisadora Yasodara Córdova, especialista em ética de dados e privacidade, a divulgação de dados de populações históricas envolvidas em conflitos de terras, da maneira como foi feita, merecia mais cuidado. Ela criticou o desprezo pela privacidade e vulnerabilidade dessas populações e sinalizou que poderia haver má fé no cruzamento desses dados com outras bases para deanonimizar (identicar) a população quilombola, apontando a herança colonialista e racista da ciência e do estudo de políticas públicas.   

A IA do Google que escreve notícias

Sob o nome provisório de Genesis, o Google está testando uma ferramenta que usa inteligência artificial para escrever notícias. Segundo reportagem do New York Times, ela já foi oferecida para organizações de notícias como o próprio New York Times, o Washington Post e para a empresa que detém o Wall Street Journal, NewsCorp. Uma fonte anônima relatou ao jornal que o Google acredita que a Genesis servirá como uma espécie de assistente pessoal para jornalistas, automatizando algumas tarefas para liberar tempo para outras. Por outro lado, alguns executivos acharam a proposta inquietante, considerando que a ideia parece subestimar o esforço de produzir notícias precisas e engenhosas. O professor e comentarista de mídia Jeff Jarvis apontou vantagens e desvantagens: se ela puder oferecer informações factuais de forma precisa, então deve ser utilizada. No entanto, se for utilizada de forma indevida por jornalistas em assuntos que requeiram nuance e compreensão cultural, isso pode manchar a reputação tanto da Genesis quanto das organizações que a utilizam.

SAIBA MAIS

Para aprender mais e aprender sempre


Geo e cronolocalização com o BellingCat
Em junho, o fundador e diretor criativo do Bellingcat, Eliot Higgins, fez um webinar com o Sentinel Hub sobre o trabalho da organização e o campo mais amplo de OSINT (Open Source Intelligence, ou inteligência de fontes abertas). Neste mês, a apresentação foi disponibilizada no YouTube, e nela Higgins demonstrou como funciona a identificação de tempo e localização de eventos (geo e cronolocalização), explicando como estas operações podem envolver múltiplas fontes de informação disponíveis abertamente. Além da demonstração, há também uma seção de perguntas e respostas bastante pertinente ao campo de investigações abertas.

Acessando e tratando dados do DataSUS
O cientista de dados Téo Calvo fez uma coleção em sua Twitch para ajudar as pessoas que trabalham com pesquisa científica a ter os dados do DataSUS. Ao vivo, ele iniciou um processo de coleta e organização dos dados do sistema, para futura disponibilização em um datalake. Segundo ele, cientistas, analistas e qualquer outra pessoa pesquisadora poderão usar esses dados para realizar suas análises, publicações de artigos e assim por diante. No último mês, Calvo também iniciou uma coleção de Introdução à Programação com Python.

Jornalismo de dados no dia a dia das redações

Foi o tema de uma das conversas do 5º Fórum de Jornalismo Especializado, Regional e Comunitário, que contou com a presença da coordenadora da Escola de Dados Jamile Santana. A atividade contou também com a participação de Guilherme Fellitti, jornalista e co-fundador da Novelo Data, e Renata Tomaz, jornalista e professora da Escola de Comunicação, Mídia e Informação da Fundação Getulio Vargas (FGV ECMI). Além dessa conversa, o evento contou com um painel sobre filtros e algoritmos e outro sobre fact-checking para redações com poucos recursos humanos ou financeiros. O encontro foi transmitido ao vivo no YouTube e você também pode ler um breve resumo das atividades.

SNIPPETS

Dicas curtas e certeiras


Jonathan Soma, Lucas Thaynan e Cindy Damasceno disponibilizaram o material sobre Inteligência Artificial usado em suas oficinas na conferência da ABRAJI.

A Global Investigative Journalism Network publicou, na coleção Forbidden Stories, o Projeto Bruno e Dom, a fim de retomar e valorizar o trabalho de expor atividades ilegais nas fronteiras do Brasil, Peru e Colômbia, que vinha sendo desenvolvido por Bruno Pereira e Dom Phillips antes de seus assassinatos em 2022.

Raphael Saldanha criou o Quem Trabalha Aqui, uma aplicação para pesquisar informações sobre agentes de unidades de saúde, tais como nome, vínculo e carga horária.

Amanda Maia traduziu para português o ebook “Jornalismo de Dados: um guia rápido”, de Paul Bradshaw.

O Curso-R fez uma live explicando como configurar o VSCode para programar na linguagem R.

Jessica Temporal lançou o “Grande microlivro de Git”, um ebook sobre conceitos do dia-a-dia e introdutórios, ou fundamentais, de Git.

Jade Drummond explica como funciona o Legislatech, nova ferramenta do Núcleo Jornalismo, que opera no monitoramento da atividade legislativa. 

Bellingcat mostra como funciona a ferramenta Eyes on Russia Map, a partir do monitoramento de 500 dias da guerra entre Rússia e Ucrânia.

Laura Dixon e Maxime Domegni contaram os sete aprendizados mais importantes da CIJ Summer Investigative Journalism Conference 2023. 

Sharon Machlis, da InfoWorld, ensina como usar GPT e SQL sem fornecer dados confidenciais. 

Lisa Charlotte Muth, da Datawrapper, ensina como destacar o que você deseja que seus leitores vejam usando as cores.
Todas as gravações das atividades da JupyterCon 2023 estão disponíveis.

INSPIRA

Trabalhos e iniciativas inovadoras para te inspirar


Com dados do Strava, um aplicativo de monitoramento de atividades físicas, e imagens de satélite do Google Earth, o New York Times reproduziu os tempos de ciclistas amadores e profissionais no Tour de France. A competição anual de ciclismo de estrada realizada na França aconteceu de 1 a 23 de julho, e embora amadores e profissionais não compitam na mesma categoria, o jornal utilizou os dados do aplicativo para comparar o quanto profissionais são mais rápidos do que o resto de nós. Além de visualizações divertidas, a matéria também mostrou a distribuição dos tempos para completar diferentes provas da competição.

NOVOS DADOS

Conjuntos de dados e plataformas publicados recentemente


Dados detalhados sobre beneficiários do Novo Bolsa Família, divulgado pelo Portal da Transparência da Controladoria-Geral da União (CGU).  

FIquem Sabendo em parceria com Muckrock, liberaram os dados de gastos do cartão corporativo da vice-presidência no período de Hamilton Mourão (2019-2022).

O Projeto Achados e Pedidos, realizado pela Transparência Brasil e Abraji, disponibilizou dados detalhados das emendas parlamentares individuais, enviadas pela Câmara dos Deputados. 

UPDATE

Atualize-se com as novidades de softwares e bases de dados


A OpenAI disponibiliza via API a utilização do GPT-4.

Disponível o Visual Studio Code for Education no GitHub Education. 

Frictionless2md 1.0 melhorou o gerenciamento de arquivos temporários, adicionou verificação de requisitos e a opção mention. 

Open Refine 3.7.4 muitas funcionalidades utilizando Wikibase, maioria da tradução disponível na interface do usuário, Excel pode importar todos os dados como texto, dentre outros. 

Jupyter 7 já está disponível e com ele colaboração em tempo real, depuração interativa, melhoria da acessibilidade, modo escuro e mais.