Fevereiro/2023

AGENDA

Oportunidades e prazos para não perder de vista


01/03 – Dia em que ocorrerá o Webinar ChatGPT & DALL-E: What Generative AI means for journalism, no qual serão debatidas questões concernentes aos benefícios e riscos atrelados ao desenvolvimento da Inteligência Artificial.

02/03 – Data limite para inscrever-se no curso “Da ocorrência ao trânsito em julgado: como cobrir pautas criminais”, gratuito e online e voltado a estudantes e profissionais de jornalismo.

02 a 05/03 – Data da NICAR 2023, conferência de jornalismo promovida anualmente pela Investigative Reporters and Editors (IRE).

04 a 10/03 – Durante a semana, celebramos os Dias dos Dados Abertos. Confira em breve no blog da OKBR onde serão os eventos realizados no Brasil.

11/03FOIA Fest, evento híbrido para profissionais envolvidos com projetos investigativos feitos a partir do Freedom Of Information Act.. 

12/03 – Prazo final para inscrições na segunda edição do curso Jornalismo de Dados Ambientais: no rastro do desmatamento da Amazônia, que acontecerá online de 20/03 a 20/04.

12/03 – Data limite para inscrição no programa Jogo Limpo 2.0, que tem o objetivo de enfrentar a desinformação no Brasil. Haverá mentoria de cinco meses e bolsa de até US$ 13.750 por pessoa selecionada.

13/03 – Primeiro dia de treinamento de mineração de dados utilizando R, planilhas e OpenRefine pela Universidade de Oklahoma.

13/03 – Prazo para garantir ingressos com preço antecipado para a 12ª edição da RightsCon, sobre direitos humanos na era digital.

14/03 – Na sessão Creating charts with Google Trends data, o Flourish ensina a como visualizar dados do Google Trend em templates interativos.

15/03 – Prazo final para participar do Generative AI in the Newsroom Challenge, que procura propostas criativas sobre como usar IA generativa no jornalismo. A Northwestern University pagará US$ 250 pelo tempo e esforço dos selecionados.

20/03 – Prazo final para inscrições no programa online de bolsas AI to Amplify, do Instituto Goethe, voltada a quem desenvolve aplicações ou a quem atua em áreas como filosofia, artes, sociologia, direito e ativismo e quer propor uma intervenção em torno do tema.

31/03 – Prazo final da chamada de trabalhos para o X Seminário de Pesquisa em Jornalismo Investigativo. Os trabalhos e pesquisas selecionados serão apresentados no 18º Congresso Internacional de Jornalismo Investigativo, que acontecerá entre os dias 29/06 e 2/07.

14/04 – Início da especialização remota em Educação Midiática, uma parceria entre Agência Lupa com a Universidade do Vale do Rio dos Sinos (UNISINOS). Inscrições abertas

14 a 15/04: 24ª edição do International Symposium on Online Journalism, em Austin, no Texas.

18 a 19/04 – Acontece a User QGIS Conference, na Holanda. Chamada para palestras ainda estão abertas. 

19 a 20/04csv,conf,v7 ocorre presencialmente em Buenos Aires, na Argentina,  e terá compartilhamento de experiências sobre de análise de dados para ciência, jornalismo, governo e fontes de dados.

03 a 05/05Outlier Conference acontece em Porto (Portugal), com diversos agentes da comunidade de dados

05/05 – Prazo para submeter trabalhos para Computers, Privacy and Data Protection Conference (CPDP LatAm)

05 a 07/05Festival3i2023, festival de jornalismo inovador da América Latina organizado pela Ajor (Associação de Jornalismo Digital), ocorrerá presencialmente no Rio de Janeiro e abordará temas como sustentabilidade, inovação e o próprio jornalismo brasileiro e latino-americano.

09 a 11/05Data23, conferência da Tableau, acontecerá em Las Vegas. 

10 a 12/05JupyterCon reunirá, em Paris, na França, desenvolvedores, pesquisadores, educadores, cientistas de dados, entre outros, para debater acerca do ecossistema Jupyter.

05 a 08/06 – 12ª edição da RightsCon acontece online e na Costa Rica. 

22 a 24/06European Data & Computational Journalism Conference acontece em Zurique, na Suíça.

29/06 a 02/0718º Congresso Internacional de Jornalismo Investigativo acontecerá em São Paulo (SP), organizado pela Abraji.

NO MUNDO DOS DADOS

Notícias e discussões quentes


Investigando crimes de guerra na Ucrânia

Em entrevista ao Reuters Institute for the Study of Journalism, Nick Waters, do Bellingcat, explicou como a organização coleta, verifica e arquiva evidências de código aberto de possíveis crimes de guerra na Ucrânia. O Civilian Harm in Ukraine é um banco de dados criado pelo Bellingcat, pretende ser um documento vivo. A coleção começou no primeiro dia da invasão e o coletivo pretende continuar com atualizações até o fim do conflito. O banco de dados é composto de incidentes que resultaram em possíveis danos civis, incluindo foguetes ou mísseis atingindo áreas civis e a destruição de infraestrutura civil. A entrevista discute a metodologia do Bellingcat para verificar a autenticidade de imagens e vídeos, bem como a forma como o coletivo usa tecnologias de análise de dados para identificar informações relevantes.

Inteligência Artificial e a produção jornalística

Nick Diakopoulos, professor de Jornalismo Computacional na Northwestern, preparou um notebook no Google Colab para jornalistas que querem usar IA para a produção de pautas. O documento contém conselhos sobre pedidos, limitações e recursos e exemplos para reescrita, resumo, brainstorming, classificação, extração, dados para texto. O acadêmico também quer entender os desafios enfrentados pelos profissionais do jornalismo na implementação de IA generativa na redação e está buscando propostas de ideias de como utilizar modelos generativos de IA (ChatGPT, GPT-3, DALL-E e semelhantes) para ajudar em uma tarefa jornalística e pretende atuar como consultor técnico de algumas das propostas. Entenda como participar do projeto.

Mais de 1 em cada 3 jornalistas de dados são completamente autodidatas

O jornalismo de dados continua sendo um campo dominado por homens, mais de 60% da indústria de jornalismo de dados é formada por profissionais entre 25 e 44 anos de idade, uma em cada quatro pessoas na área do jornalismo de dados tem de três a cinco anos de experiência, treinamentos em visualização de dados são os mais procurados. Esses são alguns insights da pesquisa The State of Data Journalism 2022, feita pelo DataJournalism.com. Mais de 1.800 jornalistas participaram do projeto, e alguns dos achados da pesquisa foram exibidos com Flourish.

SAIBA MAIS

Para aprender mais e aprender sempre


Alternativas de código aberto ao Mapbox

O Mapbox é uma das melhores ferramentas para a produção de visualizações contendo mapas interativos, porém nos últimos anos vem se tornando uma ferramenta bastante cara para a realidade de redações de pequeno e médio porte. Neste texto, Kevin Schaul, do Washington Post, conta como o jornal vem substituindo o Mapbox e indica alternativas de código aberto como OpenMapTiles, Maputnik, PMTiles e Maplibre-gl-js, que conseguem oferecer funcionalidades semelhantes.

Linhas curvas ou retas em visualizações?

Neste post, Richard Brath, da Uncharted, compara o uso de linhas curvas e retas em visualizações de dados, com foco em dois exemplos específicos: o diagrama de Sankey e o mapa do metrô de Londres. Ele discute a eficácia de cada abordagem em diferentes cenários, bem como suas limitações, e indica que a escolha entre linhas curvas e retas deve ser determinada pelo contexto específico em que a visualização é usada.

5 ferramentas para turbinar suas investigações

A Global Investigative Journalism Network (GIJN) pediu a Johanna Wild, líder de uma equipe de tecnologia investigativa, e Tristan Lee, cientista de dados, para revelar suas atuais ferramentas “acessíveis” favoritas para jornalistas investigativos. Em resposta, os profissionais do Bellingcat ofereceram várias soluções de ponta que usaram recentemente para se aprofundar em assuntos como a guerra na Ucrânia e grupos de conspiração do QAnon na Europa. São sugestões gratuitas, eficazes, fáceis de usar, mas que precisam da ajuda de um profissional de TI para serem instaladas.

SNIPPETS

Dicas curtas e certeiras


A Ambiental Media está com uma pesquisa aberta para entender a demanda dos jornalistas brasileiros por dados socioambientais.

Rafael Pereira criou o pacote geobr para Python e R, fornecendo de forma facilitada acesso a mais de 27 malhas de dados espaciais oficiais do Brasil. 

O bot Legislaredes, criado pelo Núcleo, monitora a tramitação de leis sobre redes sociais e plataformas digitais no Congresso Nacional. 

Solomon Moon selecionou, a partir do Posit Package Manager, seus pacotes Python preferidos para lidar com dados. 

No Towards Data Science (TDS), Mike Shakhomirov explica qual o melhor formato de arquivo para big data.

Ainda no TDS, Rory Spanton escreve sobre prós e contras entre funções embutidas e pacotes R e Thuwarakesh Murallie ensina como trabalhar com funções complexas em Python usando Regex.

INSPIRA

Trabalhos e iniciativas inovadoras para te inspirar


O site Grid.News apresenta uma linha do tempo interativa sobre a guerra na Ucrânia, iniciada em fevereiro de 2022. A linha do tempo é dividida em seis categorias, com eventos e ações dos lados ucraniano e russo apresentados em ordem cronológica. A visualização inclui fotos e vídeos, bem como análises e contexto para cada evento, fornecendo uma visão geral das complexidades do conflito.

NOVOS DADOS

Conjuntos de dados e plataformas publicados recentemente


O Portal de Dados Abertos do Governo Federal disponibilizou base com a distribuição da renda apurada pelos contribuintes em um determinado exercício, tendo por fonte as declarações de imposto de renda da pessoa física.

A Agência Nacional de Transportes Terrestres (ANTT) publicou dados referentes à prestação do serviço regular de transporte rodoviário interestadual e internacional de passageiros, sob regime de autorização.

APT UPDATE

Atualize-se com as novidades de softwares e bases de dados


CKAN 2.10 traz configurações novas no Docker Compose, proteção para prevenir ataques, sistema de autenticação refatorado e mais.  

A biblioteca Pandas liberou a versão 2.0.0 para ser testada e, a partir dela, aplicar possíveis ajustes na versão oficial, que sairá em breve.