Janeiro/2023

AGENDA

Oportunidades e prazos para não perder de vista


01/02 – Prazo para inscrição no World Data Visualization Prize, uma parceria entre as organizações World Government Summit e Information is Beautiful, que concederá um prêmio no valor de cinquenta mil dólares a quem atrelar criatividade a design, análise de dados e storytelling.

03/02 – Data limite para retorno por parte da Open News acerca do aceite das propostas enviadas anteriormente para o programa Scholarships+.

03/02 – Último dia para inscrição no The Understanding Needs to Broaden the Use of NASA Data for Air Quality (UNBOUND AQ), programa da NASA sobre dados da qualidade do ar.

05/02 – Fim das submissões para o Lightning Talk, que ocorrerá em Nashville, entre 2 e 5 de março. As dez ideias mais bem votadas receberão a oportunidade de participar da conferência.

05/02 – Prazo de inscrição para uma vaga de Jornalista de Dados na Abraji, a fim de atuar no Projeto CruzaGrafos durante quatro meses em trabalho remoto.

06/02 – Último dia para inscrições no programa de bolsas para jornalistas oferecido pelo Reuters Institute for the Study of Journalism em Oxford.

13/02 – Data limite para inscrição no Curso de Atualização de Ciência de Dados aplicada à Saúde 2023, do Ensino Icict (Instituto de Comunicação e Informação Científica e Tecnológica em Saúde), da Fiocruz.

14/02 – O Flourish oferece a sessão Mapping 101: Learn how to use maps to visualize your data, a qual mostrará como visualizar dados geoespaciais com um mapa interativo.

23/02 – Prazo para candidatura para as bolsas do programa Disarming Disinformation, realizado pelo Centro Internacional para Jornalistas (ICFJ) em parceria com o Instituto Serrapilheira e voltado a estudar a desinformação científica no país.

26/02 – Fim do prazo de inscrição para o programa Acelerando Negócios Digitais, financiado por uma parceria entre a META e associações brasileiras de mídia, com a finalidade tanto de aprimorar os modelos de negócios quanto a sustentabilidade financeira de organizações midiáticas. Para tanto, o programa oferecerá mentorias individuais de cinco meses, treinamento e até quinze mil dólares de bolsa por organização selecionada.

02 a 05/03 – Data da NICAR 2023, conferência de jornalismo promovida anualmente pela Investigative Reporters and Editors (IRE).

12/03 – Data limite para submissão de inscrição no programa Jogo Limpo 2.0, o qual é financiado pelo YouTube, com o objetivo de enfrentar a desinformação no Brasil por meio do apoio a jornalistas. Haverá mentoria de cinco meses e bolsa de até US$ 13.750 por pessoa selecionada.

13/03 – Primeiro dia de treinamento de mineração de dados utilizando R, planilhas e OpenRefine pela Universidade de Oklahoma.

13/03 – Prazo para garantir ingressos com preço antecipado para a 12ª edição da RightsCon, sobre direitos humanos na era digital, que acontecerá online e na Costa Rica em junho do próximo ano. 

14/03 – Na sessão Creating charts with Google Trends data, o Flourish ensina a como visualizar dados do Google Trend em templates interativos.

19 a 20/04 – Ocorrerá a Conferência da csv,conf,v7 presencialmente em Buenos Aires, na Argentina, na qual será possível compartilhar experiências acerca de análise de dados para ciência, jornalismo, governo e fontes de dados.

09 a 11/05 – A Data23, conferência da Tableau, acontecerá em Las Vegas. 

10 a 12/05 – A JupyterCon reunirá, em Paris, na França, desenvolvedores, pesquisadores, educadores, cientistas de dados, entre outros, para debater acerca do ecossistema Jupyter.

22 a 24/06 – A European Data & Computational Journalism Conference acontece em Zurique, na Suíça.

29/06 a 02/07 – O 18º Congresso Internacional de Jornalismo Investigativo acontecerá em São Paulo (SP), sob organização da Abraji.

NO MUNDO DOS DADOS

Notícias e discussões quentes


Jornalismo, mídia e tecnologia em 2023

Neste mês, o Reuters Institute traz uma pesquisa contendo um compilado de previsões para o ano, realizada com a participação ​​de mais de 300 profissionais sêniores de mídia de 53 países e territórios. O panorama traçado aponta preocupações com a inflação e o financiamento de meios jornalísticos, a esperança em assinaturas digitais, a crescente preocupação com a evitação de notícias, um olhar atento às mudanças na cobertura da emergência climática e a expectativa que o ano seja decisivo para a incorporação de tecnologias de inteligência artificial no jornalismo. O trabalho foi conduzido por Nic Newman, pesquisador associado sênior no Reuters Institute for the Study of Journalism, onde é o principal autor do Digital News Report anual desde 2012.

Um banco de dados de posts antidemocráticos

Como foram organizados os atos de vandalismo em Brasília, realizados em 08/01? Para responder a esta pergunta, a Agência Lupa montou um banco de de dados colaborativo visando mapear postagens antidemocráticas feitas no início deste mês nas redes sociais e em aplicativos de mensagens.

OSINT pela democracia

Também no esforço de ajudar jornalistas e ativistas a identificarem postagens pró-golpe nas redes, a Open Knowledge Brasil (OKBR), com apoio da Purpose Brasil, realizou duas oficinas de investigações digitais abordando técnicas de Open Source Intelligence (OSINT, ou inteligência de fontes abertas) para apurar a investida golpista. Antes da realização das oficinas, a OKBR também tinha apontado, em texto, como tecnologias e uso de dados podem auxiliar na identificação de criminosos que atentam contra a democracia. 

Dados do Censo: confiáveis?

Em recente entrevista à Folha de São Paulo, o ex-presidente do IBGE, Roberto Olinto, defende que os dados do Censo não são confiáveis e que uma auditoria na pesquisa deve ser realizada, pede que responsáveis sejam investigados e levanta possibilidade de o país ter desperdiçado R$ 2,3 bilhões. Hoje pesquisador associado do FGV Ibre (Instituto Brasileiro de Economia da Fundação Getúlio Vargas), Olinto aponta a redução do questionário, a diminuição do orçamento e a exoneração de diretores experientes como algumas das questões políticas que já impactam os resultados preliminares do Censo.

Um contraponto… A Associação Brasileira de Estudos Populacionais (ABEP) divulgou uma nota em defesa do órgão, ressaltando que o processo ainda não se encerrou e que críticas infundadas geram desinformação e são um “desserviço”. O IBGE, por sua vez, afirma que a metodologia implementada foi aprovada pelo conselho consultivo do Censo.

SAIBA MAIS

Para aprender mais e aprender sempre


Raio-R da campanha eleitoral de Lula

Fernando Barbalho, cientista de dados sênior na Secretaria do Tesouro Nacional, utilizou um conjunto de códigos do pacote R Stats para analisar os dados das despesas de campanha de Lula em 2022. A partir de um datalake da Base dos Dados, Barbalho mostrou como fez os filtros e ajustes necessários para trabalhar a base, ensinando passo a passo, códigos e fazendo comentários sobre as análises em post no seu Medium.

De olho nos dados do cartão corporativo de Bolsonaro
No início do mês, a agência Fiquem Sabendo disponibilizou os dados dos gastos de Jair Bolsonaro no cartão corporativo, até então sigilosos. A Base dos Dados tratou as informações e realizou uma transmissão ao vivo ensinando como explorá-las, com a participação de João Carabetta, chefe executivo de dados da Prefeitura do Rio de Janeiro e co-fundador da Base dos Dados; Judite Cypreste, jornalista de dados da Prefeitura do Rio de Janeiro; e Bruno Schimitt Morassutti, cofundador e conselheiro fiscal da agência Fiquem Sabendo.

SNIPPETS

Dicas curtas e certeiras


Scott Stroz escreveu um tutorial sobre como indexar dados no formato JSON no MySQL, visando melhorar o desempenho das consultas a esses dados.  

Ben Johnson escreveu um guia de como utilizar o LifeFS, um sistema de arquivos que replica o banco de dados SQLite de maneira rápida.

O artigo de Leonie Monigatti aponta como a biblioteca Polar consegue ser mais eficaz com grandes volumes de dados, quando comparada à famosa biblioteca Pandas.  

Fernanda Santos demonstrou em vídeo como a biblioteca Plotly pode ser usada para criar gráficos bonitos e interativos.

David Rumsey disponibilizou uma galeria cartográfica com visualizações que mapeiam o tempo entre 1606 e 2005.

A comunidade DataViz Rio conversou com Gabriela Momberg sobre seu projeto de TCC que explora a visualização de dados no contexto que permeia a alimentação no território paulistano. 

O Flourish organizou um webinar sobre dicas de adaptação de visualizações de dados para mídias sociais.

INSPIRA

Trabalhos e iniciativas inovadoras para te inspirar


Por padrão ou intencionalmente, os registros de transações financeiras de doadores e empresas para políticos britânicos é um labirinto de dados, que estão espalhados por diferentes sites e plataformas, publicados online, impressos, em PDFs e planilhas, em formatos que não podem ser comparados ou analisados facilmente.

The Westminster Accounts, uma parceria entre a Tortoise Media e a Sky News, é um projeto de visualização de dados que pretende mostrar como o dinheiro advindo de grupos informais pode influenciar a atuação de parlamentares do Reino Unido, num momento em que as regras e sistemas de transparência não estão funcionando como deveriam. 

A ferramenta, criada pela Tortoise Media em parceria com a Sky, permite visualizar de forma simples quanto cada parlamentar recebeu desses grupos, buscando pelo seu nome, e também agrupa, em visualização distinta, os montantes recebidos pelos partidos, frentes parlamentares e de acordo com a fonte do dinheiro.

NOVOS DADOS

Conjuntos de dados e plataformas publicados recentemente

A Base dos Dados disponibilizou os dados tratados sobre o cartão corporativo presidencial, adquiridos via LAI pela agência Fiquem Sabendo.

APT UPDATE

Atualize-se com as novidades de softwares e bases de dados


DBeaver lançou uma ferramenta que permite selecionar áreas em um mapa a partir do painel de valores. 

Matelgo incluiu a livraria Regex Library Transforms, que permite extrair dados de páginas web usando regex. 

Climate Learn é a nova biblioteca do PyTorch para acessar conjunto de dados climáticos, modelos de Machine Learning e pipelines de treinamento e visualização.