#41 Previsões para 2023, OSINT pela democracia, dados do Censo e mais
Janeiro/2023
AGENDA
Oportunidades e prazos para não perder de vista
01/02 – Prazo para inscrição no World Data Visualization Prize, uma parceria entre as organizações World Government Summit e Information is Beautiful, que concederá um prêmio no valor de cinquenta mil dólares a quem atrelar criatividade a design, análise de dados e storytelling.
03/02 – Data limite para retorno por parte da Open News acerca do aceite das propostas enviadas anteriormente para o programa Scholarships+.
03/02 – Último dia para inscrição no The Understanding Needs to Broaden the Use of NASA Data for Air Quality (UNBOUND AQ), programa da NASA sobre dados da qualidade do ar.
05/02 – Fim das submissões para o Lightning Talk, que ocorrerá em Nashville, entre 2 e 5 de março. As dez ideias mais bem votadas receberão a oportunidade de participar da conferência.
05/02 – Prazo de inscrição para uma vaga de Jornalista de Dados na Abraji, a fim de atuar no Projeto CruzaGrafos durante quatro meses em trabalho remoto.
06/02 – Último dia para inscrições no programa de bolsas para jornalistas oferecido pelo Reuters Institute for the Study of Journalism em Oxford.
13/02 – Data limite para inscrição no Curso de Atualização de Ciência de Dados aplicada à Saúde 2023, do Ensino Icict (Instituto de Comunicação e Informação Científica e Tecnológica em Saúde), da Fiocruz.
14/02 – O Flourish oferece a sessão Mapping 101: Learn how to use maps to visualize your data, a qual mostrará como visualizar dados geoespaciais com um mapa interativo.
23/02 – Prazo para candidatura para as bolsas do programa Disarming Disinformation, realizado pelo Centro Internacional para Jornalistas (ICFJ) em parceria com o Instituto Serrapilheira e voltado a estudar a desinformação científica no país.
26/02 – Fim do prazo de inscrição para o programa Acelerando Negócios Digitais, financiado por uma parceria entre a META e associações brasileiras de mídia, com a finalidade tanto de aprimorar os modelos de negócios quanto a sustentabilidade financeira de organizações midiáticas. Para tanto, o programa oferecerá mentorias individuais de cinco meses, treinamento e até quinze mil dólares de bolsa por organização selecionada.
02 a 05/03 – Data da NICAR 2023, conferência de jornalismo promovida anualmente pela Investigative Reporters and Editors (IRE).
12/03 – Data limite para submissão de inscrição no programa Jogo Limpo 2.0, o qual é financiado pelo YouTube, com o objetivo de enfrentar a desinformação no Brasil por meio do apoio a jornalistas. Haverá mentoria de cinco meses e bolsa de até US$ 13.750 por pessoa selecionada.
13/03 – Primeiro dia de treinamento de mineração de dados utilizando R, planilhas e OpenRefine pela Universidade de Oklahoma.
13/03 – Prazo para garantir ingressos com preço antecipado para a 12ª edição da RightsCon, sobre direitos humanos na era digital, que acontecerá online e na Costa Rica em junho do próximo ano.
14/03 – Na sessão Creating charts with Google Trends data, o Flourish ensina a como visualizar dados do Google Trend em templates interativos.
19 a 20/04 – Ocorrerá a Conferência da csv,conf,v7 presencialmente em Buenos Aires, na Argentina, na qual será possível compartilhar experiências acerca de análise de dados para ciência, jornalismo, governo e fontes de dados.
09 a 11/05 – A Data23, conferência da Tableau, acontecerá em Las Vegas.
10 a 12/05 – A JupyterCon reunirá, em Paris, na França, desenvolvedores, pesquisadores, educadores, cientistas de dados, entre outros, para debater acerca do ecossistema Jupyter.
22 a 24/06 – A European Data & Computational Journalism Conference acontece em Zurique, na Suíça.
29/06 a 02/07 – O 18º Congresso Internacional de Jornalismo Investigativo acontecerá em São Paulo (SP), sob organização da Abraji.
NO MUNDO DOS DADOS
Notícias e discussões quentes
Jornalismo, mídia e tecnologia em 2023
Neste mês, o Reuters Institute traz uma pesquisa contendo um compilado de previsões para o ano, realizada com a participação de mais de 300 profissionais sêniores de mídia de 53 países e territórios. O panorama traçado aponta preocupações com a inflação e o financiamento de meios jornalísticos, a esperança em assinaturas digitais, a crescente preocupação com a evitação de notícias, um olhar atento às mudanças na cobertura da emergência climática e a expectativa que o ano seja decisivo para a incorporação de tecnologias de inteligência artificial no jornalismo. O trabalho foi conduzido por Nic Newman, pesquisador associado sênior no Reuters Institute for the Study of Journalism, onde é o principal autor do Digital News Report anual desde 2012.
Um banco de dados de posts antidemocráticos
Como foram organizados os atos de vandalismo em Brasília, realizados em 08/01? Para responder a esta pergunta, a Agência Lupa montou um banco de de dados colaborativo visando mapear postagens antidemocráticas feitas no início deste mês nas redes sociais e em aplicativos de mensagens.
OSINT pela democracia
Também no esforço de ajudar jornalistas e ativistas a identificarem postagens pró-golpe nas redes, a Open Knowledge Brasil (OKBR), com apoio da Purpose Brasil, realizou duas oficinas de investigações digitais abordando técnicas de Open Source Intelligence (OSINT, ou inteligência de fontes abertas) para apurar a investida golpista. Antes da realização das oficinas, a OKBR também tinha apontado, em texto, como tecnologias e uso de dados podem auxiliar na identificação de criminosos que atentam contra a democracia.
Dados do Censo: confiáveis?
Em recente entrevista à Folha de São Paulo, o ex-presidente do IBGE, Roberto Olinto, defende que os dados do Censo não são confiáveis e que uma auditoria na pesquisa deve ser realizada, pede que responsáveis sejam investigados e levanta possibilidade de o país ter desperdiçado R$ 2,3 bilhões. Hoje pesquisador associado do FGV Ibre (Instituto Brasileiro de Economia da Fundação Getúlio Vargas), Olinto aponta a redução do questionário, a diminuição do orçamento e a exoneração de diretores experientes como algumas das questões políticas que já impactam os resultados preliminares do Censo.
Um contraponto… A Associação Brasileira de Estudos Populacionais (ABEP) divulgou uma nota em defesa do órgão, ressaltando que o processo ainda não se encerrou e que críticas infundadas geram desinformação e são um “desserviço”. O IBGE, por sua vez, afirma que a metodologia implementada foi aprovada pelo conselho consultivo do Censo.
SAIBA MAIS
Para aprender mais e aprender sempre
Raio-R da campanha eleitoral de Lula
Fernando Barbalho, cientista de dados sênior na Secretaria do Tesouro Nacional, utilizou um conjunto de códigos do pacote R Stats para analisar os dados das despesas de campanha de Lula em 2022. A partir de um datalake da Base dos Dados, Barbalho mostrou como fez os filtros e ajustes necessários para trabalhar a base, ensinando passo a passo, códigos e fazendo comentários sobre as análises em post no seu Medium.
De olho nos dados do cartão corporativo de Bolsonaro
No início do mês, a agência Fiquem Sabendo disponibilizou os dados dos gastos de Jair Bolsonaro no cartão corporativo, até então sigilosos. A Base dos Dados tratou as informações e realizou uma transmissão ao vivo ensinando como explorá-las, com a participação de João Carabetta, chefe executivo de dados da Prefeitura do Rio de Janeiro e co-fundador da Base dos Dados; Judite Cypreste, jornalista de dados da Prefeitura do Rio de Janeiro; e Bruno Schimitt Morassutti, cofundador e conselheiro fiscal da agência Fiquem Sabendo.
SNIPPETS
Dicas curtas e certeiras
Scott Stroz escreveu um tutorial sobre como indexar dados no formato JSON no MySQL, visando melhorar o desempenho das consultas a esses dados.
Ben Johnson escreveu um guia de como utilizar o LifeFS, um sistema de arquivos que replica o banco de dados SQLite de maneira rápida.
O artigo de Leonie Monigatti aponta como a biblioteca Polar consegue ser mais eficaz com grandes volumes de dados, quando comparada à famosa biblioteca Pandas.
Fernanda Santos demonstrou em vídeo como a biblioteca Plotly pode ser usada para criar gráficos bonitos e interativos.
David Rumsey disponibilizou uma galeria cartográfica com visualizações que mapeiam o tempo entre 1606 e 2005.
A comunidade DataViz Rio conversou com Gabriela Momberg sobre seu projeto de TCC que explora a visualização de dados no contexto que permeia a alimentação no território paulistano.
O Flourish organizou um webinar sobre dicas de adaptação de visualizações de dados para mídias sociais.
INSPIRA
Trabalhos e iniciativas inovadoras para te inspirar
Por padrão ou intencionalmente, os registros de transações financeiras de doadores e empresas para políticos britânicos é um labirinto de dados, que estão espalhados por diferentes sites e plataformas, publicados online, impressos, em PDFs e planilhas, em formatos que não podem ser comparados ou analisados facilmente.
The Westminster Accounts, uma parceria entre a Tortoise Media e a Sky News, é um projeto de visualização de dados que pretende mostrar como o dinheiro advindo de grupos informais pode influenciar a atuação de parlamentares do Reino Unido, num momento em que as regras e sistemas de transparência não estão funcionando como deveriam.
A ferramenta, criada pela Tortoise Media em parceria com a Sky, permite visualizar de forma simples quanto cada parlamentar recebeu desses grupos, buscando pelo seu nome, e também agrupa, em visualização distinta, os montantes recebidos pelos partidos, frentes parlamentares e de acordo com a fonte do dinheiro.
NOVOS DADOS
Conjuntos de dados e plataformas publicados recentemente
A Base dos Dados disponibilizou os dados tratados sobre o cartão corporativo presidencial, adquiridos via LAI pela agência Fiquem Sabendo.
APT UPDATE
Atualize-se com as novidades de softwares e bases de dados
DBeaver lançou uma ferramenta que permite selecionar áreas em um mapa a partir do painel de valores.
Matelgo incluiu a livraria Regex Library Transforms, que permite extrair dados de páginas web usando regex.
Climate Learn é a nova biblioteca do PyTorch para acessar conjunto de dados climáticos, modelos de Machine Learning e pipelines de treinamento e visualização.