5 e 6/11 – ESPM SÃO PAULO
JORNALISMO DE DADOS COM EDITORES DE PLANILHAS
Nem só de colunas e linhas são formados os editores de planilhas: eles possuem uma série de recursos que podem facilitar o seu trabalho com dados. Neste workshop, Bianca Muniz, analista de dados da Agência Pública, vai ensinar macetes, fórmulas e atalhos para você ter na manga na próxima vez que abrir um arquivo no Google Sheets.
O único requisito para acompanhar o passo a passo é ter acesso à internet. Na planilha que ela usa como exemplo, foram analisadas bases de dados do IBAMA e do SUS. As dicas que você vai encontrar nesta sessão auxiliam em duas das etapas do fluxo de trabalho com dados: a preparação e a análise.
A preparação é quando importamos e limpamos os dados. Para essa etapa, Muniz passa instruções de como carregar arquivos para dentro do Google Sheets e mostra alguns “truques”, como:
• congelar linhas e colunas;
• apagar registros repetidos;
• navegar de forma mais rápida dentro da planilha (spoiler: não precisa scrollar a tela infinitamente para ir na última linha de uma base de dados com milhares de registros. Aperte “Ctrl” + “seta para baixo” e você chegará ao final da planilha num instante);
• somar a quantidade de caracteres em uma célula (spoiler 2: foi assim que ela conseguiu identificar a quantidade de multas ambientais cometidas por pessoas jurídicas e por pessoas físicas. Na base de dados do IBAMA, CNPJ e CPF aparecem tarjados);
• concatenar duas ou mais cadeias de caracteres;
• botar todo o conteúdo com caracteres maiúsculos ou, ao contrário, deixar tudo em minúsculos;
• extrair apenas os primeiros e os últimos caracteres de uma célula.
Para a etapa de análise, momento em que entrevistamos os dados, Muniz mostra como faz para agrupar, sumarizar e ordenar as informações, usando o recurso da tabela dinâmica. É na análise que os dados nos revelam fatos. Por exemplo, da base de dados de multas expedidas pelo IBAMA, no estado do Espírito Santo, em 2022, descobrimos que:
• No município de Afonso Cláudio, a soma das multas expedidas foi de R$: 565.500,00. Esse total corresponde a 4 multas.
• O valor mais alto do total de multas no estado foi registrado na cidade de Linhares e corresponde de R$: 55.864.430,00.
O último recurso ensinado por Muniz é uma fórmula poderosa, o PROCV, que permite cruzar informações de diferentes bases de dados. Os minutos finais do encontro são para a gente se inspirar: ela mostra exemplos de reportagens investigativas feitas com dados analisados em editores de planilhas.
BIANCA MUNIZ
Biomédica e mestre em Ciências pela Unifesp, especialista em Jornalismo de Dados e Automação pelo Insper e estudante de jornalismo na Universidade de São Paulo. Atualmente é pesquisadora visitante na Universidade do Texas em Austin, com projeto selecionado pela Agência USP de Inovação. Trabalha na Agência Pública desde 2020, inicialmente como estagiária de jornalismo de dados e hoje como analista de dados.
REALIZAÇÃO
DESENVOLVIDO COM
APOIO
Nosso conteúdo está disponível sob a licença Creative Commons Atribuição 4.0 Internacional, e pode ser compartilhado e reutilizado para trabalhos derivados, desde que citada a fonte.