* Este conteúdo integra o acervo de Boletins de Dados, nossos informativos mensais sobre as principais novidades e oportunidades relacionadas ao trabalho com dados. Para acessar as edições mais recentes reunidas na seção exclusiva e receber a próxima edição em sua caixa de entrada, junte-se ao nosso programa de membresia e apoie nosso trabalho.

AGOSTO/2019

Olá,

Neste mês, demos a largada da quarta edição do Coda.Br, a maior conferência de jornalismo de dados e métodos digitais do Brasil.

Queremos construir a programação coletivamente e contamos com a sua participação. Por isso, manteremos o formulário de envio de propostas e sugestões aberto especialmente para nossos membros, até dia 7 de setembro.

Lembre-se: como membro, você também pode participar de nosso grupo no Telegram e tem 20% de desconto nos nossos cursos presenciais, basta solicitar via email. As próximas turmas são em Salvador/BA (setembro) e Fortaleza/CE (outubro).

AGENDA

Oportunidades e prazos para não perder de vista

• 07/09 – Submissão de propostas para a rstudio::conf(2020).

• 08/09 – Envio de trabalhos para concorrer ao primeiro prêmio de jornalismo de dados do Brasil, o Prêmio Cláudio Weber Abramo.

• 08/09 – Inscrição de visualizações de dados para concorrer desafio do Data Visualization Community Survey 2019.

• 15/09 – Envio de trabalhos no III Workshop de Informação, Dados e Tecnologia, que ocorre em novembro em Brasília.

• 25/09 – Trabalha com dados educacionais? Com bolsas de até R$ 8 mil, este edital da Jeduca convida jornalistas a proporem pautas sobre edução.

• 27/09 – Comunicadores e acadêmicos podem se inscrever no Nieman Fellowship da Universidade de Harvard, que busca pesquisadores e profissionais com projetos para melhorar o futuro do jornalismo.

• 01/10 – Bolsa da National Endowment for Democracy com residência no International Forum for Democratic Studies em Washington (EUA), para cinco meses de estudo entre 2020 e 2021.

• 01/10 – Inscrições na Summer School da USP com a International Political Science Association.

NO MUNDO DOS DADOS

Notícias e discussões quentes

Compartilhando análises

Como realizar investigações baseadas em dados de forma aberta, transparente e passível de ser reproduzida ou checada? Com esse objetivo, diversos profissionais adotam os “blocos de notas turbinados” com códigos, gráficos e comentários – os famosos notebooks. Baseado no artigo ‘Ten simple rules for writing and sharing computational analyses in Jupyter Notebooks’, vamos compartilhar dicas simples para escrever e compartilhar análises assim.

Regra um: pense em uma narrativa para um público. Leve em consideração seus leitores. E na sua “narrativa computacional” documente por que tomou cada passo e qual trajetória está sendo feita.

Escrever o processo, não só os resultados, é a regra dois. Ainda que opte por não compartilhar depois, documente todas explorações feitas durante a análise – mesmo as fracassadas! E pense de forma modular. Cada célula do notebook deve ser uma etapa relevante de sua trajetória – não as deixe nem muito longas (+100 de linhas), nem muito curtas.

O mesmo vale para o código. É fácil copiar e colar, mas a sugestão para reutilizá-los no mesmo notebook é criar módulos ou pacotes. Depois da exploração inicial, crie um fluxo (pipeline) de modo que o notebook possa ser lido, adaptado, executado e explorado por terceiros. Registre todos softwares ou pacotes necessários e use sistemas de controle de versão, como o Git.

Por fim, todo esforço de transparência é quase inútil se, além do código da análise, os dados utilizados não estão acessíveis. As dicas finais pedem por o fornecimento de dados abertos e contextualizados, além de um maior engajamento em prol da ciência e pesquisa aberta.


Educação em dados

Os notebooks também podem ser utilizados em treinamentos e formações. No nosso grupo de membros no Telegram, o Tiago Maranhão compartilhou o excelente currículo em visualização de dados com Python ou Javascript lançado pelo UW Interactive Data Lab. O foco são bibliotecas descritivas, como o Vega-Lite e Altair, e é possível rodar os notebooks disponíveis no GitHub direto do navegador, em sites como o Observable ou o Colab Research.

Ainda sobre compartilhamento de conhecimentos, o projeto DataJournalism publicou em agosto reflexões sobre estratégias de ensino em jornalismo de dados em Universidades, com relatos da Austrália, Tunísia, México, Hong Kong, Argentina, EUA, Quirguistão e Irlanda. No texto, os professores discutem os desafios e características do ensino de jornalismo de dados em suas localidades.


Oportunidades

Estudantes interessados em desenvolver códigos podem aproveitar o “GitHub Student Developer Pack”, que voltou à ativa oferecendo acesso gratuito ao Github Pro e outras ofertas exclusivas. Inclusive, em novembro tem o GitHub Universe e, até dia 9 de setembro, dá para pedir isenção na taxa de inscrição para o evento, que ocorre nos Estados Unidos.

E a Houston University realiza uma pesquisa global sobre jornalismo de dados e convida profissionais a responderem um formulário de até 15 minutos. Quem completar, concorre a U$ 200 em recompensas.

SAIBA MAIS

Para aprender mais e aprender sempre

Você já deve saber do curso online gratuito ‘Introdução ao jornalismo de dados’ que estamos realizando em parceria com o Knight Center, mas sabia que eles terão mais novidades este ano?

Em breve, teremos o curso ‘Jornalismo de Dados e Visualizações com Tecnologias Livres’. Integram a equipe de professores um baita time, incluindo os criadores do Flourish, Alberto Cairo, Simon Rogers, editor de dados do Google, além de Jan Diehm (The Pudding), Marco Túlio Pires, entre outros.

***

Aliás… Alberto Cairo publicou texto na Scientific American sobre infográficos enganosos. A partir de dados sobre obesidade e expectativa de vida, ele discute visualização de dados, correlações e encerra com quatro dicas:

1) Tentar não ver apenas o que o gráfico mostra, mas aquilo que pode não estar mostrando;

2) Não pule para as conclusões, especialmente se um gráfico parece confirmar o que você já acredita;

3) Questione se você está verbalizando corretamente o conteúdo do gráfico;

4) Considere se os dados representam o nível exigido para fazer as inferências que você quer. Se você quer aprender sobre países, digamos, consulte dados no nível nacional, mas se você quer aprender sobre seus próprios riscos de saúde, procure dados sobre indivíduos. E, seja como for, sempre se lembre que, em qualquer gráfico ou entre quaisquer dados, correlação não é a mesma coisa que causalidade.

***

Por falar nisso, foi lançada a edição em português do aclamado livro sobre causalidade ‘The Book Of Why’, cuja edição impressa agora pode ser importada no Brasil pela Livraria Cultura.

E Cairo foi considerado (de longe) um dos principais pensadores sobre o tema em pesquisa do Data Visualization Society publicado em agosto. Também é um dos jurados do Prêmio Cláudio Weber Abramo de Jornalismo de Dados, realizado pela Escola de Dados no Brasil.

***

Em seu blog, o cientista de dados José Ferraz Neto publicou um ótimo tutorial sobre técnicas de classificação de dados, detalhando com bom humor alguns dos classificadores mais utilizados: intervalos iguais, quebras naturais, quantis e customizados.

E a Natália Mazotte entrevistou Luiz Fernando Toledo, criador do Fiquem Sabendo, agência de dados especializada em Lei de Acesso à Informação. O vídeo de 30 minutos traz dicas valiosas para fazer pedidos de dados governamentais.

SNIPPETS

Dicas curtas e certeiras sobre o trabalho com dados

O Volt Data Lab publicou estatísticas e dados sobre a produção de podcasts no Brasil e nos Estados Unidos.

***

A Propublica lançou um guia para jornalismo de dados colaborativo, com orientações sobre como conduzir trabalho assim, do início ao fim.

***

Ainda é a versão beta, mas vale conferir este guia do Data Carpentery sobre organização de dados em planilhas para cientistas sociais.

***

“Um padrão que vejo é que equipes de cientistas de dados em uma empresa usam R e a equipe de engenharia de dados usa Python”. À Quartz, Hadley Wickham falou sobre R e Python, as duas linguagens mais populares para lidar com dados, e seus planos de desenvolver um novo backend para o pacote ‘dplyr’.

***

Títulos são importantes em infográficos. E não é pouco. Frequentemente, as pessoas passam mais tempo olhando o título do que os dados e ele é lembrado como a principal mensagem do gráfico, segundo este artigo do Multiple Views .

***

Entre a arte e visualização de dados: nesta entrevista, Nicholas Rougeux fala de seu trabalho e processo criativo: “experimentação é a chave para qualquer projeto e eu aprendi cedo a registrar cada iteração que crio”.

Between the words’: trabalho de Nicholas Rougeux explorando a pontuação de clássicos literários nasceu com um insight após erro no uso de expressões regulares.

INSPIRA

Trabalhos e iniciativas inovadoras para te inspirar 

Em agosto, o aumento do desmatamento na Amazônia se tornou uma pauta global. Mas como dar a real dimensão deste aumento e do tamanho da maior floresta tropical do mundo?

Feito por uma agência digital focada em dados, o site amazondeforestation.io topou o desafio e criou uma plataforma com um mapa onde o ritmo do desmatamento da Amazônia pode ser visualizado em qualquer lugar. Por exemplo, considerando um ponto inicial em São Paulo e seguindo as últimas taxas, de acordo com o site, esta seria a área de devastação daqui a um mês, quando você receber a próxima edição do boletim.

APT UPDATE

Trabalhos e iniciativas inovadoras para te inspirar

Voltando aos notebooks, o Jupyter chegou a sua versão 6.0, em sua maior atualização desde 2017. Mas a dica dos desenvolvedores é começar a migrar para o Jupyterlab, que está na versão 1.0.

***

Fim da linha para o Python 2: em janeiro de 2020, a versão será oficialmente descontinuada.

***

Git 2.23: O famoso sistema de versionamento traz novos comandos que explicitam diferentes usos do tradicional comando “git checkout”: restaurar arquivos (“git restore”) e trocar o “branch” (“git switch”).

***

LibreOffice 6.3 saiu com melhorias de performance do editor de planilhas Calc e na função de procura vertical (PROCV/VLOOKUP).


Ficou algo de fora? Envie sugestões e dicas para [email protected].