* Este conteúdo integra o acervo de Boletins de Dados, nossos informativos mensais sobre as principais novidades e oportunidades relacionadas ao trabalho com dados. Para acessar as edições mais recentes reunidas na seção exclusiva e receber a próxima edição em sua caixa de entrada, junte-se ao nosso programa de membresia e apoie nosso trabalho.

JULHO/2019

A segunda edição do nosso boletim já chega com novidades especiais.

Sem gastar nada, membros da Escola de Dados podem ganhar uma licença do Hunch.ly, uma extensão para o navegador que automaticamente coleta e documenta todas as páginas visitadas, facilitando buscas e anotações. Ferramenta excelente para jornalistas e pesquisadores que realizam investigações online.

Você pode concorrer a uma das 8 licenças gratuitas que iremos sortear. Basta responder a esta mensagem até o dia 6 de agosto.

É sem compromisso: use o serviço de graça até julho de 2020 e só continue se quiser.

AGENDA

Oportunidades e prazos para não perder de vista

• 05/08 – A Python Brasil 2019 está recebendo propostas para atividades práticas (tutoriais) durante o evento, que ocorre em Ribeirão Preto/SP nos dias 23 e 24/10.
• 20/08 – A Python Software Foundation (PSF) recebe indicações de nomes para serem reconhecidos como membros ‘fellow’, pessoas que realizaram contribuições significativas para a comunidade.
• 21/08 – A Folha de São Paulo procura profissionais em visualização de dados para integrar a equipe de dados e inteligência do jornal.
• 27/08 – Profissionais criativos, líderes de organizações da sociedade civil e ativistas podem se inscrever para participar do programa de ‘fellows’ TED, que dá apoio e treinamento para convidados de uma das conferências mais famosas da Internet.
• 30/08 – Até final de agosto, estão abertas as inscrições para o prêmio ‘Information is Beautiful’ de 2019, que reconhece os melhores trabalhos em visualização de dados e infografias mundo afora.
• 01/09 – Mais uma da PSF: a fundação busca pessoas com proficiência em inglês para escrever sobre Python de forma remunerada em seu blog.
• 02/09 – Pesquisadores sobre dados e internet podem se inscrever no programa Internet and Society Fellowship 2020, na Alemanha.

NO MUNDO DOS DADOS

Notícias e discussões quentes

Inteligência Artificial nas redações

Julho nos reservou uma boa dose de inspiração para pensar o presente e o futuro da Inteligência Artificial (IA) no jornalismo. A Florencia Coelho compartilhou aprendizados e exemplos inspiradores não só nas redações, mas também iniciativas em prol do meio ambiente e direitos humanos. Já a Quartz mostrou como usou IA para lidar com 200 mil documentos vazados e Jonathan Stray destrinchou seu impacto no jornalismo investigativo. A despeito das promessas mais entusiasmadas, onde as máquinas ajudariam com a pesquisa, sugerindo perguntas, transcrevendo respostas ou checando dados, Stray aposta que, no curto prazo, esta tecnologia irá impactar principalmente a limpeza de dados.

Também há problemas e desafios. Para uma reflexão com outras nuances, vale ler esse trabalho sobre uso de inteligência artificial para fins de desinformação, que impõe desafios cadas vez maiores à verificação de fatos, por meio de deepfakes, por exemplo. A Stanford Magazine também publicou um texto recente sobre riscos e oportunidades que a IA traz ao jornalismo.

E vem mais por aí: ainda este ano, a Google e a London School of Economics and Political Science irão lançar um relatório abordando o impacto da IA no jornalismo, a partir de uma pesquisa com redações de todos os continentes. E Francesco Marconi, que trabalhou com IA na Associated Press e no Wall Street Journal, colocou em pré-venda o livro ‘Newsmakers: Artificial Intelligence and the Future of Journalism’.


Para além de Nightingale

Stephanie Evergreen reflete sobre desigualdades e visualização de dados no texto ‘Beyond Nightingale: Being a Woman in Data Visualization’. Florence Nightingale (1820-1910) foi estatística e pioneira na enfermagem e no uso de infográficos para investigações baseadas em dados. Seus trabalhos sobre mortalidade do exército inglês na Guerra da Crimeia se tornaram clássicos e, hoje, ela batiza o recém-lançado jornal da Data Visualization Society (DVS), uma coalizão de pesquisadores e profissionais da área.

Evergreen argumenta que Nightingale funciona como um “token” para preencher um espaço feminino na visualização de dados, talvez por ocupar um lugar especial na história eurocêntrica e militar do tema. No texto publicado no lançamento do jornal da DVS, é possível encontrar outras referências históricas e contemporâneas de trabalhos importantes de visualização de dados feitos por mulheres, como os da Emma Willard e Giorgia Lupi.

Para acompanhar as diversas discussões e materiais sobre visualização de dados, você pode participar da comunidade do Data Visualization Society, que conta com newsletter e canal no Slack.


Sobre os ombros de gigantes

Participar de todas as conferências interessantes sobre dados é impossível. Mas dá para aprender mesmo sem estar presente, acompanhando as apresentações e recursos disponibilizados. Recentemente, tivemos materiais de sobra: são mais de 30 apresentações do Domingo de Dados, iniciativa inédita do Congresso da Associação Brasileira de Jornalismo Investigativo (ABRAJI, que agora tem repositório no Github) com um dia inteiro de oficinas de jornalismo de dados.

Teve também a CSVConf, uma conferência sobre dados abertos que recentemente lançou vídeos com apresentações da edição deste ano: manipulação de dados na linha de comandoaprendizado de máquina e democracia participativa foram alguns dos tópicos abordados.

E, para quem curte R, outra dica boa são os materiais da conferência useR2019, que traz dezenas de apresentações sobre temas bastante diversos. Vale também ficar atento à rstudio::conf, que abriu inscrições para sua edição de 2020, nos EUA.

SAIBA MAIS

Para aprender mais e aprender sempre

A professora Mahayana Godoy publicou todos os materiais didáticos do curso ‘Análise e Visualização de Dados Quantitativos em Linguística’, incluindo slides das aulas, scripts em R e datasets utilizados. A ementa vai desde conceitos estatísticos básicos a tópicos mais avançados, como análises de distribuição e regressão.

***

Já os fãs de Python podem aproveitar este curso sobre Processamento de Linguagem Natural, com vídeos e códigos recém-disponibilizados de forma gratuita.

***

Também foram disponibilizados os materiais do curso Análise de Dados Públicos do Fernando Masanori.

***

Para quem quer revisar fundamentos ou está começando na área, é recomendável este tutorial sobre pesquisas em fontes abertas, publicado no site do Bellingcat, craques no assunto que recentemente também lançaram um podcast.

SNIPPETS

Dicas curtas e certeiras sobre o trabalho com dados

A analista de dados espaciais Anita Graser publicou 5 dicas de ferramentas de análise de redes para trabalhar com rotas e mapas isocrônicos no QGIS. É possível também conferir seu post com recursos educacionais sobre análise de movimento.

***

Em entrevista ao datavizBr, Gabriel Zanlorenssi contou sobre sua experiência prática como cientista de dados do Nexo Jornal, onde usa R para gerar gráficos e análise de dados.

***

A designer Amy Cesal explica a importância dos guias de estilo para visualização de dados, com definições básicas e uma listagem com mais de 20 exemplos.

***

Quer saber como o Google trata de visualização de dados? Este texto traz diretrizes e seis princípios para se criar qualquer gráfico.

***

E, para ir além dos gráficos, há esta introdução para jornalistas sobre ‘data physicalization’, a utilização de objetos físicos para representar dados. Outra dica é o TwoTone, que permite transformar dados em sons.

***

O IJNet traduziu um texto com estratégias e dicas de ferramentas para detecção de alterações em fotos digitais e o Washington Post publicou um especial sobre vídeos manipulados.

***

Por sua vez, o New York Times experimenta com a tecnologia do blockchain para garantir a autenticidade de fotos.

INSPIRA

Trabalhos e iniciativas inovadoras para te inspirar

O Consórcio Internacional de Jornalistas Investigativos (ICIJ) publicou em julho detalhes sobre os bastidores do especial ‘Divisão de Propinas’ (Bribery Division). O projeto mobilizou 50 jornalistas de 10 países para analisar 13.000 documentos internos da Odebrecht que foram vazados.

O trabalho destaca-se por aliar a análise de um volume massivo de documentos com jornalismo colaborativo entre diferentes redações. Para lidar com tantos arquivos, eles usaram o Datashare, uma plataforma de código-aberto desenvolvida pelo ICIJ, que consegue indexar diferentes tipos de arquivos e detectar automaticamente pessoas, organizações e localidades em documentos diversos, facilitando assim a pesquisa no material.

O Datashare ainda está na versão beta, mas o ICIJ incentiva seu uso por outras iniciativas.

APT UPDATE

Trabalhos e iniciativas inovadoras para te inspirar 

TheyDrawIt! é uma ferramenta de visualização de séries históricas, que permite ao leitor “desenhar” sua própria estimativa e compará-la com os dados reais, além de ver a predição de outros usuários. A plataforma foi explicada em detalhes por seus desenvolvedores, o Midwest Uncertainty Collective.

***

CivisAnalysis é uma ferramenta para analisar comportamento dos deputados federais e partidos brasileiros por meio de seu histórico de votações, que traz dados da legislatura atual.

***

E o electionsBR – pacote em R para extração de dados eleitorais – agora tem suporte aos dados do pleito de 2018.

***

Mês animado no Flourish: gráficos de linha a la ‘corrida de cavalos’ e diagramas de Sankey agora possuem movimentos. Também teve novidades na forma de posicionar rótulos em gráficos de barra.

***

Outra baita ferramenta para visualização de dados também ganhou atualizações. O Datawrapper agora permite o preenchimento de áreas ao redor de linhas – ideal para mostrar intervalos de confiança.

***

Verdadeiro canivete suíço na hora de limpar dados, o OpenRefine chegou a sua versão 3.2, trazendo novos métodos fonéticos para agrupar (“clusterizar”) palavras semelhantes, entre outras novidades.

***

Notebooks turbinados: o projeto Jupyter ganhou um reforço de peso com o Voilà, que cria painéis (dashboards) e aplicações web autônomas (standalone). Confira sua galeria de exemplos e o texto explicativo feito pelo desenvolvedores.

***

E, para os fãs de Javascript, agora é possível fazer consultas a banco de dados diretamente dos notebooks do Observable.


Ficou algo de fora? Envie sugestões e dicas para [email protected]