*Este conteúdo integra o acervo de Boletins de Dados, nossos informativos mensais sobre as principais novidades e oportunidades relacionadas ao trabalho com dados. Para acessar as edições mais recentes reunidas na seção exclusiva e receber a próxima edição em sua caixa de entrada, junte-se ao nosso programa de membresia e apoie nosso trabalho.

FEVEREIRO/2020

Olá,

Você tem experiência em trabalhar com dados e ama compartilhar conhecimento? 

Então, temos um convite: participe de nossa Rede de Instrutores da Escola de Dados, que lançamos aqui neste boletim em primeira mão. Basta preencher este formulário de interesse e, em breve, enviaremos mais informações.

E a primeira turma do ano para o curso ‘Transformando dados em histórias’ já foi fechada no Rio de Janeiro, mas ainda há vagas em Brasília e, em breve, abriremos inscrições para São Paulo. Como membro, você tem 20% de desconto na inscrição e, caso ainda não esteja lá, pode entrar também nosso canal exclusivo no Telegram.

Por fim, uma boa notícia que fevereiro nos trouxe: a Natália Mazotte, cofundadora da Escola de Dados no Brasil, foi indicada como uma das finalistas no Troféu Mulher Imprensa. Para votar, basta entrar no site do Portal Imprensa e confirmar sua escolha via email, até o dia 2 de março.

Até mais,

AGENDA

Oportunidades e prazos para não perder de vista

• 05/03 – Aula-debate no Sesc/SP sobre o documentário “Privacidade Hackeada” e os riscos que a vigilância pode representar para a democracia.

• 05/03 – O maior evento anual sobre jornalismo de dados do mundo – o NICAR – acontece em Nova Orleans (EUA). Acompanhe pela hashtag #NICAR2020.

• 07/03 – Open Data Day: evento conta com edição do Cerveja com Dados no Rio de Janeiro e atividade sobre dados do legislativo em São Paulo. Confira também as atividades em outras cidades do Brasil.

• 08/03 – Prazo final de inscrição no programa para startups de jornalismo, promovido pelo Google News Initiative.

• 09/03 – Último dia de inscrições para o programa de microbolsas da Agência Pública, que apoia reportagens investigativas feitas por estudantes sobre mobilidade urbana. 

• 16/03 – O Google Summer of Code irá abrir inscrições para estudantes interessados em participar deste encontro voltado ao desenvolvimento de softwares de código aberto.

• 21/03 – Início do curso ‘Construção, coleta e uso de dados para realizar ações sociais’, oferecido pela Escola de Dados em parceria com o Sesc/SP.

• 29/03 – O Coda Story’s Bruno Fellowship financia jornalistas que queiram investigar temas ligados à desinformação, autoritarismo nas tecnologias e a guerra contra a ciência.

NO MUNDO DOS DADOS

Notícias e discussões quentes

Os vencedores de 2020 do Sigma Awards

O herdeiro do Data Journalism Awards anunciou seu veredito final sobre os melhores trabalhos de jornalismo de dados em 2019. O Brasil foi o segundo país com o maior número de finalistas, junto com o Reino Unido, com 7 indicados, porém, desta vez nenhum concorrente brasileiro foi premiado. Na página do Sigma Awards, é possível conferir a lista completa dos vencedores e os comentários da comissão avaliadora.

A melhor reportagem guiada por dados em grandes redações foi a The Troika Laundromat, uma investigação sobre quase 3 mil empresas em 15 países, revelando como políticos corruptos e outros criminosos manejaram bilhões de dólares em esquemas de lavagem de dinheiro. A reportagem Copy, Paste, Legislate também recebeu uma menção honrosa na categoria, por revelar a extensão do impacto dos lobby corporativo na atividade legislativa nos Estados Unidos. A investigação analisou a linguagem de projetos de lei em todos os estados americanos, revelando que 10 mil deles eram quase idênticos.


Dicionário de dados, para que te quero?

Coletar grandes quantidades de dados é inútil se você não puder analisá-los. Para isso, é muito importante ter alguma documentação explicando tudo o que você precisa saber para interpretar os dados. Tradicionalmente, esta é a função do dicionário de dados, um documento com informações sobre uma determinada base, tais como a definição de cada variável ou formato dos dados.

Segundo este artigo da Humans of Data, porém, um dicionário de dados moderno deve ir além disso e incluir outras características relevantes para se avaliar a qualidade e consistência das informações, por exemplo, estatísticas descritivas básicas para as variáveis quantitativas. O texto dá outras dicas valiosas para quem quer elaborar seu próprio dicionário. Na mesma linha, vale também conferir este artigo da Harvard Business Review, que dá dicas para deixar seus dados consistentes desde a coleta.


Dados enviesados

À medida em que tecnologias de inteligência artificial ganham cada vez mais espaço em aplicações cotidianas, a existência de vieses em conjuntos de dados torna-se um risco real não só para estatísticos, mas para toda população, especialmente aquela tradicionalmente marginalizada. A Forbes publicou recentemente uma reportagem sobre o assunto, mostrando como diferentes tipos de vieses afetam sistemas como algoritmos de seleção para empregos, carros automatizados e ferramentas de reconhecimento facial.

The Economist também divulgou os resultados de uma pesquisa da Universidade de Hong Kong, que mostrou como as recomendações de analistas financeiros são “enviesadas” por suas nacionalidades. E o pesquisador Alex Garcia deu uma entrevista sobre vieses raciais nos dados, a partir de uma apresentação dada na última edição da conferência NICAR.

SAIBA MAIS

Para aprender mais e aprender sempre

Grandes veículos jornalísticos compartilharam bastidores do seu trabalho com jornalismo visual e dados. A revista The Economist revelou algumas de suas diretrizes para elaborar gráficos e visualizações de dados para o Instagram, enquanto a equipe de investigações visuais do NYTimes fez uma transmissão ao vivo, onde compartilharam experiências sobre o uso de Open Source Intelligence, imagens e dados durante investigações jornalísticas.

***

Aconteceu em fevereiro a SRCCON:Product, a primeira conferência dedicada a discutir o desenvolvimento de produtos no jornalismo. O professor Rich Gordon destacou 7 reflexões sobre o evento, como a importância de um trabalho ativo de engajamento dos veículos de mídia com o público. Em seu Twitter, Marco Túlio Pires, cofundador da Escola de Dados no Brasil, também destacou percepções e aprendizados sobre a conferência.

SNIPPETS

Dicas curtas e certeiras sobre o trabalho com dados

Foi lançado em fevereiro o The Markup, que se propõe a investigar grandes empresas de tecnologia. Leitura recomendada para todas as pessoas interessadas em escrutinar algoritmos.

*** 

O site Investigate.ai traz dicas práticas de ciência de dados para jornalistas, através de materiais didáticos e exemplos em Python sobre temas como regressões, análise de textos e problemas de classificação.

***

Este post no blog do ArcGIS traz bons e maus exemplos no uso de mapas para visualizar dados sobre o Coronavírus, mas as dicas são válidas para trabalhos cartográficos em geral.

***

@Naanadr compartilhou em seu Github o notebook de um curso em português sobre o OpenCV, uma popular ferramenta para computação visual.

***

O site TableauFit tratou do “Efeito Stroop” e sua importância na hora de escolher as cores de sua visualização de dados em dashboards. 

***

Em entrevista, o designer Darren Long, um dos jurados do Sigma Awards, falou sobre jornalismo de dados na Ásia e fluxos de trabalhos para esta área.

***

Outra entrevista que vale a leitura: o Duncan Clark, CEO do Flourish, abordou o uso de áudios em visualizações de dados interativas, uma das funcionalidades especiais de sua plataforma.

***

E o Estado de São Paulo mostrou como saber programar pode ser um trunfo para profissionais fora da área de tecnologia, citando cursos de programação que são oferecidos em disciplinas como Direito e Medicina.

INSPIRA

Trabalhos e iniciativas inovadoras para te inspirar

Crédito: CBS News

O programa de TV CBS This Morning abordou a questão da desigualdade americana de maneira bastante inovadora, através de uma visualização de dados física e interativa. O repórter solicitou que as pessoas tentassem adivinhar como a riqueza dos EUA é distribuída entre os diferentes segmentos econômicos de sua população.

Munidos de uma torta, os participantes deviam distribuir as fatias de acordo com seus palpites e depois eram apresentados aos dados que correspondiam à realidade. O resultado foi considerado chocante pela maioria, que não imaginava que 90% da torta é destinada aos mais ricos, 10% vai para a classe média alta e a classe média, apenas 0,3% para a classe média baixa e nada para os mais pobres, que possuem apenas dívidas. 

Outro trabalho interessante sobre distribuição de riquezas foi feito pelo site Mother Jones, que em uma visualização de dados animada em vídeo mostrou o tamanho do patrimônio de Mike Bloomberg, bilionário candidato à presidência dos EUA, por meio de diferentes comparações. Imperdível!

APT UPDATE

Atualize-se com as novidades de softwares para trabalhar com dados

A recém-lançada versão 4.0 da plataforma de banco de dados de grafos Neo4j traz escalabilidade ilimitada, entre outras novidades. 

***

A Microsoft combinou o Excel, o Word e PowerPoint em um único app de Android, que já está disponível na Play Store.

***

A ferramenta Joyful Data permite a elaboração de visualizações de dados diferenciadas com a biblioteca JavaScript Joy.JS diretamente do navegador, sem necessidade de escrever códigos.

***

A versão 10.8 do ArcMap apresenta novos recursos em mapeamento, geoprocessamento e publicação.

***

A Oracle anunciou sua plataforma de ciência de dados na nuvem: o novo serviço facilita que equipes de ciência de dados criem e implementem colaborativamente modelos de aprendizado de máquina.


Ficou algo de fora? Envie sugestões e dicas para [email protected]