[Este é um resumo do post ‘How to make dope shit’, publicado por Ilia Blinderman no The Pudding. O resumo foi feito por Adriano Belisário e Paulette Desormeaux, no contexto do curso de jornalismo de dados realizado pelo Knight Center em 2019. O texto original é dividido em três partes: a primeira parte explora o trabalho com dados, a segunda parte que aborda práticas de design e a última trata de storytelling. O resumo em português foi atualizado em janeiro de 2021 e acrescido do conteúdo sobre a terceira parte.]

Nesta série de postagens publicadas pelo The Pudding, veículo considerado uma referência na área de visualização de dados, Ilia Blinderman apresenta ferramentas e conceitos para narração visual de dados, dando uma visão geral do campo, mostrando bastidores do The Pudding e indicando como o leitor pode melhorar suas habilidades para fazer boas visualizações, sem entrar em muitos detalhes técnicos. A ideia do texto é também eliminar parte do misticismo desnecessário que envolve o trabalho com dados, pois, segundo o autor, a única coisa que separa um iniciante de um especialista em dados é a prática.

Como o The Pudding trabalha

O The Pudding conta com uma equipe com formação e experiências variadas, da ciência da computação à biologia marinha ou jornalismo. Todas as ferramentas utilizadas pelo time são gratuitas e de código aberto, o que significa que qualquer pessoa pode usá-las. Portanto, o custo dos softwares não é uma barreira para quem quer trabalhar com visualização de dados. Basta tempo e persistência.

Os componentes do trabalho do The Pudding apresentados nesta série de postagens são: dados, visualização e o processo de escrita/storytelling.

Vejamos cada um deles, a começar com os dados.

Sentindo-se à vontade com programação

O primeiro texto da série aborda uma questão comum entre iniciantes em programação: qual linguagem aprender? A resposta depende do que você quer fazer. O autor prefere Python para trabalhar com dados, pois sua sintaxe é relativamente simples de entender e já existem muita bibliotecas, que são como complementos que você pode colocar em seu código, para lidar com quase qualquer tarefa envolvendo dados. Seu colega Russell, por exemplo, prefere JavaScript/Node. Já outro, Amber, usa a linguagem R e Matt prefere MySQL para o processamento de muitos dados.

Blinderman, o autor, trabalha com uma mistura de R, Python, MySQL e planilhas, dependendo do deseja fazer. Para análises básicas, segundo ele, o Excel ou o editor de Planilhas Google já são suficientes.

Confira abaixo alguns links úteis indicados no texto:

R

MySQL

JavaScript

Em Python, o autor sugere aos debutantes a resolução de exercícios de programação, indicando a utilização do Jupyter Notebook com Anaconda (não se preocupe com os nomes, basta lembrar que o Anaconda permite instalar coisas mais facilmente). O Jupyter oferece uma interface muito intuitiva e fácil de usar, transmitindo uma sensação de que o ato de programar é algo simples, além de ser uma plataforma na qual você pode editar e comentar rapidamente seu código. Se você nunca usou, confira este pequeno tutorial indicado no texto.

Depois de familiarizar com a programação, a sugestão de Blinderman é que você use o My First Python Notebook, apresentado como o melhor recurso de programação para iniciantes interessados ​​em trabalhar com dados. Ele mantém um discurso técnico mínimo, mas mostra o alcance das análises que você poderá fazer.

O autor reconhece que a primeira etapa do trabalho com dados pode ser um pouco irritante. A razão é que aprender a programar não requer apenas a aprendizagem de um certo número de comandos, mas uma nova maneira de pensar.

A capacidade mais importante de desenvolver no início é se sentir à vontade em aceitar que não sabemos como fazer algo e pedir ajuda, fazendo as perguntas certas. StackOverflow é o principal fórum no qual os programadores solicitam ajuda e conselhos.

Resumindo, as dicas da primeira parte do texto são:

1.- Ganhe uma noção básica de programação (o autor sugere a linguagem Python ou JavaScript).

2.- Fique irritado, deixe-se intimidar e depois supere isso.

3.- Não tenha medo de perguntar às pessoas que têm mais experiência. Eles terão prazer em ajudá-lo se perceberem que você está se esforçando.

Design

A segunda parte do texto busca aliviar algumas ansiedades que as pessoas encontram ao fazer visualizações de dados. Uma dica inicial é se inspirar com trabalhos de referência na área. Assim, você pode saber o que é possível ser feito, tanto no sentido do que pode ser visualizado, quanto em como fazer isso.

O próprio The Pudding é uma grande referência nessa área, mas o autor compartilham também outras sugestões:

Outra sugestão é criar sua própria lista de trabalhos favoritos, seja por conta da mensagem, pela apresentação visual ou a estratégia adotada para comunicar certos pontos. Você pode criar um documento para ir salvando estes exemplos ou usar o Sightline, um serviço e uma extensão do navegador Chrome que ajuda a “favoritar” e compartilhar visualizações.

Na hora de criar a sua própria visualização, é fundamental refletir sobre qual é o seu argumento central. Ou seja, qual é a mensagem-chave que você está tentando comunicar? Apenas depois de definir isto, é possível definir qual é o tipo de gráfico mais adequado para seu trabalho.

Nesta etapa, você pode revisitar alguns de seus exemplos favoritos para ver se há alguma inspiração ou algum tipo de gráfico que possa te servir também. Você também pode consultar o Data Visualization Catalogue e o Data Viz Project, duas plataformas que classificam tipos de gráficos e respectivos exemplos e descrições dos tipos de dados mais adequados para cada um.

Ainda que algumas possam começar a trabalhar em um gráfico diretamente no código, este não é o caso da maioria. Então, outra sugestão é rascunhar primeiro algumas visualizações estáticas usando alguma ferramenta mais simples para desenhos gráficos, como o Keynote, Adobe Illustrator ou o Figma. Quando você estiver feliz com o resultado do seu trabalho, então, aí sim comece a pensar em interatividade.

O post do The Pudding indica o livro ‘Interactive Data Visualization for the Web’ de Scott Murray como uma referência para quem deseja estudar interatividade e dados para web, a partir de linguagens como HTML, CSS e JavaScript.

O passo seguinte é conferir o código de outras pessoas que já precisaram resolver um problema semelhante ao seu. Neste sentido, vale conferir o Bl.ocks Builder, que reúne diversos exemplos de trabalhos de visualização de dados com seus respectivos códigos em JavaScript (usando a biblioteca D3). Você pode experimentar buscar tanto pelo tipo de gráfico que deseja criar, quanto por alguma função em específico.

No entanto, ainda assim, é possível que você tenha dúvidas. Neste caso, a dica é fazer perguntas. Você pode usar o grupo do D3 no Slack ou no StackOverflow, por exemplo. Ambos estão em inglês.

Um curto parênteses aqui: em português, nós temos também o Fórum de Jornalismo de Dados.

Elaborar visualizações de dados é um processo iterativo, onde partimos de rascunhos mais simples para então experimentar e evoluir com melhorias. É assim que grandes equipes trabalham. No guia, são referenciando diversos rascunhos de trabalhos da Scientific American e do Google News Lab para exemplificar este ponto.

Por fim, é apresentada uma palestra de Mike Bostock, criador do D3.Js, que trabalhou por anos com visualizações de dados no New York Times. Basicamente, sua mensagem é que bons trabalhos nesta área são frutos de trabalho árduo, mais do que algum talento estético inato. A mensagem final é consoladora, segundo o guia: se uma pessoa deste calibre tenta centenas de diferentes abordagens para ver qual é a melhor, então, isso é um bom sinal para nós continuarmos trabalhando duro também.

Escrita e Storytelling

A última parte da série de posts tem um caráter um pouco diferente. Enquanto as dicas anteriores focaram muito no “como”, apresentando caminhos introdutórios para quem quer começar a se aventurar na área, a postagem sobre ‘storytelling’ traz um conceito mais nebuloso.

As dicas sobre a etapa de escrita ou produção do storytelling de uma história baseada em dados serão apresentadas a partir de alguns pontos: quem é o seu público? Seu foco é amplo ou restrito? Quão complexa é sua mensagem principal? Como você irá desenvolver seu argumento? E, por último, como você chegou a sua conclusão?

Vejamos abaixo cada um destes pontos.

Quem é seu público?

Aqui, o autor vê duas respostas possíveis. Ou você tem pela frente um projeto pessoal, cujo público primordial é você mesmo, ou terá que fazer um trabalho para outras pessoas.

No caso de projetos pessoais, Ilia Blinderman vê grandes possibilidades de experimentação e criatividade. No texto, ele conta sobre sua experiência pessoal com o trabalho All the lonely people, que desenvolveu por conta própria e onde teve oportunidade de praticar com tecnologias como QGIS, JavaScript e etc. “Muitas vezes, projetos pessoais são mais animadores do que trabalhos comissionados e publicados, em grande parte porque os autores colocam muito de si mesmo em suas criações”, afirma.

Já trabalhar para outras pessoas, te ajuda a trabalhar sob certas restrições. Isso muitas vezes nos força a eliminar ou reduzir problemas técnicos ou estéticos que são irrelevantes para a entrega daquilo que se pretende. Ou seja, trabalhar para outras pessoas também ajuda a nos focar naquilo que realmente importa. Aqui, ele apresenta um lema: “o mínimo produto viável primeiro, todo o resto depois”.

Segundo ele, trabalhar para outras pessoas também tem outra vantagem. Nestes casos, você também é forçado a se comunicar de maneira mais clara do que quando está contando uma história para si mesmo. Portanto, é importante conhecer quem será sua audiência, seus conhecimentos prévios e até mesmo acatar algum grau de redundância nas explicações, para garantir a compreensão das informações. Ainda que não dê para comunicar todas as nuances de sua análise, você deve garantir que o público tem contexto suficiente para compreender seu raciocínio e suas conclusões, após ler seu trabalho.

Seu foco é amplo ou restrito?

Nesta seção, o autor delineia duas situações muito comuns ao trabalhar com dados. Na primeira, você tem apenas uma base de dados e um foco amplo. Neste caso, o mais importante é o processo exploratório em si ou alguma motivação existente para conhecer mais a fundo algum tema. Depois de analisar os dados de diversas formas, pode ser que você termina com diversos gráficos, notas, conclusões curiosas ou outras ideias anotadas em um documento. Tudo isso, porém, não é a história que será publicada.

Segundo ele, o perigo dessa abordagem ampla é o momento onde, após muitos dias de análise, percebe-se que não há nada particularmente interessante nos dados. E, como afirma Ilia Blinderman, “se não houver ideias que capturem sua curiosidade, você pode ter certeza de que será um grande esforço capturar a do seu leitor”.

Ao contrário, a abordagem estimulada no The Pudding parte de um foco restrito, delimitado por uma questão central, que é passível de ser respondida não só por uma, como por diversas bases de dados. Questões que te animam ou que geram debates entre pessoas próximas são bons sinais, em geral. Segundo ele, formular sua história como uma resposta baseada em dados a uma certa pergunta pode ajudar também a conquistar o interesse do público.

Em resumo, se o seu conjunto de dados for interessante por si só, você pode explorá-lo e adotar uma abordagem mais livre para sua história, permitindo que os insights surjam durante sua análise. Mas é mais fácil partir de uma questão interessante do que torcer para encontrar tais insights em um conjunto de dados.

Depois da análise, quão complexa é sua ideia?

O post de Blinderman recomenda também se considerar o grau de complexidade da ideia mais importante de sua história. Caso se trate de algo simples, que você conseguiria explicar de forma sucinta e objetiva para outras pessoas que não são da área, por exemplo, então a recomendação é que você comece sua história já “com o pé na porta”, apresentando de cara seu argumento principal. Nesta linha, o autor cita uma matéria do The Pudding sobre bandas de punk populares.

Já quando o assunto é complexo, a dica é começar com um personagem. As pessoas “incorporam” as estatísticas e podem comunicar uma experiência humana, que tem mais chance de capturar a atenção das pessoas, quando comparada aos “números frios”. O modo mais fácil de fazer isso é contar a história de um registro dos seus dados.

Pareceu abstrato? Blinderman dá um exemplo próprio no post: esta reportagem do The o Pudding sobre demissões causadas pela automação de processos, onde ele começa a história falando a partir da perspectiva de um setor específico, os motoristas de caminhões. Você não precisa seguir toda a história falando apenas deste mesmo registro, mas este recurso pode funcionar como uma isca para fisgar a atenção do seu leitor. Assim, você pode explicar a complexidade do tema em uma escala menor antes de lidar com as conclusões mais amplas.

Desenvolvendo seu argumento

Neste ponto, a reflexão é sobre como vamos dividir nossa mensagem entre textos e gráficos. No The Puddings, eles fogem de histórias com muitos textos e tentam mostrar os principais insights por meio de gráficos. O veículo não trabalha com modelos (templates) pré-definidos, mas ainda assim Blinderman destaca três abordagens recorrentes.

  1. Empilhe um gráfico e um argumento: quando existem diversos argumentos e aprendizados na sua história, uma boa solução pode ser usar um gráfico para cada seção e, para cada um deles, desenvolver o argumento central em um texto. Um dos benefícios desta solução é que fica bem fácil integrar os gráficos nos textos, utilizando ferramentas comuns, como o ggplot ou o Flourish, por exemplo.
  2. Scrollyteling: esta técnica utiliza da função de rolar a página com o mouse ou o teclado como uma parte fundamental da narrativa. Comum nos trabalhos do The Pudding, esta abordagem funciona bem quando há um gráfico central e certas animações ou efeitos podem ser disparadas à medida que os usuários rolam a página. Entre as vantagens do scrollytelling, Blinderman destaca uma experiência altamente fluida e agradável para o leitor. Por outro lado, atualmente é bastante trabalhosa a implementação do scrollytelling de forma funcional tanto para dispositivos móveis quanto para computadores de mesa.
  3. Toque a toque ou passo a passo: uma vez que o scrollytelling é tão trabalhoso, o The Pudding também utiliza outras abordagens, como a aplicada nesta matéria sobre música pop. Ao invés de rolar a tela, o usuário precisa apenas clicar na página. O autor menciona que o veículo já chegou a aplicar abordagens assim até em posts no Instagram, usando imagens no modo carrossel. A grande vantagem é que é bem fácil criar conteúdos assim e de quebra ainda te ajuda a ser breve nos textos, já que não é possível encaixar muito conteúdo em uma tela de celular, por exemplo.

Como você chegou a sua conclusão?

Aqui, o autor destaca a importância de ter transparência quanto aos caminhos adotados na investigação, que embasaram as conclusões apresentadas. No The Pudding, em geral, é publicada também uma seção sobre o método utilizado, após a conclusão da matéria. É ali que ficam os links para os dados utilizados e as explicações sobre os cálculos feitos.

A publicação do método e a transparência quanto aos códigos utilizados ou análises feitas ajudam a dar mais credibilidade a seu trabalho e também permitem que leitores experientes possam revisá-lo criticamente. Como um exemplo notório de transparência quanto a isso, Blinderman destaca o trabalho How We Analyzed Google’s Search Results do The Markup.

Conclusão

Após destacar questões sobre o público, o objetivo de cada trabalho, suas complexidades e as melhores formas de visualizar os dados e contar uma história, Blinderman conclui o texto compartilhando o email de contato do The Pudding, seu perfil no Twitter e outros links interessantes. Confira aqui os links paras três partes do artigo em inglês: dados, design e storytelling.