Um mundo de possibilidades: aula de raspagem e visualização de dados no Rio
Por Déborah Araujo
Colocar os dados em perspectiva. Essa seria a definição do quarto e penúltimo dia (11) do curso “Introdução ao Jornalismo de Dados” na Escola de Comunicação da UFRJ. Nessa aula, os participantes aprenderam – a partir de exemplos de grandes reportagens e muitos exercícios em sala – a usar programas de raspagem de dados da web e construir diferentes tipos de gráficos com ferramentas gratuitas de visualização. “Precisamos tentar ver as páginas com os olhos do computador. Cada página é formada por blocos de códigos”, explica o programador e jornalista Marco Túlio Pires. Cada código é o HTML – HyperText Markup Language (ou Linguagem de Marcação de Hipertexto) de uma página da internet.
É possível visualizar essa organização modular em qualquer página clicando com o botão direito do mouse e na opção “Inspecionar elemento”, que abre a barra webinspector. Conhecer essa função é essencial para a raspagem de informações pelo programa Web Scraper uma ferramenta para Google Chrome. O mais interessante é que permite raspar informações de um link com várias páginas, como a Billboard 200, lista das músicas que fazem mais sucesso atualizada semanalmente. Uma forma mais simples é raspar os dados e importar em uma planilha do Google Sheets por meio do código =importHTML(“url”,”query”,”index”) digitado na primeira célula – o termo “query” sendo substituído por uma “tabela” ou “lista” de dados. Essa fórmula pode ser usada raspar informações da web que parecem visualmente desorganizadas ou inutilizáveis. Uma vez importados para a tabela, é possível limpar esses dados no Open Refine ou fazer tabela dinâmica no Excel, como visto nas aulas anteriores.
Mas a cereja do bolo na primeira parte da aula foi o site IfThisThenThat – IFTTT. A plataforma permite cruzar dados ao usuário cruzar dados de diferentes sites e programas. Pode-se programar comentários sobre o clima na sua página do Facebook a partir de dados de um site de previsão do tempo, ou até mesmo raspar informações para uma planilha do Google Sheets sobre usuários do Instagram que tiraram fotos em um museu de qualquer lugar do mundo. “É uma ação que dispara outra ação. A pessoa pode raspar dados sem saber programar, são muitas as possibilidades”, ressalta Pires.
Funcionalidade e estética
“Todo bom infográfico é funcional como um martelo, multidimensional como uma cebola, belo e verdadeiro como uma equação matemática.” A frase do design gráfico Alberto Caio ilustra a segunda parte da aula, ministrada pela jornalista Natália Mazotte, tutora da Escola de Dados. Ela apresentou à turma soluções estéticas interessantes para projetos de visualização de dados. “Ser funcional, verdadeira, multidimensional, bonita e esclarecedora são os atributos que uma visualização deve ter”, observa Mazotte.
As funções dos gráficos – mostrar, comparar, classificar e/ou correlacionar – devem ser escolhidas de antemão para guiar a forma como a visualização será construída e o leitor possa interagir com as diversas camadas de informação. “Quanto mais funções você reunir no seu gráfico, mais completo ele é”, acrescenta Mazotte. Para mais dicas sobre visualização, a jornalista recomenda o The Data Visualization Catalog. Natália Mazotte também apresentou algumas plataformas muito utilizadas por redações e profissionais no dia a dia.
O Infogr.am é uma das mais recomendadas, por conta de sua interatividade nos gráficos e a possibilidade de acrescentar vídeos e imagens. Além disso, o infográfico construído pode ser inserido na página da notícia. Outro programa recomendado para contar histórias e incorporar elementos interativos é o Timeline.js, que é criado a partir de uma planilha no Google Drive. Ainda em aprimoramento, o Odyssey.js permite a construção de histórias interativas conforme o usuário passa o mouse pela página. A plataforma foi inspirada na lógica narrativa de rolagem da reportagem multiplataforma Snow Fall, do jornal The New York Times. Por fim, o Tableu Public, que se destaca por permitir a visualização simultânea de diferentes planilhas. “Ele permite filtrar sua base de dados e faz o resto do trabalho por você. Mas o Tableu só funciona com os dados previamente limpos por completo”, completa Mazotte.