O post abaixo é a tradução do relato 5 things I learned at #CodaBR, Brazil’s first data journalism conference, de Keila Guimarães. Confira:

Um grupo de pesquisadores de dados, jornalistas e estudantes se reuniu no sábado, dia 21, em São Paulo para a #CodaBR – Conferência Brasileira de Jornalismo de Dados, a primeira rodada de conversas e workshops sobre jornalismo de dados.

O evento foi organizado pela  Escola de Dados, parte de uma rede que oferece treinamento de dados pelo mundo, com o apoio do Núcleo de Informação e Coordenação do Ponto BR (NIC.br), uma entidade civil sem fins lucrativos que trabalha com o domínio .br do Brasil.

Durante 10 horas de evento, participantes estiveram presentes nos workshops de limpeza de dados com Python, mapeamento com GIS, análise estatística, programação em R para jornalismo, raspagem de dados, além de conversas sobre acesso à informação, privacidade e segurança digital.

Aqui estão meus cinco tópicos da #CodaBR:

1) Jornalistas precisam pressionar por dados abertos

Lei de Acesso à Informação é relativamente nova no Brasil – a primeira lei garantindo acesso à informação pública aos cidadãos (e imprensa) tem efetivamente estado em vigor desde 2012. A lei objetivava trazer mais transparência ao determinar que qualquer informação de interesse público deveria se tornar pública. Também deu aos cidadãos e jornalistas o poder de requerer qualquer dado a órgãos governamentais e obtê-lo sem nenhum custo.

O defensor do acesso à informação Fabiano Angélico falou sobre como plataformas de transparência poderiam ser mais acessadas por jornalistas no Brasil. Numa época em que os jornais do país estão escolhendo disputas legais com governos locais para acessar dados públicos, jornalistas poderiam ir além usando as ferramentas disponíveis para monitorar o poder e fazer com que os responsáveis por decisões prestem contas.

Sites como Dados Abertos, Portal da Transparência e Siga Brasil poderiam funcionar como fontes para pesquisar dados sobre órgãos públicos. Fazendo pressão nos órgãos públicos para liberar informações pela lei de acesso, repórteres poderiam exigir mais dados abertos e transparência. Aos interessados em fazer um requerimento pela Lei de Acesso à Informação, aqui está um guia prático da Abraji.

2) Existe um substituto para o VLOOKUP e ele é bem bacana

Todo mundo que já teve que usar a função VLOOKUP provavelmente já se deparou com um monte de resultados #N/A e #ERROR na planilha. Eles provavelmente se desesperaram quando não conseguiram achar um motivo para a fórmula estar quebrada. A boa notícia é que aparentemente existe uma fórmula que faz o mesmo que a função VLOOKUP – com menos drama. Uma combinação de fórmulas chamada Match e Index no Google Sheets funciona bem como substituta da detestável VLOOKUP. A dica foi dada por Marco Tulio Pires, da School of Data, no workshop de análise de dados. A multidão não conseguia esconder seu entusiasmo. Usando as duas fórmulas, conseguimos combinar duas planilhas, fizemos com que elas navegassem por ambas as abas e trouxessem apenas os dados que queríamos ter em nossa análise. Felicidade define. Um tutorial de como combinar Match e Index está aqui (em inglês).

3) R é uma ferramenta ótima para visualização, não apenas para análise de dados

Anteriormente, eu tinha uma ideia parca do que era R e sempre pensei que fosse ótimo para extrair e estruturar dados, e analisar informação. Mas R é muito, muito mais!

Como David Opoku da School of Data colocou, “R é um ambiente no qual você pode fazer todo o seu trabalho de dados”. Como jornalistas de dados, estamos acostumados a analisar dados no Excel e depois trabalhar em visualizações em plataformas de terceiros – seja CartoDB, Tableau, ou alguma outra.

O que me surpreendeu é que existem ótimos pacotes de R por aí para a gente trabalhar, e esses pacotes permitem que você produza visualizações poderosas. Uma que conseguimos entender um pouco melhor foi a Leaflet, biblioteca em JavaScript útil para mapas interativos.

Aqui está um tutorial para o pacote no GitHub.

4) A América Latina está indo muito bem no jornalismo de dados – só que não falamos sobre isso

Há um ótimo jornalismo de dados sendo feito na América Latina – só que passamos menos tempo falando sobre isso. Projetos como o da TV Globo sobre as mortes pela polícia de São Paulo, como a investigação feita pelo Ojo Publico sobre financiamento político de campanhas no Peru, mostram a abrangência das narrativas de dados na região.

Esses projetos mostram que os jornalistas na América Latina estão se esforçando para contar histórias apoiadas em dados, em vez baseadas apenas em evidências anedóticas. Aqui está uma lista de projectos destacados na conferência:

  • A Farra do FIES – Estadão Dados descobriu como o governo deu milhares de milhões de reais para universidades privadas brasileiras a fim de aumentar o número de graduados no país, mas não conseguiu fazê-lo
  • LGBTfobia – um projeto do Huffington Post Brasil destacando a falta de informação pública sobre violência contra pessoas LGBT
  • Mortes pela polícia – analisando arquivos da polícia em São Paulo, obtidos pela lei de acesso, a TV Globo descobriu que uma em cada quatro pessoas assassinadas na polícia foi morta pela polícia
  •  #FondosdePapel – uma investigação do Ojo Publico no Peru descobriu uma rede de corrupção no sistema de financiamento de campanhas políticas no país
  •  A face real da desnutrição – A investigação do jornal Plaza Publica mostrou a real dimensão da desnutrição infantil na Guatemala e mostrou os relatórios imprecisos do governo sobre o assunto
5) Jornalistas de dados precisam se reunir mais

Há um grande senso de comunidade no mundo da tecnologia e não é diferente com o mundo do jornalismo de dados. Tanto os repórteres interessados na obtenção de novas habilidades e programadores dispostos a ajudar redações com sua experiência podem fazer mais quando trabalham em rede.

Ter a oportunidade de partilhar ideias e compreender as capacidades uns aos outros é necessário para fortalecer a comunidade. Jornalistas de dados no Brasil estão certamente ansiosos para a próxima #CodaBR, desenvolvendo ainda mais a comunidade e seu potencial.