A partir desta semana, o jornal Correio 24 horas disponibiliza todos os dados sobre balneabilidade* das praias da Bahia desde 2007. Em parceria com a Escola de Dados, o jornal conseguiu extrair dados de 1,4 mil boletins acessados no portal Balneabilidade do Instituto do Meio Ambiente e Recursos Hídricos (Inema) e utilizados em uma série de quatro reportagens que mostraram a situação das praias na Bahia.

Os boletins estão disponibilizados em planilhas, disponíveis no GitHub do Correio 24h. Além deles, a Escola de Dados também disponibilizou os códigos em Python utilizados para raspar os dados do sistema do Inema. Isto porque os boletins gerados pelo sistema são publicados no formato PDF, que não é lido por máquinas.

Álvaro Justen, responsável pelo programa de cursos da Escola de Dados e pela liberação dos dados e códigos, ressalta que o objetivo é permitir que outras pessoas que queiram desenvolver trabalhos similares não tenham que passar por todas as etapas de raspagem e conversão de dados novamente, o que acaba restrito àqueles que detêm conhecimentos de programação.

Para o desenvolvedor da Escola de Dados, disponibilizar esses dados e códigos ajuda a fomentar o ecossistema e o uso de dados públicos, permitindo que outras pessoas consigam estudar e entender melhor o que está acontecendo na sociedade. Outras bases também estão sendo liberadas no Brasil.IO, projeto que agrega dados de interesse público em formato aberto e livre.

Em matéria para o Correio, Juan Torres, editor de inovação do jornal, explica: “As matérias que fizemos foram fruto das análises realizadas pelo CORREIO. No entanto, ao abrir os dados e o código, a gente permite que qualquer pessoa possa fazer suas próprias análises”.

 


Balneabilidade é a capacidade que um local tem de possibilitar o banho e atividades esportivas em suas águas, ou seja, é a qualidade das águas destinadas à recreação de contato primário.