18 e 19/11 – ESPM SÃO PAULO (CAMPUS ÁLVARO ALVIM)
R. DR. ÁLVARO ALVIM, 123 – VILA MARIANA
GERENCIANDO, PUBLICANDO E CONSUMINDO DADOS COM CKAN
Texto por Vitor Arthur
A publicação e raspagem de dados abertos é algo importante no trabalho do jornalista de dados. Hoje, muitos órgãos públicos e organizações utilizam a Comprehensive Knowledge Archive Network (CKAN) para a disponibilização dessas bases. Neste workshop, Pedro Guimarães (Open Knowledge Brasil) e Vitor Baptista (Fiquem Sabendo) ensinaram como utilizar o gerenciador para publicar e coletar dados abertos.
A CKAN é uma plataforma livre, de código aberto, para criação de repositórios de dados, dispondo de interface gráfica e API. Originada em 2008 e desenvolvida pela Open Knowledge, a ferramenta está em constante atualização e é considerada um Bem Público Digital. O gerenciador é desenvolvido em Python com PostgreSQL.
No início da atividade, os instrutores explicaram que, por mais que a base do CKAN tenha um visual básico, muitas instituições utilizam de maneira customizada, como o Portal de Dados Abertos do governo federal, os dados abertos do Governo do Estado de São Paulo e a ONG Base dos Dados.
A plataforma disponibiliza diversas funções para o gerenciamento e disponibilização de dados. Para publicadores, a CKAN pode ser instalada em um servidor, com a possibilidade de modificar sua interface de usuário e expandir funcionalidades por meio de plugins.
Entre as principais funcionalidades do gerenciador de dados estão a descrição de metadados, publicação de dados de maneira agnóstica (podendo ser qualquer tipo de arquivo), busca avançada, personalização do design e visualização de dados. A depender da instituição, APIs também podem ser disponibilizadas ao usuário, permitindo o acesso de maneira programática.
Pedro explicou que, ao utilizar a API do próprio CKAN, há a possibilidade de executar tarefas por meio da interface gráfica. Se disponibilizado pelo administrador, é possível o acesso a dados por meio do DataStore, extensão do CKAN, para capturar os dados, por meio de requisições normais ou utilizando SQL.
Ao final da atividade, os instrutores mostraram ainda como fazer requisições de dados utilizando a API do CKAN, por meio do HTTPie, plataforma para realização de consultas de forma mais intuitiva. O exemplo utilizado foi o portal de dados abertos da Prefeitura de Recife.
Referências
Gerenciando, publicando e consumindo dados com CKAN
Portal de dados abertos do Governo Federal
Não há pré-requisitos.
PEDRO GUIMARÃES
Agente cultural, ativista dos movimentos de software livre, código aberto, libertação animal, meio ambiente, educação popular, transparência pública. Bacharel em Ciência da Computação pela UFPB (2012), atua desde 2010 como engenheiro, analista e desenvolvedor de software, em especial com Sistemas de Informação Geográficos (SIG) e mapas. Atuou entre 2013 e 2015 como consultor da ONU/PNUMA dentro do MCTI no LNCC, responsável pelo explorador geográfico de dados do Sistema da Informação Sobre a Biodiversidade Brasileira. Entre 2016 e 2021 atuou como consultor para o Greenpeace com dados de políticas públicas, monitoramento e proteção ambiental. Atua desde 2021 na equipe da OKBR como Engenheiro de Dados para o projeto Querido Diário.
VITOR BAPTISTA
Gestor de Tecnologia da Fiquem Sabendo, agência especializada na Lei de Acesso à Informação, onde desenvolve a primeira plataforma brasileira para monitorar as agendas de autoridades, o Agenda Transparente. Vitor tem mestrado em Ciência da Computação e trabalha com tecnologias cívicas desde 2011, quando fez parte da comunidade Transparência Hacker. Foi líder técnico na Open Knowledge International como membro das equipes de desenvolvimento do CKAN, Frictionless Data e outros. É o mantenedor do Queremos Saber, plataforma para envio de pedidos de acesso à informação sem identificação, e cientista de dados em uma startup dos EUA. Seu maior interesse é em como a sociedade pode usar dados para o bem coletivo.
Nosso conteúdo está disponível sob a licença Creative Commons Atribuição 4.0 Internacional, e pode ser compartilhado e reutilizado para trabalhos derivados, desde que citada a fonte.