#38 Regulação do lobby, microdados do Inep e mais
Agosto/2022
AGENDA
Oportunidades e prazos para não perder de vista
• 01/09 – Começa o nosso curso Publicadores: gerenciando dados abertos com o CKAN. As inscrições também seguem abertas.
• 01/09 – Seminário do CGI.br sobre regulação de plataformas digitais no Brasil. Evento presencial em São Paulo, com transmissão ao vivo pelo YouTube.
• 02 a 04/09 – O Hackathon Pegabot, do Instituto Tecnologia e Sociedade (ITS Rio), promove soluções criativas no combate à desinformação e oferece prêmios de até R$ 5 mil.
• 02 a 04/09 – Hackathon de ferramentas de investigação de análise de redes de mídias sociais do Bellingcat.
• 07/09 – Lançamento do ¡Sigan el dinero!, manual da Organized Crime and Corruption Reporting Project (OCCRP) para ajudar jornalistas a buscar empresas, propriedades, contratos públicos e processos judiciais na América Latina. O evento será às 16h no horário de Brasília.
• 13/09 – Mais uma edição do Cerveja com Dados Porto em Alegre, a primeira pós-pandemia.
• 14/09 a 15/09 – Git Merge 2022, grande encontro internacional da comunidade Git.
• 15/09 – Data limite para inscrições para as bolsas FAPESP de projeto de pesquisa ligado a Wikidata, Wikimedia Commons, Wikipédia e o software livre Tainacan.
• 18/09 – Prazo final para inscrições na 4ª edição do Prêmio Cláudio Weber Abramo de Jornalismo de Dados.
• 19 a 22/09 – Code for All Summit 2022 tem sessões gratuitas para todas as pessoas interessadas em tecnologia cívica.
• 23 a 25/09 – Mais um hackathon do Bellingcat, desta vez de ferramentas gerais de investigação digital. Inscrições até 16/09.
• 26/09 – Prazo final para inscrição no curso de formação tecnopolítica, marketing digital e racismo ambiental da Casa Preta, realizado no âmbito do projeto “Fortalecendo o Ecossistema de Dados e Inovação Cívica na Amazônia Brasileira”, do programa Vozes pela Ação Climática Justa – VAC.
• 15/10 – Prazo para se inscrever no Fellowship for Prospective Leaders, com bolsas de até € 2.600 mensais, organizado pelo German Chancellor Fellowship.
• 17 a 21/10 – Data da Coalesce, conferência voltada à engenharia analítica e a pessoas que trabalham com dados.
• 17 a 23/10 – Ocorre a Python Brasil, em Manaus (AM).
• 31/10 a 06/11 – É a vez da sétima edição da Conferência de Jornalismo de Dados e Métodos Digitais, Coda.Br 2022, que terá atividades online e em São Paulo.
NO MUNDO DOS DADOS
Notícias e discussões quentes
Regulamentação do lobby para mais transparência
Um artigo publicado na revista Consultor Jurídico destaca que a divulgação de escândalos como o caso dos “pastores do MEC”, apurado utilizando dados da agenda pública de gestores políticos, reacenderam a discussão sobre a regulamentação do lobby e a aprovação de projeto de lei sobre o tema pelo Congresso Nacional.
O artigo esclarece que nos Estados Unidos, após inúmeros escândalos envolvendo a falta de transparência na relação público-privada, o governo aprovou o Lobbying Disclosure Act que, na prática impõe medidas de transparência nas relações entre particulares e agentes públicos para defesa de interesses, sobretudo, por meio de medidas de cadastro e identificação dos profissionais que atuam com lobbying (lobbyists), registros e divulgação dos contatos realizados com agentes públicos e vedações a ex-agentes públicos relativas a assumir esse tipo de função, que se estende por um ano após a saída de suas funções.
No Brasil, ainda lidamos com a falta de dados atualizados e padronizados sobre a agenda pública, desafio que vem sendo superado por meio do uso da Lei de Acesso à Informação e ferramentas de inovação cívica como a Agenda Transparente, projeto da Fiquem Sabendo.
Inep e os microdados do Enem e Enade
O Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira (Inep), vinculado ao Ministério da Educação, voltou a publicar o conjunto de microdados do Exame Nacional do Ensino Médio (Enem) e do Exame Nacional de Desempenho dos Estudantes (Enade). Os microdados dessas e outras avaliações haviam sido excluídos do portal sob alegação de cumprimento à Lei Geral de Proteção de Dados Pessoais (LGPD), afetando pesquisas e análises do desempenho e estrutura escolar em todo País. A republicação segue recomendações da Controladoria Geral da União. Confira aqui o calendário.
Por governos estaduais mais transparentes
A Open Knowledge Brasil (OKBR) e a Rede de Embaixadoras de Inovação Cívica lançaram a campanha #CartaPorUmGovernoEstadualAberto, iniciativa que propõe a pessoas candidatas a governos estaduais e assembleias legislativas no Brasil a priorização da transparência e a abertura dos dados públicos.
As cartas pedem o cumprimento do direito de acesso à informação pública e da Lei de Acesso à Informação, o incentivo da transparência em toda a administração pública estadual, processos e instrumentos destinados à abertura, atualização e melhoria dos dados fundamentais para o cumprimento da LAI e adequação da Lei Geral de Proteção de Dados Pessoais, e outros itens relacionados. Confira aqui as versões das cartas para o executivo e o legislativo.
Contra o pedágio do governo digital
Diversas entidades brasileiras estão participando da “Assinatura – Manifesto sobre PL 2224/21”, projeto de lei que impõe cobrança para acesso e processamento de dados públicos. A Open Knowledge Brasil é uma das organizações signatárias do manifesto que defende investimento em estruturas de abertura de dados e transparência ativa. Outras entidades interessadas em participar da mobilização, podem encaminhar um e-mail para secretariaexecutiva@direitosnarede.org.br com o assunto “Assinatura – Manifesto sobre PL 2224/21” e o nome da organização signatária no corpo do e-mail.
Por dentro da rstudio::conf(2022)
Flávia E. Rius, Beatriz Milz e Julio Trecenti compartilharam suas impressões pessoais sobre a maior conferência da linguagem, realizada no fim do mês de julho, no blog curso-r. Eles destacaram os workshops, palestras e keynotes que mais gostaram, e compartilharam diversos links contendo parte da documentação do evento.
E Cédric Scherer, um dos instrutores do evento, compartilhou seus 2 dias de workshops de design gráfico com ggplot2,contendo 9 sessões, 760 slides e 314 ggplots. A própria organização da conferência também soltou links com as gravações abertas das palestras e keynotes, além de alertar para ficarmos de olho no próximo post de blog que vai resumir os materiais do evento.
SAIBA MAIS
Para aprender mais e aprender sempre
Cursos sobre Lei de Acesso à Informação
A Controladoria da Prefeitura de São Paulo está com inscrições abertas para dois cursos gratuitos relacionados à Transparência Pública. O primeiro é o curso de Lei de Acesso à Informação – Ferramenta de Controle Social, direcionado principalmente para Conselheiros Públicos Municipais. O segundo é o curso de Pedidos de Informação Pública: ferramenta de Cidadania. As aulas acontecem em setembro, online e ao vivo. As inscrições vão até esta quarta-feira, dia 31/08 e as inscrições podem ser feitas por cidadãos de qualquer lugar do Brasil.
Incrementando investigações ambientais
Um post da Global Investigative Journalism Network (GIJN) destaca um dos painéis da conferência Interconnected: Reporting the Climate Crisis, do Pulitzer Center, onde repórteres e designers ambientais contaram como usam dados e suas visualizações para tornar suas investigações mais atrativas.
Profissionais que cobrem a Tailândia e a África Ocidental compartilharam suas experiências investigando desmatamento e a seca, e o painel – que está disponível online – também contou com a participação do jornalista brasileiro Hyury Potter falando sobre o projeto Amazônia Minada, que mapeia solicitações de mineração ilegal em terras indígenas e áreas protegidas em tempo real. Hyury também esteve em julho no Coda Amazônia, ensinando como investigar dados georreferenciados.
Para saber mais sobre mapas e visualizações, confira também a documentação de nossa conferência, que conforme mencionamos acima, está disponível no site do evento.
Estatística para cientistas de dados
No blog Towards Data Science, Adrienne Kline, acadêmica de pós-doutorado na Northwestern University em aprendizado de máquina e saúde, iniciou uma série de bootcamps sobre estatística, com o fim de ensinar a matemática e os métodos por trás das bibliotecas que utilizadas diariamente por cientistas de dados. O primeiro deles é sobre os fundamentos, já o segundo aborda centro, variação e posição e o terceiro se dedica a explicar probabilidade.
Novo guia sobre jornalismo de dados
No início deste mês, Bianca Muniz, analista de dados da Agência Pública; Elena Wesley, coordenadora de conteúdo do data_labe; e Graziela França, diretora de conteúdo da Agência Tatu apresentaram o painel “Jornalismo de dados para mudar realidades” no 4º Domingo de Dados da Abraji.
Os slides da apresentação, contendo trabalhos relevantes das três iniciativas, estão disponíveis online, e outro produto da ocasião foi a criação do guia “Jornalismo de Dados e o impacto no cenário local“, organizado pelas três profissionais, com algumas dicas e referências relevantes sobre o tema.
SNIPPETS
Dicas curtas e certeiras
No Dados Finos, Guilherme Storck disponibilizou um tutorial sobre como fazer mapas de calor utilizando o Google Data Studio.
•
O pesquisador Rodrigo Cunha está com uma vaquinha virtual para iniciar seus estudos sobre o consumo de visualizações gráficas por pessoas cegas e de baixa visão.
•
O Internetlab lançou a segunda edição do relatório “Os Vetores da Comunicação Política em Aplicativos de Mensagens: hábitos e percepções do brasileiro”.
•
Tutorial do Bellingcat ensina a usar novas tecnologias para investigar fotografias antigas.
•
O Bellingcat também elencou as ferramentas que os pesquisadores de código aberto afirmam mais utilizar, em recente pesquisa promovida pelo coletivo de investigações digitais.
•
A Wired conta agora com um banco de dados de suas reportagens sobre inteligência artificial, com opção de filtragem por aplicação, usuário final, setor e pela tecnologia.
•
Em palestra à Redação da Folha, Ben Welsh, do Big Local News, destacou iniciativas e experiências de jornalismo de dados local.
•
A GIJN trabalhou com uma equipe de especialistas da Fundação Ford para adaptar a Ferramenta de Avaliação de Segurança Cibernética (CAT) da Ford para uso por grupos jornalísticos investigativos.
•
João Vitor da Silva Gomes ensina a explorar o dataset MNIST de dígitos manuscritos com a biblioteca Keras, no Python, e também mostra como construir uma tabela de frequências para dados agrupados com Pandas.
INSPIRA
Trabalhos e iniciativas inovadoras para te inspirar
Criado em janeiro de 2021, o projeto Girl Be the Captain é de divulgação de rock, mulheres e infográficos. No perfil do Instagram, toda semana tem um retrato de uma mulher que arrasa (ou arrasou) no mundo do rock e três infográficos para descobrir mais sobre ela: um retrato, sua “rede” e uma cronologia de sua carreira.
A primeira mulher perfilada foi Courtney Love, dona da famosa frase “Não namore o capitão do time de futebol, seja o capitão do time”, expressão que dá nome ao projeto. No infográfico cronológico, é possível acompanhar numa linha do tempo o lançamentos de álbuns e singles, além das participações mais expressivas das artistas, dentro e fora dos palcos.
Há também um belíssimo exemplo de utilização de grafos para mostrar como as personagens já mencionadas nas publicações se relacionam entre si.
NOVOS DADOS
Conjuntos de dados e plataformas publicados recentemente
Gabriel Zanlorenssi está disponibilizando sua sistematização em planilhas das transcrições dos debates presidenciais.
O Mapbiomas lançou uma nova versão do Monitor do Fogo. O novo sistema difere e complementa o monitoramento do INPE (Instituto Nacional de Pesquisas Espaciais) porque avalia as cicatrizes do fogo, e não os focos de calor.
O Conselho Nacional de Justiça (CNJ) lançou o Sistema Nacional de Investigação Patrimonial e Recuperação de Ativos (Sniper), que identifica em segundos os vínculos patrimoniais, societários e financeiros entre pessoas físicas e jurídicas.
O Inep disponibilizou novamente os microdados das edições de 2010 a 2015 do Exame Nacional do Ensino Médio (Enem) e os de 2012 e 2013 do Exame Nacional de Desempenho dos Estudantes (Enade), junto com um cronograma para a liberação dos microdados das demais edições.
APT UPDATE
Atualize-se com as novidades de softwares e bases de dados
A versão 3.0 do Brazil Data Cube Explorer apresenta recursos aprimorados para acessar e visualizar séries temporais de imagens extraídas de cubos de dados e trajetórias de uso e cobertura da terra.
•
Datawrapper lança novo recurso para criar anotações de texto em gráficos de colunas agrupados e empilhados, que tenham categorias abaixo da coluna.
•
Visual Studio Code agora permite ir para a célula com falhas mais recentes no notebook, remover importações com Pylance, copiar imagens de saída na célula do Jupyter notebook, entre outros.
•
SportyR 2.0 traz introdução de intervalo de exibição, novo conjunto de dados internos, documentação atualizada, entre outros.
•
A versão Maltego 4.3.1 adicionou a coluna Time, que permite filtrar os resultados por propriedades de tempo para novas integrações, além de correções de bugs.
•
Fernando Barbalho criou um script em R que baixa do CKAN um pdf com tabelas de tetos dos gastos, extrai as tabelas, transforma para tidy e devolve uma lista com dois dataframes com as tabelas.