Agosto/2022

AGENDA

Oportunidades e prazos para não perder de vista


01/09 – Começa o nosso curso Publicadores: gerenciando dados abertos com o  CKAN. As inscrições também seguem abertas. 

01/09 – Seminário do CGI.br sobre regulação de plataformas digitais no Brasil. Evento presencial em São Paulo, com transmissão ao vivo pelo YouTube.

02 a 04/09 – O Hackathon Pegabot, do Instituto Tecnologia e Sociedade (ITS Rio), promove soluções criativas no combate à desinformação e oferece prêmios de até R$ 5 mil.

02 a 04/09Hackathon de ferramentas de investigação de análise de redes de mídias sociais do Bellingcat.

07/09 – Lançamento do ¡Sigan el dinero!, manual da Organized Crime and Corruption Reporting Project (OCCRP) para ajudar jornalistas a buscar empresas, propriedades, contratos públicos e processos judiciais na América Latina. O evento será às 16h no horário de Brasília.

13/09 – Mais uma edição do Cerveja com Dados Porto em Alegre, a primeira pós-pandemia.

14/09 a 15/09Git Merge 2022, grande encontro internacional da comunidade Git.

15/09 – Data limite para inscrições para as bolsas FAPESP de projeto de pesquisa ​​ligado a Wikidata, Wikimedia Commons, Wikipédia e o software livre Tainacan.

18/09 – Prazo final para inscrições na 4ª edição do Prêmio Cláudio Weber Abramo de Jornalismo de Dados.

19 a 22/09Code for All Summit 2022 tem sessões gratuitas para todas as pessoas interessadas em tecnologia cívica.

23 a 25/09 – Mais um hackathon do Bellingcat, desta vez de ferramentas gerais de investigação digital. Inscrições até 16/09.

26/09 – Prazo final para inscrição no curso de formação tecnopolítica, marketing digital e racismo ambiental da Casa Preta, realizado no âmbito do projeto “Fortalecendo o Ecossistema de Dados e Inovação Cívica na Amazônia Brasileira”, do programa Vozes pela Ação Climática Justa – VAC.

15/10 – Prazo para se inscrever no Fellowship for Prospective Leaders, com bolsas de até € 2.600 mensais, organizado pelo German Chancellor Fellowship.

17 a 21/10 – Data da Coalesce, conferência voltada à engenharia analítica e a pessoas que trabalham com dados.

17 a 23/10 – Ocorre a Python Brasil, em Manaus (AM).

31/10 a 06/11 – É a vez da sétima edição da Conferência de Jornalismo de Dados e Métodos Digitais, Coda.Br 2022, que terá atividades online e em São Paulo.

NO MUNDO DOS DADOS

Notícias e discussões quentes


Regulamentação do lobby para mais transparência

Um artigo publicado na revista Consultor Jurídico destaca que a divulgação de escândalos como o caso dos “pastores do MEC”, apurado utilizando dados da agenda pública de gestores políticos, reacenderam a discussão sobre a regulamentação do lobby e a aprovação de projeto de lei sobre o tema pelo Congresso Nacional. 

O artigo esclarece que nos Estados Unidos, após inúmeros escândalos envolvendo a falta de transparência na relação público-privada, o governo aprovou o Lobbying Disclosure Act que, na prática impõe medidas de transparência nas relações entre particulares e agentes públicos para defesa de interesses, sobretudo, por meio de medidas de cadastro e identificação dos profissionais que atuam com lobbying (lobbyists), registros e divulgação dos contatos realizados com agentes públicos e vedações a ex-agentes públicos relativas a assumir esse tipo de função, que se estende por um ano após a saída de suas funções.

No Brasil, ainda lidamos com a falta de dados atualizados e padronizados sobre a agenda pública, desafio que vem sendo superado por meio do uso da Lei de Acesso à Informação e ferramentas de inovação cívica como a Agenda Transparente, projeto da Fiquem Sabendo. 

Inep e os microdados do Enem e Enade

O Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira (Inep), vinculado ao Ministério da Educação, voltou a publicar o conjunto de microdados do Exame Nacional do Ensino Médio (Enem)  e do Exame Nacional de Desempenho dos Estudantes (Enade). Os microdados dessas e outras avaliações haviam sido excluídos do portal sob alegação de cumprimento à Lei Geral de Proteção de Dados Pessoais (LGPD), afetando pesquisas e análises do desempenho e estrutura escolar em todo País. A republicação segue recomendações da Controladoria Geral da União. Confira aqui o calendário

Por governos estaduais mais transparentes

A Open Knowledge Brasil (OKBR) e a Rede de Embaixadoras de Inovação Cívica lançaram a campanha #CartaPorUmGovernoEstadualAberto, iniciativa que propõe a pessoas candidatas a governos estaduais e assembleias legislativas no Brasil  a priorização da transparência e a abertura dos dados públicos. 

As cartas pedem o cumprimento do direito de acesso à informação pública e da Lei de Acesso à Informação, o incentivo da transparência em toda a administração pública estadual, processos e instrumentos destinados à abertura, atualização e melhoria dos dados fundamentais para o cumprimento da LAI e adequação da Lei Geral de Proteção de Dados Pessoais, e outros itens relacionados. Confira aqui as versões das cartas para o executivo e o legislativo.

Contra o pedágio do governo digital

Diversas entidades brasileiras estão participando da “Assinatura – Manifesto sobre PL 2224/21”, projeto de lei que impõe cobrança para acesso e processamento de dados públicos. A Open Knowledge Brasil é uma das organizações signatárias do manifesto que defende investimento em estruturas de abertura de dados e transparência ativa. Outras entidades interessadas em participar da mobilização, podem encaminhar um e-mail para secretariaexecutiva@direitosnarede.org.br com o assunto “Assinatura – Manifesto sobre PL 2224/21” e o nome da organização signatária no corpo do e-mail.

Por dentro da rstudio::conf(2022)

Flávia E. Rius, Beatriz Milz e Julio Trecenti compartilharam suas impressões pessoais sobre a maior conferência da linguagem, realizada no fim do mês de julho, no blog curso-r.  Eles destacaram os workshops, palestras e keynotes que mais gostaram, e compartilharam diversos links contendo parte da documentação do evento.

E Cédric Scherer, um dos instrutores do evento, compartilhou seus 2 dias de workshops de design gráfico com ggplot2,contendo 9 sessões, 760 slides e 314 ggplots. A própria organização da conferência também soltou links com as gravações abertas das palestras e keynotes, além de alertar para ficarmos de olho no próximo post de blog que vai resumir os materiais do evento.

SAIBA MAIS

Para aprender mais e aprender sempre


Cursos sobre Lei de Acesso à Informação

A Controladoria da Prefeitura de São Paulo está com inscrições abertas para dois cursos gratuitos relacionados à Transparência Pública. O primeiro é o curso de Lei de Acesso à Informação – Ferramenta de Controle Social, direcionado principalmente para Conselheiros Públicos Municipais. O segundo é o curso de Pedidos de Informação Pública: ferramenta de Cidadania. As aulas acontecem em setembro, online e ao vivo. As inscrições vão até esta quarta-feira, dia 31/08 e as inscrições podem ser feitas por cidadãos de qualquer lugar do Brasil.

Incrementando investigações ambientais

Um post da Global Investigative Journalism Network (GIJN) destaca um dos painéis da conferência Interconnected: Reporting the Climate Crisis, do Pulitzer Center, onde repórteres e designers ambientais contaram como usam dados e suas visualizações para tornar suas investigações mais atrativas. 

Profissionais que cobrem a Tailândia e a África Ocidental compartilharam suas experiências investigando desmatamento e a seca, e o painel – que está disponível online – também contou com a participação do jornalista brasileiro Hyury Potter falando sobre o projeto Amazônia Minada, que mapeia solicitações de mineração ilegal em terras indígenas e áreas protegidas em tempo real. Hyury também esteve em julho no Coda Amazônia, ensinando como investigar dados georreferenciados.

Para saber mais sobre mapas e visualizações, confira também a documentação de nossa conferência, que conforme mencionamos acima, está disponível no site do evento.

Estatística para cientistas de dados

No blog Towards Data Science, Adrienne Kline, acadêmica de pós-doutorado na Northwestern University em aprendizado de máquina e saúde, iniciou uma série de bootcamps sobre estatística, com o fim de ensinar a matemática e os métodos por trás das bibliotecas que utilizadas diariamente por cientistas de dados. O primeiro deles é sobre os fundamentos, já o segundo aborda centro, variação e posição e o terceiro se dedica a explicar probabilidade.

Novo guia sobre jornalismo de dados

No início deste mês, Bianca Muniz, analista de dados da Agência Pública; Elena Wesley, coordenadora de conteúdo do data_labe; e Graziela França, diretora de conteúdo da Agência Tatu apresentaram o painel “Jornalismo de dados para mudar realidades” no 4º Domingo de Dados da Abraji.

Os slides da apresentação, contendo trabalhos relevantes das três iniciativas, estão disponíveis online, e outro produto da ocasião foi a criação do guia “Jornalismo de Dados e o impacto no cenário local“, organizado pelas três profissionais, com algumas dicas e referências relevantes sobre o tema.

SNIPPETS

Dicas curtas e certeiras


No Dados Finos, Guilherme Storck disponibilizou um tutorial sobre como fazer mapas de calor utilizando o Google Data Studio.

O pesquisador Rodrigo Cunha está com uma vaquinha virtual para iniciar seus estudos sobre o consumo de visualizações gráficas por pessoas cegas e de baixa visão.

O Internetlab lançou a segunda edição do relatório “Os Vetores da Comunicação Política em Aplicativos de Mensagens: hábitos e percepções do brasileiro”.

Tutorial do Bellingcat ensina a usar novas tecnologias para investigar fotografias antigas.

O Bellingcat também elencou as ferramentas que os pesquisadores de código aberto afirmam mais utilizar, em recente pesquisa promovida pelo coletivo de investigações digitais.

A Wired conta agora com um banco de dados de suas reportagens sobre inteligência artificial, com opção de filtragem por aplicação, usuário final, setor e pela tecnologia.

Em palestra à Redação da Folha, Ben Welsh, do Big Local News, destacou iniciativas e experiências de jornalismo de dados local.

A GIJN trabalhou com uma equipe de especialistas da Fundação Ford para adaptar a Ferramenta de Avaliação de Segurança Cibernética (CAT) da Ford para uso por grupos jornalísticos investigativos.

João Vitor da Silva Gomes ensina a explorar o dataset MNIST de dígitos manuscritos com a biblioteca Keras, no Python, e também mostra como construir uma tabela de frequências para dados agrupados com Pandas.

INSPIRA

Trabalhos e iniciativas inovadoras para te inspirar


Criado em janeiro de 2021, o projeto Girl Be the Captain é de divulgação de rock, mulheres e infográficos. No perfil do Instagram, toda semana tem um retrato de uma mulher que arrasa (ou arrasou) no mundo do rock e três infográficos para descobrir mais sobre ela:  um retrato, sua “rede” e uma cronologia de sua carreira.

 

Courtney Love, a primeira perfilada no Girl Be The Captain

A primeira mulher perfilada foi Courtney Love, dona da famosa frase “Não namore o capitão do time de futebol, seja o capitão do time”, expressão que dá nome ao projeto. No infográfico cronológico, é possível acompanhar numa linha do tempo o lançamentos de álbuns e singles, além das participações mais expressivas das artistas, dentro e fora dos palcos. 

Há também um belíssimo exemplo de utilização de grafos para mostrar como as personagens já mencionadas nas publicações se relacionam entre si. 

Um dos exemplos de grafos do projeto.

NOVOS DADOS

Conjuntos de dados e plataformas publicados recentemente


Gabriel Zanlorenssi está disponibilizando sua sistematização em planilhas das transcrições dos debates presidenciais.  

O Mapbiomas lançou uma nova versão do Monitor do Fogo. O novo sistema difere e complementa o monitoramento do INPE (Instituto Nacional de Pesquisas Espaciais) porque avalia as cicatrizes do fogo, e não os focos de calor.

O Conselho Nacional de Justiça (CNJ) lançou o Sistema Nacional de Investigação Patrimonial e Recuperação de Ativos (Sniper), que identifica em segundos os vínculos patrimoniais, societários e financeiros entre pessoas físicas e jurídicas. 



O Inep disponibilizou novamente os microdados das edições de 2010 a 2015 do Exame Nacional do Ensino Médio (Enem) e os de 2012 e 2013 do Exame Nacional de Desempenho dos Estudantes (Enade), junto com um cronograma para a liberação dos microdados das demais edições.

APT UPDATE

Atualize-se com as novidades de softwares e bases de dados


A versão 3.0 do Brazil Data Cube Explorer apresenta recursos aprimorados para acessar e visualizar séries temporais de imagens extraídas de cubos de dados e trajetórias de uso e cobertura da terra.

Datawrapper lança novo recurso para criar anotações de texto em gráficos de colunas agrupados e empilhados, que tenham categorias abaixo da coluna.

Visual Studio Code agora permite ir para a célula com falhas mais recentes no notebook, remover importações com Pylance, copiar imagens de saída na célula do Jupyter notebook, entre outros.

SportyR 2.0 traz introdução de intervalo de exibição, novo conjunto de dados internos, documentação atualizada, entre outros. 

A versão Maltego 4.3.1 adicionou a coluna Time, que permite filtrar os resultados por propriedades de tempo para novas integrações, além de correções de bugs.

Fernando Barbalho criou um script em R que baixa do CKAN um pdf com tabelas de tetos dos gastos, extrai as tabelas, transforma para tidy e devolve uma lista com dois dataframes com as tabelas.