#19 Oportunidades, tendências de 2021 e a situação dos dados abertos
*Este conteúdo integra o acervo de Boletins de Dados, nossos informativos mensais sobre as principais novidades e oportunidades relacionadas ao trabalho com dados. Para acessar as edições mais recentes reunidas na seção exclusiva e receber a próxima edição em sua caixa de entrada, junte-se ao nosso programa de membresia e apoie nosso trabalho.
Dezembro/2020
Olá,
Nosso primeiro Boletim de Dados de 2021 vem de cara nova e com muitas oportunidades na seção ‘Agenda’. Trazemos também o anúncio da abertura da segunda turma do curso Publicadores de Dados.
Como membro da Escola de Dados, você tem direito a 20% de desconto. Basta responder este e-mail manifestando seu interesse. Mas você também pode concorrer a uma das 300 bolsas com isenção completa do valor de inscrição.
Sobre a virada do ano, nós já contamos no blog como foi o nosso 2020, mas tivemos ainda mais novidades no fim do ano passado: a Escola de Dados e o Prêmio Cláudio Weber Abramo de Jornalismo de Dados fecharam uma parceria com o Sigma Awards, a maior premiação internacional da área.
Nas últimas edições, o Brasil se destacou pela quantidade e qualidade de trabalhos inscritos e em 2021 não deve ser diferente. Por isso, se você produziu algum trabalho de jornalismo de dados de destaque recentemente, não perca a oportunidade de concorrer ao prêmio de 5 mil dólares e faça sua inscrição em janeiro!
Tenha uma boa leitura e um excelente 2021!
Adriano Belisário
Coordenador da Escola de Dados
Agenda
Oportunidades e prazos para não perder de vista
• 10/01 – O BlackInData realiza um desafio de visualização de dados voltado para pessoas da diáspora negra de qualquer parte do mundo. • 10/01 – O Erasmus Mundus oferece bolsas de estudo de até 49 mil euros para pessoas interessadas em realizar mestrado em jornalismo na Europa. • 11/01 – Em Santa Catarina, está aberto o edital da FAPESC para contratar profissionais da área de participação social, controle social, transparência e dados abertos. • 11/01 – Prazo para submeter inscrições para o Tow Center for Digital Journalism da Universidade da Columbia, que irá financiar propostas de pesquisas em tecnologias emergentes, inteligência artificial e tendências do jornalismo digital. • 11/01 – O National Endowment for Democracy (NED) está com seleção aberta para apoiar organizações da sociedade civil, inclusive mídias independentes, com projetos de cerca de 50 mil dólares. • 19/01 – Grand Challenges ICODA COVID-19 Ciência de Dados irá financiar projetos de até 100 mil dólares que ajudem no combate à pandemia. • 22/01 – O Centro de Comunicações Ambientais GRID-Arendal oferece 4 bolsas de 2.300 euros para jornalistas de países do sul global realizarem investigações sobre crimes ambientais. • 23/01 – Projetos de trabalhos jornalísticos de fôlego capazes de transformar realidades podem ser inscritos no O’Brien Fellowship in Public Service Journalism. • 29/01 – Fim das inscrições para bolsas gratuitas da segunda turma do curso ‘Publicadores de Dados – Da gestão estratégica à abertura’. • 01/02 – Jornalistas e analistas de políticas públicas com ideias de impacto podem se inscrever no programa de Fellows da New America, que financia propostas de 15 a 30 mil dólares. • 01/02 – Prazo final das inscrições para a maior premiação internacional do jornalismo de dados, o Sigma Awards. • 04 a 07/02 – Acontece a Outlier 2021, a conferência online da Data Visualization Society. • 08/02 – Encerramento das inscrições do programa de fellowship do Reuters Institute. |
No mundo dos dados
Notícias e discussões quentes
Encruzilhadas da proteção de dados no Brasil
Em 2021, os debates sobre proteção de dados irão esquentar. No mesmo ano em que uma importante legislação sobre o tema (LGPD) entra em vigor, o governo quer colocar à venda parte importante da infra-estrutura governamental de dados, que guarda informações de milhões de pessoas. O Serviço Federal de Processamento de Dados (Serpro) e a Empresa de Tecnologia e Informações da Previdência (Dataprev) são duas empresas públicas que estão em um pacote mais amplo de “desestatização” do governo federal, mas merecem atenção especial.
A Forbes já destacou que o Dataprev talvez seja o ativo mais valioso de todo o pacote e especula que empresas internacionais como a IBM podem estar entre as possíveis compradoras. Não é para menos. Só ela lida e guarda informações de cerca de 35 milhões de beneficiários do INSS, assim como dados tributários da população. O BNDES já anunciou que só a preparação para a privatização do Dataprev e do Serpro vai custar aos cofres públicos quase R$ 8 milhões.
Enquanto países como Estados Unidos e a China ou órgãos como a União Europeia discutem medidas cada vez mais protetivas e restritivas quanto ao armazenamento dos dados de seus cidadãos, aqui o governo parece ir na contramão. A possível transferência para empresas privadas dos dados governamentais sobre milhões de cidadãos já chamou atenção da sociedade civil, conforme noticiou a Folha, e também no Tribunal de Contas da União (TCU), onde o ministro Vital do Rêgo manifestou “possível risco à segurança dos dados governamentais […] em face das suas reais perspectivas de privatização“.
Já sobre a Lei Geral de Proteção de Dados, Fernanda Campagnucci alertou sobre a possível “rota de colisão” da legislação com a transparência pública. A diretora-executiva da Open Knowledge Brasil apontou que a LGPD pode servir como uma equivocada justificativa para um aumento das negativas de liberação de dados via Lei de Acesso à Informação, por exemplo. “Para evitar que seja usada como pretexto para fechamento de informações, deve ser exigida a máxima transparência sobre o tratamento dos dados”, afirmou, em artigo publicado em dezembro.
Joe Biden toma posse nos EUA. E daí?
No próximo dia 20, Joe Biden toma posse como presidente dos Estados Unidos e claro que as mudanças de ventos no país trarão mudanças também na área de tecnologia da informação.
Um artigo da Information Technology & Innovation Foundation sobre a agenda de Biden na área de tecnologia e inovação resume as novas propostas do seguinte modo: mais gastos, mais regulação e multilateralismo.
Os pesquisadores apontam que a nova gestão deve investir em pesquisa e desenvolvimento de energias limpas, banda larga de Internet em áreas rurais e outras ações voltadas a diminuir a exclusão digital no país. Sobre dados, mencionam que Biden já se envolveu com uma iniciativa de dados abertos contra o câncer e citam uma possível maior ênfase em temas como a proteção de dados, nesta nova administração.
O MIT Review também falou sobre a relação de Biden com o Vale do Silício e recordou que o futuro presidente defende que empresas da Internet tenham responsabilidade legal sobre os conteúdos que hospedam.
Outras tendências para 2021
A empresa de consultoria Gartner destacou algumas tendências para dados e analytics em 2021. Painéis interativos para visualização de dados (dashboards) estão em baixa, segundo a vice-presidente de pesquisa da empresa. Em seu lugar, ela aposta em histórias baseadas em dados (data stories), que apresentam insights para o leitor de forma ativa, ao invés de exigir que a pessoa analise os gráficos para extrair conhecimentos relevantes.
Também chama atenção a aposta no uso de blockchain para contratos inteligentes e na utilização de metadados, os dados sobre os dados, em conjunção com técnicas de aprendizado de máquina. Confira a lista completa das 10 tendências destacadas no Information Week.
Saiba mais
Para aprender mais e aprender sempre
IA e aprendizado de máquina: livros e mão na massa
Repórter especializado em inteligência artificial, Khari Johnson listou livros de destaque sobre o tema em 2020. Uma breve resenha de cada um foi postada no site Venture Beat, mas separamos aqui os títulos das 9 publicações: Black Futures; Monopolies Suck; Competing in the age of AI; Turning Point; Distributed Blackness; Too Smart; Girl Decoded; Artificial Whiteness e Data Feminism, cuja autora aliás esteve no último Coda.Br.
Para uma experiência mais mão na massa, vale ver o curso online gratuito da universidade de Harvard ‘Data Science: Machine Learning’, que tem início dia 27 de janeiro. Para ir se aquecendo ou se preferir algo mais curto, tem também o post recém-publicado no R-Bloggers, que traz um guia completo para trabalhar com regressão linear no R.
***
Dados abertos hoje
O Open Data Inventory publicou o levantamento do Open Data Watch 2020 com um panorama da situação internacional dos dados abertos em diversos países, trazendo inclusive informações específicas sobre dados abertos de gênero. A publicação ‘The state of Open Data 2020‘ também trouxe um sobrevôo da área, tratando, por exemplo, do impacto da Covid-19.
O Brasil também tem publicação recente sobre o tema. Resultado do Open Data Day no Rio Grande do Norte em 2020, um ebook gratuito sobre dados abertos governamentais e inovação cívica foi lançado no final do ano passado.
***
Visualização de dados
Da prestigiada coleção O’Reilly, o livro ‘Hands-On Data Visualization‘ traz uma abordagem prática sobre a contação de histórias (storytelling) com dados, usando tanto planilhas quanto códigos. A publicação ainda é um trabalho em progresso mas já pode ser conferida online.
Por falar em códigos para visualização de dados, quem programa em R pode se interessar por este tutorial recente sobre customização de temas do ggplot2 ou desenvolvimento de aplicações com Shiny. Os adeptos do JavaScript vão gostar do post com os destaques do ano do ObservableHQ e as dicas, no mesmo site, sobre visualização de periodicidade com a biblioteca d3.
Como trabalho de destaque recente, vale conferir a investigação de Lindsey Poulter e Hesham Eissa, que se debruçaram sobre um tema pouco usual: existem vieses nas disponibilidades e escolhas de cores dos tênis de corrida entre homens e mulheres? Estas decisões são ou não afetadas por estereótipos de gênero (estilo “menino veste azul e menina veste rosa”), por exemplo? Para descobrir, faça um mergulho colorido no Running Color, que traz dados de 8.884 tênis.
Snippets
Dicas curtas e certeiras sobre o trabalho com dados
O Global Investigative Journalism Network listou 10 trabalhos de jornalismo de dados de destaque em 2020 mundo afora – e Samarth Bansai contou sobre como é este campo de trabalho na Índia, em um post recente.
No final de dezembro o Cetic.Br trouxe uma publicação especial sobre o impacto da inteligência artificial no mundo do trabalho.
O RStudio anunciou os ganhadores de um concurso para premiar as melhores tabelas feitas pela comunidade de R; vale conferir os trabalhos e suas documentações!
No site do Laboratório Hacker de Campinas, você encontra um vídeo-tutorial sobre o Querido Diário, mostrando como extrair dados do diário oficial de Teresina (PI).
O blog Datavizbr publicou em janeiro o post final da série “Visualização de dados com sotaque brasileiro”, destacando comunidades e grupos de pesquisas da área (spoiler: nós da Escola de Dados estamos na lista!)
Inspira
Trabalhos e iniciativas inovadoras para te inspirar
“A erosão de dados em todo governo federal é especialmente insidiosa pois é relativamente invisível para o público em geral. Frequentemente, as únicas pessoas que sabem o valor desses conjuntos de números são aquelas que trabalham com eles diariamente. As implicações de vida ou morte dos dados podem ser altamente técnicas e difíceis de transmitir. Mas, olhando para os tipos de dados que estão sendo apagados, surge uma narrativa clara da intenção política”.
Pareceu familiar?
Este é um trecho do trabalho de destaque deste mês. O especial ‘Data Disappeared’ do HuffPost com um inventário sobre destruição de dados na administração de Donald Trump na presidência dos Estados Unidos. Os jornalistas mostraram uma série de casos onde houve destruição, desaparecimento ou distorção dos dados do governo.
As histórias contam com uma apresentação visual especial, muitas referências em links e estão organizadas em capítulos definidos de acordo com os seguintes temas: pandemia, mudança climática, populações vulneráveis, ciência, alimentação, conservação e o censo nacional.
Update
Atualize-se com as novidades de softwares e bases de dados disponíveis
A versão 2.0 da biblioteca Javascript Mapbox GLJS passou de uma licença aberta para uma licença proprietária; conheça os novos termos de uso.
O Nexo disponibilizou um repositório com dados sobre as pesquisas eleitorais das eleições municipais de 2020.
O Programa Nacional de Solos do Brasil (Pronasolos) disponibilizou uma versão experimental de uma plataforma com dados históricos sobre os solos do país.
Agora está mais fácil consultar o CNPJs na Receita Federal: conheça a API Minha Receita, desenvolvida por Cuducos.
O pessoal da Base de Dados liberou 260 GB de dados sobre a Relação Anual de Informações Sociais (RAIS), com informações de 1985 a 2019, agregados por Municípios e UF.
Enslaved.org é um site lançado em dezembro de 2020 que reúne dados históricos e informações de cerca de meio milhão de pessoas escravizadas.
E o IncidentDatabase.ai traz um catálogo de incidentes envolvendo o uso de inteligência artificial.
Sugestões? Envie um e-mail para escoladedados@ok.org.br.