*Este conteúdo integra o acervo de Boletins de Dados, nossos informativos mensais sobre as principais novidades e oportunidades relacionadas ao trabalho com dados. Para acessar as edições mais recentes reunidas na seção exclusiva e receber a próxima edição em sua caixa de entrada, junte-se ao nosso programa de membresia e apoie nosso trabalho.

Junho/2021

Olá,

Em junho, lançamos um curso inédito, em parceria com o eixo de Inovação Cívica da Open Knowledge Brasil. Na formação ‘Python para Inovação Cívica: primeiros passos na prática’, as pessoas participantes terão uma introdução a esta linguagem de programação, com foco em técnicas de raspagem e análise de dados.

Você pode garantir sua vaga com 20% de desconto finalizando a compra com o cupom #membresia. As bolsas para inscrições gratuitas estão abertas até dia 16 de julho.

Em junho, também abrimos o acesso ao ebook ‘Fluxo de trabalho com dados: do zero à prática’. Agora, ele está disponível de forma aberta e gratuita, em nossa recém-publicada página de ebooks ou nas plataformas Amazon e Kobo.

Além disso, também prorrogamos nossa chamada pública para atividades no Coda.Br. Você pode enviar sugestões de temas ou pessoas convidadas, além de submeter sua própria proposta de atividade. Ajude-nos a construir essa edição do evento compartilhando suas ideias até o dia 15 de julho!

E, em julho, nosso programa de membresia terá um webinar com Fernando Barbalho, que irá apresentar uma nova plataforma do Tesouro Nacional para comparação de dados internacionais sobre economia e gestão pública. O encontro acontece no dia 22 de julho às 19 horas.

Boa leitura e até a próxima,

Adriano Belisário

Coordenador da Escola de Dados

AGENDA

Oportunidades e prazos para não perder de vista


• 30/06 – Último dia de inscrições no 43º Prêmio Jornalístico Vladimir Herzog de Anistia e Direitos Humanos.

• 01/07 – Acontece o webinar Investigating Wildlife Trafficking, realizado pela Global Investigative Journalism Network em parceria com Global Initiative Against Transnational Organized Crime.

• 01/07 – O Centro Internacional para Jornalistas (ICFJ) transmite o webinar How to pitch stories to organizations that fund reporting projects.

• 04/07 – Último dia de inscrição de trabalhos de pesquisa no VIII Seminário de Pesquisa da Associação Brasileira de Jornalismo Investigativo (ABRAJI).

• 07/07 – A Enap recebe Alexis Wichowski (Universidade de Columbia) no encontro #FronTend: Evitando o vale do desespero: como avançar na transformação digital nos governos.

• 08/07 – O Instituto Alan Turing recebe Emily M. Bender para apresentação do artigo “On the Dangers of Stochastic Parrots: Can Language Models Be Too Big?”, que foi destaque da edição de março do Boletim.

• 08/07 – A Enap realiza o evento Futuros Radicais: Liberdade para Transformar, para discutir temas como financiamento de bens públicos, coalizão de dados e democracia participativa.

• 15/07 – Prazo final para inscrições na 9º edição do Prêmio Gabo, que celebrará trabalhos jornalísticos de excelência voltados para os públicos das Américas, Espanha e Portugal.

• 15/07 – Data limite para enviar propostas de atividades ou sugestões para a programação do Coda.Br 2021.

• 16/07 – Prazo máximo para inscrições nas bolsas de isenção de inscrição em nosso curso ‘Python para Inovação Cívica‘.

• 17/07 – Último dia de matrícula no Master em Jornalismo de Dados, Automação e Data Storytelling do Insper.

• 18/07 – Começa o 41º Congresso da Sociedade Brasileira de Computação (CSBC 2021), que traz cursos, seminários, concursos e workshops.

• 22/07 – Webinar do programa de mebresia da Escola de Dados sobre dados internacionais de economia e gestão pública, com a participação de Fernando Barbalho.

• 26/07 – Início do 11º Fórum da Internet no Brasil (FIB), com uma programação de 5 dias, completamente online.

• 01/08 – Último dia para inscrição de trabalhos no Prêmio Dados Abertos para o Desenvolvimento, do Banco Nacional de Desenvolvimento Econômico e Social (BNDES).

• 01/08 – Encerramento do prazo para chamada de artigos para a 12ª Conferência Internacional de Comissários de Acesso à Informação.

NO MUNDO DOS DADOS

Notícias e discussões quentes


Menos impresso, mais desconfiança e TikTok

No Digital News Report 2021, relatório anual produzido pelo Reuters Institute e a Universidade de Oxford, o Brasil se destacou mais uma vez pelo alto índice de preocupação com desinformação nas redes sociais e o declínio ainda mais acentuado do consumo de mídia impressa.

A décima edição do relatório mostra que jornais convencionais e jornalistas atraem mais atenção por notícias no Facebook e no Twitter, mas são ofuscados por influenciadores e fontes alternativas, em redes como o Snapchat, Instagram e TikTok.

De acordo com o estudo, o TikTok agora conta com a presença de cerca de um quarto (24%) das pessoas abaixo de 35 anos entre os países analisados, com 7% destas usando a plataforma para notícias. A pesquisa aponta também uma penetração maior da ferramenta em partes da América Latina e Ásia.

Processamento de Linguagem Natural para além do inglês

O Processamento de Linguagem Natural (NLP) é uma área de inteligência artificial que visa compreender, analisar e dar sentido às linguagens humanas, auxiliando em tarefas comuns no mundo todo, como tradução, verificação gramatical e classificação de tópicos. No entanto, a maioria dos avanços tecnológicos neste campo ainda é feita com base no idioma inglês.

Em recente newsletter do #JournalismAI, Sabrina Argoub explorou esta questão e entrevistou Chayma Mehdi, do Inkyfada (Tunísia), e Delfina Arambillet e Flor Coelho, do La Nación (Argentina) para entender os desafios na criação de soluções em NLP com base em outros idiomas.

Aliás… em fevereiro, também abordamos os usos de NLP no jornalismo em nosso blog e comentamos trabalhos de algumas redações no Brasil.

Participação cívica em decisões algorítmicas

De forma crescente, o uso de dados e algoritmos de tomada de decisões no governo impacta diretamente a vida das pessoas. Visando incluir os cidadãos no debate sobre o desenvolvimento, implementação e usos de tecnologias emergentes, o Data Justice Lab da Cardiff University publicou o guia ‘Advancing civic participation in algorithmic decision-making: a guidebook for the public sector‘. Voltado para gestores públicos, o material oferece diversos exemplos e metodologias úteis, como júris de cidadãos a conselhos de supervisão da comunidade para orçamento participativo, entre outros recursos.

Sigma Awards 2021 anuncia ganhadores 

O projeto No Epicentro (Agência Lupa) foi um dos ganhadores da maior premiação de jornalismo de dados do mundo. No Brasil, o trabalho ‘100 mil no mortes no Brasil – o cálculo de uma tragédia’ (Nexo) também recebeu uma citação especial na edição deste ano. Confira a lista completa de ganhadores no site do Sigma Awards. A Escola de Dados foi parceira na realização da edição de 2021 do prêmio.

SAIBA MAIS

Para aprender mais e aprender sempre


Tutorial do Datasette em português

Datasette é uma ferramenta de código aberto ideal para armazenar, explorar e publicar dados diretamente do navegador. A solução, que serve tanto para pessoas quanto para organizações, pode ser muito útil para redações, por exemplo, que possuem certas bases de dados de interesse que são consultadas de forma recorrente por jornalistas.

É possível fazer consultas diretamente pela interface gráfica ou por meio de SQL, além de usufruir de plugins que facilitam a visualização dos dados em mapas, APIs para disponibilização das informações e outras funcionalidades. Para conhecer a ferramenta, desde a instalação até o compartilhamento de dados na Internet, confira o tutorial inédito publicado, em português, por Nicolás Linares.

Deep learning e visualização de redes

Quer aprender sobre deep learning usando Python? Então, vale a pena conferir os notebooks da segunda edição do livro Deep Learning with Python (Manning Publications), que foram recentemente atualizados no repositório do projeto. No material, é possível encontrar tópicos sobre os fundamentos do aprendizado de máquina, como utilizar Keras e Tensorflow, entre outros temas.

Na linguagem R, o destaque fica para o material sobre visualização de redes, criado por Katherine Ognyanova. Em Network visualization with R, a pesquisadora revisa o básico sobre o assunto, aborda bibliotecas sobre redes e mostra como criar visualizações interativas com apoio de bibliotecas JavaScript.

SNIPPETS

Dicas curtas e certeiras sobre o trabalho com dados


O Pulitzer Center abriu inscrições para o programa Data Journalism Grants de subsídio de projetos inovadores de jornalismo de dados do mundo todo.

O repositório OSINT-Brazuca compila dicas e referências para trabalhar com inteligência com fontes abertas no Brasil.

Por falar nisso, a nova plataforma Icarus Flight permite analisar dados de atividades e registros de propriedade de aeronaves globalmente. Jornalistas e pesquisadores sem fins lucrativos podem requisitar acesso gratuito.

Na Poynter, Barbara Gray deu dicas básicas para estudantes que querem ir além do básico na hora de fazer buscas online.

A comunidade RLadies São Paulo realizou um meetup sobre visualização de dados com o pacote ggplo2.

Acompanhe o Data Vis Dispatch, uma coluna semanal no blog do Datawrapper que trará semanalmente o melhor da visualização de dados, com atenção especial para trabalhos de jornalismo de dados.

A Python Brasil, maior conferência sobre linguagem de programação Python do Brasil e da América Latina, já tem data marcada para sua edição de 2021: 11 a 17 de outubro.

NaN? NA? Aprenda mais sobre valores ausentes com esse  guia ilustrado publicado no Towards Data Science. O material é baseado em Python e Pandas.

INSPIRA

Trabalhos e iniciativas inovadoras para te inspirar


No mês que o Brasil chegou à marca de meio milhão de pessoas mortas por conta da Covid-19, a Piauí publicou ‘Um país que vai ficando sem ar’, uma visualização de dados que se utiliza da respiração para traduzir sensorialmente a angústia das vítimas da doença.

Os infografistas Ariel Tonglet e Rodolfo Almeida criaram um vídeo onde cada mês da pandemia é equivalente a cinco segundos. Ao acompanharmos o ritmo sugerido pelo círculo central, que acelera e diminui proporcionalmente ao número de mortos mensalmente, a respiração fica quase impossível em abril de 2021 – período que registrou sozinho quase um quinto das mortes pelo novo coronavírus desde março de 2020.

Segundo Rodolfo Almeida, o trabalho foi inspirado nos aplicativos de meditação, que fizeram sucesso na pandemia, e na obra ‘Mata’, criada por Bárbara Castro. A artista utilizou ciclos respiratórios e visualização de dados para abordar o desmatamento na Amazônia.

UPDATE

Atualize-se com as novidades de softwares e bases de dados


A FAPESP e a USP criaram o repositório Covid-19 Data Sharing/BR com o objetivo de contribuir em pesquisas sobre a doença.

A base de dados sobre logradouros da Região Metropolitana de São Paulo agora conta com mais de 320 mil segmentos ou trechos viários.

Novos conjuntos de dados na Base dos Dados: dados sobre a inflação do Brasil de 1994 a 2020, servidores pensionistas civis e militares e dados do Censo Escolar.

Por falar em educação, conheça o QEdu Gestão, uma plataforma voltada para gestores educacionais que possibilita inserir, visualizar e analisar indicadores de forma simples.

GitHub lançou novidades para a seção de ‘Issues’, como checklist de tarefas ou a possibilidade de anexar vídeo nos comentários.

PyTorch 1.9 traz dentre as suas principais atualizações a extensão do suporte a operações de álgebra linear no módulo torch.linalg, incluindo todas as funções do módulo de algebra linear do Numpy.

PyTorch para R: Torch 0.4.0 chega com melhorias, como a opção de salvar listas.

Disponível a versão OpenRefine 3.5 beta, com aperfeiçoamentos no suporte à Wikibase e divisão de colunas.

Microsoft Excel agora conta com o Office Scripts, que facilita a automatização de tarefas.

Grasshopper, aplicativo voltado para o ensino de programação a partir da linguagem Javascript, agora está disponível em português em sua versão para Android.

Conheça o Science Pulse, uma plataforma que identifica informações relevantes compartilhadas nas redes sociais por cientistas e especialistas.

Chegou o Tableau 2021.2, que traz melhorias nas formas de consultas aos dados e a possibilidade de organizar visualizações por coleções.

E o RAWGraphs agora tem tutoriais para todos os gráficos e disponibiliza novos gráficos e diagramas.


Sugestões? Envie um e-mail para [email protected]org.br.