*Este conteúdo integra o acervo de Boletins de Dados, nossos informativos mensais sobre as principais novidades e oportunidades relacionadas ao trabalho com dados. Para acessar as edições mais recentes reunidas na seção exclusiva e receber a próxima edição em sua caixa de entrada, junte-se ao nosso programa de membresia e apoie nosso trabalho.

DEZEMBRO/2019

Olá!

Começamos este primeiro boletim de 2020 celebrando sua parceria no ano passado, que foi repleto de realizações para a Escola de Dados, como você pode conferir nesse resumo das nossas principais atividades de 2019. Sem dúvidas, seu apoio foi muito importante para realizarmos tanto e esperamos continuar juntos neste ano, com um programa de membros ainda melhor.

Para isso, queremos ouvir sua opinião. Basta preencher este formulário, que é bem curtinho. Sua resposta é muito importante e nos permitirá fazer os ajustes necessários para deixar o programa de membros cada vez mais do seu jeito. Além disso, no formulário, você poderá também votar no tema do nosso próximo tutorial.

Desejamos um 2020 radiante a todas as pessoas que nos acompanham.

Até fevereiro!

AGENDA

Oportunidades e prazos para não perder de vista

• 10/01 – Imersão sobre desenvolvimento de produtos para pequenas redações, realizada pelo Google, que apoiará custos de viagem.

• 15/01 –  Prazo final de inscrições para o “Investigation is collaboration” da Tactical Tech, que reunirá os participantes selecionados em abril na Costa Rica.

• 31/01 – A Associated Press está com um processo seletivo para contratar um jornalista de dados para trabalhar nos Estados Unidos.

• 31/01 – O World Data Forum 2020, organizado pelas Nações Unidas, recebe propostas de sessões para comporem a programação do encontro, que acontece em outubro na Suíça.

• 03/02 – Chamada de trabalhos para o Simpósio Brasileiro de Trabalho Digital (DigiLabour), que ocorre no Rio Grande do Sul em abril.

• 03/02 – Fim das inscrições para o Journalism Fellowship do Reuters Institute com a Universidade de Oxford.

• 03/02 – Início do curso online gratuito ‘Investigative Reporting in the Digital Age’, oferecido pelo Knight Center.

• 03/02 – Com o fim do Data Journalism Awards, o Sigma Awards assumiu o posto de grande premiação do jornalismo de dados global: as inscrições para a primeira edição estão abertas até o início de fevereiro.

• 07/02 – Prazo para envio de propostas de apresentações para a CSV,Conf. O evento será em maio nos Estados Unidos.

• 17/02 – Início da Escola de Verão de Metodologia de Pesquisa, que realiza diversos cursos relacionados ao trabalho com dados no Paraná.

NO MUNDO DOS DADOS

Notícias e discussões quentes

Jornalismo de dados em 2020

Virada de ano é época não só de retrospectivas, mas também de projeções. E, para o jornalismo de dados, não faltaram reflexões sobre o que 2020 nos reserva. O Nieman Lab publicou o Predictions for Journalism in 2020. Na coletânea, Brenda Salinas mostrou como a distribuição de conteúdo em áudio está sendo transformada pela implementação de tecnologias baseadas em dados, como aprendizado de máquina, enquanto Ståle Grut apostou que 2020 será o ano no qual o jornalismo baseado em inteligência com fontes abertas (Open Source Intelligence – OSINT) irá ganhar as grandes redações. Já Scott Havens refletiu sobre a importância das redações coletarem dados em primeira mão para tomarem decisões melhores e Sarah Schmalbach mostrou como a própria produção jornalística também pode ser quantificada de diferentes maneiras.


E no Brasil…

O Farol Jornalismo e a Associação Brasileira de Jornalismo Investigativo (Abraji) também organizaram prospecções do ano para a área no Brasil. Inteligência artificial foi diretamente abordada em dois textos: Adriano Belisário explorou algumas das dificuldades que os vídeos alterados por com estas técnicas (deepfakes) trazem para o combate à desinformação e Fábio Takahashi falou sobre o uso de algoritmos nas redações durante um ano eleitoral. Por falar em pleitos municipais, vale também a leitura deste artigo da Natália Mazotte no blog do John S. Knight Journalism Fellowships Class, que trata dos desafios e oportunidades envolvendo “desertos de dados” e redações locais com cobertura regional.


Inspirações para visualização de dados

Quem precisa de novas ideias para visualizar dados já começa o ano com excelentes opções. No último mês, foram anunciados os vencedores de um dos maiores prêmios de visualização de dados do mundo, o Information is Beautiful Awards. Com diversas categorias e premiações, a lista traz bastante exemplos inspiradores, assim como esta lista de melhores projetos de 2019 elaborada pelo site Flowing Data.

Além disso, o blog do Data Visualization Society também trouxe postagens interessantes recentemente. Alexandra Khoo mostrou os bastidores da criação de uma visualização de dados sobre músicas de casamento, desde a inspiração no trabalho Data Portraits de Giorgia Lupi, passando pela coleta e análise de dados do Spotify e os primeiros rascunhos em papel até a versão final do trabalho. Nesta, diferentes profissionais discutem seus métodos para escolher uma ferramenta de visualização de dados, seja ela digital ou analógica. Como não podia deixar de ser, teve também uma retrospectiva do ano, que relembrou alguns fatos e novidades notáveis desta área em 2019.

SAIBA MAIS

Para aprender mais e aprender sempre

Lançado em 2019, o livro State of Open Data analisa uma década de avanços no campo de dados abertos mundo afora em diversas áreas. A publicação e o debate que marcou seu lançamento foram abordadas nesta postagem de Augusto Herrmann, que destaca a atualidade do tema: “para tornar possível muitas das atividades que hoje emergem como ciência de dados, modelagem e treinamento de IA e cidades humanas e inteligentes precisamos não apenas de dados, mas sim de dados abertos”.

***

Estão disponíveis as apresentações do SatRday São Paulo, realizado no final de 2019. Tudo, é claro, envolvendo a linguagem R. Teve apresentação sobre aprendizado de máquina, publicações com R Markdown, autenticação em aplicativos feitos em Shiny, dados sobre a área de saúde, SQL, entre outras.

***

O Bellingcat lançou um ótimo tutorial sobre busca reversa de imagens na Internet, comparando o resultado de diferentes serviços, como Google Images, Bing e Yandex, que se saiu muito bem nos testes. O material dá ainda dicas para aumentar o sucesso deste tipo de busca, tal como cortar elementos da foto que não são relevantes ou mesmo borrá-los para que os algoritmos se concentrem naquilo que realmente importa.

***

O novo livro de Alberto Cairo ainda não tem tradução para português, mas quem quiser conferir as principais dicas de ‘How Charts Lie – Getting Smarter About Visual Information’ pode conferir a breve resenha publicada pelo IJNet. De acordo com o autor, “precisamos parar de acreditar — consciente ou inconscientemente — que gráficos são ilustrações”. Ele enfatiza que gráficos não são representações objetivas ou ilustrações da realidade. Para ele, gráficos são “argumentos formulados visualmente e precisam ser avaliados e verificados com o mesmo cuidado que qualquer outra coisa que colocamos ao escrever uma matéria”.

SNIPPETS

Dicas curtas e certeiras sobre o trabalho com dados

O Coursera está oferecendo o primeiro mês grátis em um curso sobre ciência de dados e inteligência artificial, realizado pela equipe da IBM.

***

O IJNet listou alguns trabalhos notáveis no jornalismo de dados mundial em 2019 e o site Brasil.IO foi um dos destaques.

***

A Abraji abriu chamada de sugestões de atividades para a próxima edição do seu congresso anual, que ocorre nos dias 25 a 27 de junho de 2020, em São Paulo.

***

MIT News noticiou a iniciativa de uma equipe deste instituto de tecnologia em parceria com a IBM para desenvolver o ObjectNet, um curioso dataset de imagens, que posiciona objetos comuns em modos estranhos para testar a inteligência dos algoritmos de computação visual.

***

A Credibility Coalition lançou o CredCatalog, um catálogo mundial para dar visibilidade a projetos que buscam melhor a qualidade da informação, como iniciativas de checagem de fatos.

***

Em dezembro, o Governo Federal anunciou a criação do Lattes Data, uma plataforma de armazenamento de dados científiacheicos no Brasil, uma das frentes do Compromisso pela Ciência Aberta, que conta com a parceria da Open Knowledge Brasil.

***

Quer saber como o trabalho com dados geográficos está transformando o mundo? Confira este compilado com 1000 (sim, mil) aplicações diferentes com GIS.

INSPIRA

Trabalhos e iniciativas inovadoras para te inspirar 

Crédito: New York Times

Em mais um excelente trabalho de visualização de dados, o New York Times se debruçou sobre informações acerca da qualidade do ar no mundo. Logo de início, a reportagem ‘See How the World’s Most Polluted Air Compares With Your City’s’ utiliza recursos para estimar a localização dos leitores, a fim de comparar a poluição do ar em suas cidades com o padrão considerado “bom” pela Agência Norte-Americana de Proteção Ambiental. Para facilitar a comparação, também é exibido um caso crítico de poluição do ar, o de Nova Delhi, que tem níveis extremos.

A poluição é representada visualmente por pontos que flutuam na tela dos leitores, representando as partículas finas conhecidas como PM2.5. Na realidade, este material microscópico é invisível: seu tamanho é cerca de 35 vezes menor que um grão de areia. Mas seus efeitos, não. Estas partículas são hoje um grave problema de saúde pública, responsável pela morte de milhões de pessoas no mundo. Sua origem está principalmente na combustão, como a gasolina dos carros, queima de carvão ou queimadas florestais. No mapa global destas “partículas finas” de poluição, o Brasil aparece destacado entre agosto e setembro de 2019, por conta dos incêndios na Amazônia.

APT UPDATE

Atualize-se com as novidades de softwares para trabalhar com dados

Dezembro teve grandes novidades no Datawrapper. Agora, o plano gratuito não tem mais limite de gráficos por usuário, conta com muitas funcionalidades antes restritas a quem pagava assinatura e permite inclusive o trabalho colaborativo entre várias pessoas.

***

O Flourish também anunciou novas funcionalidades para o gráfico de dispersão, que agora pode ser animado e ter transições para outras visualizações, como o “gráfico de violino” (violin plot).

***

Atlas da Notícia – iniciativa que mapeia o jornalismo local no Brasil – lançou uma API para acesso direto aos seus dados, trazendo exemplos de scripts em R e Python.

***

O veículo mexicano Animal Político lançou a plataforma de código-aberto Sinapsis, que pode ser usada na investigação de conexões entre empresas na América Latina.

***

Foi lançado o pacote fbSim, que permite aos usuários de R acessar dados e conteúdos de páginas no Facebook. Teve também o Radlibrary, que permite acessar a API do Facebook Ad Library.

***

Em Python, outra biblioteca interessante recém-lançada é o Metaflow, desenvolvida pela equipe para gerenciar projetos de ciência de dados do início ao fim. O site CIO fez um texto em português explicando seu funcionamento.


Ficou algo de fora? Envie sugestões e dicas para [email protected]