#01 Open Source Intelligence, notícias falsas no WhatsApp e mais
* Este conteúdo integra o acervo de Boletins de Dados, nossos informativos mensais sobre as principais novidades e oportunidades relacionadas ao trabalho com dados. Para acessar as edições mais recentes reunidas na seção exclusiva e receber a próxima edição em sua caixa de entrada, junte-se ao nosso programa de membresia e apoie nosso trabalho.
JUNHO/2019
Olá,
Você está recebendo a primeiríssima edição do nosso boletim mensal exclusivo, que traz as principais novidades sobre o trabalho com dados no Brasil e no mundo.
Mas atenção: a partir do mês que vem, ela será enviada exclusivamente para os membros da Escola de Dados. Até 8 de julho, você pode fazer uma assinatura anual com preço promocional. Confira todos benefícios e aproveite já.
Além disso, você já ajuda a Escola de Dados a ir além colaborando com qualquer valor e divulgando nossa campanha.
AGENDA
Oportunidades e prazos para não perder de vista
|
NO MUNDO DOS DADOS
Notícias e discussões quentes
OSINT alerta
A comunidade internacional que trabalha com “inteligência com fontes abertas” (Open Source Intelligence – OSINT) ficou em polvorosa em junho. O motivo? Mudanças consideráveis no acesso a dados para fins de investigação, como restrições na interface de busca do Facebook, o fim do acesso gratuito ao site Intel Techniques e ao motor de buscas Pipl, entre outras novidades. A era de ouro da OSINT acabou, escreveu um blog sobre o tema.
Por um lado, isso pode ser uma vitória em prol da privacidade de dados pessoais. Por outro, como notou o Buzzfeed, as funcionalidades de busca avançada do Facebook permitem que jornalistas, defensores dos direitos humanos e investigadores localizem evidências importantes em suas investigações.
Mas nem tudo está perdido: novas interfaces de consulta ao Facebook já foram criadas, como as do Graph.tips, Searchbook e o Facebook Graph Searcher. Ainda em junho, o Bellingcat também disponibilizou um bom tutorial sobre busca no Twitter com o Tweetdeck e o Columbia Journalism Review publicou um guia mais geral sobre o OSINT, útil para quem está começando no tema.
Notícias falsas no Whatsapp
O Digital News Report do Reuters Institute trouxe um retrato sobre o consumo de notícias digitais, a partir de uma pesquisa com 75 mil pessoas em 38 países. O Brasil destaca-se pelo fato de ter o WhatsApp como principal plataforma para discussão e compartilhamento de notícias, bem como pelo alto índice de preocupação sobre a veracidade dos conteúdos compartilhados – duas tendências mundiais. Inclusive, desinformação no WhatsApp foi o tema desta pesquisa no contexto das eleições nacionais, feita pelo Sérgio Spagnuolo, criador do Volt Datalab.
Vale destacar também que a maioria dos usuários participarem de grupos no WhatsApp com pessoas desconhecidas e o celular ter superado com folga os computadores desktop como principal dispositivo de acesso, de acordo com o Reuters Institute. Confira aqui outros destaques da pesquisa, segundo um diretor da organização.
Deu no New York Times
O famoso jornal norte-americano publicou recentemente materiais diversos sobre jornalismo de dados. Não só explicam como fizeram seus repórteres amarem planilhas, como também disponibilizaram os materiais utilizados no treinamento e trouxeram 5 estudos de caso de uso de dados em reportagens do New York Times.
As habilidades básicas da capacitação incluem o uso de funcionalidades como tabela dinâmica e procura vertical (VLOOKUP/PROCV) no Google Sheet, além de extração de dados em PDF com Tabula, que foi tema de um tutorial recente da Escola de Dados.
SAIBA MAIS
Para aprender mais e aprender sempre
Abrir a caixa-preta de algoritmos é uma área promissora no jornalismo de dados. Nesta palestra do Berkman Klein Center for Internet & Society, Christo Wilson mostra um exemplo prático de investigações sobre viés de gênero nos resultados de motores de busca de empregos.
***
Gosta de visualização de dados? Então, talvez te interesse ler esta lista comentada de livros sobre o assunto. Entre os nomes indicados, está Alberto Cairo, que participou da última edição do Coda.Br, conferência da Escola de Dados, e recentemente anunciou em seu (ótimo) blog, que seu novo livro está em pré-venda.
***
Vale ainda conferir este post sobre uso de empatia em visualizações, a série sobre incerteza (parte um e dois) e este resumo dos ensinamentos de um curso com Edward Tufte.
SNIPPETS
Dicas curtas e certeiras sobre o trabalho com dados
O fluxo de trabalho com dados (“data pipeline”) desenvolvido pela rede da Escola de Dados é uma referência metodológica internacional. Pesquisador de dados abertos, Tim Davies elaborou uma versão comentada de cada uma de suas etapas com foco na aplicação de inteligência artificial ao trabalho com dados.
***
Não terceirize a limpeza dos seus dados: é aí que você irá conhecê-los intimamente. A sugestão é de Hadley Wickham, cientista-chefe do R Studio, que deu dicas para jornalistas em entrevista e publicou a segunda edição do seu livro Advanced R.
***
Como utilizar conteúdo gerado pelo público e fazer o público ser parte da sua equipe em projetos de jornalismo de dados? Este artigo fornece boas pistas, a partir da experiência do La Nación Data, que ganhou o prêmio de melhor portfólio em jornalismo de dados no Data Journalism Awards de 2019.
***
Se você utiliza a função PowerQuery para importar dados no Excel, fique atento. Pesquisadores descobriram uma falha de segurança que permite a troca e roubo de dados. Atualize o programa e tenha cuidado com planilhas desconhecidas.
INSPIRA
Trabalhos e iniciativas inovadoras para te inspirar
O jornal alemão Der Tagesspiegel foi o ganhador do Data Journalism Awards na categoria de inovação em jornalismo de dados. Tudo começou com uma das principais reclamações dos ciclistas de Berlin: a proximidade com a qual os carros trafegam nas vias, colocando-os em perigo. Assim, nasceu o Radmesser.
O jornal criou 100 sensores para medir a distância entre a bicicleta e os carros, convocando seus leitores a utilizarem os equipamentos. Receberam 2500 inscrições e, utilizando técnicas estatísticas, selecionaram os participantes, de acordo com critérios diversos.
Depois de cinco meses de trabalho, finalmente, puderam cravar: 56% das medições revelavam uma proximidade ilegal entre carros e ciclistas nas vias públicas.
O trabalho está em alemão, mas no site do Data Journalism Awards é possível saber mais detalhes sobre o projeto em inglês.
APT UPDATE
Trabalhos e iniciativas inovadoras para te inspirar
O QGIS chegou à versão 3.8. A última versão traz novidades nas funcionalidades de processamento em lote, composição de mapas, entre outras.
***
GeoBr é uma biblioteca em R, lançada para facilitar o acesso a arquivos geográficos (shapefiles) do IBGE.
***
Outra novidade boa para a turma do R é o Rayshader, que facilita a criação de gráficos animados em três dimensões.
***
Em dúvida na hora de montar sua paleta de cores com cores distintas (multi-hued)? Vale conferir o site Chroma.js Color Palette Helper, que ganhou novas funcionalidades recentemente.
***
O Tableau fechou um acordo definitivo de venda para a Salesforce do seu popular software de visualização de dados.
***
O InVid é uma esta extensão voltada para verificação de vídeos, que trouxe um novo design e funcionalidade para análise de vídeos do Facebook em sua última versão.
Gostou do boletim? Ficou algo de fora? Envie sugestões e dicas para [email protected]