*Este conteúdo integra o acervo de Boletins de Dados, nossos informativos mensais sobre as principais novidades e oportunidades relacionadas ao trabalho com dados. Para acessar as edições mais recentes reunidas na seção exclusiva e receber a próxima edição em sua caixa de entrada, junte-se ao nosso programa de membresia e apoie nosso trabalho.

Setembro/2020

Olá,

Neste mês, lançamos o site do Coda.Br, que acontece entre 2 e 7 de novembro. Já é possível ter uma prévia dos temas de debate e das novidades da edição deste ano e, nos próximos dias, iremos publicar a programação completa da nossa Conferência de Jornalismo de Dados e Métodos Digitais. Se sua assinatura anual estiver válida nas datas do evento, você tem ingresso completo garantido.

E não se esqueça de aproveitar os outros benefícios como participante do nosso programa de membresia: junte-se ao nosso grupo no Telegram e vote no tema do próximo tutorial da Escola de Dados, acesse nosso ebook exclusivo e aproveite seus descontos em nossos cursos usando o seu cupom.

Desejamos uma boa leitura e um excelente mês de outubro!

Adriano Belisário
Coordenador da Escola de Dados

AGENDA

Oportunidades e prazos para não perder de vista

• 1/10 – Último dia de inscrição no Prêmio Cláudio Weber Abramo de Jornalismo de Dados.

• 2/10 – Marco Zero lança edital de microbolsas de reportagem para territórios periféricos.

• 5/10 – Prazo para inscrição no Prêmio Gabo 2020, que recebe trabalhos de visualizações de dados na categoria ‘Imagem’.

• 5/10 – Inscrições para o novo curso do Knight Center sobre investigações digitais para jornalistas.

• 5/10 – Começam as aulas do IDP sobre cobertura eleitoral, checagem de fatos e investigações.

• 7/10 – Inscrição no Luiza Code, um programa de formação em tecnologia voltado para mulheres, que irá selecionar 40 candidatas com interesse em programação.

• 7-9/10 – Acontece o LatinR 2020, trazendo atividades sobre aprendizado de máquina, Shiny, markdown e outros temas. Tudo com R, é claro.

• 10/10 – Dados da saúde aplicados ao R é o tema do novo evento da RLadiesBH.

• 15/10 – A Earth Journalism Network convida veículos de comunicação e ONGs que trabalham com temas de biodiversidade a participar do Biodiversity Media Grants 2020.

• 15/10 – Meetup sobre Justiça, Transparência, Viés e Explicabilidade em Inteligência Artificial.

• 20/10 – A Nodes – conferência da Neo4J – reúne atividades com especialistas em grafos.

• 25/10 – Encerram as inscrições de propostas no edital de jornalismo de educação da Jeduca.

NO MUNDO DOS DADOS

Notícias e discussões quentes

Arte, museu e visualização de dados

O blog Nightingale publicou uma interessante reflexão sobre o processo de digitalização dos museus, que cada vez mais usam a tecnologia e visualização de dados para expor seus acervos de maneira inovadora. O texto fala sobre diferentes níveis de experiência digital, como visitas guiadas virtuais e experiências interativas, citando exemplos reais para lá de inspiradores, como a navegação cronológica em 3D do projeto Museu do Mundo, do Museu Britânico, ou uma exploração de coleção de moedas feita por uma universidade alemã.

Para uma perspectiva histórica, o projeto sobre visualização de dados e a imaginação moderna, feito pela biblioteca de Stanford, traz mais elementos para entender as raízes da visualização de dados e entender seu impacto nos trabalhos culturais e científicos.

E, às vezes, os próprios dados se tornam arte. O Nightingale também publicou um texto de Kirell Benzi sobre o tema, em que ele explica seu processo de criação e como faz a transição de uma visualização de dados para um trabalho artístico. No Brasil, há trabalhos como o do artista e pesquisador Pedro Victor, cuja série ‘Totalidades’ produziu quadros com visualizações de dados econômicos.

Um dos quadros com visualização de dados da série Totalidades, de Pedro Vitor


Dados abertos no mundo corporativo

Mais de 30 das maiores empresas dos EUA decidiram publicar dados outrora privados sobre diversidade da sua força de trabalho, como informações de gênero, raça e etnia. De acordo com a notícia da Bloomberg, a publicação é resultado de uma iniciativa da Corregedoria de Nova York.

E o recém-publicado relatório ‘Bridging Economic Opportunity Through Open Data’ produzido pela Citi Foundation e Echoing Green traz experiências de empreendedores social, como o projeto Raheem, que facilita a denúncia e o registro de abusos da polícia contra a população negra nos Estados Unidos.


Novos colonialismos

novo dossiê da revista Select trata de algoritmos e traz o texto “Racismo Algorítmico: entre a (des)inteligência artificial e a epistemologia da ignorância” de Tarcízio Silva. A publicação também conta com a colaboração de Giselle Beiguelman, que fala do trabalho do artista Adam Harvey sobre dados, direitos humanos e inteligência artificial.

Na revista, Beiguelman também entrevista Ulises Mejias, pesquisador e ativista, que fala sobre a noção de colonialismo de dados protagonizado pelos Estados Unidos e pela China. Por falar nisso, no Boletim de Dados passado, destacamos a aula do Practical Data Ethics sobre colonialismo algorítmico.

Pôster de Adam Harvey, reproduzido na capa da revista Select. Fonte: Think Privacy – Adam Harvey


Inteligência artificial e jornalismo

Também no Boletim de agosto falamos sobre a Generative Pre-trained Transformer 3 (GPT-3). Em setembro, o Guardian utilizou este modelo para gerar um artigo de opinião produzido pelo algoritmo, garantindo, no texto publicado, que a inteligência artificial das máquinas está em missão de paz. E o MIT Technology Review abordou outra experiência ambiciosa: o Diffbot. Ao contrário do GPT-3, esta iniciativa não está focada em criar um modelo de linguagem, mas em codificar todas as sentenças da web na tríade sujeito, verbo e objeto para assim produzir um grafo do conhecimento humano.

O impacto da inteligência artificial no jornalismo foi tema do podcast TalkPython. No episódio, em inglês, foram apresentados projetos jornalísticos reais que fazem uso desta tecnologia, como trabalhos do BuzzfeedLos Angeles Times, entre outros.

SAIBA MAIS

Para aprender mais e aprender sempre

Cuidados nas cores e mapas

Datawrapper publicou 13 orientações sobre como escolher cores em suas visualizações de dados. Você não precisa ser um artista para acertar nas combinações de cores dos seus gráficos e mapas, mas alguns cuidados são recomendáveis.

No texto, Lisa Charlotte dá dicas valiosas, falando de cuidados com a saturação, o contraste, o uso da roda das cores, entre outros temas. Para ir fundo, vale ler também os artigos específicos sobre uso de cores na representação de gênero e partidos políticos.

Uma das dicas é evitar cores saturadas: à esquerda, é possível ver um gráfico com cores muito brilhantes, que não é recomendado. Na direita, está a versão melhorada. Fonte: Datawrapper

Já o The Correspondent publicou uma reflexão sobre como certos elementos visuais na produção de mapas podem acabar reforçando estereótipos negativos sobre imigrantes. Segundo os autores, o uso de setas para indicar o fluxo de pessoas entre fronteiras é uma reminiscência dos mapas de guerra e pode despertar medos, por exemplo. Sob esta perspectiva crítica, o trabalho “disseca” um mapa tradicional e propõe uma releitura da visualização de dados sobre o tema.

***

E nas palavras

O blog do Localization Lab publicou um texto elencando termos tecnológicos com viés preconceituosos, na perspectiva de gênero, raça e classe, tais como: a dicotomia mestre/escravo (master/slave), lista negra (blacklist) vs lista branca (whitelist), turco mecânico (Mechanical Turk), entre outros.

***

Inferência causal

Universidade de Duke publicou no YouTube uma série de vídeos de um bootcamp sobre inferência causal, voltado para cientistas sociais. São 11 vídeos curtinhos sobre o tema, cobrindo tópicos como a leitura de papers empíricos, mensurações e contrafactuais.

SNIPPETS

Dicas curtas e certeiras sobre o trabalho com dados

06 de março de 2021: eis a data do próximo Open Data Day. O anúncio foi feito recentemente e você já pode reservar o dia na agenda.

***

Coberturas locais: o Nexo publicou um texto sobre a situação da primeira infância nas cidades brasileiras, a partir da plataforma ‘Primeira Infância Primeiro’, que disponibiliza dados sobre o tema em todos os municípios.

***

Duas excelentes iniciativas de promoção dos dados abertos e transparência pública lançaram campanhas de financiamento coletivo. Vale a pena conferir a página do Querido Diário e do Fiquem Sabendo.

***

Brazil Data Cube é uma plataforma do Instituto Nacional de Pesquisas Espaciais que facilita o acesso a imagens de satélite e dados de sensoriamento remoto.

***

Com dados: o Datalabe publicou uma investigação sobre a privatização da saúde no subúrbio do Rio de Janeiro e a Folha de São Paulo falou sobre diversidade racial em escolas privadas.

***

New York Times fez uma navegação guiada por um gráfico para contar a história da riqueza de Donald Trump.

***

Com a aproximação das eleições, vale ler o texto do First Draft que traz dicas sobre como falar com familiares e amigos sobre difusão de mensagens falsas via Whatsapp.

INSPIRA

Trabalhos e iniciativas inovadoras para te inspirar 

Em setembro, o mundo atingiu a marca trágica de 1 milhão de mortes registradas por conta da Covid-19. O Washington Post e o The Straits Times escolheram utilizar gráficos de fluxo para contar esta história. Apesar de utilizarem a mesma representação visual, os veículos adotaram narrativas diferentes: o primeiro utiliza o gráfico apenas como uma introdução para a reportagem, que traz relatos de casos reais. Já o segundo separou os dados das mortes globais e as histórias individuais em páginas diferentes. Vale a pena conferir ambos.

O Washington Post destacou o aumento de casos no Brasil em maio. Fonte: Washington Post

E o The Boston Globe analisou mais de 1 milhão de mortes, mas não da Covid-19. Neste caso, foram os registros de falecimentos em Massachusetts durante as últimas duas décadas. A investigação especial fala das desigualdades sociais e traz também gráficos sobre o tema.

APT UPDATE

Atualize-se com as novidades de softwares para trabalhar com dados

BotSlayer chegou na sua versão 1.3 com melhorias na interface e performance. A ferramenta foi tema do tutorial sobre monitoramento de ataques no Twitter, que publicamos este ano.

***

Frictionless-py: foi lançada a versão para Python da biblioteca Frictionless Data, uma especificação para facilitar a interoperabilidade de dados, feita pela Open Knowledge.

***

Mais fáceis, rápidos e bonitos: o Datawrapper turbinou as possibilidades de visualização de dados e mapas.

***

Foi lançada em setembro a versão 1.0 do plumber, que facilita a criação de APIs com R, e do dbplyr, para conexão com bancos de dados.

***

Já o pacote modelsummary – que produz resumos de modelos estatísticos – alcançou a versão 0.6.

***

Outra novidade em R recém-lançada foi o pacote torch para lidar com redes neurais e aprendizado de máquina.

***

Uma prévia do novo RawGraphs2 já está acessível para os colaboradores da campanha de financiamento desta ferramenta de visualização de dados.


Ficou algo de fora? Envie sugestões e dicas para escoladedados@ok.org.br