Setembro/2023

AGENDA

Oportunidades e prazos para não perder de vista


01/10 – É dada a largada para o Hacktoberfest! No mês em que projetos de código aberto recebem contribuições, o Querido Diário, do programa Ciência de Dados para Inovação Cívica da Open Knowledge Brasil, indica como você pode ajudar

04/10 – O 7º Seminário Internacional de Jornalismo, uma parceria da ESPM com a Columbia Journalism School, ocorrerá em São Paulo. 

05/10 – Último dia para adquirir ingressos a preços promocionais para a Conferência Brasileira de Jornalismo de Dados e Métodos Digitais.

08/10 – Prazo final de inscrições para o Prêmio Cláudio Weber Abramo de Jornalismo de Dados, que terá sua cerimônia de premiação no encerramento do Coda.Br.

12/10 – O News Impact Summit: Elevating Climate Journalism, do European Journalism Centre, será realizado em Lisboa. 

13/10 – Data limite para inscrições no 5º Prêmio Livre.jor de Jornalismo-Mosca

15/10 – Último dia para se inscrever no GNI Startups Lab Brasil

17 a 18/10SRCCON 2023, conferência liderada por jornalistas que desejam transformar seu trabalho, suas organizações e suas comunidades.

• 18/10 – A Spatial Data Science Conference será realizada em Nova Iorque, EUA, e também terá workshops ao vivo, online. 

07 a 09/11Festival de Datos em Punta del Este, no Uruguai.

06 a 10/1111º Congresso Nacional de Design da Informação, com trilha sobre visualização de dados.

18 e 19/11 – 8ª edição da Conferência Brasileira de Jornalismo de Dados e Métodos Digitais, Coda.Br, em São Paulo.

13 a 16/12Cultural Data Analytics Conference 2023, em Talín, na Estônia. 

NO MUNDO DOS DADOS

Notícias e discussões quentes


Coda Amazônia 2023 

De 31/08 a 02/09, a segunda edição do Coda Amazônia foi realizada. Desta vez, a conferência não ficou limitada à capital paraense, mas também proporcionou uma troca de vivências e compartilhamento de perspectivas com lideranças marajoaras no município de Salvaterra. Os painéis realizados na Universidade Federal do Pará contaram com transmissão ao vivo e estão disponíveis nesta playlist do YouTube. E a documentação das demais atividades do evento, que trataram de temas como segurança digital, desinformação socioambiental e agenda climática, e ferramentas como ChatGPT, PyScript e StoryMaps, está disponível no site do evento.

LLMs, IA Generativa e modelo transformador

Neste mês, uma matéria aberta do Financial Times buscou mostrar, de maneira didática, como funcionam os LLMs (large language models). A partir da frase “We go to work by trains”, a animação explica como é feita a tradução de frases para “tokens”, unidades básicas que podem ser codificadas. A parte dinâmica da matéria traz conceitos como aproximação e incorporação de palavras, exemplificando como funcionam os modelos transformadores, que processam uma sequência inteira de uma vez – seja uma frase, um parágrafo ou um artigo inteiro – analisando todas as suas partes e não apenas palavras individuais. Vale conferir.

SAIBA MAIS

Para aprender mais e aprender sempre


Guia de investigação de ameaças digitais

Neste mês, a Global Investigative Journalism Network publicou a recapitulação das partes iniciais do Reporter’s Guide to Investigating Digital Threats, de Jane Lytvynenko, Etienne Maynier e Luis Assardo. No primeiro capítulo, são apresentadas ferramentas para conter tanto informações falsas quanto a desinformação, além de estudos de caso sobre o tema. A infraestrutura digital é o foco do segundo capítulo, que traz ferramentas e recursos para investigações online. O terceiro capítulo abarca a proteção contra ameaças digitais, vigilância online e ataques virtuais, ao passo que o capítulo final busca entender como campanhas de trollagem se tornaram modelos de negócios.

Expondo o Invisível: kit está inteiramente disponível em português

No último dia 12, a Escola de Dados organizou um webinar de lançamento de um material sobre investigações digitais, o kit Expondo o Invisível. O conteúdo propõe ensinar a investigar e se proteger tanto no âmbito digital quanto em investigações em campo. Originalmente desenvolvido em inglês pela Tactical Tech, o material agora está totalmente traduzido para o português, em trabalho feito por Celso Bessa e voluntários, participantes também da atividade de lançamento. A Escola de Dados traduziu 3 destes conteúdos e os disponibilizou em seu site. O kit completo está disponível no site do próprio projeto.

Como o Nexo utiliza o R para visualização de dados

Em recente texto para a seção Gráfico, do Nexo, Gabriel Zanlorenssi explica como e por que o jornal utiliza o R para a elaboração de suas visualizações. O jornalista destacou que a maior vantagem de usar uma linguagem de programação para trabalhar com dados é o tempo, tanto para produzir novas pautas quanto para a criação de gráficos mais elaborados. Por meio da utilização do software RStudio com o TidyVerse, conjunto de pacotes criados por Hadley Wickham, Zanlorenssi indica que os gráficos do jornal são criados com o pacote ggplot2 e suas extensões. Personalização, escala e compatibilidade com dados brasileiros são fatores apontados como relevantes na escolha de uso do pacote. Para o próximo mês, a promessa do espaço é trazer uma comparação entre R e Python, outra linguagem de programação amplamente utilizada.

Bônus: se você quer utilizar o R para comparar dados do Brasil com os da América Latina, confira este tutorial elaborado por Fernando Barbalho e publicado no site da Escola de Dados.

SNIPPETS

Dicas curtas e certeiras


O TweetDeck tornou-se, oficialmente, um serviço pago, como aponta Jay Peters na The Verge.

Foi lançada, em 21 de setembro, a Plataforma cidacsClima, voltada para dados climáticos, ambientais e de saúde.

O Observatório do Marajó revelou que as prefeituras da região possuem resultados insatisfatórios em relação à segunda avaliação realizada pelo ITGP (Índice de Transparência e Governança Pública).

A organização Cedra é destaque na utilização de estatísticas oficiais para explicar e evidenciar a desigualdade racial no Brasil.

INSPIRA

Trabalhos e iniciativas inovadoras para te inspirar


Em setembro, a Bloomberg fez uma análise mostrando como as empresas dos Estados Unidos vêm contratando mais pessoas não-brancas após os protestos do Black Lives Matter. Por meio de uma visualização simples, com gráficos ao fundo e a utilização de caixinhas flutuantes explicativas, muitas vezes contendo a própria legenda em seu conteúdo, fica fácil de ver como novos empregos foram distribuídos entre as minorias em 2021, que a mudança mais visível foi entre funcionários de cargos de níveis mais iniciais e também como ficou a distribuição entre as raças entre os profissionais de cargos de diferentes níveis. Na visualização, há ainda, uma caixa seletora que permite ver de forma mais detalhada a distribuição racial de algumas das 100 maiores empresas americanas.

NOVOS DADOS

Conjuntos de dados e plataformas publicados recentemente


A ferramenta CruzaGrafos, da Abraji, recebeu uma atualização no início de setembro com mais de 28 milhões de registros da dívida ativa da União.

UPDATE

Atualize-se com as novidades de softwares e bases de dados


A versão beta do GitHub Copilot Chat está disponível para os usuários em todos os idiomas, o que possibilita a codificação da linguagem de forma natural por pessoas desenvolvedoras. 

O Metabase 47 foi liberado, com processos de downloads de PDF ou uploads de arquivos CSV, e, ainda, ferramentas de pesquisa e serialização de dados.