#49 Coda Amazônia, IA Generativa e um guia de investigação de ameaças digitais
Setembro/2023
AGENDA
Oportunidades e prazos para não perder de vista
• 01/10 – É dada a largada para o Hacktoberfest! No mês em que projetos de código aberto recebem contribuições, o Querido Diário, do programa Ciência de Dados para Inovação Cívica da Open Knowledge Brasil, indica como você pode ajudar.
• 04/10 – O 7º Seminário Internacional de Jornalismo, uma parceria da ESPM com a Columbia Journalism School, ocorrerá em São Paulo.
• 05/10 – Último dia para adquirir ingressos a preços promocionais para a Conferência Brasileira de Jornalismo de Dados e Métodos Digitais.
• 08/10 – Prazo final de inscrições para o Prêmio Cláudio Weber Abramo de Jornalismo de Dados, que terá sua cerimônia de premiação no encerramento do Coda.Br.
• 12/10 – O News Impact Summit: Elevating Climate Journalism, do European Journalism Centre, será realizado em Lisboa.
• 13/10 – Data limite para inscrições no 5º Prêmio Livre.jor de Jornalismo-Mosca.
• 15/10 – Último dia para se inscrever no GNI Startups Lab Brasil.
• 17 a 18/10 – SRCCON 2023, conferência liderada por jornalistas que desejam transformar seu trabalho, suas organizações e suas comunidades.
• 18/10 – A Spatial Data Science Conference será realizada em Nova Iorque, EUA, e também terá workshops ao vivo, online.
• 07 a 09/11 – Festival de Datos em Punta del Este, no Uruguai.
• 06 a 10/11 – 11º Congresso Nacional de Design da Informação, com trilha sobre visualização de dados.
• 18 e 19/11 – 8ª edição da Conferência Brasileira de Jornalismo de Dados e Métodos Digitais, Coda.Br, em São Paulo.
• 13 a 16/12 – Cultural Data Analytics Conference 2023, em Talín, na Estônia.
NO MUNDO DOS DADOS
Notícias e discussões quentes
Coda Amazônia 2023
De 31/08 a 02/09, a segunda edição do Coda Amazônia foi realizada. Desta vez, a conferência não ficou limitada à capital paraense, mas também proporcionou uma troca de vivências e compartilhamento de perspectivas com lideranças marajoaras no município de Salvaterra. Os painéis realizados na Universidade Federal do Pará contaram com transmissão ao vivo e estão disponíveis nesta playlist do YouTube. E a documentação das demais atividades do evento, que trataram de temas como segurança digital, desinformação socioambiental e agenda climática, e ferramentas como ChatGPT, PyScript e StoryMaps, está disponível no site do evento.
LLMs, IA Generativa e modelo transformador
Neste mês, uma matéria aberta do Financial Times buscou mostrar, de maneira didática, como funcionam os LLMs (large language models). A partir da frase “We go to work by trains”, a animação explica como é feita a tradução de frases para “tokens”, unidades básicas que podem ser codificadas. A parte dinâmica da matéria traz conceitos como aproximação e incorporação de palavras, exemplificando como funcionam os modelos transformadores, que processam uma sequência inteira de uma vez – seja uma frase, um parágrafo ou um artigo inteiro – analisando todas as suas partes e não apenas palavras individuais. Vale conferir.
SAIBA MAIS
Para aprender mais e aprender sempre
Guia de investigação de ameaças digitais
Neste mês, a Global Investigative Journalism Network publicou a recapitulação das partes iniciais do Reporter’s Guide to Investigating Digital Threats, de Jane Lytvynenko, Etienne Maynier e Luis Assardo. No primeiro capítulo, são apresentadas ferramentas para conter tanto informações falsas quanto a desinformação, além de estudos de caso sobre o tema. A infraestrutura digital é o foco do segundo capítulo, que traz ferramentas e recursos para investigações online. O terceiro capítulo abarca a proteção contra ameaças digitais, vigilância online e ataques virtuais, ao passo que o capítulo final busca entender como campanhas de trollagem se tornaram modelos de negócios.
Expondo o Invisível: kit está inteiramente disponível em português
No último dia 12, a Escola de Dados organizou um webinar de lançamento de um material sobre investigações digitais, o kit Expondo o Invisível. O conteúdo propõe ensinar a investigar e se proteger tanto no âmbito digital quanto em investigações em campo. Originalmente desenvolvido em inglês pela Tactical Tech, o material agora está totalmente traduzido para o português, em trabalho feito por Celso Bessa e voluntários, participantes também da atividade de lançamento. A Escola de Dados traduziu 3 destes conteúdos e os disponibilizou em seu site. O kit completo está disponível no site do próprio projeto.
Como o Nexo utiliza o R para visualização de dados
Em recente texto para a seção Gráfico, do Nexo, Gabriel Zanlorenssi explica como e por que o jornal utiliza o R para a elaboração de suas visualizações. O jornalista destacou que a maior vantagem de usar uma linguagem de programação para trabalhar com dados é o tempo, tanto para produzir novas pautas quanto para a criação de gráficos mais elaborados. Por meio da utilização do software RStudio com o TidyVerse, conjunto de pacotes criados por Hadley Wickham, Zanlorenssi indica que os gráficos do jornal são criados com o pacote ggplot2 e suas extensões. Personalização, escala e compatibilidade com dados brasileiros são fatores apontados como relevantes na escolha de uso do pacote. Para o próximo mês, a promessa do espaço é trazer uma comparação entre R e Python, outra linguagem de programação amplamente utilizada.
Bônus: se você quer utilizar o R para comparar dados do Brasil com os da América Latina, confira este tutorial elaborado por Fernando Barbalho e publicado no site da Escola de Dados.
SNIPPETS
Dicas curtas e certeiras
O TweetDeck tornou-se, oficialmente, um serviço pago, como aponta Jay Peters na The Verge.
Foi lançada, em 21 de setembro, a Plataforma cidacsClima, voltada para dados climáticos, ambientais e de saúde.
O Observatório do Marajó revelou que as prefeituras da região possuem resultados insatisfatórios em relação à segunda avaliação realizada pelo ITGP (Índice de Transparência e Governança Pública).
A organização Cedra é destaque na utilização de estatísticas oficiais para explicar e evidenciar a desigualdade racial no Brasil.
INSPIRA
Trabalhos e iniciativas inovadoras para te inspirar
Em setembro, a Bloomberg fez uma análise mostrando como as empresas dos Estados Unidos vêm contratando mais pessoas não-brancas após os protestos do Black Lives Matter. Por meio de uma visualização simples, com gráficos ao fundo e a utilização de caixinhas flutuantes explicativas, muitas vezes contendo a própria legenda em seu conteúdo, fica fácil de ver como novos empregos foram distribuídos entre as minorias em 2021, que a mudança mais visível foi entre funcionários de cargos de níveis mais iniciais e também como ficou a distribuição entre as raças entre os profissionais de cargos de diferentes níveis. Na visualização, há ainda, uma caixa seletora que permite ver de forma mais detalhada a distribuição racial de algumas das 100 maiores empresas americanas.
NOVOS DADOS
Conjuntos de dados e plataformas publicados recentemente
A ferramenta CruzaGrafos, da Abraji, recebeu uma atualização no início de setembro com mais de 28 milhões de registros da dívida ativa da União.
UPDATE
Atualize-se com as novidades de softwares e bases de dados
A versão beta do GitHub Copilot Chat está disponível para os usuários em todos os idiomas, o que possibilita a codificação da linguagem de forma natural por pessoas desenvolvedoras.
O Metabase 47 foi liberado, com processos de downloads de PDF ou uploads de arquivos CSV, e, ainda, ferramentas de pesquisa e serialização de dados.