Outubro/2023

AGENDA

Oportunidades e prazos para não perder de vista


• 03/11 – Miniconferência “Day of Inspiration”, com uma palestra de Tiago Maranhão no Maryland Institute College of Art.

• 07 a 09/11 – Festival de Datos em Punta del Este, no Uruguai.

• 06 a 10/11 – 11º Congresso Nacional de Design da Informação, com trilha sobre visualização de dados.

• 18 e 19/11 – 8ª edição da Conferência Brasileira de Jornalismo de Dados e Métodos Digitais, Coda.Br, em São Paulo.

• 20/11 – Consulta pública do Ministério da Saúde sobre a disponibilidade e o uso dos dados abertos do SUS. Contribua por meio do formulário online

• 01/12 – Prazo final para as inscrições no programa de microbolsas para Formação de Repórteres Indígenas da Agência Pública.

• 13 a 16/12 – Cultural Data Analytics Conference 2023, em Talín, na Estônia.

NO MUNDO DOS DADOS

Notícias e discussões quentes


IA para dublagem e jornalismo em plataformas digitais

Neste mês, a Forbes Brasil entrevistou Bruno Sartori (especialista em deepfake e CEO da Sintetica.Ai) acerca do anúncio de plataformas digitais, como YouTube e Spotify, sobre a utilização de IA para dublagem de vídeos e podcasts. Ambas as plataformas argumentaram que as novas tecnologias potencializam a criatividade humana e aprofundam a relação entre produtores de conteúdo e consumidores. Sartori destacou os possíveis impactos no setor de dublagens no mercado audiovisual, além das questões éticas envolvendo direitos autorais. 

Uso da IA na visualização de dados
A JournalismAi e a Tableau discorreram sobre o emprego de Inteligência Artificial para atividades desenvolvidas por jornalistas no campo da visualização de dados. A Daisy, por exemplo, é uma estrutura de IA que permite aos usuários extrair facilmente insights de conjuntos de dados complexos e estruturados sobre as eleições na Índia, usando consultas em linguagem natural.

Já o Tableau, lançou o DataTales, uma ferramenta que simplifica o processo de criação envolvendo um grande modelo de linguagem para ajudar os autores a criar e verificar múltiplas versões de uma história de dados no contexto de um determinado gráfico.

Elaborada por Tableau (2023).

SAIBA MAIS

Para aprender mais e aprender sempre


A viagem dos dados 

Já parou para pensar qual o caminho que seus dados fazem a partir do momento que você utiliza o cartão de transporte? Com a proposta de explorar os fatores sociopolíticos, econômicos, normativos e técnico-institucionais  que entrelaçam o fluxo de dados e explicam a economia política subjacente às infraestruturas de dados no setor público, Fernanda Campagnucci desenvolveu a dissertação “Para uma economia política dos dados: uma proposta de governança democrática de dados a partir do estudo da infraestrutura digital do cartão de transporte da cidade de São Paulo”.


Vieses no aprendizado de máquina

Carla Vieira, por sua vez, contribuiu nos estudos de vieses em modelos de aprendizado de máquina, desenvolvendo a dissertação “Uso de agrupamento para alcançar explicabilidade global de modelos de aprendizado de máquina”, assunto que vem sendo globalmente estudado desde 2016 e que tem cada vez mais sido urgente, dado às aplicações dos modelos em tomadas de decisões que geram impactos na sociedade.  


Tecnologia afrorreferenciada

E por falar em impacto que os algoritmos causam na sociedade, Tarcízio Silva, já conhecido pelo sua coleção de livros que abordam o tema, disponibilizou gratuitamente a sua mais recente publicação organizada com Thiane Neves,  que tem por título “Grios e tecnologias digitais”, onde se propõem a pensar tecnologia a partir de grandes intelectuais negros do país.

SNIPPETS

Dicas curtas e certeiras


Disponível o guia “Segurança Pública em Dados: Guia prático para jornalistas”, construído em parceria com Instituto Fogo Cruzado, Instituto Sou da Paz, Fiquem Sabendo e Abraji.

O Núcleo Jornalismo lançou seu próprio chatbot – o NuclitoGPT -, treinado a partir de aprendizado de máquina profundo (LLMs).

GitHub aponta informações importantes para ficar atento hoje em dia, ao desenvolver projetos de aprendizado profundo de máquina (LLM).

DataWrapper procura por estudantes que queiram trabalhar desenvolvendo mapas, de maneira remota ou presencial (em Berlim). 

David Caswell escreveu sobre as 12 instituições jornalísticas que participaram do AI in Journalism Challenge, dentre elas, a brasileira Agência Publica.  

Bert Spaan ensina como criar mapas com poucas linhas de código, utilizando o plugin Allmaps e a biblioteca de Javascript Leaflet.

Todos os vídeos da Conferência PyTorch 2023 estão disponíveis no Youtube. Destacamos A Powerful Combination for Generative AI, Accelerating Generative AI e Into Generative AI with PyTorch Lightning 2.0

Liderado pela OCCPR (Organized Crime and Corruption Reporting Project) o projeto Narco Files pretende mostrar como o crime organizado a nível global está se reconfigurando.

INSPIRA

Trabalhos e iniciativas inovadoras para te inspirar


Utilizando dados do Associated Press, USA Today e Northeastern University, o jornal The Washington Post desenvolveu uma visualização que mostra, desde 2006, os números de pessoas mortas por armas de fogo. Descrevendo como “assassinatos em massa com armas”, as análises apontaram que a maioria dos casos, 24 vezes em média desde 2006, acontecem com pessoas conhecidas do atirador, revelando que estes eventos não são explosões aleatórias de violência pública. O objetivo do projeto é apontar as pessoas assassinadas, os atiradores e as circunstâncias em torno do assassinato.

Na visualização principal (relacionado a imagem acima), as pessoas em lilás são pessoas desconhecidas e as pessoas em cinza são conhecidas do atirador, todas elas com informação detalhada. Além disso, é possível explorar os dados a partir de datas, tiroteios em massa por ano, tipos comuns de assassinatos em massa e detalhes sobre os atiradores.

NOVOS DADOS

Conjuntos de dados e plataformas publicados recentemente


A Base dos Dados disponibilizou dois conjuntos de dados: decisões do Supremo Tribunal Federal (STF), com variáveis de modalidade de julgamento, indicador de tramitação, relator, entre outros; e dados da Copa do Brasil.

UPDATE

Atualize-se com as novidades de softwares e bases de dados


VSCode 1.84 dentre as muitas atualizações a possibilidade de executar células de notebook precedentes ou dependentes e o ajudante de desativação de ambiente virtual.