#31 Previsões, desigualdades e apagão de dados

JANEIRO/2022

Olá,

No final de 2021, publicamos em nosso site uma retrospectiva de nossas principais realizações no ano passado, junto com algumas previsões e metas estabelecidas para este ano que se inicia. Como participante do nosso programa de membresia, você é parte importante destas conquistas.

Muito obrigado por seu apoio, esperamos seguir juntos ao longo de 2022! 🙂

A primeira semana do ano já traz uma data importante: no dia 7 de dezembro, encerram as inscrições para o Sigma Awards, a maior premiação de jornalismo de dados do mundo. Pela segunda vez, a Escola de Dados é parceira de mídia da iniciativa, junto com outras organizações que promovem premiações locais na Coréia do Sul e Paquistão.

Ainda em janeiro, iremos abrir as inscrições para mais uma turma do curso Dados 360. Pessoas participantes do programa de membresia possuem 20% de desconto na inscrição, mas as vagas são limitadas. Também vamos lançar um ebook sobre análise de dados educacionais e anunciar novas atividades públicas em breve.

Para não perder nada, entre em nosso grupo da membresia no Telegram ou siga-nos no TwitterYouTube e LinkedIn.

Boa leitura e um excelente novo ano,

Adriano Belisario

Coordenador da Escola de Dados

AGENDA

Oportunidades e prazos para não perder de vista


• 07/01 – Prazo para se inscrever na terceira edição do Sigma Awards.

• 07/01 – Data & Society busca projetos de pesquisa sobre raça e tecnologia para um programa de fellowship, além de manter outras vagas abertas para cargos diversos.

• 07/01 – Encerramento das inscrições para o Columbia Women’s Leadership Network in Brazil, programa da Universidade de Columbia para lideranças femininas na gestão pública.

• 07/01 – Universidade de Siegen procura pesquisador associado (PosDoc) em Mídia e Métodos Digitais.

• 07/01 Prazo final para o Michael Jacobs Grants, beneficiando jornalistas que trabalham com artigos e/ou livros sobre viagens na América Latina e/ou Espanha.

• 07/01 – Encerramento das inscrições para bolsas no programa Local Sustainability Solutions Journalism Fellowship, focada em soluções locais para questões ambientais.

• 10/01 – Abrem as inscrições para os cursos de verão do IME-USP, com diversas aulas na área de dados.

• 11/01 – Prazo do concurso de narrativas digitais do World Press Photo.

• 12/01 – Último dia para submeter projetos sobre acessibilidade no programa de Inteligência Artificial da Microsoft.

• 13/01 – Término da chamada de propostas de sessões a programação da RightsCon 2022, que será realizada online pela Access Now.

• 15/01 – Rede de Jornalismo Investigativo (GNIJ) contrata gerente para supervisionar e treinar sua equipe multinacional de 12 editores regionais.

• 16/01 – Prazo para se candidatar às vagas na Open Knowledge Brasil, em advocacy, comunicação visual e gestão.

• 21/01 – Encerramento das inscrições para o Reboot Student Fellowship, programa para apoiar trocas de conhecimentos sobre tecnologia e sociedade.

• 30/01 – Fechamento das vagas do Digital Media Research Center para pesquisadores de pós-doutorado, para trabalhar com partidarismo e polarização online no Laureate Fellowship do Australian Research Council (ARC).

• 31/01 – Prazo final para aplicar para bolsas de apoio ao jornalismo investigativo. A Fund for Investigative Journalism busca projetos inovadores ou que exponha ilegalidades.

• 31/01 – Último dia para jornalistas se inscreverem em dois treinamentos intensivos sobre meio ambiente e biomedicina, ofertados pela Universidade de Chicago.

• 17/02 – Início da nova turma de nosso curso Dados 360, na Escola de Dados.

NO MUNDO DOS DADOS

Notícias e discussões quentes


Apagão de dados da COVID-19

Enquanto o mundo observa um novo aumento do número de casos da COVID-19, o Brasil está às cegas em um “apagão de dados”, por conta da péssima estrutura de proteção de dados e segurança digital do Governo Federal e de diversos ataques recentes. “Agora no mês de janeiro, na primeira quinzena de janeiro, nós esperamos estar com esses dados estabilizados. Mas nunca dá para cravar, né?”, disse Marcelo Queiroga, ministro da Saúde, durante coletiva no final de dezembro.

Até lá, uma alternativa pode ser conferir e colaborar com o levantamento do site Brasil.IO, no qual voluntários compilam os dados diretamente das Secretarias de Saúde

Ainda sobre o tema, para refletir ou se inspirar, vale ler o The Guardian, que convidou integrantes da Royal Statistical Society Covid-19 Task Force a publicarem uma coluna de opinião refletindo sobre seus esforços em comunicar os dados da pandemia. É possível explorar diversas visualizações de dados relacionados à COVID-19 no painel elaborado pelo site COVIC.


Retrospectiva e previsões 

Na leva de postagens de fim de ano, o New York Times e o FiveThirtyEight compartilharam retrospectiva e coletâneas de gráficos importantes do ano de 2021. Já o Towards Data Science publicou um artigo sobre as tendências do ano passado na área de dados e analytics.

Quanto às previsões para o jornalismo em 2022, o Niemanlab trouxe uma coletânea com a colaboração de diversos pesquisadores e profissionais de todo mundo, incluindo Natália Viana e Moreno Cruz Osório no Brasil. Já o MuckRack ouviu as predições de 5 jornalistas, incluindo temas como notícias locais, pandemia e colaborações entre redações e organizações da sociedade civil.


Desigualdades digitais

Em dezembro, o webinar ‘Tecnologias, opressão e luta nas favelas’ feito pela FGV convidou David Nemer para o primeiro bate-papo após seu recém-lançado livro ‘Tecnologia do oprimido’. O trabalho reflete sobre as assimetrias e possibilidades de apropriação das atuais tecnologias digitais, a partir de uma etnografia realizada no Brasil. Outra nova referência interessante para a área é o ‘Handbook of Digital Inequality’, coletânea de trabalhos sobre temas como saúde, privacidade, geografia e infra-estruturas.

Também vale seguir o trabalho Timnit Gebru no recém-criado Distributed AI Research Institute (DAIR). Demitida do Google por realizar uma pesquisa crítica aos modelos de processamento de linguagem natural adotados na empresa, a cientista de dados fundou sua própria instituição, como um espaço de pesquisa de base sobre inteligência artificial, independente das influências de grandes empresas de tecnologia.

SAIBA MAIS

Para aprender mais e aprender sempre


PCA e álgebra linear

A London School of Economics and Political Science, por meio da iniciativa JournalismAI, criou cursos online em parceria com o Google News Initiative. Você pode começar com o ‘Introduction to Machine Learning’ e emendar com o ‘Hands-on Machine Learning’.

Se já tiver algum conhecimento em matemática, pode relembrar ou descobrir a importância dos determinantes de uma matriz com um artigo no Toward Data Science ou conhecer a empreitada de Tivadar Danka, que está escrevendo um livro sobre matemática e aprendizagem de máquina.

Danka promete contato direto com o público durante o processo e disponibilizou um capítulo de “degustação” sobre Análise de Componentes Principais (PCA), um dos métodos de aprendizagem de máquina mais comuns, servindo para identificar a relevância das variáveis de um conjunto de dados. No Twitter, Karl Rohe publicou uma explicação visual a respeito de PCA como uma forma de regressão.


IA no jornalismo e no governo

Se preferir algo menos técnico, o site Data Journalism publicou um artigo sobre as possibilidades de aplicações práticas das técnicas de aprendizagem de máquina no jornalismo investigativo, comentando trabalhos do Los Angeles Times, Grist, The Markup, entre outros veículos internacionais. No setor público, vale conferir os padrões de transparência algorítmica que o governo britânico adotou no final de 2020.

Tudo isso deve ganhar crescente atenção, uma vez que no futuro pode ser ainda mais fácil aplicar estes recursos de inteligência artificial. O MIT Technology Review abordou as potencialidades e limites de um método de aprendizagem de máquina supervisionado onde é preciso passar apenas um exemplo ao modelo, ao invés de ter que treiná-los a partir de vastos conjuntos de dados. O trabalho foi publicado no paper ‘Less Than One’-Shot Learning: Learning N Classes From M’.


Investigações visuais e OSINT

Na 12ª Conferência de Jornalismo Investigativo Global, a equipe do The New York Times apresentou suas técnicas de investigação visual para reportagens, área que cresceu nos últimos anos, a ponto de grandes veículos como o próprio NY Times formarem equipes dedicadas ao tema. Em dezembro, a turma da Global Investigative Journalism Network publicou um relato em português sobre a sessão. Também na Conferência, os jornalistas Craig Silverman e Jane Lytvynenko apresentam ferramentas para checar a veracidade das informações que circulam na Internet.

A equipe do NY Times usou imagens de satélites e dados para investigar o contrabando de petróleo.

Já em inglês e em vídeo, a novidade sugerida é um vídeo tutorial de Brecht Castel mostrando como utilizar informações de fontes abertas (OSINT) para analisar manifestações e protestos.

SNIPPETS

Dicas curtas e certeiras sobre o trabalho com dados


Fillipo Valsorda, desenvolvedor no Google, fala sobre a importância da valorização de profissionais mantenedores de projetos em código aberto e implicações no futuro.

Artigo aponta divergências em comparação dos dados educacionais sobre recursos públicos em 11 estados e discute os desafios do FUNDEB.

 •

Está disponível o conteúdo do Data Talks, uma série de diálogos entre Brasil e Alemanha sobre transparência pública e dados governamentais abertos.

O relatório JUST JOKING! examina as implicações artísticas, culturais e políticas do uso de DeepFakes na mídia, a partir da análise de mais de 70 casos.

Sobre visualização de dados, Júlia Giannella publicou um artigo sobre a visualização de dados em acervos digitais.

Já Nick Desbarats refletiu sobre o que levar em consideração na criação de uma visualização de dados.

Python: 5 práticas para programação orientada a objetos e como extrair dados de listas de reprodução usando a API do Spotify, no Towards Data Science

Em tutorial inédito para nosso canal do YouTube, Adriano Belisario – coordenador da Escola de Dados – como utilizar a função PROCV no Google Sheets para fazer cruzamentos.

INSPIRA

Trabalhos e iniciativas inovadoras para te inspirar


É comum apresentar visualizações de gênero com simbologias estereotipadas: usar rosa para representar mulheres e azul para representar homens, por exemplo. Ao mesmo tempo, análises e visualizações relacionadas a gênero, acesso e justiça ganham uma importância cada vez maior. Foi pensando nisso que Giorgia Lupi e a equipe do Pentagram desenvolveram um sistema de visualização de dados sobre equidade de gênero.

O sistema criado por Giorgia Lupi utiliza padrões visuais simples para retratar realidades complexas sobre as assimetrias de gênero.

Nela, todo elemento é construído a partir de um sinal de igual (=) ou sinal de mais (+), reforçando a centralidade dos dois conceitos em busca de uma equidade. Como a igualdade de gênero é algo que afeta todos os países do mundo, foram desenvolvidas diretrizes que dessem suporte a cada especificidade na aplicação do sistema. A ideia é ajudar a construir uma sociedade mais igualitária a partir de visualizações livres de estereótipos.

UPDATE

Atualize-se com as novidades de softwares e bases de dados


A revista AzMina junto a outras jornalistas construíram o Monitoramento de Discurso Político Misógino, uma aplicação web e API que detecta discurso de ódio contra mulheres.

Bastian Herre disponibilizou um conjunto de dados sobre as ideologias econômicas dos líderes ao redor do mundo.

O Global Citizenship Observatory liberou um conjunto de dados sobre legislação de cidadania, incluindo diferentes maneiras de adquirir e perder uma cidadania.

O IBGE atualizou sua Base Cartográfica Vetorial Contínua do Brasil para escala 1:250.000, disponibilizando em formatos livres.

O Observable adicionou suporte nativo a células SQL, tornando possível fazer consultas usando bancos de dados externos e explorar os resultados em uma tabela.

Estudantes e iniciantes, o Pandas Tutor ajuda a compreender como os dados são manipulados no Pandas. Para quem usa R, é possível ver a mesma coisa usando o Tidy Data Tour.

O Github está melhorando a forma como se pesquisa código na plataforma.

Base dos Dados lançou um novo módulo no pacote Python que valida os dados antes de subir para a plataforma deles.

Graph tool é um novo módulo Python voltado para manipulação e análise estatística usando grafos.

pkgdown 2.0.0 traz novos modelos e modos de personalizar seu site para seus pacotes em R


Sugestões? Envie um e-mail para [email protected].

Posts relacionados

Deixe um comentário

Esse site utiliza o Akismet para reduzir spam. Aprenda como seus dados de comentários são processados.