Agosto/2024

AGENDA

Oportunidades e prazos para não perder de vista


• 02 a 22/09 – Inscrições para o Prêmio Claudio Weber Abramo 2024.

• 02 e 03/09 – 15º Seminário de proteção à privacidade e aos dados pessoais, gratuito e presencial em São Paulo, com transmissão pelo Youtube.

• 10/09 – Acontece o webinar Master the art of data storytelling, organizado pelo Flourish. 

• 18/09 – Encontro Brasileiro de Data Science, na Faculdade Getúlio Vargas (FGV). Evento gratuito.

• 18 e 19/09 – PyTorch Conference 2024, em San Francisco – CA.

• 01/10 a 05/11 – Começa uma nova edição do curso do CKAN, na Escola de Dados. Inscrições abertas. 

• 10 a 12/10 – Prazo para inscrever atividade no LibreOffice Conference 2024, que acontece em Luxemburgo com possibilidades de apresentação online.

• 16 a 21/10 – Python Brasil (PyBR), no Rio de Janeiro – RJ. Inscrições abertas.

• 17/10 – Acontece o The Tech We Want Online Summit, organizado pela Open Knowledge Foundation.

• 20/10 – Encerramento do período de submissão de ideias ou sugestões para a Conferência NICAR25.

• 24/10 – Data limite para jornalistas investigativos ambientais se inscreverem em bolsas de 400 mil euros, oferecidas pela Earth Investigations Program

• 18 a 22/11 – Acontece a Conferência Latino-Americana sobre o uso de R em pesquisa e desenvolvimento (LatinR). Online.

• 02 a 08/12 – Acontece a Conferência Internacional de Software Livre e de Código Aberto para Geoespacial (FOSS4G), em Belém – PA.

• 03 a 06/12 – América Aberta 2024, em Brasília. Informações no site oficial do evento.

NO MUNDO DOS DADOS

Notícias e discussões quentes


PESQUISAS ELEITORAIS A TODO VAPOR

No período que antecede as eleições, ganha destaque um dos fenômenos essenciais para avaliar as intenções de voto da população: as pesquisas eleitorais. Teresina (PI), conhecida como o “paraíso das pesquisas eleitorais”, tem sido palco de um fenômeno notável na pré-campanha das eleições municipais de 2024, segundo os jornalistas Marcelo Soares e Vitória Pilar afirma para a Folha de S.Paulo.

A cidade registrou 51 levantamentos entre fevereiro e agosto, superando capitais maiores como São Paulo e Rio de Janeiro. Esse fenômeno reflete uma tendência nacional de aumento na quantidade de pesquisas eleitorais, impulsionado por institutos menores e regionais.

No entanto, a falta de fiscalização rigorosa pelo Tribunal Superior Eleitoral (TSE) sobre a metodologia e execução das pesquisas levanta preocupações sobre a confiabilidade e representatividade dos dados. O TSE apenas registra os levantamentos e depende de denúncias para investigar possíveis irregularidades.

Analistas defendem uma regulamentação mais rígida, incluindo a obrigatoriedade de publicação de bancos de dados detalhados das pesquisas. Enquanto isso, sugere-se que o público considere uma média das pesquisas para obter uma visão mais precisa do cenário eleitoral.

Apesar de serem essenciais para avaliar o clima político, as pesquisas enfrentam desafios metodológicos e de credibilidade, especialmente com a crescente resistência dos eleitores a participar de sondagens e o advento de novas tecnologias que podem afetar a representatividade das amostras.

SAIBA MAIS

Para aprender mais e aprender sempre


ANALISANDO DADOS ELEITORAIS

Compreender como os votos estão distribuídos dentro do território, pode se transformar em uma poderosa ferramenta de estratégia seja para campanhas eleitorais, seja para analisar outras questões relacionadas ao cumprimento de políticas públicas. Neste mês, Thays Lavor (InfoAmazonia) utilizando dados do Tribunal Superior Eleitoral (TSE) fez uma análise de como esses dados se apresentam em Belém (PA). A atividade foi bastante rica e se estendeu para uma parte dois, agora em setembro, onde se pretende criar um mapa com estes dados. 

APRENDENDO COM A IA GENERATIVA

Como a IA generativa pode ajudar a aprender uma habilidade ou escrever software? Nicholas Carlini, do Google DeepMind, oferece exemplos do mundo real – com prompts e resultados – de “conversas” que ele e a máquina tiveram com diferentes modelos de linguagem grandes (LLMs) para melhorar significativamente sua capacidade de realizar pesquisas e ajudar a trabalhar em projetos paralelos de codificação aleatória.

ALFABETIZAÇÃO EM DADOS

Em uma era como a nossa onde os dados estão por toda parte, saber lidar minimamente com eles é essencial. Sam Priddy, da Tableau, indica conceitos importantes para começar a sua jornada básica de aprendizado em relação aos dados. Diferente do que se pensa, Sam indica que entender os dados antes de aprender uma ferramenta é essencial.

SNIPPETS

Dicas curtas e certeiras


Fábio Vasconcellos desenvolveu um grafo para analisar padrões e sobreposições na rede de coligações para prefeito nas eleições deste ano.

Anete Ezera ensina 8 maneiras para visualizar dados sobre eleições.

Agência Publica utilizando dados públicos descobriu que 24 prefeitos eleitos em 2020 e multados por infrações ambientais na última década são pré-candidatos nas eleições deste ano.

MapBiomas disponibilizou o vídeo de lançamento da Coleção 9 de mapas anuais de cobertura e uso da terra no Brasil (1985-2023) e a Premiação da 6ª Edição do Prêmio MapBiomas.

Santiago Villa escreveu um artigo com 10 dicas para fazer pedidos melhores de acesso à informação.

Adriano Belisário desenvolveu a ferramenta Smart Image Sorter para classificar imagens sem precisar treinar modelos de inteligência artificial.

Dario Radečić ensinou como utilizar o R tidymodels, pacote voltado para aprendizado de máquina.

Sharon Machlis criou a ferramenta Mastodon ‘Toots’ que coleta informações postadas no Mastodon, relacionadas a conferência Posit 2024, usando os pacotes rtoot e DT.

GitHub no seu guia para iniciantes ensina como fazer um pull request.

VSCode disponibilizou tutorial ensinando como configurar o ambiente de desenvolvimento para utilizar a linguagem Python.

Reuters desenvolveu visualização a partir de imagens de satélites mostrando como deslizamentos de terras na Índia varreram assentamentos e destruíram edifícios.

InfoAmazonia utilizando dados do Centro Nacional de Monitoramento e Alertas de Desastres Naturais (Cemaden) descobriu seca em terras indígenas da Amazônia.

New York Times fez reportagem interativa mostrando como uma deepfake de Elon Musk contribuiu com bilhões de fraudes.

Bloomberg desenvolveu uma visualização mostrando como Gaza se transformou em um grande entulho e o que será necessário para reconstruí-la.

INSPIRA

Trabalhos e iniciativas inovadoras para te inspirar


Uma das grandes promessas em tempos de eleição são as construções de creches e pré-escolas em tempo integral, um aparato público que serve de grande apoio principalmente para a população negra. No entanto, esse atendimento continua falho em muitas regiões do país, como no Rio de Janeiro. É o que mostra a visualização da Gênero e Número.

Utilizando dados do Censo Escolar 2023 das 923 creches e pré-escolas municipais do Rio de Janeiro, apenas 45% delas são 100% integrais. Na matéria é possível visualizar ainda outros gráficos como capitais com maior número de aparelhos 100% integrais e o quanto que foi construído com o passar dos anos por cada prefeito desde 2008. Uma baita proposta de análise nestes tempos eleitorais para avaliar o cumprimento das políticas públicas locais.

Na imagem, quantidades de escolas por região do Rio de Janeiro.

NOVOS DADOS

Todos pela Educação lança a plataforma Educação Já Municípios que possibilita baixar um panorama da educação em cada município do país, com vários índices como aprendizagem, características da rede, investimento por aluno, entre outros.

Novo conjunto de dados da NASA sobre qualidade do ar está disponível, fornecendo concentração de massa corrigida na superfície.

Petrobras lança geoportal de incentivo ao abatimento de emissões de CO², utilizando dados de emissões do setor de difícil abatimento de energia, dados de poços exploratórios, levantamentos geofísicos e mais.

UPDATE

Atualize-se com as novidades de softwares e bases de dados


LibreOffice 24.8 destaca a função XLOOKUP, melhores modelos de apresentações e novo modo de criptografia ODF baseada em senha.

Git 2.46 implementou o pseudo-merge, uma maneira que irá facilitar e agilizar a busca por commits.

Base dos Dados automatizou os joins para tradução de códigos institucionais como sexo, municipios do IBGE, Raça/Cor, entre outros.

CKAN 2.11 destaca a integração do HTMX e a consolidação da abordagem hipermídia na arquitetura.