31/10 A 3/11 – ONLINE
5 e 6/11 – ESPM SÃO PAULO

DESCOMPLICANDO A ANÁLISE DE DADOS ELEITORAIS

DIA:
05/11

HORÁRIO:
14:00h

DURAÇÃO:
1:30h

Sala:
C605

Nível:
Básico

Sobre o workshop

No workshop da head de dados da organização Base de Dados Laura Amaral, os participantes colocaram a mão na massa para acessar, extrair e manusear dados eleitorais. Laura apresentou as principais tabelas de dados eleitorais do Tribunal Superior Eleitoral (TSE) e ensinou como extrair os dados usando a linguagem SQL e a criar visualizações em poucos minutos utilizando o Google Data Studio. 

Na primeira parte da atividade, a palestrante tratou do banco de dados públicos da Base dos Dados (BD), que conta com mecanismos de busca de dados abertos e tem como propósito universalizar o acesso a dados de qualidade. Também compartilhou como referência a plataforma Siga o Dinheiro, uma iniciativa da BD e do veículo de imprensa JOTA em prol da simplificação do acesso a dados eleitorais.

Os dados sobre candidatos, partidos e financiamento de campanhas aparecem de forma pouco intuitiva no portal institucional do TSE e, por isso, o acesso descomplicado pela BD faz com que jornalistas e pesquisadores tenham mais facilidade em trabalhar com esses dados. O site da Base dos Dados concentra toda a série histórica de dados do TSE, com informações adicionais geradas pela análise conduzida pela equipe de dados da BD. 

Ao acessar a plataforma, na área “Dados”, é possível chegar à base “Eleições Brasileiras” e em seguida, no menu lateral esquerdo, às tabelas tratadas. Na oficina, os participantes navegaram pela tabela “candidatos”, na qual constam informações gerais das candidaturas (partido, situação, nome de urna) e demográficas (gênero, idade, estado civil), e pela tabela “receitas_candidato”, onde há informações de doações (valores, fonte, doadores, data, CPF/CNPJ). 

Para explorar os dados, Laura usou o SQL durante a oficina, mas também é possível fazer o download das bases utilizando Python, R e Stata. A palestrante apresentou os comandos básicos do SQL (“select”, “from”, “where” e “distinct”) e realizou exercícios práticos junto aos participantes para responder “Quais cargos Lula e Bolsonaro se candidataram em sua trajetória política?” e “Quem foi o maior doador da campanha de Bolsonaro em 2022?”. 

Utilizando o ambiente do BigQuery, o serviço de armazenamento de dados gerenciado pelo Google para análises com escala em petabytes, e os comandos em SQL, os participantes combinaram diferentes conjuntos de dados eleitorais e conseguiram gerar novas informações sobre as bases.

Por fim, Laura mostrou como criar visualizações de dados no Google Data Studio e comprovou que, acessando as ferramentas adequadas, é possível desbravar os dados eleitorais de forma simples.

Referências

lauraamaral

LAURA AMARAL

Head de dados na Base dos Dados e Engenheira Biomédica pela Universidade Federal do ABC.

gustavoalcantara

GUSTAVO ALCÂNTARA

Analista de Dados na Base dos Dados, geógrafo pela PUC-Campinas e mestrando em demografia pela Unicamp.

REALIZAÇÃO

DESENVOLVIDO COM

APOIO

Visite os sites das edições anteriores: 20162017201820192020 e 2021.

Nosso conteúdo está disponível sob a licença Creative Commons Atribuição 4.0 Internacional, e pode ser compartilhado e reutilizado para trabalhos derivados, desde que citada a fonte.