5 e 6/11 – ESPM SÃO PAULO
DESCOMPLICANDO A ANÁLISE DE DADOS ELEITORAIS
No workshop da head de dados da organização Base de Dados Laura Amaral, os participantes colocaram a mão na massa para acessar, extrair e manusear dados eleitorais. Laura apresentou as principais tabelas de dados eleitorais do Tribunal Superior Eleitoral (TSE) e ensinou como extrair os dados usando a linguagem SQL e a criar visualizações em poucos minutos utilizando o Google Data Studio.
Na primeira parte da atividade, a palestrante tratou do banco de dados públicos da Base dos Dados (BD), que conta com mecanismos de busca de dados abertos e tem como propósito universalizar o acesso a dados de qualidade. Também compartilhou como referência a plataforma Siga o Dinheiro, uma iniciativa da BD e do veículo de imprensa JOTA em prol da simplificação do acesso a dados eleitorais.
Os dados sobre candidatos, partidos e financiamento de campanhas aparecem de forma pouco intuitiva no portal institucional do TSE e, por isso, o acesso descomplicado pela BD faz com que jornalistas e pesquisadores tenham mais facilidade em trabalhar com esses dados. O site da Base dos Dados concentra toda a série histórica de dados do TSE, com informações adicionais geradas pela análise conduzida pela equipe de dados da BD.
Ao acessar a plataforma, na área “Dados”, é possível chegar à base “Eleições Brasileiras” e em seguida, no menu lateral esquerdo, às tabelas tratadas. Na oficina, os participantes navegaram pela tabela “candidatos”, na qual constam informações gerais das candidaturas (partido, situação, nome de urna) e demográficas (gênero, idade, estado civil), e pela tabela “receitas_candidato”, onde há informações de doações (valores, fonte, doadores, data, CPF/CNPJ).
Para explorar os dados, Laura usou o SQL durante a oficina, mas também é possível fazer o download das bases utilizando Python, R e Stata. A palestrante apresentou os comandos básicos do SQL (“select”, “from”, “where” e “distinct”) e realizou exercícios práticos junto aos participantes para responder “Quais cargos Lula e Bolsonaro se candidataram em sua trajetória política?” e “Quem foi o maior doador da campanha de Bolsonaro em 2022?”.
Utilizando o ambiente do BigQuery, o serviço de armazenamento de dados gerenciado pelo Google para análises com escala em petabytes, e os comandos em SQL, os participantes combinaram diferentes conjuntos de dados eleitorais e conseguiram gerar novas informações sobre as bases.
Por fim, Laura mostrou como criar visualizações de dados no Google Data Studio e comprovou que, acessando as ferramentas adequadas, é possível desbravar os dados eleitorais de forma simples.
LAURA AMARAL
Head de dados na Base dos Dados e Engenheira Biomédica pela Universidade Federal do ABC.
GUSTAVO ALCÂNTARA
Analista de Dados na Base dos Dados, geógrafo pela PUC-Campinas e mestrando em demografia pela Unicamp.
REALIZAÇÃO
DESENVOLVIDO COM
APOIO
Nosso conteúdo está disponível sob a licença Creative Commons Atribuição 4.0 Internacional, e pode ser compartilhado e reutilizado para trabalhos derivados, desde que citada a fonte.