18 e 19/11 – ESPM SÃO PAULO (CAMPUS ÁLVARO ALVIM)
R. DR. ÁLVARO ALVIM, 123 – VILA MARIANA
DESVENDANDO DADOS COM R: NAVEGANDO PELO MOSAICO MUNICIPAL BRASILEIRO
Texto por Renan Cavalcante
O workshop conduzido por Fernando Barbalho, cientista de dados do Tesouro Nacional, focou no uso da linguagem de programação R para analisar dados do Censo de 2022 do IBGE. A base de dados trabalhada inclui informações sobre população, área territorial, e gastos com saúde e educação dos municípios brasileiros.
O ponto de partida da discussão focou na importância de compreender a dinâmica dos municípios brasileiros, destacando que o conhecimento sobre a estrutura e gestão municipal é crucial para avaliar e construir políticas públicas efetivas. Além de informações atualizadas que permitem análises mais precisas sobre a realidade brasileira, o levantamento mais recente do IBGE é uma gigantesca fonte de pautas para jornalistas.
Durante a atividade, várias técnicas de manipulação de dados no R foram abordadas, incluindo a leitura de dados da API do IBGE, transformações de dados (ETL – Extract, Transform, Load) e operações básicas de estatística descritiva, como cálculos de média e mediana da população e da área dos municípios. Usando o RStudio, os participantes criaram visualizações de dados por meio de boxplots e gráficos de barras para compreender melhor a distribuição dos dados.
Um ponto-chave da oficina foi a integração de diferentes conjuntos de dados. Para combinar informações demográficas e territoriais com dados sobre gastos e percentuais de despesas em saúde e educação dos municípios brasileiros em 2022, foi utilizada a função inner_join, unindo tabelas com variáveis comuns em valores e significados. Esta análise foi aprofundada com o uso de técnicas de visualização de dados para destacar disparidades regionais e outras tendências significativas.
As discussões ganharam profundidade com a referência a um trabalho do instrutor na SINCOFI apresentado na “Conferência Regional de Dados Abiertos para América Latina y el Caribe” deste ano. A aplicação analisa os deslocamentos hospitalares no Brasil, revelando que pacientes frequentemente viajam para outras cidades em busca de atendimento, principalmente de municípios menores e com menos recursos. O estudo, baseado na linguagem R, serve também como uma valiosa fonte de pautas.
As técnicas demonstradas no workshop são aplicáveis a uma variedade de campos, incluindo jornalismo, pesquisa acadêmica e análise de políticas públicas.
Referências
Deslocamento de pacientes e desigualdades na saúde brasileira
Conhecimentos básicos em R e tidyverse.
FERNANDO BARBALHO
Doutor em Administração pela Universidade de Brasília (2014). Atualmente é auditor federal de finanças e controle da Secretaria do Tesouro Nacional (STN). A trajetória profissional e acadêmica mais recente está principalmente relacionada a dados abertos e desenvolvimento de produtos que resultem em maior transparência do Setor Público brasileiro. Nos finais de semana costuma utilizar o R para investigar perguntas de pesquisa que escapam ao mundo das finanças públicas.
Nosso conteúdo está disponível sob a licença Creative Commons Atribuição 4.0 Internacional, e pode ser compartilhado e reutilizado para trabalhos derivados, desde que citada a fonte.