18  e 19/11 – ESPM SÃO PAULO (CAMPUS ÁLVARO ALVIM)
R. DR. ÁLVARO ALVIM, 123 – VILA MARIANA

DESVENDANDO DADOS COM R: NAVEGANDO PELO MOSAICO MUNICIPAL BRASILEIRO

DIA:
19/11

HORÁRIO:
11:15h

DURAÇÃO:
1:30h

Nível:
Intermediário

Sobre o workshop

Texto por Renan Cavalcante

 

O workshop conduzido por Fernando Barbalho, cientista de dados do Tesouro Nacional, focou no uso da linguagem de programação R para analisar dados do Censo de 2022 do IBGE. A base de dados trabalhada inclui informações sobre população, área territorial, e gastos com saúde e educação dos municípios brasileiros.

O ponto de partida da discussão focou na importância de compreender a dinâmica dos municípios brasileiros, destacando que o conhecimento sobre a estrutura e gestão municipal é crucial para avaliar e construir políticas públicas efetivas. Além de informações atualizadas que permitem análises mais precisas sobre a realidade brasileira, o levantamento mais recente do IBGE é uma gigantesca fonte de pautas para jornalistas.

Durante a atividade, várias técnicas de manipulação de dados no R foram abordadas, incluindo a leitura de dados da API do IBGE, transformações de dados (ETL – Extract, Transform, Load) e operações básicas de estatística descritiva, como cálculos de média e mediana da população e da área dos municípios. Usando o RStudio, os participantes criaram visualizações de dados por meio de boxplots e gráficos de barras para compreender melhor a distribuição dos dados.

Um ponto-chave da oficina foi a integração de diferentes conjuntos de dados. Para combinar informações demográficas e territoriais com dados sobre gastos e percentuais de despesas em saúde e educação dos municípios brasileiros em 2022, foi utilizada a função inner_join, unindo tabelas com variáveis comuns em valores e significados. Esta análise foi aprofundada com o uso de técnicas de visualização de dados para destacar disparidades regionais e outras tendências significativas.

As discussões ganharam profundidade com a referência a um trabalho do instrutor na SINCOFI apresentado na “Conferência Regional de Dados Abiertos para América Latina y el Caribe” deste ano. A aplicação analisa os deslocamentos hospitalares no Brasil, revelando que pacientes frequentemente viajam para outras cidades em busca de atendimento, principalmente de municípios menores e com menos recursos. O estudo, baseado na linguagem R, serve também como uma valiosa fonte de pautas.

As técnicas demonstradas no workshop são aplicáveis a uma variedade de campos, incluindo jornalismo, pesquisa acadêmica e análise de políticas públicas.

 

Referências

Deslocamento de pacientes e desigualdades na saúde brasileira

Aplicação do SICONFI

Projeto executado durante a atividade

Arquivo zip – Fernando Barbalho

Pré-requisitos da atividade

Conhecimentos básicos em R e tidyverse.

fernando-barbalho

FERNANDO BARBALHO

Doutor em Administração pela Universidade de Brasília (2014). Atualmente é auditor federal de finanças e controle da Secretaria do Tesouro Nacional (STN). A trajetória profissional e acadêmica mais recente está principalmente relacionada a dados abertos e desenvolvimento de produtos que resultem em maior transparência do Setor Público brasileiro. Nos finais de semana costuma utilizar o R para investigar perguntas de pesquisa que escapam ao mundo das finanças públicas.

Visite os sites das edições anteriores: 20162017201820192020, 2021 e 2022.

Nosso conteúdo está disponível sob a licença Creative Commons Atribuição 4.0 Internacional, e pode ser compartilhado e reutilizado para trabalhos derivados, desde que citada a fonte.