Análise de Banco de Dados com Python
SOBRE O WORKSHOP
Texto por Ludemilla Diniz
Revisado pela Escola de Dados
Gustavo Ramos, licenciado em Matemática pela UEPA e especialista em Ciência de Dados e Inteligência Artificial pela UNINTER, é organizador da comunidade Açaí com Dados e fundador dos projetos Hidrus e Ecomonitor, que têm como objetivo a eficiência energética e o racionamento de água, luz e gás.
Em uma atividade prática, ele demonstrou como utilizar dados abertos para análise e cruzamento, gerando gráficos e mapas que proporcionam insights aplicáveis em diversas áreas de estudo. É importante ressaltar a necessidade de submeter os dados a um processo de tratamento antes da análise. Segundo o palestrante, esse processo inclui etapas que vão desde a modelagem de dados desordenados (por exemplo, uma coluna de idades com valores como 10, 16 e 30), transformando-os em informações mais úteis (como faixas etárias), até a visualização dos dados. Isso os torna prontos para qualquer tipo de análise, seja descritiva, diagnóstica ou preditiva, permitindo a identificação de padrões de comportamento, levantamento de hipóteses e correlações. Esse processo cria uma base argumentativa sólida para a tomada de decisões.
Neste workshop, foi apresentado um exemplo do trabalho realizado nos encontros da comunidade Açaí com Dados, especificamente a análise dos reservatórios federais brasileiros. Os scripts utilizados para essa análise estão disponíveis no repositório da comunidade no GitHub, sendo os mesmos arquivos empregados durante o workshop.
Além disso, o palestrante utilizou diversos bancos de dados. Na Base dos Dados, uma ONG de projeto open source que realiza o pré-tratamento dos dados, ele utilizou informações do ONS (Operador Nacional do Sistema Elétrico) para identificar o estado de localização de cada reservatório. Ele também usou a plataforma SAR (Sistema de Acompanhamento de Reservatórios) e o pacote reservatórios BR (escrito em R) para obter dados sobre os principais reservatórios brasileiros.
Todo o processo de extração dos dados mencionados está bem documentado nos respectivos sites. No caso dos dados do pacote, Gustavo os forneceu através do repositório da comunidade Açaí com Dados.
O cruzamento de dados foi realizado durante a parte prática da atividade. Esse trabalho permitiu uma análise exploratória detalhada, destacando aspectos como o ano de construção dos reservatórios e o número de barragens construídas em diferentes períodos. Essas análises possibilitaram o aprofundamento e a validação da discussão sobre a importância do controle das usinas hidrelétricas, gerando insights valiosos para a transparência dessa questão.
LOCAL
Laboratório 106
NÍVEL
Básico.
REFERÊNCIAS
- Slide da atividade
- Repositório com arquivos da oficina
- Instruções sobre a atividade
- Google Colab
- Base dos Dados
- Operador Nacional do Sistema Elétrico (ONS)
- Agência Nacional de Águas (ANA)
- Sistema de Acompanhamento de Reservatórios / Agência Nacional de Águas e Saneamento Básico (SAR-ANA)
- BigQuery
- Reservatórios brasileiros em BR
- Lista de reservatórios em arquivo csv
- Comunidade Açai com dados
Gustavo Ramos
Formado em licenciatura em matemática, especialista em ciência de dados e inteligência artificial e organizador da comunidade açaí com dados
Visite o site da edição anterior. Confira o site do Coda.Br 2023.
Nosso conteúdo está disponível sob a licença Creative Commons Atribuição 4.0 Internacional, e pode ser compartilhado e reutilizado para trabalhos derivados, desde que citada a fonte.