5 e 6/11 – ESPM SÃO PAULO
Análise de Dados com Python para pessoas usuárias de Excel
Neste workshop, a mestranda em informática Deborah Foroni ensinou como executar, em Python, as principais funções utilizadas no Microsoft Excel/Planilhas Google para superar os problemas de lidar com grandes bases de dados e ganhar autonomia para trabalhar, principalmente, com microdados.
Para acompanhar a atividade, não é preciso ter conhecimento prévio de programação. O pensamento analítico sobre os dados, bem como conhecer a estrutura de uma base e saber quais perguntas se deseja responder a partir dela, é o que guia essa transposição de ferramentas.
O primeiro passo é entender a sintaxe do Python e a estrutura dos dados armazenados, que podem ser um texto (string), um número inteiro (int), um número quebrado (float) ou uma informação verdadeira ou falsa (booleana). Deborah também explicou o que são os métodos, as funções e as bibliotecas e reforçou a importância de se fazer uma documentação detalhada do código, com comentários sobre os comandos executados.
A oficina contou com uma parte prática utilizando a biblioteca Pandas, uma das mais populares para análise de dados dentro da linguagem. Para fazer a equivalência entre o Python e o Excel/Planilhas, foram identificadas algumas das principais funções utilizadas nos editores de planilha, como ordenação ascendente e descendente, filtragem, criação de tabela dinâmica, criação de condições e, ainda, operações matemáticas e estatísticas básicas, como soma, média, mediana, maior e menor valores.
Em seguida, a palestrante propôs alguns exercícios utilizando funções básicas e a importação e organização dos dados em uma tabela. Para treinar, os participantes importaram um arquivo em formato CSV com dados do portal da transparência da Assembleia Legislativa de São Paulo. Deborah compartilhou algumas boas práticas do tratamento de dados em Python, como a visualização de tabelas após a aplicação de filtros e outras manipulações, para auxiliar na detecção de desvios do padrão e inconsistências nos dados.
Os participantes aprenderam ainda a criar um mapa de calor em Python, utilizando a biblioteca Seaborn, de visualização em gráficos. Por meio de um comando simples, foi possível customizar a tabela obtida, ressaltando visualmente os elementos desejados.
Referências da atividade
• Conjunto de dados usado no workshop
• Notebook do Google Colab usado no workshop
Deborah Foroni
Mestranda em Informática e Gestão do Conhecimento na Universidade Nove de Julho e trabalha na área de dados há 5 anos. Também atua em comunidade de tecnologia de mulheres e de pessoas LGBTQIAP+ , como as Pyladies SP e Todas as Letras.
REALIZAÇÃO
DESENVOLVIDO COM
APOIO
Nosso conteúdo está disponível sob a licença Creative Commons Atribuição 4.0 Internacional, e pode ser compartilhado e reutilizado para trabalhos derivados, desde que citada a fonte.