Introdução a análise de dados com Pandas
SOBRE O WORKSHOP
Você já ouviu falar em análise de dados com Pandas? A analista de dados Anicely Santos e a engenheira de software Juliany Raiol apresentaram no primeiro dia de Coda Amazônia o workshop sobre o uso de Pandas no contexto da análise de dados. As palestrantes explicaram que Pandas é uma biblioteca de código aberto pertencente à linguagem Python, flexível e de fácil uso. No workshop, utilizou-se o Jupyter, uma ferramenta que mistura código e texto, como um caderno de códigos ou notebook, nome dado a ferramentas desse tipo. A ferramenta pode ser utilizada offline, em versões para Windows, Mac e Linux, mas existem versões online, como o Google Colab.
Antes de iniciar, foi apresentado um panorama sobre os diversos tipos de dados produzidos a todo momento no mundo e como ainda é difícil analisá-los, mas também fazer as perguntas certas e conseguir tomar decisões a partir das respostas. O processo não é estático, está sempre em constante atualização.
O workshop abordou desde a importância de dados abertos e onde encontrá-los, aproveitando para mostrar como fazer a extração dos dados de Índice de Desenvolvimento da Educação Básica (Ideb), utilizados na atividade. Juliany enfatizou a importância da transparência em órgãos públicos no contexto de disponibilização de dados e o quanto esse acesso é importante para controle social e desenvolvimento de políticas públicas eficazes. No entanto, como nem todos os dados estão tão facilmente acessíveis, Juliany e Anicely também falaram sobre maneiras de utilizar Python para conseguir adquiri-los.
A instrutora apresentou a pipeline básica de dados e, abordando a questão das análises, apontou a limitação de editores de planilhas ao analisar grandes volumes de dados, e ressaltou o quanto Pandas, como uma das várias bibliotecas existentes para esse propósito, pode tornar esse trabalho mais simples. A atividade passou pelo processo de ETL (Extração, Transformação e Carregamento), mostrando as etapas mais utilizadas no dia a dia como estatística básica, filtros e agrupamentos.
Por fim, para ir além, foram indicados alguns tutoriais, cursos e livros, além da ênfase no poder da comunidade na troca de conhecimento e avanços nos aprendizados.
NÍVEL
Básico
Referências
Anicely santos
Formada em Análise e Desenvolvimento de Sistemas, pós graduanda em Ciências de Dados e Analytics. Assistente pedagógico na Escola de Dados.
Juliany Raiol
É pós-graduanda em Ciência de Dados pela Universidade do Estado do Amazonas (UEA) e bacharela em Sistemas de Informação pela mesma instituição. Além de ser organizadora do PyLadies e do PyData Manaus, também é uma das Embaixadoras de Inovação Cívica da Open Knowledge Brasil. Adora compartilhar o que aprende e nutre um amor intenso pela área de computação. Acredita que o conhecimento é transformador e, por isso, deve ser de fácil acesso.
REALIZAÇÃO
CORREALIZAÇÃO
PATROCÍNIO
APOIO