[gem_fullwidth background_style=”cover” background_position_vertical=”center” background_parallax=”1″ background_parallax_mobile=”1″ fullheight=”1″ padding_top=”150″ padding_bottom=”120″ background_color=”#01083d” background_image=”62547″]
[gem_divider margin_top=”28″]

[gem_divider margin_top=”24″]
31/10 A 3/11 – ONLINE
5 e 6/11 – ESPM SÃO PAULO
[gem_divider margin_top=”50″][gem_button position=”center” style=”outline” size=”medium” corner=”50″ border=”5″ icon_pack=”elegant” text=”CONFIRA A PÁGINA DO EVENTO” hover_background_color=”#ff197c” link=”url:https%3A%2F%2Fescoladedados.org%2Fcoda2022|title:INSCREVA%20UMA%20ATIVIDADE|target:_blank” text_color=”#ff197c” hover_text_color=”#ffffff” border_color=”#ff197c” hover_border_color=”#ff197c”][gem_divider margin_top=”50″][/gem_fullwidth]

análise de dados com pandas usando o colab research

[gem_youtube width=”1210″ height=”680″ video_id=”ZUWo4BocfMU”]
[gem_icon_with_text icon_pack=”fontawesome” centered=”1″ icon_fontawesome=”f133″ icon_color=”#ec1879″]

DIA:
05/11

[/gem_icon_with_text]
[gem_icon_with_text icon_pack=”fontawesome” centered=”1″ icon_fontawesome=”f017″ icon_color=”#ec1879″]

HORÁRIO:
11:00h

[/gem_icon_with_text]
[gem_icon_with_text icon_pack=”fontawesome” centered=”1″ icon_fontawesome=”f252″ icon_color=”#ec1879″]

DURAÇÃO:
1:30h

[/gem_icon_with_text]
[gem_icon_with_text icon_pack=”fontawesome” centered=”1″ icon_fontawesome=”f041″ icon_color=”#ec1879″]

Sala:
C505

[/gem_icon_with_text]
[gem_icon_with_text icon_pack=”fontawesome” centered=”1″ icon_fontawesome=”f0ae” icon_color=”#ec1879″]

Nível:
Intermediário

[/gem_icon_with_text]
[gem_icon_with_text icon_pack=”fontawesome” flow=”1″ icon_fontawesome=”f05a” icon_color=”#ec1879″ icon_top_margin=”10″ icon_left_side_padding=”10″]

Sobre o workshop

[/gem_icon_with_text]

Parte da rotina de jornalistas de diversas áreas, a análise e a visualização de dados podem ganhar produtividade e eficiência com a utilização da linguagem de programação Python. Com ela, é possível usar bibliotecas que já contêm as funções desejadas a fim de otimizar o processo e conduzir análises com base em boas práticas. Neste workshop, o cientista da computação André Filipe Batista ensinou a fazer uma análise exploratória a partir de dados reais e a criar a visualização de um gráfico interativo usando duas bibliotecas: Pandas e Altair.

Para a atividade, André se baseou em uma visualização de dados de saúde e riqueza de países amplamente divulgada pelo cientista Hans Rosling, médico sueco especializado no uso de dados de saúde para a proposição de mudanças de políticas públicas e autor do livro Factfulness. O desafio dos participantes foi recriar um famoso gráfico de comparação entre o PIB per Capita e a expectativa de vida dos países ao longo de quase seis décadas. Para isso, foi analisada uma versão atualizada dos dados utilizados por Rosling, disponibilizada em formato CSV. 

Para fazer análise e inferências sobre dados, a indicação é usar a biblioteca Pandas, que trabalha bem com tabelas e filtros. Para começar, os participantes criaram um novo notebook na plataforma gratuita Google Colab e importaram os dados. Em seguida, começaram a trabalhar com filtragem por meio de uma consulta para criar comparações, a partir da evolução temporal das variáveis presentes nas tabelas e de recortes regionais e nacionais, e analisar duas variáveis ao mesmo tempo. Também é possível, com as funções do Pandas, extrair as principais estatísticas descritivas, como média, mediana, maior e menor valor.

A segunda parte do workshop focou na visualização dos dados. A biblioteca Altair foi utilizada para a criação dos gráficos em Python. O cientista de dados orientou aos alunos que criassem um gráfico de pontos, que foi refinado com customização por cores, tamanho, interatividade e edição de títulos e legendas. Com a inserção dos novos elementos visuais, é possível incorporar ao gráfico novas informações, para além do que é registrado nos eixos x e y. Para finalizar, André mostrou como exportar o gráfico resultante da análise em diferentes formatos, tanto como código quanto como produto, para sua utilização em apresentações ou reportagens digitais.

[gem_divider margin_top=”50px”][gem_icon_with_text icon_pack=”fontawesome” flow=”1″ icon_fontawesome=”f085″ icon_color=”#ec1879″ icon_top_margin=”10″ icon_left_side_padding=”10″]

Referências da atividade

[/gem_icon_with_text]
andrefilipe

ANDRE FILIPE BATISTA

Doutor em Engenharia da Computação pela Universidade de São Paulo (USP). Graduação e mestrado em ciência da computação com ênfase em inteligência artificial. Mais de 10 anos de experiência no mercado de tecnologia da informação e computação de alto desempenho.  Atua também como cientista de dados na área da Saúde; realizou pós-doutorado em Data Science aplicado à Saúde na Escola de Saúde Pública da Universidade de São Paulo, com parcerias internacionais, em destaque com a Universidade de Harvard.

REALIZAÇÃO

DESENVOLVIDO COM

APOIO

Visite os sites das edições anteriores: 20162017201820192020 e 2021.

[gem_socials colored=”custom” alignment=”right” icons_size=”16″ socials=”%5B%7B%22social%22%3A%22facebook%22%2C%22url%22%3A%22https%3A%2F%2Ffacebook.com%2Fescoladedados%22%7D%2C%7B%22social%22%3A%22twitter%22%2C%22url%22%3A%22https%3A%2F%2Ftwitter.com%2Fescoladedados%22%7D%2C%7B%22social%22%3A%22instagram%22%2C%22url%22%3A%22https%3A%2F%2Finstagram.com%2FOpenKnowledgeBrasil%22%7D%2C%7B%22social%22%3A%22youtube%22%2C%22url%22%3A%22https%3A%2F%2Fwww.youtube.com%2FEscoladeDados%22%7D%5D” color=”#ffffff”]

Nosso conteúdo está disponível sob a licença Creative Commons Atribuição 4.0 Internacional, e pode ser compartilhado e reutilizado para trabalhos derivados, desde que citada a fonte.