[gem_fullwidth background_style=”cover” background_position_vertical=”center” background_parallax=”1″ background_parallax_mobile=”1″ fullheight=”1″ padding_top=”150″ padding_bottom=”120″ background_color=”#000c55″ background_image=”78559″]
[gem_divider margin_top=”28″]

[gem_divider margin_top=”24″]

18  e 19/11 – ESPM SÃO PAULO (CAMPUS ÁLVARO ALVIM)
R. DR. ÁLVARO ALVIM, 123 – VILA MARIANA
[gem_divider margin_top=”50″][gem_button position=”center” size=”large” corner=”50″ icon_pack=”elegant” icon_position=”right” text=”CONFIRA O SITE DO EVENTO” hover_background_color=”#4719ff” link=”url:https%3A%2F%2Fcoda.escoladedados.org|target:_blank” text_color=”#ffffff” hover_text_color=”#ffffff” background_color=”#a38dff”][gem_divider margin_top=”50″][gem_divider margin_top=”50″][/gem_fullwidth]

PPRIMEIROS PASSOS NO JORNALISMO DE DADOS: INTRODUÇÃO AO R E AO TIDYVERSE

[gem_icon_with_text icon_pack=”fontawesome” centered=”1″ icon_fontawesome=”f133″ icon_color=”#a38dff”]

DIA:
19/11

[/gem_icon_with_text]
[gem_icon_with_text icon_pack=”fontawesome” centered=”1″ icon_fontawesome=”f017″ icon_color=”#a38dff”]

HORÁRIO:
09:30h

[/gem_icon_with_text]
[gem_icon_with_text icon_pack=”fontawesome” centered=”1″ icon_fontawesome=”f252″ icon_color=”#a38dff”]

DURAÇÃO:
1:30h

[/gem_icon_with_text]
[gem_icon_with_text icon_pack=”fontawesome” centered=”1″ icon_fontawesome=”f0ae” icon_color=”#a38dff”]

Nível:
Básico

[/gem_icon_with_text]
[gem_icon_with_text icon_pack=”fontawesome” flow=”1″ icon_fontawesome=”f085″ icon_color=”#a38dff” icon_top_margin=”10″ icon_left_side_padding=”10″]

Sobre o workshop

[/gem_icon_with_text]

Texto por Renan Cavalcante

 

Neste workshop, os instrutores Ana Carolina Moreno e Jean Prado guiaram os participantes no fluxo de trabalho com dados a partir do RStudio, o  software livre de ambiente de desenvolvimento integrado para a linguagem de programação R.

O passo a passo começa com a instalação da coleção de pacotes Tidyverse. Para isso, deve-se executar o comando install.packages(“tidyverse”). Esse código, inclusive, serve para a instalação de outros pacotes – basta alterar o nome entre aspas.

Ao instalar um pacote no R, não é preciso realizar o processo novamente, mas deve-se importá-lo a cada novo projeto para que ele seja ativado. Para importar o Tidyverse é utilizado o código library(tidyverse), sem aspas entre os parênteses.

Com a coleção importada, é hora de trazer o arquivo da base de dados para o R, o que pode ser feito abrindo o arquivo, em formato .csv, com o comando read.csv(“nome_arquivo”), para carregar arquivos separados por vírgulas; ou read.csv2(“nome_arquivo”), para os separados por ponto e vírgula.

Em seguida, deve-se realizar a limpeza e transformação dos dados, com o auxílio de funções específicas para essas etapas, contidas no Tidyverse.

Já para a fase de análise dos dados, essas são algumas das funções mais utilizadas:

FUNÇÃO O QUE FAZ

select seleciona colunas específicas da base

filter seleciona linhas específicas da base

mutate cria colunas ou altera valores em uma coluna

group_by agrupa linhas de valores iguais em uma coluna

summarise par do group_by, cria o resumo desses grupos

arrange ordena a forma de visualizar a tabela

O próximo passo é gerar visualizações para facilitar a comunicação das descobertas feitas na etapa da análise. Para isso, os instrutores apresentaram o pacote ggplot do Tidyverse, que permite a criação de gráficos. A lógica por trás do ggplot é que cada linha inserida corresponda a uma nova camada de personalização do gráfico. 

Primeiro, seleciona-se o tipo de gráfico e, em seguida, as colunas da tabela que serão representadas. Depois, é possível personalizar o gráfico para que a visualização cumpra seu papel de facilitar a absorção das informações pelo leitor. Para isso, o pacote disponibiliza diversas ferramentas que possibilitam a troca de cores, a criação de legendas, a escolha de fontes e a inserção de títulos.

 

Referências

Tidyverse

ggplot2

[gem_divider margin_top=”50px”][gem_icon_with_text icon_pack=”fontawesome” flow=”1″ icon_fontawesome=”f133″ icon_color=”#a38dff” icon_top_margin=”10″ icon_left_side_padding=”10″]

Pré-requisitos da atividade

[/gem_icon_with_text]

R e RStudio instalado ou uma conta no Posit Cloud.

Ana Carolina Moreno

ANA CAROLINA MORENO

Jornalista de dados sênior da TV Globo e participante das R-Ladies SP desde 2019. Produz reportagens dirigidas por dados para televisão e internet. Participa do Conselho Consultivo da Associação de Jornalistas de Educação (Jeduca).

jean

JEAN PRADO

Analista de Mídias Sociais no Greenpeace Brasil. Jornalista de formação e tem paixão por dados.

Visite os sites das edições anteriores: 20162017201820192020, 2021 e 2022.

[gem_socials colored=”custom” alignment=”right” icons_size=”16″ socials=”%5B%7B%22social%22%3A%22facebook%22%2C%22url%22%3A%22https%3A%2F%2Ffacebook.com%2Fescoladedados%22%7D%2C%7B%22social%22%3A%22twitter%22%2C%22url%22%3A%22https%3A%2F%2Ftwitter.com%2Fescoladedados%22%7D%2C%7B%22social%22%3A%22instagram%22%2C%22url%22%3A%22https%3A%2F%2Finstagram.com%2FOpenKnowledgeBrasil%22%7D%2C%7B%22social%22%3A%22youtube%22%2C%22url%22%3A%22https%3A%2F%2Fwww.youtube.com%2FEscoladeDados%22%7D%5D” color=”#ffffff”]

Nosso conteúdo está disponível sob a licença Creative Commons Atribuição 4.0 Internacional, e pode ser compartilhado e reutilizado para trabalhos derivados, desde que citada a fonte.