[gem_fullwidth background_style=”cover” background_position_vertical=”center” background_parallax=”1″ background_parallax_mobile=”1″ fullheight=”1″ padding_top=”150″ padding_bottom=”120″ background_color=”#000c55″ background_image=”78559″]
[gem_divider margin_top=”28″]

[gem_divider margin_top=”24″]

18  e 19/11 – ESPM SÃO PAULO (CAMPUS ÁLVARO ALVIM)
R. DR. ÁLVARO ALVIM, 123 – VILA MARIANA
[gem_divider margin_top=”50″][gem_button position=”center” size=”large” corner=”50″ icon_pack=”elegant” icon_position=”right” text=”CONFIRA O SITE DO EVENTO” hover_background_color=”#4719ff” link=”url:https%3A%2F%2Fcoda.escoladedados.org|target:_blank” text_color=”#ffffff” hover_text_color=”#ffffff” background_color=”#a38dff”][gem_divider margin_top=”50″][gem_divider margin_top=”50″][/gem_fullwidth]

PPRIMEIROS PASSOS NO JORNALISMO DE DADOS: INTRODUÇÃO AO R E AO TIDYVERSE

[gem_icon_with_text icon_pack=”fontawesome” centered=”1″ icon_fontawesome=”f133″ icon_color=”#a38dff”]

DIA:
18/11

[/gem_icon_with_text]
[gem_icon_with_text icon_pack=”fontawesome” centered=”1″ icon_fontawesome=”f017″ icon_color=”#a38dff”]

HORÁRIO:
11:15h

[/gem_icon_with_text]
[gem_icon_with_text icon_pack=”fontawesome” centered=”1″ icon_fontawesome=”f252″ icon_color=”#a38dff”]

DURAÇÃO:
1:30h

[/gem_icon_with_text]
[gem_icon_with_text icon_pack=”fontawesome” centered=”1″ icon_fontawesome=”f0ae” icon_color=”#a38dff”]

Nível:
Básico

[/gem_icon_with_text]
[gem_icon_with_text icon_pack=”fontawesome” flow=”1″ icon_fontawesome=”f085″ icon_color=”#a38dff” icon_top_margin=”10″ icon_left_side_padding=”10″]

Sobre o workshop

[/gem_icon_with_text]

Texto por Renan Cavalcante

 

Ao começar a trabalhar com dados, o jornalista descobre que nem todas as planilhas podem ser abertas utilizando o Excel. O editor de planilhas da Microsoft tem um limite de pouco mais de 1 milhão de linhas. Para efeito de comparação, a base de dados do Enem de 2018 possui mais de 5 milhões de linhas, uma para cada inscrito no exame. Para contornar o problema, são utilizadas linguagens de programação que auxiliam no trabalho jornalístico baseado em dados, como o R.

Neste workshop, os instrutores Ana Carolina Moreno e Jean Prado mostraram como é possível utilizar o R para analisar bases de dados em formato de tabela, nas quais cada linha é um registro e cada coluna traz detalhes sobre ela. Essas tabelas são conhecidas como data frame ou tibble e são comumente salvas no formato .csv.

Aqui, é fundamental aprender o ciclo do trabalho com dados: importar, limpar, transformar e visualizar. O primeiro passo é importar a base de dados para o R Studio. Depois, é hora da limpeza: formatar os dados para que cada linha seja uma variável e cada coluna uma observação. A próxima etapa é a transformação, em que são criadas novas observações importantes para o trabalho. E para concluir, cria-se a visualização dos dados em formato de gráficos ou mapas que facilitam a comunicação e entendimento das informações ali contidas.

É importante entender que não existe uma base de dados ideal. É necessário a adaptação através de transformações e cruzamentos com outras bases para que as análises sirvam para o trabalho. Também vale lembrar que as bases não são a realidade, mas sim uma representação dela. 

Introduzindo o Tidyverse

Durante a atividade, os palestrantes apresentaram o Tidyverse, um conjunto de pacotes que compartilha a mesma gramática e estrutura. Dentre eles, destacaram os mais relevantes para um trabalho jornalístico baseado em dados:

  • readr: para abrir bases de dados e salvar tabelas;
  • dplyr:  para manipular os dados (filtrar, criar colunas, agrupar, resumir, ordenar etc.);
  • stringr:  para organizar textos identificando padrões;
  • lubridate: para ajustar formatos de data e hora;
  • ggplot2:  para criar visualização de dados;
  • magrittr: para estruturar o código e deixá-lo mais legível.

 

Referências

Primeiros passos no jornalismo de dados: Introdução ao R e ao Tidyverse (1/3)

Como baixar e instalar o R

Tutorial em vídeo de como baixar e instalar o R

R para Ciência de Dados

Tidyverse

[gem_divider margin_top=”50px”][gem_icon_with_text icon_pack=”fontawesome” flow=”1″ icon_fontawesome=”f133″ icon_color=”#a38dff” icon_top_margin=”10″ icon_left_side_padding=”10″]

Pré-requisitos da atividade

[/gem_icon_with_text]

R e RStudio instalado ou uma conta no Posit Cloud.

Ana Carolina Moreno

ANA CAROLINA MORENO

Jornalista de dados sênior da TV Globo e participante das R-Ladies SP desde 2019. Produz reportagens dirigidas por dados para televisão e internet. Participa do Conselho Consultivo da Associação de Jornalistas de Educação (Jeduca).

jean

JEAN PRADO

Analista de Mídias Sociais no Greenpeace Brasil. Jornalista de formação e tem paixão por dados.

Visite os sites das edições anteriores: 20162017201820192020, 2021 e 2022.

[gem_socials colored=”custom” alignment=”right” icons_size=”16″ socials=”%5B%7B%22social%22%3A%22facebook%22%2C%22url%22%3A%22https%3A%2F%2Ffacebook.com%2Fescoladedados%22%7D%2C%7B%22social%22%3A%22twitter%22%2C%22url%22%3A%22https%3A%2F%2Ftwitter.com%2Fescoladedados%22%7D%2C%7B%22social%22%3A%22instagram%22%2C%22url%22%3A%22https%3A%2F%2Finstagram.com%2FOpenKnowledgeBrasil%22%7D%2C%7B%22social%22%3A%22youtube%22%2C%22url%22%3A%22https%3A%2F%2Fwww.youtube.com%2FEscoladeDados%22%7D%5D” color=”#ffffff”]

Nosso conteúdo está disponível sob a licença Creative Commons Atribuição 4.0 Internacional, e pode ser compartilhado e reutilizado para trabalhos derivados, desde que citada a fonte.