Limpando dados da COVID-19 com R

Com o avançar da pandemia do novo coronavírus, mais e mais pessoas se vêem confrontadas cotidianamente com números, gráficos e dados sobre os novos casos. Nesse contexto, jornalistas, pesquisadores de diversas áreas e cidadãos em geral precisam ter acesso facilitado a informações confiáveis, tanto para facilitar a compreensão da situação, como para combater a onda de desinformação e “negacionismo” envolvendo a importância das medidas de isolamento social.

Para ajudar a leitura dos dados a partir de fontes confiáveis, elaboramos um breve tutorial, mostrando como realizar algumas operações básicas com informações sobre a COVID-19. O tutorial é básico, mas assume algum conhecimento da linguagem R para realizar ou adaptar os comandos sugeridos. Nos exercícios, iremos usar o repositório da Johns Hopkins.

Neste tutorial, iremos ver como…

  • Obter e filtrar dados de casos internacionalmente da Johns Hopkins;
  • Transformar colunas e lidar com datas para trabalhar com a série temporal;
  • Identificar o número de dias passados desde determinado limiar de casos, por país;
  • Calcular aumento de casos como percentual e em números absolutos;
  • Cruzar dados populacionais para fazer taxas por habitantes;
  • Calcular a média móvel para facilitar a identificação de tendências;

 

Confira aqui o tutorial em formato de notebook

 

Mais dados abertos sobre COVID-19

Confira abaixo algumas fontes de dados abertos sobre COVID-19 no Brasil e no mundo.

No Brasil

No mundo

Tem outras sugestões de fontes de dados? Deixe nos comentários abaixo.

* Tutorial escrito por Adriano Belisário

Comments (1)

Deixe um comentário

Esse site utiliza o Akismet para reduzir spam. Aprenda como seus dados de comentários são processados.