Criando um projeto reprodutível em R

Atividade exclusiva para pessoas inscritas no Coda.Br 2021.

Inscreva-se já OU faça login

SOBRE O WORKSHOP

Imagine que você tenha programado um código, ele esteja rodando normalmente, mas certo dia você nota uma inconsistência nos dados. O erro pode não ter sido sequer apontado pelo código, mas você vai conferir os resultados e lá está ele. Em ambientes corporativos e acadêmicos, onde muitos códigos são escritos por mais de uma pessoa, lidar com cenários assim às vezes é mais comum do que gostaríamos. Mas não precisa se desesperar mais! Neste workshop, João Santos, engenheiro de dados na Conta Split, parte de um caso real para explicar como desenvolver um projeto reprodutível em R e garantir resultados consistentes no futuro. 

Quando uma anomalia surge no código, o primeiro passo é investigar de onde ela vem: está no backend? Algo mudou no banco de dados? O erro realmente existe? Após encontrar a raiz do problema, tão importante quanto resolvê-lo é garantir que erros assim não ocorram novamente. Para isso, o workshop apresenta diversas bibliotecas, ferramentas e boas práticas que podem ser aliadas quando você for organizar seu projeto.

Entre as principais ferramentas que podem salvar seu dia estão desde pacotes clássicos, como o Tidyverse, até outras como renv, que controla as versões das dependências usadas no projeto. Santos também destaca opções como here, que auxilia na construção de caminhos relativos e evita inconsistências em caso de mudança de sistemas operacionais; o GitHub, que cria uma fotografia de versões anteriores e também deixa o repositório salvo na nuvem; e até práticas mais simples, como criar um bom arquivo readme.

Depois de conhecer os seus aliados e a função de cada um deles, é hora de colocar a mão na massa. Na parte prática da oficina, Santos mostra como criar do zero um novo diretório no R a partir das dicas compartilhadas anteriormente. Ao final, você será capaz de desenvolver projetos reprodutíveis com diretórios organizados. 

NÍVEL

Intermediário.

DURAÇÃO

1:30h

REFERÊNCIAS DA ATIVIDADE

joaosantos

João Santos

Atualmente é Engenheiro de Dados Jr. na Conta Split. Participa como assistente de pesquisa do Departamento de Ciência Política da Emory University, onde pesquisa desinformação política. Cursa a graduação em Relações Internacionais na PUC-Rio, e possui a certificação AWS Certified Cloud Practitioner.

REALIZAÇÃO

DESENVOLVIDO COM

APOIO

APOIO DE MÍDIA

Visite os sites das edições anteriores: 2016201720182019 e 2020