Python + R juntos com Quarto. Seus relatórios nunca mais serão os mesmos
SOBRE O WORKSHOP
Texto por Tatianny Soares
Revisado pela Escola de Dados
Python versus R? Que tal Python e R? Essa foi a perspectiva que marcou o início deste workshop, conduzido por Bianca Muniz, da agência pública de jornalismo investigativo, nos convidando a considerar a sinergia entre essas duas linguagens em vez de optar por uma delas.
Para iniciar, Bianca guiou os participantes no desenvolvimento de dois relatórios, um com R e com Python. Esse exercício serviu para os participantes verem o quão simples é utilizar o Quarto no Posit Studio (antigo R Studio) e o quanto é simples desenvolver um relatório, onde na maioria das vezes é possível fazer tudo sem utilizar script.
Com isso, ela também introduziu o que seria a ferramenta Quarto: um sistema de publicação científica e técnica de código aberto construído sobre o Pandoc (poderoso conversor de tipos de arquivo). No primeiro momento, houve apenas a criação de um documento, sem maiores informações.
Embora estivesse abordando duas linguagens com grande potencial para análise de dados, a instrutora apontou que não precisaria estar em conflito, já que com o Quarto é possível utilizar o melhor das duas. A chave para essa integração reside no uso do pacote “reticulate”, que existe dentro da linguagem R. A combinação dessas linguagens abre um leque de possibilidades, permitindo a criação de produtos diversificados, tais como relatórios, sites, blogs (como o blog das R-ladies de São Paulo), apresentações e muito mais.
Um elemento fundamental nesse processo de integração é o “knitr”, um pacote que facilita a harmonização de diferentes componentes dentro do Quarto. Outra ferramenta essencial é o Pandoc, que desempenha o papel de construir documentos dinâmicos que combinam código, saída e texto. Isso resulta na produção de produtos interativos, como sites e apresentações, que agregam valor à comunicação de dados. Os dois pacotes estão inclusos no Quarto.
Voltando para os primeiros passos do relatório conduzido no início da atividade, a instrutora foi além com uma demonstração prática, mostrando como combinar R, Python e Quarto, desta vez usando um ambiente virtual chamado Posit Cloud.
Na demonstração, ela utilizou a base de multas ambientais, criando um relatório que exibia as áreas com maior incidência de multas ambientais no estado do Pará. Com isso, a instrutora explicou o papel de cada ferramenta utilizada: o R foi empregado para análise de dados, o Python para a coleta de informações e o Quarto para integrar esses dados na geração de um relatório.
À medida que a familiarização com o Quarto avançava, Bianca apresentou os principais componentes de um documento Quarto: o YAML, onde são inseridas configurações sobre o documento, como formatação, data, título e autor; os trechos de código (code chunks), que começam e terminam com três crases (geralmente) e são identificados com uma linguagem de programação entre chaves {}; e o Markdown, uma linguagem simples para formatação de texto. A personalização pode ser feita utilizando HTML. Na documentação da ferramenta, há muitos exemplos de uso.
Bianca ainda mostrou opções de como colocar o seu relatório de maneira pública na web para que outras pessoas consigam ter acesso e interagir (se for o caso). Umas das opções foi o GitHub Pages, plataforma gratuita que consegue hospedar páginas web a partir de projetos armazenados no GitHub.
REFERÊNCIAS
Bianca Muniz
Bianca Muniz é Analista de Dados da Agência Pública. Possui graduação em Biomedicina, mestrado em Ciências pela Unifesp e especialização em Jornalismo de Dados e Automação pelo Insper. Atualmente, é estudante de jornalismo na Universidade de São Paulo, com período de intercâmbio em Empreendedorismo e Inovação realizado na Universidade do Texas em Austin, nos EUA. Desde 2020 na Pública, participou de coberturas reconhecidas pelo Prêmio Roche de Jornalismo em Saúde e reportagens finalistas do Sigma Awards e Prêmio Cláudio Weber Abramo de Jornalismo de Dados.
REALIZAÇÃO
PATROCÍNIO
CORREALIZAÇÃO
APOIO
Visite o site da edição anterior. Confira o site do Coda.Br 2023.
Nosso conteúdo está disponível sob a licença Creative Commons Atribuição 4.0 Internacional, e pode ser compartilhado e reutilizado para trabalhos derivados, desde que citada a fonte.