Primeiro as primeiras coisas: análise exploratória com R

SOBRE O WORKSHOP

Coordenado pela estatística Juliana Marques, neste workshop você aprenderá sobre o fluxo de trabalho com dados no R, a ler e fazer gráficos, e claro, também um pouco sobre estatística. A base de dados utilizada é a de pesquisas eleitorais realizadas no ano de 2020 no Brasil, disponível no repositório de dados eleitorais do TSE (confira os links abaixo).

Na primeira parte da atividade, a pesquisadora mostra o que você precisa para começar a análise dos dados: atalhos no R, como instalar pacotes e acessar suas bibliotecas, como criar um diretório de trabalho, baixar a base diretamente da Internet ou importá-la manualmente, e depois descompactá-la.

Com o arquivo no R, você poderá ler a tabela e o nome das suas variáveis, e partir para a limpeza. Juliana guia passo a passo as ações necessárias nessa etapa para que não haja problemas na análise dos dados, mostrando como excluir dados duplicados e alterar o tipo de dados de uma coluna na tabela.

Chegada a hora da análise dos dados, você utilizará pacotes e funções nativas para investigar os dados das pesquisas eleitorais. Você descobrirá as datas de início da primeira e da última pesquisa realizada, a frequência de valores por cargo e origem de recursos, além de seus valores percentuais. Saberá também a quantidade de empresas envolvidas por município, os municípios onde há mais de três empresas atuando e onde se concentram. Tudo isso utilizando filtros e gráficos como histograma, box plot e gráfico de pareto.

Por fim, você poderá analisar a relação entre valores de pesquisas e quantidade de entrevistados, adicionando a função de correlação ao seu programa. Ao final da atividade, você terá adquirido um repertório de ferramentas para trabalhar e entrevistar dados de forma eficiente.

NÍVEL

Básico

DURAÇÃO

1:30h

FERRAMENTAS E REFERÊNCIAS

juliana

Juliana Marques

É estatística e pesquisadora. Tem mais de 7 anos de experiência no mercado de telecomunicações trabalhando com modelos estatísticos na área de marketing. Nos dois últimos anos, trabalhou no Data_labe, laboratório de dados e narrativas do Complexo da Maré, que permeia o uso da estatística nos 3 pilares de atuação da organização: produção de conteúdo, formação e geração cidadã de dados.

REALIZAÇÃO

DESENVOLVIDO COM

APOIO

APOIO DE MÍDIA