Primeiro as primeiras coisas: análise exploratória com R
SOBRE O WORKSHOP
Coordenado pela estatística Juliana Marques, neste workshop você aprenderá sobre o fluxo de trabalho com dados no R, a ler e fazer gráficos, e claro, também um pouco sobre estatística. A base de dados utilizada é a de pesquisas eleitorais realizadas no ano de 2020 no Brasil, disponível no repositório de dados eleitorais do TSE (confira os links abaixo).
Na primeira parte da atividade, a pesquisadora mostra o que você precisa para começar a análise dos dados: atalhos no R, como instalar pacotes e acessar suas bibliotecas, como criar um diretório de trabalho, baixar a base diretamente da Internet ou importá-la manualmente, e depois descompactá-la.
Com o arquivo no R, você poderá ler a tabela e o nome das suas variáveis, e partir para a limpeza. Juliana guia passo a passo as ações necessárias nessa etapa para que não haja problemas na análise dos dados, mostrando como excluir dados duplicados e alterar o tipo de dados de uma coluna na tabela.
Chegada a hora da análise dos dados, você utilizará pacotes e funções nativas para investigar os dados das pesquisas eleitorais. Você descobrirá as datas de início da primeira e da última pesquisa realizada, a frequência de valores por cargo e origem de recursos, além de seus valores percentuais. Saberá também a quantidade de empresas envolvidas por município, os municípios onde há mais de três empresas atuando e onde se concentram. Tudo isso utilizando filtros e gráficos como histograma, box plot e gráfico de pareto.
Por fim, você poderá analisar a relação entre valores de pesquisas e quantidade de entrevistados, adicionando a função de correlação ao seu programa. Ao final da atividade, você terá adquirido um repertório de ferramentas para trabalhar e entrevistar dados de forma eficiente.
NÍVEL
Básico
DURAÇÃO
1:30h
FERRAMENTAS E REFERÊNCIAS
Juliana Marques
É estatística e pesquisadora. Tem mais de 7 anos de experiência no mercado de telecomunicações trabalhando com modelos estatísticos na área de marketing. Nos dois últimos anos, trabalhou no Data_labe, laboratório de dados e narrativas do Complexo da Maré, que permeia o uso da estatística nos 3 pilares de atuação da organização: produção de conteúdo, formação e geração cidadã de dados.
REALIZAÇÃO
DESENVOLVIDO COM
APOIO
APOIO DE MÍDIA