Confira o curso inédito Dados 360.
O conteúdo abaixo foi parte do curso gratuito em formato MOOC (massive open online course) organizado pelo Knight Center em parceria com a Escola de Dados de 5 de agosto a 8 de setembro de 2019. Confira aqui a página oficial do curso no site do Knight Center. Os links abaixo foram compilados por Álvaro Justen.
Material Introdutório
Material de Apoio
A pirâmide invertida do jornalismo de dados
Módulo 1: O que é Jornalismo de Dados?
Facilitadora: Natália Mazotte.
Objetivo
Ao final da primeira semana, você terá aprendido:
- O que, afinal, é jornalismo de dados?
- Conceitos fundamentais e fluxo de trabalho com dados
- Incorporando novas habilidades à rotina jornalística
- De John Snow ao jornalismo de dados do NYT: exemplos inspiradores e inovadores;
- O que quantificamos? Dados e incerteza
- Ligando o radar para obter dados
- Perguntas cruciais para compreender seus dados.
Vídeos
Vídeo 2: O que é jornalismo de dados?
Vídeo 3: Fluxo de trabalho com dados
Vídeo 4: Exemplos de jornalismo de dados
Vídeo 6: Busca avançada para obter bases de dados
Vídeo 7: Usando a LAI para obter bases de dados
Vídeo extra: Entrevista com Luiz Toledo – Estratégias para uso da LAI
Material Extra
Tutorial: Solicitando dados via LAI
Tutorial: Busca avançada na Web
Dados e incerteza: por que precisamos ser céticos?
Novas fronteiras do jornalismo de dados no Brasil
Jornalismo de Dados: Conceitos e categorias
Importância do jornalismo de dados
Genealogia do Jornalismo de Dados (em inglês)
Jornalismo de Dados com Impacto (em inglês)
Planilha colaborativa: fontes de dados disponíveis
The Wall Street Journal Guide To Information Graphics
Módulo 2: Como Entrevistar Bases de Dados?
Facilitador: Adriano Belisário.
Objetivo
Ao final da segunda semana, você terá aprendido:
- O que são dados abertos e dados legíveis por máquinas;
- O que é e como abrir um arquivo CSV;
- Quais são os tipos de dados mais comuns e como configurá-los;
- Operações básicas: ordenar e filtrar dados por diferentes critérios;
- Agrupando informações: como usar tabela dinâmica para analisar dados;
- Análise de dados com taxas e medidas de tendência central);
- Correlação de variáveis;
- Como cruzar dados.
Vídeos
Vídeo 1: Apresentação do módulo
Vídeo 2: O que são dados abertos e dados legíveis por máquinas?
Vídeo 3: O que é e como abrir um arquivo CSV?
Vídeo 4: Quais são os tipos de dados mais comuns e como configurá-los?
Vídeo 5: Operações básicas: ordenar e filtrar dados por diferentes critérios
Vídeo 6: Agrupando informações: como usar tabela dinâmica para analisar dados
Vídeo 7: Outliers e medidas de tendência central
Vídeo 8: Calculando taxas simples
Material de Apoio
Entrevistando Dados: uma introdução prática – parte I
Entrevistando Dados: uma introdução prática – parte II
Análise com estatística descritiva para leigos
Quiz sobre as 5 estrelas dos dados abertos
Módulo 3: Como Avaliar e Melhorar a Qualidade dos Dados?
Facilitadores: Natália Mazotte e Adriano Belisário.
Objetivo
Ao final da terceira semana, você terá aprendido:
- Como avaliar a qualidade dos dados?
- Como limpar dados com o Open Refine;
- E quando o dado não está estruturado ou em formato legível por máquina?
- Como lidar com dados em PDF;
- A usar o Inspetor Web para fazer um raio-X da estrutura de um site;
- Como raspar dados usando seu navegador (sem programar!).
Vídeos
Vídeo 2: Checando a qualidade dos dados
Vídeo 3: Introdução ao Open Refine
Vídeo 4: Open Refine – parte 1
Vídeo 5: Open Refine – parte 2
Vídeo 6: Open Refine – parte 3
Vídeo 7: Introdução à raspagem de dados
Vídeo 8: Extraindo dados de PDFs com Tabula
Material de Apoio
Guia Quartz para a Limpeza de Dados
Tutorial Escola de Dados: Raspagem e Jornalismo de Dados
Tutorial Escola de Dados: Ferramentas simples e gratuitas de raspagem
Tutorial da Escola de Dados: Guia para converter PDF em tabelas
Tutorial Escola de Dados: Libertando dados com Tabula e Rows
Tutorial Escola de Dados: Usando o Tabula na linha de comando
Tutorial Escola de Dados: Usando OCR em dados e tabelas de PDFs
Open Refine: ‘Cluster and Edit’ em detalhes
Módulo 4: Como Dar uma Cara Para Seus Dados?
Facilitador: Rodrigo Menegat.
Objetivo
Ao final da quarta semana, você terá aprendido:
- Os princípios teóricos da visualização de dados;
- Como usar a visualização de dados para fazer análise exploratória;
- Quais são os principais tipos de gráfico e quando usar cada um;
- Quais são os erros mais comuns na hora de montar um gráfico;
- Quebrando as regras: inovando no jornalismo visual;
- Como usar algumas ferramentas de visualização online.
Vídeos
Vídeo 1: O que é visualização de dados?
Vídeo 2: Legal, mas pra que isso serve?
Vídeo 3: Como escolho o melhor formato para meu gráfico?
Vídeo 4: Dá pra fazer um gráfico preciso e atraente ao mesmo tempo?
Vídeo 5: Mão na massa – 1ª tarefa
Vídeo 6: Mão na massa – 2ª tarefa
Material de Apoio
Download: planilha para exercício do vídeo 5
Download: planilha para exercício do vídeo 6
Slides apresentados nos vídeos
Introdução à visualização de dados, por Rodrigo Menegat
Erros comuns na visualização, por Kathy Chang, Kate Eyler-werve e Alberto Cairo
Visualização na apuração: análise exploratória, por Rodrigo Menegat
Dez ferramentas para fazer visualização de dados, por Rodrigo Menegat
A vanguarda da visualização de dados no jornalismo, por Rodrigo Menegat
The Functional Art, de Alberto Cairo
The Truthful Art, de Alberto Cairo
The Wall Street Journal Guide To Information Graphics, de Dona M. Wong
Módulo 5: SQL Para Grandes Bases de Dados
Facilitador: Álvaro Justen.
Objetivo
Ao final da quinta semana, você terá aprendido:
- O que é SQL e como utilizar
- Acessando e filtrando registros de uma tabela
- Ordenando, limitando e exportando resultados das consultas
- Criando agrupamentos e otimizando as consultas
- Cruzando tabelas (JOIN).
Vídeos
Material de Apoio
Programa: DB Browser for SQLite
Dados (baixar todos os arquivos)
Tutorial: Identificando partidos que mudaram de nome
Matéria: Erros em cadastros no TSE vão de patrimônio bilionário à cor da pele