Confira o curso inédito Dados 360.

O conteúdo abaixo foi parte do curso gratuito em formato MOOC (massive open online course) organizado pelo Knight Center em parceria com a Escola de Dados de 5 de agosto a 8 de setembro de 2019. Confira aqui a página oficial do curso no site do Knight Center. Os links abaixo foram compilados por Álvaro Justen.

Adriano Belisário

Álvaro Justen

Natália Mazotte

Rodrigo Menegat

Material Introdutório

Convite ao curso

Bem-vinda(o) ao curso

Material de Apoio

O que são dados?

O que são dados abertos?

A pirâmide invertida do jornalismo de dados

Módulo 1: O que é Jornalismo de Dados?

Facilitadora: Natália Mazotte.

Objetivo

Ao final da primeira semana, você terá aprendido:

  • O que, afinal, é jornalismo de dados?
  • Conceitos fundamentais e fluxo de trabalho com dados
  • Incorporando novas habilidades à rotina jornalística
  • De John Snow ao jornalismo de dados do NYT: exemplos inspiradores e inovadores;
  • O que quantificamos? Dados e incerteza
  • Ligando o radar para obter dados
  • Perguntas cruciais para compreender seus dados.

Vídeos

Vídeo 1: Introdução ao Módulo

Vídeo 2: O que é jornalismo de dados?

Vídeo 3: Fluxo de trabalho com dados

Vídeo 4: Exemplos de jornalismo de dados

Vídeo 5: Perguntas cruciais

Vídeo 6: Busca avançada para obter bases de dados

Vídeo 7: Usando a LAI para obter bases de dados

Vídeo extra: Entrevista com Luiz Toledo – Estratégias para uso da LAI

Material Extra

Slides – Módulo 1

Tutorial: Solicitando dados via LAI

Tutorial: Busca avançada na Web

Dados e incerteza: por que precisamos ser céticos?

Novas fronteiras do jornalismo de dados no Brasil

Jornalismo de Dados: Conceitos e categorias

Importância do jornalismo de dados

Genealogia do Jornalismo de Dados (em inglês)

Jornalismo de Dados com Impacto (em inglês)

Planilha colaborativa: fontes de dados disponíveis

The Wall Street Journal Guide To Information Graphics

Módulo 2: Como Entrevistar Bases de Dados?

Facilitador: Adriano Belisário.

Objetivo

Ao final da segunda semana, você terá aprendido:

  • O que são dados abertos e dados legíveis por máquinas;
  • O que é e como abrir um arquivo CSV;
  • Quais são os tipos de dados mais comuns e como configurá-los;
  • Operações básicas: ordenar e filtrar dados por diferentes critérios;
  • Agrupando informações: como usar tabela dinâmica para analisar dados;
  • Análise de dados com taxas e medidas de tendência central);
  • Correlação de variáveis;
  • Como cruzar dados.

Vídeos

Vídeo 1: Apresentação do módulo

Vídeo 2: O que são dados abertos e dados legíveis por máquinas?

Vídeo 3: O que é e como abrir um arquivo CSV?

Vídeo 4: Quais são os tipos de dados mais comuns e como configurá-los?

Vídeo 5: Operações básicas: ordenar e filtrar dados por diferentes critérios

Vídeo 6: Agrupando informações: como usar tabela dinâmica para analisar dados

Vídeo 7: Outliers e medidas de tendência central

Vídeo 8: Calculando taxas simples

Vídeo 9: Cruzando tabelas

Material de Apoio

Slides: Módulo 2

Introdução à Análise de Dados

Entrevistando Dados: uma introdução prática – parte I

Entrevistando Dados: uma introdução prática – parte II

Análise com estatística descritiva para leigos

Quiz sobre as 5 estrelas dos dados abertos

Numbers in the newsroom

O que são dados abertos?

Módulo 3: Como Avaliar e Melhorar a Qualidade dos Dados?

Facilitadores: Natália Mazotte e Adriano Belisário.

Objetivo

Ao final da terceira semana, você terá aprendido:

  • Como avaliar a qualidade dos dados?
  • Como limpar dados com o Open Refine;
  • E quando o dado não está estruturado ou em formato legível por máquina?
  • Como lidar com dados em PDF;
  • A usar o Inspetor Web para fazer um raio-X da estrutura de um site;
  • Como raspar dados usando seu navegador (sem programar!).

Vídeos

Vídeo 1: Introdução ao Módulo

Vídeo 2: Checando a qualidade dos dados

Vídeo 3: Introdução ao Open Refine

Vídeo 4: Open Refine – parte 1

Vídeo 5: Open Refine – parte 2

Vídeo 6: Open Refine – parte 3

Vídeo 7: Introdução à raspagem de dados

Vídeo 8: Extraindo dados de PDFs com Tabula

Vídeo 9: ImportHTML

Material de Apoio

Slides: Módulo 3

Guia Quartz para a Limpeza de Dados

Tutorial Escola de Dados: Raspagem e Jornalismo de Dados

Tutorial Escola de Dados: Ferramentas simples e gratuitas de raspagem

Tutorial da Escola de Dados: Guia para converter PDF em tabelas

Tutorial Escola de Dados: Libertando dados com Tabula e Rows

Tutorial Escola de Dados: Usando o Tabula na linha de comando

Tutorial Escola de Dados: Usando OCR em dados e tabelas de PDFs

Open Refine: Dowload

Tabula: Dowload

Webscraper: Dowload

Bases de Dados

Open Refine: ‘Cluster and Edit’ em detalhes

Tutoriais Webscraper

Módulo 4: Como Dar uma Cara Para Seus Dados?

Facilitador: Rodrigo Menegat.

Objetivo

Ao final da quarta semana, você terá aprendido:

  • Os princípios teóricos da visualização de dados;
  • Como usar a visualização de dados para fazer análise exploratória;
  • Quais são os principais tipos de gráfico e quando usar cada um;
  • Quais são os erros mais comuns na hora de montar um gráfico;
  • Quebrando as regras: inovando no jornalismo visual;
  • Como usar algumas ferramentas de visualização online.

Vídeos

Vídeo 1: O que é visualização de dados?

Vídeo 2: Legal, mas pra que isso serve?

Vídeo 3: Como escolho o melhor formato para meu gráfico?

Vídeo 4: Dá pra fazer um gráfico preciso e atraente ao mesmo tempo?

Vídeo 5: Mão na massa – 1ª tarefa

Vídeo 6: Mão na massa – 2ª tarefa

Material de Apoio

Slides: Módulo 4

Download: planilha para exercício do vídeo 5

Download: planilha para exercício do vídeo 6

Slides apresentados nos vídeos

Introdução à visualização de dados, por Rodrigo Menegat

Erros comuns na visualização, por Kathy Chang, Kate Eyler-werve e Alberto Cairo

Visualização na apuração: análise exploratória, por Rodrigo Menegat

Dez ferramentas para fazer visualização de dados, por Rodrigo Menegat

A vanguarda da visualização de dados no jornalismo, por Rodrigo Menegat

The Functional Art, de Alberto Cairo

The Truthful Art, de Alberto Cairo

The Wall Street Journal Guide To Information Graphics, de Dona M. Wong

Módulo 5: SQL Para Grandes Bases de Dados

Facilitador: Álvaro Justen.

Objetivo

Ao final da quinta semana, você terá aprendido:

  • O que é SQL e como utilizar
  • Acessando e filtrando registros de uma tabela
  • Ordenando, limitando e exportando resultados das consultas
  • Criando agrupamentos e otimizando as consultas
  • Cruzando tabelas (JOIN).

Vídeos

Vídeo 1: Introdução

Vídeo 2: Filtrando

Vídeo 3: Organizando

Vídeo 4: Agrupando

Vídeo 5: Cruzando

Material de Apoio

Slides: Módulo 5 Aula 1

Slides: Módulo 5 Aula 2

Slides: Módulo 5 Aula 3

Slides: Módulo 5 Aula 4

Slides: Módulo 5 Aula 5

Slides: Módulo 5 (baixar)

Programa: DB Browser for SQLite

Dados (baixar todos os arquivos)

Tutorial: Identificando partidos que mudaram de nome

Matéria: Erros em cadastros no TSE vão de patrimônio bilionário à cor da pele

Explicação visual dos tipos de JOIN em SQL (em Inglês)

Documentação do comando EXPLAIN QUERY PLAN (em Inglês)