CURSOS
Essenciais ou temáticos, confira nossos cursos e seus módulos

A Escola de Dados oferece uma série de treinamentos presenciais sob demanda para organizações interessadas em incorporar o uso de tecnologia e dados abertos de forma efetiva em seus fluxos de trabalho. Nossos cursos são flexíveis e baseados em uma metodologia amplamente testada por uma rede global de instrutores. Partimos da identificação de problemas reais e da experiência dos participantes para incentivar trocas e manter um alto nível de engajamento.

Este é o “cardápio de cursos” atual da Escola de Dados. Cada capacitação é composta por módulos intercambiáveis, que podem ser oferecidos separadamente. Como parte da facilitação, mapeamos as necessidades da sua organização e desenvolvemos os materiais e a estratégia para solucioná-las.

Atenção: devido à pandemia, os cursos presenciais estão suspensos.

QUEM JÁ FEZ

Conheça algumas das organizações e empresas que já fizeram cursos com a Escola de Dados. Entre em contato e solicite para sua organização.

ESSENCIAIS

As principais habilidades para entender, gerenciar e trabalhar com dados.

Transformando dados em histórias

Saber lidar com dados digitais se tornou essencial para quem deseja incidir de forma qualificada no debate público, com a crescente demanda por informação, precisão e transparência. Mas por onde começar?

Neste curso introdutório, apresentamos o contexto geral e as principais técnicas e ferramentas empregadas em cada etapa do fluxo de trabalho com dados. É voltado a jornalistas, cientistas sociais, membros da sociedade civil ou qualquer interessado em construir narrativas de impacto e qualificar, com evidências, o debate público. Os participantes vão aprender, partindo de exemplos reais, a trabalhar com bases de dados para extrair delas análises e produzir tabelas, gráficos, mapas e diagramas usando diferentes métodos e ferramentas web.

FUNDAMENTOS DOS DADOS DIGITAIS

O início da maravilhosa jornada ao mundo dos dados. Os participantes vão se familiarizar com conceitos básicos e se inspirar com referências de trabalhos de todo o mundo. Saiba o que são dados estruturados e não estruturados, formatos mais comuns para bases de dados, o que torna um dado legível por máquina e conheça os poderes e os riscos das narrativas orientadas por dados.

ENTREVISTANDO DADOS

Os participantes irão aprender a utilizar editores de planilha e conceitos de estatística descritiva para entrevistar bases de dados e interpretar resultados. Aprenderão ainda a realizar cruzamentos de dados para extrair insights, evidências e conhecimentos relevantes de dados brutos.

RASPAGEM E LIMPEZA

É nesta etapa que validamos os dados que vamos utilizar. Erros de digitação, campos com mais de um tipo de dado, colunas que deveriam ser linhas, linhas que deveriam ser colunas, linhas duplicadas, falta de diferentes unidades de medida… Saiba como detectar e corrigir problemas comuns em bases públicas utilizando funções básicas e avançadas do OpenRefine, uma ferramenta gratuita e de código livre. Também aprenda a libertar dados de PDFs e comece a construir suas próprias (e inéditas!) bases raspando dados de páginas web.

VISUALIZAÇÃO DE DADOS

Quando apresentados de forma clara e atrativa, os dados têm o potencial de convencer e gerar impacto. Conheça os fundamentos do design da informação para entender como escolher a forma gráfica mais eficiente, hierarquizar as informações da sua história, utilizar cores e tipografias a seu favor e evitar escolhas que podem levar a conclusões enganosas. Aprenda a construir visualizações interativas com as principais ferramentas web disponíveis.

CONSULTAS ESTRUTURADAS COM SQL

Quando os dados são muito grandes e seu editor de planilha trava, já é hora de abandonar as tabelas e lidar com bancos de dados. Os participantes irão aprender a realizar consultas estruturadas a bases de dados massivas, utilizando a linguagem SQL.

Programação para não-programadores

Quer aprender a programar para lidar com dados de sua pesquisa, mas não sabe por onde começar? Este curso dá uma introdução à programação com exemplos práticos do trabalho com dados e foco em pessoas com pouca ou nenhuma experiência no campo. Python, uma das linguagens de programação mais utilizadas para análises de dados, será apresentada e, ao fim do curso, os participantes estarão aptos a escrever seus primeiros programas.

INTRODUÇÃO À PROGRAMAÇÃO E AO TRABALHO COM DADOS

Não importa a linguagem. Para começar a programar você vai precisar dominar conceitos básicos e entender qual a lógica que rege o funcionamento dos computadores. Será dada uma atenção especial às linguagens mais comuns no trabalho com dados, apresentando suas particularidades e alguns casos de uso.

RASPANDO E LIMPANDO DADOS

O próximo passo é aprender como importar dados de diferentes formatos e organizá-los de forma adequada para análises. Conhecidas como raspagem e limpeza, estas duas etapas consomem boa parte do tempo durante o trabalho com dados públicos.

PUBLICANDO COM CÓDIGOS E DADOS ABERTOS

Aqui, veremos metodologias, formatos e ferramentas para publicar códigos e dados de forma aberta, favorecendo a colaboração de outros desenvolvedores.

Entrevistando bases de dados massivas

Bases de dados massivas, com dezenas de gigabytes, são cada vez mais comuns. Saber lidar bem com elas é fundamental. Aqui, iremos aprender na prática como desvendar insights e revelar fatos por meio da análise ou “entrevistas” com dados, sempre utilizando como exemplos bases reais de órgãos públicos no Brasil. Se você não tem experiência com programação e precisa extrair respostas de grandes volumes de dados, então encontrou o curso certo.

DA PLANILHA AO INSIGHT

Fazer boas perguntas não é tarefa fácil. Com bases gigantes, menos ainda. Neste módulo, veremos como definir o problema que iremos abordar é parte fundamental de qualquer pesquisa.

COMO ORGANIZAR BANCOS DE DADOS

Evite erros comuns e aprenda dicas de como organizar ou importar os dados de sua análise. Veremos também dicas para extrair insights de planilhas e quais softwares e ambientes utilizar para fazer suas consultas. Também já introduziremos operações mais básicas, como comparar e unir dados de origens distintas ou como usar tabelas dinâmicas.

ENTREVISTANDO MICRODADOS COM SQL

O módulo dá uma introdução à linguagem de consulta SQL e suas implementações mais comuns. Focado em pessoas sem experiência em programação, a atividade irá apresentar a sintaxe e o modus operandi de consultas com SQL através de exemplos utilizados em investigações reais utilizando bases de dados públicas no Brasil.

TEMÁTICOS

Contexto é tudo. Conheça os dados para aproveitá-los ao máximo.

Técnicas avançadas de investigação digital

Investigar com dados e ferramentas digitais vai muito além de usar os mecanismos de buscas mais conhecidos. Aqui, entenderemos como achar “dados invisíveis” às pesquisas mais comuns e conheceremos diferentes práticas de investigação digital. Também veremos em profundidade técnicas de Open Source Intelligence (OSINT), que estão transformando radicalmente a forma como são feitas as investigações mundo afora por jornalistas e outros profissionais.

Serão apresentados exemplos e exercícios práticos, focados no contexto brasileiro, com bases de dados reais sobre políticos, empresas e governo. O objetivo é aprender como tirar o máximo de proveito de dados abertos, ferramentas digitais e redes sociais em narrativas guiadas por dados e evidências.

POLÍTICOS, EMPRESAS E GOVERNOS: INVESTIGAÇÃO COM DADOS ABERTOS

O módulo irá recapitular técnicas avançadas de pesquisa na web e mostrar como explorar bases de dados online, que são invisíveis nos mecanismos de busca tradicionais. O foco será introduzir repositórios de dados públicos no Brasil para encontrar informações relevantes sobre gestão pública, políticos e empresas.

CRUZAMENTO E BUSCAS PERSONALIZADAS EM BASES DE DADOS GIGANTES

A partir do reconhecimento das bases disponíveis, aprenderemos como realizar buscas personalizadas, indo além das limitações impostas pelas interfaces de consulta dos órgãos. Os participantes também aprenderão como entrevistar e cruzar bases de dados gigantes utilizando SQL como linguagem de consulta.

INTELIGÊNCIA COM FONTES ABERTAS

Nesta parte, iremos aprender o que é inteligência com fontes abertas (ou OSINT, Open Source Intelligence) e como esta prática está transformando as apurações jornalísticas e pesquisas forenses. Aqui, explicamos em detalhes conceitos e técnicas para investigações na Internet, técnicas e ferramentas para verificação de autenticidade, uso de imagem de satélites, entre outros temas.

EXTRAINDO O MÁXIMO DAS REDES SOCIAIS

As redes sociais são um excelente repositório de informações e não devem ser ignoradas em nenhuma investigação. Neste módulo, veremos como monitorar as redes sociais e suas diferentes interfaces (APIs) para investigar a fundo pessoas e redes de relacionamento.

Dominando raspagem e limpeza de dados

Sabe quando você já saiu do básico, mas ainda sente dificuldade em realizar atividades comuns no dia a dia do trabalho com dados? Aqui, temos um curso para quem já tem uma noção de Python, mas quer aprender mais ou aprofundar temas relacionados à coleta e limpeza de dados, etapas que em geral consomem muito tempo. Se você não é nem um programador experiente, nem um iniciante, já trabalha com dados e quer consolidar e expandir seus conhecimentos, então encontrou um curso sob medida.

CRIANDO ROBÔS PARA COLETAR DADOS NA WEB

Para começar, vamos retomar ideias importantes sobre como funciona a estrutura de uma página na Internet e como podemos acessar os dados. Em seguida, apresentaremos as principais bibliotecas de raspagem (scraping) em Python. Também abordaremos em detalhes as soluções para as tarefas mais comuns na hora de baixar dados na web, lidando problemas como preenchimento de formulários, paginação, CAPTCHA e automatização de tarefas.

LIMPANDO DADOS

Coletar é só a primeira etapa. Em geral, o trabalho árduo vem em seguida, quando é preciso organizar e limpar os dados disponibilizados para deixá-los pronto para análise. Aqui, aprenderemos como lidar informações de arquivos PDF, como fazer um uso avançado do OpenRefine para tarefas mais comuns e como usar Python para processos mais personalizados de limpeza e organização dos dados.

REGEX, PARA QUE TE QUERO?

Expressões regulares são um verdadeiro canivete suíço na hora de limpar dados. Neste módulo, aprenderemos mais sua sobre sintaxe e como ela pode ser usada em diferentes linguagens (não só Python) para dar conta de problemas reais na hora de fazer as transformações e operações de limpeza mais comuns.

Hackeando dados na linha de comando

Este é um curso rápido para quem trabalha cotidianamente com dados. Aqui, veremos como usar a interface de linha de comando (o famoso terminal) para agilizar tarefas comuns. Ações que na interface gráficas podem exigir muito tempo e muitos cliques podem ser feitas de forma muito mais rápida, se você souber as “palavras mágicas” para trabalhar com dados no terminal. Além disto, fazendo scripts que rodem no terminal (bash) é possível automatizar muitas tarefas, sem a necessidade de recorrer a linguagens de programação como Python e R.

MEXENDO NO COMPUTADOR SEM TOCAR NO MOUSE

Aqui veremos como instalar ou acessar o terminal em seu sistema operacional, quais são os comandos básicos para navegar por diretórios, acessar ou buscar arquivos. Serão também apresentados exemplos de scripts que usam estes comandos para realizar tarefas complexas.

LIMPANDO, FILTRANDO E ANALISANDO DADOS NA TELA PRETA

Aqui, veremos como editar bases gigantes direto da linha de comando. Não importa o tamanho ou o formato de seus dados. Estejam eles em uma tabela (CSV), um arquivo de texto JSON ou um banco em SQL, com alguns poucos comandos, você pode acessá-los no terminal e realizar quase todas ações mais recorrentes, como análises e limpezas básicas, filtros, conversões.

DA WEB AO TERMINAL

No terminal, você não está restrito aos dados que já possui em seu computador. Dá também para acessar e baixar novas informações da internet, sem precisar abrir seu navegador. Aqui, veremos os comandos mais comuns para fazer raspagem de dados e construiremos um script (bash) para automatizar a coleta.