nossos cursos
Realizamos cursos online e formações sob demanda, feitas exclusivamente para sua organização. Mostramos na prática como aproveitar a tecnologia e dados abertos em seus trabalhos.

ONLINE

As atividades online da Escola de Dados são realizadas por nossa equipe e uma rede de instrutores com vasta experiência em suas áreas.

DADOS 360

R$290

Em sua segunda turma, o curso traz conteúdos com um panorama completo para quem quer começar a trabalhar com dados na área da comunicação. Além de acesso imediato a 10 horas de aulas gravadas, participantes terão aulas ao vivo, orientações e práticas com especialistas e profissionais experientes, ao longo de 5 semanas.

JORNALISMO DE DADOS LOCAL

R$190

O curso traz conteúdos sobre como explorar bases de dados nacionais, que podem revelar pautas, histórias e evidências importantes sobre realidades locais. Além de acesso a 12 horas de atividades, participantes terão aulas ao vivo, orientações e práticas com especialistas e profissionais experientes, ao longo de 5 semanas.

PUBLICADORES DE DADOS

R$375

A formação abordará conceitos e ferramentas para planejar e promover a gestão estratégica e a abertura de dados em organizações, sobretudo públicas. O curso é o primeiro a abordar o tema e mescla vídeo-aulas sobre fundamentos, casos de sucesso e aulas ao vivo com profissionais e especialistas na área.

SOB DEMANDA

Devido à pandemia de Covid-19, suspendemos nossas atividades presenciais, mas ainda oferecemos formações online exclusivas para organizações sociais, empresas e instituições públicas. Nelas, vamos mapear suas necessidades e experiências para desenvolver materiais e atividades sob medida.

Caso sua organização tenham interesse nos cursos abaixo, pedimos que entre em contato conosco. 

Se você tiver interesse em participar dos nossos treinamentos individualmente, utilize este formulário.

Saber lidar com dados digitais se tornou essencial para quem deseja incidir de forma qualificada no debate público, com a crescente demanda por informação, precisão e transparência. Mas por onde começar?

Neste curso introdutório, apresentamos o contexto geral e as principais técnicas e ferramentas empregadas em cada etapa do fluxo de trabalho com dados. É voltado a jornalistas, cientistas sociais, membros da sociedade civil ou qualquer interessado em construir narrativas de impacto e qualificar, com evidências, o debate público. Os participantes vão aprender, partindo de exemplos reais, a trabalhar com bases de dados para extrair delas análises e produzir tabelas, gráficos, mapas e diagramas usando diferentes métodos e ferramentas web.

Módulo 1: Fundamento dos dados digitais
O início da maravilhosa jornada ao mundo dos dados. Os participantes vão se familiarizar com conceitos básicos e se inspirar com referências de trabalhos de todo o mundo. Saiba o que são dados estruturados e não estruturados, formatos mais comuns para bases de dados, o que torna um dado legível por máquina e conheça os poderes e os riscos das narrativas orientadas por dados.

Módulo 2: Entrevistando dados
Os participantes irão aprender a utilizar editores de planilha e conceitos de estatística descritiva para entrevistar bases de dados e interpretar resultados. Aprenderão ainda a realizar cruzamentos de dados para extrair insights, evidências e conhecimentos relevantes de dados brutos.

Módulo 3: Raspagem e limpeza
É nesta etapa que validamos os dados que vamos utilizar. Erros de digitação, campos com mais de um tipo de dado, colunas que deveriam ser linhas, linhas que deveriam ser colunas, linhas duplicadas, falta de diferentes unidades de medida… Saiba como detectar e corrigir problemas comuns em bases públicas utilizando funções básicas e avançadas do OpenRefine, uma ferramenta gratuita e de código livre. Também aprenda a libertar dados de PDFs e comece a construir suas próprias (e inéditas!) bases raspando dados de páginas web.

Módulo 4: Visualização de dados
Quando apresentados de forma clara e atrativa, os dados têm o potencial de convencer e gerar impacto. Conheça os fundamentos do design da informação para entender como escolher a forma gráfica mais eficiente, hierarquizar as informações da sua história, utilizar cores e tipografias a seu favor e evitar escolhas que podem levar a conclusões enganosas. Aprenda a construir visualizações interativas com as principais ferramentas web disponíveis.

Módulo 5: Consultas estruturadas com SQL
Quando os dados são muito grandes e seu editor de planilha trava, já é hora de abandonar as tabelas e lidar com bancos de dados. Os participantes irão aprender a realizar consultas estruturadas a bases de dados massivas, utilizando a linguagem SQL.

Quer aprender a programar para lidar com dados de sua pesquisa, mas não sabe por onde começar? Este curso dá uma introdução à programação com exemplos práticos do trabalho com dados e foco em pessoas com pouca ou nenhuma experiência no campo. Python, uma das linguagens de programação mais utilizadas para análises de dados, será apresentada e, ao fim do curso, os participantes estarão aptos a escrever seus primeiros programas.

Módulo 1: Introdução à programação e ao trabalho com dados
Não importa a linguagem. Para começar a programar você vai precisar dominar conceitos básicos e entender qual a lógica que rege o funcionamento dos computadores. Será dada uma atenção especial às linguagens mais comuns no trabalho com dados, apresentando suas particularidades e alguns casos de uso.

Módulo 2: Raspando e limpando dados
O próximo passo é aprender como importar dados de diferentes formatos e organizá-los de forma adequada para análises. Conhecidas como raspagem e limpeza, estas duas etapas consomem boa parte do tempo durante o trabalho com dados públicos.

Módulo 3: Publicando com códigos e dados abertos
Aqui, veremos metodologias, formatos e ferramentas para publicar códigos e dados de forma aberta, favorecendo a colaboração de outros desenvolvedores.

Bases de dados massivas, com dezenas de gigabytes, são cada vez mais comuns. Saber lidar bem com elas é fundamental. Aqui, iremos aprender na prática como desvendar insights e revelar fatos por meio da análise ou “entrevistas” com dados, sempre utilizando como exemplos bases reais de órgãos públicos no Brasil. Se você não tem experiência com programação e precisa extrair respostas de grandes volumes de dados, então encontrou o curso certo.

Módulo 1: Da planilha ao insight
Fazer boas perguntas não é tarefa fácil. Com bases gigantes, menos ainda. Neste módulo, veremos como definir o problema que iremos abordar é parte fundamental de qualquer pesquisa.

Módulo 2: Como organizar bancos de dados
Evite erros comuns e aprenda dicas de como organizar ou importar os dados de sua análise. Veremos também dicas para extrair insights de planilhas e quais softwares e ambientes utilizar para fazer suas consultas. Também já introduziremos operações mais básicas, como comparar e unir dados de origens distintas ou como usar tabelas dinâmicas.

Módulo 3: Entrevistando microdados com SQL
O módulo dá uma introdução à linguagem de consulta SQL e suas implementações mais comuns. Focado em pessoas sem experiência em programação, a atividade irá apresentar a sintaxe e o modus operandi de consultas com SQL através de exemplos utilizados em investigações reais utilizando bases de dados públicas no Brasil.

.

Investigar com dados e ferramentas digitais vai muito além de usar os mecanismos de buscas mais conhecidos. Aqui, entenderemos como achar “dados invisíveis” às pesquisas mais comuns e conheceremos diferentes práticas de investigação digital. Também veremos em profundidade técnicas de Open Source Intelligence (OSINT), que estão transformando radicalmente a forma como são feitas as investigações mundo afora por jornalistas e outros profissionais.

Serão apresentados exemplos e exercícios práticos, focados no contexto brasileiro, com bases de dados reais sobre políticos, empresas e governo. O objetivo é aprender como tirar o máximo de proveito de dados abertos, ferramentas digitais e redes sociais em narrativas guiadas por dados e evidências.

Módulo 1: Políticos, empresas e governos: investigação com dados abertos
O módulo irá recapitular técnicas avançadas de pesquisa na web e mostrar como explorar bases de dados online, que são invisíveis nos mecanismos de busca tradicionais. O foco será introduzir repositórios de dados públicos no Brasil para encontrar informações relevantes sobre gestão pública, políticos e empresas.

Módulo 2: Cruzamento e buscas personalizadas em bases de dados gigantes
A partir do reconhecimento das bases disponíveis, aprenderemos como realizar buscas personalizadas, indo além das limitações impostas pelas interfaces de consulta dos órgãos. Os participantes também aprenderão como entrevistar e cruzar bases de dados gigantes utilizando SQL como linguagem de consulta.

Módulo 3: Inteligência com fontes abertas
Nesta parte, iremos aprender o que é inteligência com fontes abertas (ou OSINT, Open Source Intelligence) e como esta prática está transformando as apurações jornalísticas e pesquisas forenses. Aqui, explicamos em detalhes conceitos e técnicas para investigações na Internet, técnicas e ferramentas para verificação de autenticidade, uso de imagem de satélites, entre outros temas.

Módulo 4: Extraindo o máximo das redes sociais
As redes sociais são um excelente repositório de informações e não devem ser ignoradas em nenhuma investigação. Neste módulo, veremos como monitorar as redes sociais e suas diferentes interfaces (APIs) para investigar a fundo pessoas e redes de relacionamento.

Sabe quando você já saiu do básico, mas ainda sente dificuldade em realizar atividades comuns no dia a dia do trabalho com dados? Aqui, temos um curso para quem já tem uma noção de Python, mas quer aprender mais ou aprofundar temas relacionados à coleta e limpeza de dados, etapas que em geral consomem muito tempo. Se você não é nem um programador experiente, nem um iniciante, já trabalha com dados e quer consolidar e expandir seus conhecimentos, então encontrou um curso sob medida.

Módulo 1: Criando robôs para coletar dados na web
Para começar, vamos retomar ideias importantes sobre como funciona a estrutura de uma página na Internet e como podemos acessar os dados. Em seguida, apresentaremos as principais bibliotecas de raspagem (scraping) em Python. Também abordaremos em detalhes as soluções para as tarefas mais comuns na hora de baixar dados na web, lidando problemas como preenchimento de formulários, paginação, CAPTCHA e automatização de tarefas.

Módulo 2: Limpando dados
Coletar é só a primeira etapa. Em geral, o trabalho árduo vem em seguida, quando é preciso organizar e limpar os dados disponibilizados para deixá-los pronto para análise. Aqui, aprenderemos como lidar informações de arquivos PDF, como fazer um uso avançado do OpenRefine para tarefas mais comuns e como usar Python para processos mais personalizados de limpeza e organização dos dados.

Módulo 3: Regex, para que te quero?
Expressões regulares são um verdadeiro canivete suíço na hora de limpar dados. Neste módulo, aprenderemos mais sua sobre sintaxe e como ela pode ser usada em diferentes linguagens (não só Python) para dar conta de problemas reais na hora de fazer as transformações e operações de limpeza mais comuns.

Este é um curso rápido para quem trabalha cotidianamente com dados. Aqui, veremos como usar a interface de linha de comando (o famoso terminal) para agilizar tarefas comuns. Ações que na interface gráficas podem exigir muito tempo e muitos cliques podem ser feitas de forma muito mais rápida, se você souber as “palavras mágicas” para trabalhar com dados no terminal. Além disto, fazendo scripts que rodem no terminal (bash) é possível automatizar muitas tarefas, sem a necessidade de recorrer a linguagens de programação como Python e R.

Módulo 1: Mexendo no computador sem tocar no mouse
Aqui veremos como instalar ou acessar o terminal em seu sistema operacional, quais são os comandos básicos para navegar por diretórios, acessar ou buscar arquivos. Serão também apresentados exemplos de scripts que usam estes comandos para realizar tarefas complexas.

Módulo 2: Limpando, filtrando e analisando dados na tela preta
Aqui, veremos como editar bases gigantes direto da linha de comando. Não importa o tamanho ou o formato de seus dados. Estejam eles em uma tabela (CSV), um arquivo de texto JSON ou um banco em SQL, com alguns poucos comandos, você pode acessá-los no terminal e realizar quase todas ações mais recorrentes, como análises e limpezas básicas, filtros, conversões.

Módulo 3: Da web ao terminal
No terminal, você não está restrito aos dados que já possui em seu computador. Dá também para acessar e baixar novas informações da internet, sem precisar abrir seu navegador. Aqui, veremos os comandos mais comuns para fazer raspagem de dados e construiremos um script (bash) para automatizar a coleta.