Se você já se deparou com dados que poderiam embasar histórias super interessantes, mas desistiu porque o trabalho para obtê-los pareceu insano, ou perdeu dias e dias e fez força tarefa para copiar e colar dados de milhares de páginas de resultado, não está sozinho. Mais de cem alunos começaram nesta segunda (5 de setembro) o curso de Raspagem e Mineração de Dados para Jornalistas, oferecido pela Escola de Dados em parceria com o Centro Knight.

O BOC (big online course) – assim são chamados os cursos mais especializados e com vagas limitadas na plataforma de ensino à distância do Knight – vai ensinar especificamente algumas técnicas de raspagem de dados, desde a coleta de dados não estruturados da web e de redes sociais até a captura de dados trancados em documentos PDF. Serão quatro semanas de vídeo-aulas, materiais de leitura complementares e exercícios práticos para os estudantes do curso se familiarizarem com scripts de programação e ferramentas mais simples de raspagem.

Praticamente tudo que está disponível na internet pode ser raspado. E raspagem é basicamente uma forma de automatizar a estruturação de dados (ou seja, deixá-los em formato de planilha – linhas e colunas). O Marco Túlio, coordenador global da Escola de Dados, é o instrutor do curso e uma baita referência no tema. Além de já ter oferecido outros treinamentos online e offline, de vez em quando cria robozinhos pra raspar dados por pura diversão.

As inscrições permanecem abertas até lotarmos a turma, e ainda temos algumas vagas, então dá tempo de participar. Desta vez, o curso não é gratuito. Já oferecemos um MOOC gratuito sobre jornalismo de dados com o Centro Knight que teve mais de 5 mil alunos, agora a ideia é avançar em um conteúdo mais aprofundado, com um acompanhamento mais próximo e direto do tutor (com uma turma menor, isso é possível). O custo é de 95 dólares e o pagamento é feito pela plataforma do Centro Knight na Universidade do Texas.

Quer saber mais? Os detalhes de divulgação do curso estão aqui.

curso-knight-ed