Como descobrir APIs escondidas para facilitar a raspagem de dados

Guilherme Felitti mostra como raspar sites dinâmicos usando XHR e conhecimentos básicos em Python. 

No dia 31 de março de 2021, a Escola de Dados realizou um webinar com a presença de Guilherme Felitti, fundador da Novelo Data e autor do podcast Tecnocracia, que compartilhou dicas sobre como descobrir APIs em sites para facilitar a raspagem e a tabulação de dados não estruturados. Os webinars acontecem ao vivo, com a participação de especialistas convidados e integrantes do programa de membresia da Escola de Dados.

Guilherme conta que começou a programar em 2018, e quanto mais aprendia, mais se interessava pela área. A técnica explicada por ele realiza a raspagem “interceptando” requisições conhecidas como XMLHttpRequest (XHR), usando recursos simples, presentes em todos os navegadores. Também é necessário conhecimentos básicos em Python para acompanhar o tutorial.

Veja abaixo o vídeo da atividade e pratique utilizando o notebook.

Confira o notebook com O TUTORIAL

Posts relacionados

Deixe um comentário

Esse site utiliza o Akismet para reduzir spam. Aprenda como seus dados de comentários são processados.