Uso de surveys no jornalismo investigativo e técnicas para investigar sites na Internet foram debatidos em março na principal conferência de jornalismo de dados dos Estados Unidos.

A edição de 2022 do NICAR aconteceu de forma híbrida entre 3 e 6 de março, com atividades online e um encontro presencial na cidade de Atlanta, capital da Geórgia, nos Estados Unidos. A Escola de Dados acompanhou algumas das atividades online e traz aqui novidades e dicas diretamente deste encontro, considerado uma referência na área de jornalismo de dados.

Para começar, a dica de ouro: a jornalista Sharon Machilis organizou uma página com os recursos de todas as apresentações do NICAR desde 2020. O material pode ser filtrado por ano e temas.

Confira abaixo nosso relato sobre duas sessões do evento, que abordaram o uso de surveys e ferramentas e abordagens para descobrir a identidade de pessoas responsáveis por determinado site. Para saber mais sobre a edição de 2022 e ficar por dentro de outros eventos e oportunidades da área, considere juntar-se ao nosso programa de membresia para receber o Boletim de Dados, nossa curadoria mensal dos principais assuntos da área.

Coleta de dados artesanais

E quando não existem dados sobre determinado assunto? O painel ‘Artisanal data collection methods: Hand crafting surveys for investigative journalism’ abordou o uso de pesquisas e questionários (surveys) no jornalismo investigativo. Participaram da conversa Kate Martin, repórter investigativa da Carolina Public Press, a jornalista Nicole Hayden, do The Oregonian, e Emily Featherston da Gray Television.

Como o painel mostrou, o levantamento de dados não precisa necessariamente ser algo custoso. Com apenas um formulário do Google, algumas questões e um QR Code para divulgar o link, já é possível contatar e levantar informações de centenas de pessoas, por exemplo. E, no final das contas, questionários e formulários podem ser cruciais para reportagens que abordam problemas e tendências sociais.

No painel, Kate Martin compartilhou suas estratégias na hora de construir surveys, como os que foram aplicados a centenas de hospitais no processo de apuração da série ‘Finding nurses’ , que trata das desigualdades na atenção às vítimas de assédios e agressões sexuais na Carolina do Norte, nos Estados Unidos.

Kate também recomendou que jornalistas interessados em obter dados por meio de surveys não deixem de contatar pesquisadores especialistas na área para compartilhar o questionário elaborado. Outra dica importante é dar um prazo razoável para que as pessoas envolvidas respondam. Segundo ela, duas semanas é um intervalo de tempo bom o suficiente.

Por sua vez, Nicole Hayden falou sobre uma apuração com pessoas que moram nas ruas da cidade de Portland. Para ela, trinta questões é o máximo de perguntas que um formulário deve ter, para não ultrapassarmos o limiar de atenção das pessoas. E, por fim, Emily Featherson também falou da realidade da Carolina do Norte durante a pandemia e compartilhou experiências de colaboração entre redações para a coleta dos dados.

Investigando websites

Já a apresentação de Jon Keegan ‘Who is behind this website?’ apresentou técnicas e ferramentas para investigar quem são as pessoas por trás de um determinado site na Internet. Apesar de curta, com menos de 1 hora, a sessão foi condensada de referências na áreas. Keegan é jornalista de dados investigativo no The Markup e participou da sessão com Priyanjana Bengani, que é pesquisadora do Tow Center for Digital Journalism.

Para começar, Jon sugere tentar entender os motivos que levariam alguém a criar aquele site em específico. Na palestra, ele listou diversos aspectos de um site que podem ser inspecionados para revelar pistas sobre a identidade do seu dono. Mesmo que isoladamente as informações disponíveis parecem irrelevantes, uma vez que tenhamos um conjunto suficiente de dados é possível que padrões surjam e levem a pistas importantes. 

“As perguntas que você fará serão muito diferentes, se for uma pessoa que criou seu próprio WordPress ou se for uma série de quinhentos sites que estão todos conectados por meio de alguns sinais”, comentou. Exemplos destes sinais que podem ser analisados são os subdomínios do site, metadados de arquivos, certificados SSL, relacionamento com outros sites por meio de links, perfis de redes sociais, códigos identificadores escondidos no código-fonte da página, entre outros itens. 

A quantidade de sinais e informações levantadas é tamanha que é possível se perder no processo. Por isso, Jon Keegan recomenda a criação de “diários dos dados”, uma espécie de registro e compilação das evidências encontradas. Isso é especialmente importante uma vez que é possível que os sites saiam do ar e evidências críticas sejam perdidas.

A investigações em sites e redes sociais será tema das aulas do curso inédito ‘Investigações digitais com OSINT’. As inscrições ainda estão abertas, mas as vagas são limitadas. O curso será ministrado em maio por Adriano Belisario, Eduardo Goulart e Luiza Bandeira, que pesquisam e trabalham com técnicas de inteligência com fontes abertas (OSINT) no jornalismo.