Jornalistas devem seguir exemplo de pesquisadores de mídia e olhar a Internet como uma rica fonte de dados

Por Liliana Bounegru*

No início deste ano, Alex Madrigal do Atlantic Tech publicou um artigo fascinante que revelou o mistério por trás dos gêneros cinematográficos super segmentados que o Netflix apresenta aos seus usuários. Usuários do Netflix recebem recomendações de categorias de filmes como “Dramalhões dos anos 70″ ou “Documentários Afro-Americanos de Crimes”, e há 76.897 deles! O que foi realmente interessante nesta matéria foi como Madrigal obteve suas fontes.

Para identificar esses gêneros, Madrigal escreveu um script que puxou os gêneros navegando link por link (Como ele explica no artigo, “http://movies.netflix.com/WiAltGenre?agid=1” ligado a “Documentários Afro-Americanos de Crimes” e “http://movies.netflix.com/WiAltGenre?agid=2” ligado a “Filmes cult assustadores dos anos 80”. E assim por diante). Ao fazer isso, ele essencialmente usou metadados gerados por um serviço online e lhes deu um novo propósito para iniciar uma investigação sobre a nossa cultura cinematográfica.

Embora este assunto seja normalmente considerado como “soft news” no jornalismo, pode-se imaginar como os jornalistas podem participar no escrutínio de outros algoritmos e serviços que são fundamentais para os nossos hábitos de aquisição de informação, como o Google ou Wikipedia, e suas políticas de informação. Isto é o que o bolsista do Tow Center Nick Diakopulos chama de “prestação de contas algorítmica“. Uma abordagem para a prestação de contas algorítmica que desenvolvemos na Universidade de Amsterdam e que poderia ser valiosa para jornalistas é medir como temas-chave, pontos de vista ou atores são classificados nos resultados do Google, um dos principais pontos de entrada para a web. Esta é uma versão século 21 do que os estudiosos de mídia tradicionalmente fazem quando analisam a forma como as questões são priorizadas na imprensa escrita e falada, e como isso contribui para a formação da opinião pública.

Por exemplo, um dos nossos estudos de mapeamento de anti-islamismo ou contra-jihadismo na web analisou o quão perto ou facilmente disponível está o conteúdo de ódio para o usuário habitual dos mecanismos de busca. Olhamos para onde este conteúdo está localizado nos principais domínios locais do Google de vários países: Bélgica (google.be), Holanda (google.nl), Alemanha (google.de), Índia (google.co.in), França (google.fr), Reino Unido (google.co.uk) e o Google “universal” (google.com) para palavras-chave relacionadas ao Islã como “muçulmano”, “Alá”, “burca” ou “Jihad”. Descobrimos que o conteúdo anti-muçulmano é de fato acessível nos 20 principais resultados do Google para essas consultas em cada um dos domínios locais – e em alguns casos conteúdo extremista também está presente, como mostra a visualização abaixo de uma próxima publicação de Richard Rogers e a Digital Methods Initiative (Amsterdã):

Fonte: What Does the Internet Add? Studying Counter-Jihadism Online (forthcoming). [O que a Internet acrescenta? Estudando o Contra-Jihadismo Online (prestes a ser publicado)]. Compilado por Richard Rogers e a Digital Methods Initiative, Amsterdam.

Fonte: What Does the Internet Add? Studying Counter-Jihadism Online (prestes a ser publicado). Compilado por Richard Rogers e a Digital Methods Initiative, Amsterdam.

O que estes dois exemplos têm em comum é o fato de que eles dão um novo sentido à informação gerada por serviços online e a tratam como uma fonte de dados, o que podemos usar para entender como a mídia digital pode formatar a nossa forma de pensar e agir em relação a diferentes temas. Enquanto jornalistas normalmente usam a web e as mídias sociais para identificar documentos e fontes humanas e para se comunicar com os outros, eles raramente usam as mídias sociais e a web como fonte de dados sobre a situação das questões, debates e fluxos de informação nas diferentes sociedades.

Houve algumas notáveis exceções, como o projeto do Guardian UK ‘Riot Rumours’ e o ‘Opkomst en ondergang van locais extreemrechtse‘ da NRC Handelsblat. O premiado ‘Riot Rumours’ do Guardian analisou os tweets produzidos em torno das manifestações de Londres em 2011 para identificar a ascensão e queda de boatos no Twitter, contribuindo para elucidar a dinâmica de informação nesta plataforma e como informações podem ser verificadas em situações cruciais como emergências e desastres. O exemplo anterior do jornal holandês NRC Handelsblad (2007) mostra como os jornalistas utilizaram dados da Internet para investigar a cultura holandesa, e em particular o aumento da linguagem extremista na Holanda. Em vez de entrevistar especialistas no assunto, os jornalistas extraíram centenas de sites do Internet Archive, que remontavam há vários anos, e descobriram que sites de direita cada vez mais empregavam a língua encontrada em sites extremistas, e concluiu que a direita do centro da cultura política holandesa foi se deslocando em direção a visões tradicionalmente associadas à extrema direita.

Minha experiência liderando um programa de treinamento em jornalismo de dados e trabalhando com veículos pioneiros no uso de dados digitais a serviço do jornalismo (como o New York Times, o Guardian e ProPublica) me mostrou que os jornalistas tendem a recorrer a governos, organizações não-governamentais e empresas para os dados que contam suas histórias. Mas como o uso da internet como fonte de dados pode nos ajudar a compreender não só as evidências estatísticas orientadas pela política dos atores-chave, mas também as existências sociais complexas de questões e controvérsias que se desenrolam, aquela besta misteriosa chamada opinião pública da qual a vida democrática depende? O que vestígios digitais gerados e capturados em vários serviços online podem adicionar ao nosso entendimento de debates em torno das alterações climáticas, da desigualdade, do envelhecimento, da saúde global, do extremismo, da liberdade de expressão, da migração e de outras questões importantes que enfrentamos?

É aí que a experimentação recente com novas fontes de dados na área de humanas e ciências sociais digitais pode contribuir. Na Universidade de Amsterdã estamos atualmente trabalhando em um projeto liderado pelo sociólogo Bruno Latour, que visa à utilização de dados digitais e métodos digitais para entender as controvérsias em torno da mudança climática. Por exemplo, uma das coisas que nós olhamos é como “hotspots de biodiversidade” são tratados por organizações que trabalham na adaptação às alterações climáticas. Apoiar a biodiversidade é uma parte crucial de muitas estratégias de adaptação às alterações climáticas, uma vez que aumenta a resistência a essas mudanças climáticas. Embora se possa esperar que esses hotspots vitais sejam tratados de forma igual por organizações que trabalham sobre este tema, nossa pesquisa mostrou que alguns foram negligenciados e outros receberam uma atenção desproporcional.

Fonte: Mapping Climate Change Scepticism, Mitigation and Adaptation Online. (prestes a ser publicado)]. Compilado por Richard Rogers e a Digital Methods Initiative, Amsterdam.

Outra fonte de dados extremamente rica sobre a vida social das controvérsias é a Wikipedia. Por exemplo, na Universidade de Amsterdã pesquisadores fizeram uma análise comparativa dos artigos da Wikipédia sobre o massacre de Srebrenica ocorrido em julho de 1995. Eles descobriram que em seis versões de língua diferentes da Wikipedia existem diferenças significativas na forma como os eventos foram retratados. Além de analisar os elementos básicos, tais como títulos de artigos e conteúdos, os analistas também olharam para as coisas menos óbvias, como a localização dos editores anônimos (com base no endereço IP), as páginas de discussão por trás dos artigos, imagens e listas de referência. Trazendo à tona as diferenças entre pontos de vista nacionais, este tipo de abordagem indica o potencial para a obtenção de uma melhor compreensão empírica de como diferentes públicos reagem a diferentes questões e controvérsias, da Crimea a Snowden, do Eurozone à crise financeira.

Fonte: Rogers, Richard (2013). Digital Methods. MIT Press.

Em tempos de orçamentos reduzidos e cortes de pessoal em redações, jornalistas podem recorrer a tais fontes de dados prontamente disponíveis como uma maneira de entender o envolvimento do público com questões importantes. Pesquisadores podem apoiar este processo, disponibilizando conjuntos de dados, ferramentas e protocolos desenvolvidos em seus trabalhos.A Sciences Po e a Universidade de Amsterdã estão deixando seus toolkits de pesquisa na Internet disponíveis aqui e aqui.

Espero que estes exemplos tenham mostrado que a pesquisa acadêmica em ciências sociais e humanas digitais pode ajudar a abrir a imaginação jornalística quanto às fontes para histórias e a como os vestígios deixados por usuários de vários serviços online podem se tornar uma fonte rica de provas para compreender a formação digital de públicos e de opiniões, um processo central para as nossas democracias.

Sobre a autora: Liliana Bounegru lidera a iniciativa de Jornalismo de Dados do Centro Europeu de Jornalismo, um dos principais programas de treinamento, recursos e trabalho em rede na área de jornalismo de dados. Liliana é também pesquisadora de mídia na Universidade de Amsterdã, onde ela trabalha na Iniciativa Digital Methods e no projeto colaborativo EMAPS (mapas eletrônicos para apoiar a Ciência Pública), liderado pelo sociólogo Bruno Latour. Ela também é doutoranda e trabalha com o tema do jornalismo de dados na Universidade de Groningen (Holanda) e na Universidade de Ghent (Bélgica). Ela tem um blog sobre seu trabalho em lilianabounegru.org e seu Twitter é @bb_liliana.

*Traduzido por Natália Mazotte e Isis Reis do artigo original publicado no site da London School of Economics and Political Science