E por que estou ansiosa com imagens de satélite, meio ambiente e direitos humanos


* Tradução livre, feita por Vanessa Rocha, do texto “What I’ve learned about AI and why journalists should care“, publicado no Medium por Florencia Coelho, fellow do programa JSK em Stanford em 2019 e editora de dados do La Nacion.


Deep Solar, da Stanford

O que nós precisamos entender como jornalistas é que a Inteligência Artificial (IA) oferece uma nova dimensão de oportunidades e desafios para construir o jornalismo de dados e o jornalismo computacional.

Está sendo discutido o quão útil será para o jornalismo investigativo, mas definitivamente, existem soluções interessantes e eu acho que seu uso será espalhado pelas redações ao redor do mundo, como aconteceu com blogs, vídeo, aparelhos móveis, social media e jornalismo de dados.

Cientistas discutem sobre o nome Inteligência Artificial e porque ele deve ser renomeado. De qualquer maneira, existem várias definições sobre IA e eu vou ficar com essa, que é a que aparece no Dicionário do Google:

“Inteligência Artificial é a teoria e o desenvolvimento de sistemas computadorizados capazes de executar tarefas que normalmente requerem inteligência humana, como percepção visual, reconhecimento de discurso, tomada de decisões e tradução entre línguas.”

AI = Inteligência Artificial / CS = Ciência computacional / DS = Ciência de Dados / Math = Matemática

Está intrinsecamente relacionada com o mundo da ciência da computação (CC) e da ciência de dados (CD). Já ouvi falar de IA nomeada como “estatística sofisticada”.

Imagem: Meme inspirado pelo trabalho original do Sandserifcomics

TIPOS DE AI

O primeiro uso registrado do termo “inteligência artificial” foi em 1955 pelo professor John McCarthy, na Universidade de Stanford.

Interessado em história? Você pode navegar por um infográfico histórico preparado pelo novo Instituto de IA com foco humano, na Universidade de Stanford.

Existem dois principais tipos de IA que você deve entender agora. Eles geralmente são chamados de IA forte/ geral (Strong/General AI) e IA fraca/estreita (Weak/Narrow Ai).

A IA forte ou geral – Esse tipo implica que os sistemas computacionais têm consciência, sensibilidade e autoconsciência. Eles poderiam idealmente ser multitarefas entre diferentes desafios e projetos. Esse tipo NÃO está acontecendo tão cedo e, de acordo com o que ouvi de cientistas e pesquisadores, é duvidoso que venha a existir.

Este é o tipo assustador de IA que você pode ver nos filmes, onde os robôs vêm depois dos humanos. Em uma conferência, ouvi dizer que alguns consultores estão arrecadando dinheiro para pesquisar sobre a IA geral, explorando o medo das pessoas contra esse tipo de inteligência.

IA fraco ou estreito – Esse é o tipo que vem evoluindo para resolver problemas específicos. Pode raciocinar logicamente, encontrar padrões e “aprender” dentro de um escopo de foco. Este é o tipo que é referido, testado e usado nas áreas acadêmicas, governamentais e de negócios.

Como jornalistas, talvez devêssemos estar mais preocupados com coisas ruins associadas à IA fraca, como armas autônomas e a maior automação em mercados de trabalho específicos.

Subdomínios da IA Estreita

A partir daí, diferentes subconjuntos de IA foram desenvolvidos. Os mais relevantes para o jornalismo que você provavelmente lerá são: Aprendizados sobre Máquinas, Processamento de Linguagem Natural (PLN), fala, visão, sistemas especialistas, robótica, etc.

Esses subdomínios possuem outros subconjuntos. Por exemplo, o Aprendizado de Máquina pode ser supervisionado ou não supervisionado. Você também lerá sobre o aprendizado supervisionado reforçado ou o aprendizado supervisionado fraco e as redes neurais de aprendizagem profunda.

Não entre em pânico!

O que os jornalistas precisam saber é que existem diferentes subconjuntos desses subdomínios da IA. Eles têm objetivos diferentes e até se entrelaçam em projetos e desafios.

O Aprendizado de Máquina é o predominante e tem algoritmos de propósito geral, que também são usados nos subdomínios de IA mais específicos (linguagem, fala, visão). Os sistemas especialistas são uma versão antiga da IA, mas ela é usada como gerador de leads.

Neste gráfico, um dos muitos incluídos no Relatório Anual de 2018 do Índice de Inteligência Artificial, você pode ver como o Aprendizado de Máquina conduziu trabalhos de pesquisa de IA nos últimos 15 anos.

Scopus é um banco de dados de citações de publicações revisadas por pares.

MOMENTUM

Por que a IA está explodindo? O que está acontecendo?

A resposta mais simples é: dados + tecnologia

Dados: Grandes quantidades de dados são necessárias para treinar sistemas e modelos de computador usando técnicas de IA. Governos e corporações estão produzindo as quantias necessárias. Os jornalistas podem trabalhar com um grande volume de dados obtidos por meio de vazamentos, raspagem, solicitações da Lei de Acesso à Informação, dados abertos, etc.

Tecnologia: A capacidade de armazenamento de dados e o poder de processamento da computação também aumentaram. O desafio é dinheiro. O custo financeiro pode se tornar um fardo, dependendo da quantidade de dados sendo analisados. Organizações de notícias e universidades provavelmente precisarão colaborar para ajudar que alguns projetos jornalísticos aconteçam.

IA e Jornalismo

Então, por que devemos nos importar?

1) Para cumprir nossa missão jornalística.

2) Tirar vantagem de uma ótima oportunidade para redações.

Qualquer jornalista com uma forte missão de serviço público deve entender os desafios que a IA apresenta à sociedade.

E isso já está acontecendo.

Os algoritmos de tomada de decisão que estão sendo executados em projetos governamentais e corporativos estão produzindo resultados injustos.

Sua cidade está usando ferramentas de reconhecimento facial para perseguir criminosos? O que eles estão fazendo com os dados? Quantos falsos positivos eles têm? Como eles estão preservando os direitos de privacidade? Há um equilíbrio entre segurança e privacidade? O que acontece se um governo abusivo usa a tecnologia para oprimir os grupos contra eles e controlar seus próprios seguidores?

Por outro lado, em uma era de encolhimento de redações e competição com players digitais, uma estratégia de longo prazo utilizando soluções de inteligência artificial para as diferentes fases do ciclo de notícias soa como um must-have.

Eu tenho coletado exemplos inspiradores para jornalistas e compartilhei abaixo alguns relacionados a diferentes subconjuntos de IA restrita.

Aprendizado de Máquina (algoritmos de propósito geral)

  • Supervisionado (implica em dados de treinamento rotulados): a matéria “Doctors & Sex Abuse” do Atlanta Journal Constitution “… coletou mais de 100 mil documentos disciplinares. Para nos ajudar a identificar os que envolvem má conduta sexual, criamos um programa de computador baseado em “aprendizado de máquina” para analisar cada caso e, baseado em palavras-chave, atribuiu a cada um uma classificação de probabilidade relacionada a um caso de má conduta sexual médica. Depois, lemos todos os documentos em mais de 6 mil casos para determinar a natureza de cada caso e ação do conselho.” (Metodologia)
  • Sem supervisão: a matéria “Guns in school-accident” da Associated Press usou o aprendizado de máquina sem supervisão para encontrar padrões ocultos em um conjunto de dados de 140 mil incidentes humanos documentados pelo Arquivo de Violência Armada. Depois de descobrir uma série de erros nos dados iniciais, a Associated Press utilizou o aprendizado de máquina sem supervisão para simplificar os dados e sinalizar certas entradas para revisão adicional sem orientação específica.” (Relatório O Futuro do Jornalismo Aumentado, p. 10.)

Processamento de Linguagem Natural (PLN)

O guia mais abrangente que encontrei durante esses últimos meses é o “O que os jornalistas fazem com documentos? Notas de campo para pesquisadores de processamento de linguagem natural “, de Jonathan Stray, no qual ele declara diferentes exemplos que usam a PLN personalizada.

Modelagem de tópicos: “A história da Câmera de Eco” da Reuters é sobre um pequeno grupo de advogados e sua enorme influência na Suprema Corte dos EUA. (Metodologia J. Stray, 4.1)

Análise de sentimentos: “Os Whistleblowers dizem que o IG da USAID removeu detalhes críticos de relatórios públicos”, do Washington Post. (Metodologia J. Stray, 4.2)

Discurso

Fala para texto: No projeto “Campanha presidencial totalmente categorizada” da Folha, “…também capturamos e armazenamos anúncios e vídeos de TV postados no YouTube usando a API de conversão de fala para texto do Google para [transcrever] o conteúdo de áudio desses vídeos. No final da primeira rodada da campanha, transcrevemos mais de 95 horas de vídeos”.

Eu encontrei mais exemplos de diferentes subdomínios e subconjuntos de IA. Você pode verificá-las no meu mural, usando combinações de tags com “jornalismo”.

Com o quê estou animada? Imagens de satélite, meio ambiente e direitos humanos.

Estou interessada na oportunidade de combinar imagens de satélite e ferramentas de inteligência artificial. Dê uma olhada em alguns exemplos.

Veja alguns exemplos.

Projetos ambientais

A Stanford tem projetos para identificar fazendas de animais potencialmente poluentes na Carolina do Norte e mapear todos os painéis solares nos Estados Unidos.

Os vencedores do datagrama da Conferência WiDS deste ano trabalharam para detectar plantações de óleo de palma usando imagens de satélite.

O projeto “Lepra da Terra” da Texty usou um modelo de aprendizado profundo para pesquisar imagens de satélites de 70 mil km² no norte da Ucrânia em busca de traços de mineração ilegal de âmbar. (Mais metodologia via QZ’s AI Studio)

A Reuters usou imagens de satélite e inteligência artificial que forneceram a primeira passagem. Em seguida, a equipe deles editou manualmente os resultados iniciais para garantir que não houvesse falsos positivos ou construções perdidas para acompanhar a expansão no mar no Sul da China.

Direitos humanos

O projeto da Anistia Internacional, “quantificando a destruição de aldeias em Darfur”, usou o crowdsourcing e o aprendizado de transferência para analisar automaticamente imagens de satélite em escala nacional no Sudão.

A história da Associated Press “Frutos do Mar dos Escravos”, utilizou imagens de satélite para garantir imagens de alta resolução de embarcações marítimas no sudeste da Ásia. Repórteres reuniram evidências críticas para um projeto de investigação sobre abusos na indústria de frutos do mar. A AP ganhou um Prêmio Pulitzer sobre Serviço Público em 2016. (Detalhado nos bastidores, Relatório O Futuro do Jornalismo Aumentado, Vision p. 14)

A Human Rights Watch deseja aplicar uma rede neural para escalar um olho de especialista poderá dizer a diferença entre plumas de fumaça e nuvens brancas e fofas, como monitoraram o surto de violência étnica em Mianmar em 2017.

Este é o fim da minha jornada em Stanford. Agora estou voltando para a Argentina e para o LA NACION, onde pretendo aumentar meu conhecimento nesse campo, trabalhar em projetos relacionados e trocar experiências em minha comunidade de dados.

Mantenha contato! Twitter @fcoel ou fcoelho [arroba] stanford [ponto] edu

BIBLIOGRAFIA

Para saber mais sobre oportunidades e ferramentas para coleta de notícias, produção e distribuição, essas foram minhas fontes favoritas:

AP’s report: A guide for newsrooms in the age of smart machines por F. Marconi e A. Siegman

Making Artificial Intelligence Work for Investigative Journalism por Jonathan Stray

What do journalists do with documents? por Jonathan Stray (PLN)

Knight Center for the Americas MOOC News Algorithms: The Impact of Automation and AI on Journalism com Nicholas Diakopoulos.

Computational Journalism Symposium 2019 (vídeos e artigos)

QZ AI studioColumbia Journalism Review por Nicholas Diakopoulos

Weapons of Math Destruction por Cathy O’Neil (viés do algoritmo)

Artificial Unintelligence por Meredith Broussard (sistemas especialistas)

Artificial Intelligence for Journalists por Daniel Kirsch e Julius Tröger (explicações de diferentes algoritmos de aprendizado de máquina). Está em alemão mas você pode usar o Google Tradutor.