#44 OSINT e as mudanças na API do Twitter, o segredo da inteligência dos chatbots de IA e mais
Abril/2023
AGENDA
Oportunidades e prazos para não perder de vista
• 02/05 – Aberto processo seletivo para a Especialização em Geoprocessamento pela Universidade Federal do ABC (UFABC) e Universidade Aberta do Brasil (UAB). O curso é à distância e gratuito.
• 03 a 05/05 – A Outlier Conference acontece em Porto (Portugal), com diversos agentes da comunidade de dados.
• 05/05 – Prazo para submeter trabalhos para Computers, Privacy and Data Protection Conference (CPDP LatAm).
• 05 a 07/05 – O Festival3i2023, festival de jornalismo inovador da América Latina organizado pela Ajor (Associação de Jornalismo Digital), ocorrerá presencialmente no Rio de Janeiro.
• 09 a 11/05 – A Data23, conferência da Tableau, acontecerá em Las Vegas.
• 10 a 12/05 – A JupyterCon reunirá, em Paris, na França, desenvolvedores, pesquisadores, educadores, cientistas de dados, entre outros, para debater acerca do ecossistema Jupyter.
• 18/05 – A Spatial Data Conference acontece presencialmente em Londres e em Nova Iorque.
• 05 a 08/06 – 12ª edição da RightsCon acontece online e na Costa Rica.
• 22 a 24/06 – European Data & Computational Journalism Conference acontece em Zurique, na Suíça.
• 29/06 a 02/07 – 18º Congresso Internacional de Jornalismo Investigativo acontecerá em São Paulo (SP), organizado pela Abraji.
• 30/07 – Encerra-se o prazo para submissão de candidaturas para o Prémio Jornalismo de Dados da Sociedade Portuguesa de Estatística (SPE), em parceria com a Escola Superior de Comunicação Social (ESCS).
• 31/08 e 01/09 – 2ª edição do Coda Amazônia, em Belém, no Pará.
• 02/09 – Atividades do Coda Amazônia na Ilha de Marajó.
• 17/09 a 20/09 – Período da posit::conf2023, oportunidade de integração da comunidade de ciência de dados.
• 07 a 09/11 – Festival de Datos em Punta del Este, no Uruguai.
• 06 a 10/11 – 11º Congresso Nacional de Design da Informação, com trilha sobre visualização de dados. Inscrições de artigos aberta.
NO MUNDO DOS DADOS
Notícias e discussões quentes
Como as mudanças na API do Twitter impactam investigações digitais
No fim de março, o Twitter anunciou seus novos níveis de API, basicamente eliminando sua antiga API gratuita. Ela oferecia a capacidade de extrair uma quantidade significativa de tweets e dados relacionados e era usada por pesquisadores e desenvolvedores para construir ferramentas úteis para investigar contas e conversas na plataforma. Craig Silverman, na mais recente edição de sua newsletter Digital Investigations, aponta as consequências destas mudanças no ecossistema de OSINT (Open Source Intelligence) e reforça que o conjunto de técnicas não é a mesma coisa que suas ferramentas: “Sua capacidade de encontrar abordagens criativas, de permanecer persistente diante de contratempos e de pensar em um problema é seu ativo mais importante. Ela nunca pode ser interrompida por uma API obsoleta ou desativada por um desenvolvedor”.
Financiamento, OSINT e direitos humanos
Kate Pundyk, do Oxford Internet Institute, escreveu um artigo manifestando sua preocupação com o alto custo das investigações de Open Source Intelligence no contexto de violação de direitos humanos. Segundo ela, as barreiras financeiras que as organizações do campo enfrentam, incluindo a necessidade de software e hardware de alta qualidade, bem como treinamento e capacitação de equipes especializadas, além da questão geopolítica da distribuição de recursos, impactam em lacunas significativas na documentação e responsabilização de violações de direitos humanos em países do sul global.
Boas práticas para cobertura de ataques a escolas
Os recentes ataques a escolas brasileiras, especialmente o ataque ocorrido numa escola em São Paulo no dia 27 de março, trouxeram questionamentos sobre as práticas éticas das redações e o impacto da cobertura jornalística desse tipo de violência. A Associação de Jornalistas de Educação (Jeduca) realizou um webinar sobre o tema, a fim de orientar jornalistas sobre como fazer uma cobertura responsável e evitar o “efeito contágio”, mediado por Marta Avancini, editora pública da Jeduca e editora do site da associação, Catarina de Almeida Santos, professora da Faculdade de Educação da Universidade de Brasília (UnB), e Telma Vinha, professora da Universidade Estadual de Campinas (Unicamp). Um resumo do webinar também foi publicado no Latam Journalism Review, do Knight Center.
O segredo da inteligência dos chatbots de IA
Em alta nos últimos meses, os chatbots de inteligência artificial podem impressionar ao oferecer um artigo completo sobre um determinado assunto ou por manterem conversas com seus usuários, mas convém lembrar que estes bots não pensam como humanos e não são capazes de entender o que dizem. Por trás de sua imitação da fala humana, existe uma IA alimentada com uma quantidade massiva de textos, em sua maioria disponíveis online. Nesta reportagem do The Washington Post, uma análise de um desses conjuntos de dados revela os tipos de sites proprietários, pessoais e muitas vezes ofensivos que entram nos dados de treinamento de uma IA.
SAIBA MAIS
Para aprender mais e aprender sempre
Mapas para a ação climática
O Mapbox realizou um webinar sobre o tema, com especialistas mostrando como o uso de tecnologias de mapeamento pode ser aplicado em iniciativas de combate às mudanças climáticas. Exemplos de como dados espaciais podem ser usados para entender e mitigar os efeitos do aquecimento global, como mapear áreas de risco para incêndios florestais ou planejar a construção de infraestrutura verde também foram apresentados.
Ecossistema de dados da Amazônia
Novo mapeamento da Open Knowledge Brasil busca compreender como coletivos e organizações atuantes na Amazônia brasileira compõem um ecossistema de dados, com diferentes estratégias e práticas de uso, publicação e geração de dados nas agendas socioambientais, com enfoque em mudanças climáticas, proteção territorial e desigualdades. O e-book faz parte de uma série de ações no âmbito do programa “Vozes pela Ação Climática Justa” (VAC) com o apoio do Instituto Hivos.
Séries temporais e mudanças climáticas
Em artigo para o Towards Data Science, Vitor Cerqueira explica o uso de modelos de séries temporais para previsão de ondas oceânicas de grande porte. O pesquisador em previsão de séries temporais aborda o processo de coleta e limpeza dos dados, e a aplicação de técnicas de modelagem de séries temporais para gerar previsões futuras. A abordagem é utilizada tanto para a prevenção de desastres naturais quanto para a melhoria da segurança marítima.
Usando a Posit Cloud
A Posit Cloud é um serviço da web que oferece uma experiência baseada em navegador semelhante ao RStudio, o ambiente de desenvolvimento integrado padrão para usuários e desenvolvedores R. No blog do Posit, este post mostra o novo recurso Data Connections, que permite aos usuários armazenar e compartilhar com mais rapidez e segurança credenciais de banco de dados em vários projetos de dados. Também é possível aprender a utilizar o recurso por meio deste vídeo.
SNIPPETS
Dicas curtas e certeiras
Foi criado um chatbot que permite a comunicação com qualquer repositório do GitHub, aprimorando a pesquisa por códigos, por exemplo.
Joris Guerin desenvolveu um guia rápido para experimentos com Machine Learning, de modo a construir diferentes pesquisas e avaliações, com limitações práticas.
Benjamin Feifke escreve ao Towards Data Science relatando 3 razões que o fizeram mudar de Pandas para Polars (o mais rápido dataframe de Python, segundo o autor).
Também em publicação do Towards Data Science, Fernando Barbalho mostrou como usou Quarto, Shiny e ChatGPT para desvendar a ligação entre a influência dos municípios, os gastos com saúde pública e o deslocamento de pacientes no Brasil.
A ferramenta GVision permite a detecção de marcas territoriais em imagens, o que possibilita a identificação da localidade em que uma foto foi tirada, facilitando a checagem da veracidade de imagens postadas na Internet.
Simon Couch ensina como escrever códigos com melhor desempenho utilizando o pacote R Tidyverse.
Ujaval Gandhi escreveu sobre sua experiência participando da conferência internacional do QGIS 2023 e reuniu alguns materiais das atividades do evento.
Este ano será lançado o Climate Journalism Award, prêmio europeu com 5 categorias.
Bill Wang ensina como explorar dados visualmente utilizando a linguagem Python e o Jupyter Notebook.
DBeaver lançou um vídeo de como utilizar o UPDATE, parte da série SQL for beginners.
INSPIRA
Trabalhos e iniciativas inovadoras para te inspirar
Paris, no Texas, e Paris, na França.
Visitar Paris, nos Estados Unidos. Pareceu estranho? O projeto “No Passport, No Problem“, do jornal Axios, mostra como diversas cidades americanas foram nomeadas em homenagem a localidades estrangeiras. Com visualizações estilizadas no Mapbox e ilustrações simpáticas, o projeto também mostra as origens mais comuns de nomes de lugares nos EUA, os estados americanos com mais cidades com nomes de lugares estrangeiros e a concentração de cidades dos EUA com nomes de diferentes regiões da Europa. Além disso, você pode montar seu itinerário por estado, entendendo melhor a inspiração do nome dessas cidades.
NOVOS DADOS
Conjuntos de dados e plataformas publicados recentemente
A Base dos Dados disponibiliza dados sobre tráfico escravo no mundo, no período de 1514 a 1866.
A Prefeitura de São Paulo adicionou ao seu portal de dados abertos os pedidos de informação protocolados via e-SIC.
Bases de dados geográficos de distribuição da ANEEL estão disponíveis no portal de dados abertos da autarquia.
UPDATE
Atualize-se com as novidades de softwares e bases de dados
Maltego 4.4.0 apresenta melhorias na aparência, resoluções de erros, melhorias no assistente de instalação de itens, e mais.
Quarto 1.3 com publicação em vários formatos, incorporação de células do Jupyter Notebook, anotações de códigos, entre outros.
Open Refine 3.7.2 traz em destaque atualização nas traduções, muitas implementações relacionadas ao Wikibase e resolução de erros.
Purrr 1.0 apresenta melhoria nas mensagens de erro, novas funções map e list, entre outros.