#61 Modelos de mundo com IA, políticas contra aborto e mais
Novembro/2024
AGENDA
Oportunidades e prazos para não perder de vista
• 05/11 – Data limite da chamada pública para reportagens jornalísticas baseadas em dados de biodiversidade, organizado pelo Serrapilheira.
• 15/11 – Último dia para se inscrever no Prêmio de Jornalismo Philip Meyer, organizado pelo Investigative Reporters & Editors (IRE).
• 18 a 22/11 – Acontece a Conferência Latino-Americana sobre o uso de R em pesquisa e desenvolvimento (LatinR). Online.
• 02 a 08/12 – Acontece a Conferência Internacional de Software Livre e de Código Aberto para Geoespacial (FOSS4G), em Belém – PA.
• 03 a 06/12 – América Aberta 2024, em Brasília. Inscrições abertas.
NO MUNDO DOS DADOS
Notícias e discussões quentes
NOVOS CAMINHOS NA INTELIGÊNCIA ARTIFICIAL
Uma nova possibilidade de Inteligência Artificial denominada “Modelos de mundo” tem se tornado uma aposta promissora. Essas IAs Modelos de mundo, uma nova fronteira na inteligência artificial, buscam emular a habilidade humana de criar representações mentais do ambiente, conforme aponta Kyle Wiggers para o TechCrunch. Inspirados pelo funcionamento do cérebro humano, esses sistemas são treinados com uma vasta gama de dados, incluindo imagens, áudios, vídeos e textos, com o objetivo de compreender as leis que regem o mundo físico e prever as consequências de ações. Empresas de ponta no setor de IA, como a World Labs e a DeepMind, estão investindo fortemente nessa tecnologia, que promete avanços significativos em áreas como a geração de vídeos realistas, a simulação de ambientes virtuais e a tomada de decisões complexas por sistemas autônomos. O cientista-chefe de IA da Meta, Yann LeCun, acredita que os modelos de mundo podem eventualmente permitir que sistemas de IA planejem e executem tarefas do mundo real de maneira mais intuitiva e eficiente.

Uma amostra do modelo de geração de vídeo Gen-3 da startup de IA Runway.
Créditos da Imagem: Runway
No entanto, o desenvolvimento desses modelos enfrenta desafios técnicos consideráveis. A necessidade de poder computacional extremo e a possibilidade de introduzir vieses e alucinações com base em dados de treinamento limitados ou tendenciosos são obstáculos significativos. A garantia de um conjunto de dados diversificado e abrangente é crucial para mitigar esses problemas. Apesar das dificuldades, espera-se que, com o avanço tecnológico ao longo da próxima década, os modelos de mundo possam revolucionar não apenas a criação de conteúdos digitais imersivos, mas também o campo da robótica, capacitando máquinas com um entendimento mais aprofundado do ambiente ao seu redor e permitindo a execução de tarefas complexas de maneira mais autônoma e inteligente.
SAIBA MAIS
Para aprender mais e aprender sempre
RECUPERAR INFORMAÇÕES COM LLM’S
A utilização de Modelos de Linguagem Grandes (LLMs) está revolucionando a maneira como realizamos a recuperação de informações em grandes conjuntos de dados textuais. Tradicionalmente, sistemas de busca empregam métodos híbridos que combinam técnicas de busca baseadas em texto e vetores para identificar documentos relevantes, mas esses métodos podem resultar na seleção de trechos irrelevantes ou confusos. Carlo Peron aponta uma solução envolvendo o uso de LLMs, como o GPT-4, para avaliar diretamente a pertinência dos trechos de texto em relação à consulta do usuário. Essa abordagem utiliza prompts para determinar a relevância de cada trecho, promovendo uma análise mais precisa e útil dos dados, o que pode levar a uma melhora significativa na qualidade das informações recuperadas.
SNIPPETS
Dicas curtas e certeiras
Cai Parry-Jones ensina técnicas avançadas de design para manipular a audiência na visualização de dados.
•
Thays Lavor ensinou como utilizar o QGIS com dados eleitorais na segunda parte do webinar Território do poder: táticas para mapear dados eleitorais.
•
Alex Yarosh mostra como construir melhores gráficos de linhas e de barras utilizando o Metabase.
•
Gênero e Número publica matéria guiada por dados mostrando os avanços das candidaturas femininas nas últimas 7 eleições.
•
Escola de Dados disponibiliza tutorial que ensina como categorizar imagens utilizando IA, uma tradução do material organizado por Adriano Belisário para o Bellingcat.
•
Harshit Tyagi ensina como transformar artigos em podcast utilizando o NotebookLM.
INSPIRA
Trabalhos e iniciativas inovadoras para te inspirar
Em 1973, Roe v. Wade garantiu nos Estados Unidos um direito ao aborto e ajudou a criar um caminho de acesso. Mas, o acesso ao aborto raramente tem sido uma linha reta – está cheio de reviravoltas, curvas e obstáculos. E essas barreiras se tornaram ainda mais complicadas desde que a Suprema Corte dos EUA deu aos estados o poder de proibir o aborto na decisão de Dobbs em 2022. Para ilustrar como é difícil obter atendimento de aborto, o The Pudding construu um labirinto para cada estado onde a dificuldade é calculada pelas políticas de aborto do estado.

Na imagem 51 labirintos representados os estados e as opções para escolher o tipo geográfico e os estados.
A visualização destaca 6 histórias obtidas a partir de relatórios de notícias, mas algumas características identificadoras foram alteradas. É possível selecionar labirintos a partir do tipo (geografia, ordem alfabética, regional e barreiras políticas) ou por estados. Ao selecionar o labirinto, a medida que a interação acontece procurando a saída, vai sendo contado um pouco da história do estado em relação a proibição do aborto.
NOVOS DADOS
Conjuntos de dados e plataformas publicados recentemente
A Agência Nacional de Águas e Saneamento Básico (ANA) lançou a Base Hidrográfica Ottocodificada Multiescalas Versão 6 (BHO6), que organiza as informações sobre as redes hidrográficas do País.
•
IBGE divulga dados do Censo Indígena de 2022, contendo alfabetização, registros de nascimentos e características dos domicílios, segundo recortes territoriais específicos.
•
Kaggle disponibiliza dados sobre Discursos do Senado Brasileiro de 988 a 2024.
UPDATE
Atualize-se com as novidades de softwares e bases de dados
Python 3.13 destaca melhorias nas mensagens de erro e no interpretador interativo, incluindo cores.
•
OpenRefine 3.8.4 apresenta como principal atualização as correções nas vulnerabilidades.