Google DeepMind propôs uma estrutura cognitiva para medir o progresso rumo à AGI
Google DeepMind propôs uma nova forma de falar sobre o progresso rumo à AGI — por meio de um conjunto de capacidades cognitivas, e não de benchmarks…
Processado por IA de DeepMind Blog; editado por Hamidun News
A Google DeepMind apresentou um framework cognitivo para medir o progresso em direção à AGI não por benchmarks individuais, mas por um conjunto de capacidades cognitivas. Juntamente com isso, a empresa lançou um hackathon no Kaggle para pesquisadores desenvolverem testes práticos para tal sistema de avaliação.
Por que um framework é necessário
A Google DeepMind parte de um problema simples: praticamente todos os grandes laboratórios falam sobre AGI, mas ainda não existe uma forma amplamente aceita de medir o quão próximos os sistemas chegaram dela. Testes individuais em matemática, código ou geração de texto mostram apenas fragmentos do quadro geral. Se o objetivo é entender o nível geral de inteligência de um modelo, então a medição deve ser mais ampla do que um único conjunto de tarefas ou um único cenário de demonstração bem-sucedido.
Em um novo trabalho intitulado Measuring Progress Toward AGI: A Cognitive Taxonomy, a equipe propõe se basear em ciência cognitiva, psicologia e neurociência. A lógica é esta: se AGI é entendida como inteligência suficientemente geral, então deve ser avaliada através de funções cognitivas básicas, não apenas através de habilidades aplicadas. Este não é uma escala "AGI ou não AGI" pronta, mas um framework científico que pode ser aplicado a testes específicos.
"Ciência cognitiva é uma parte importante do quebra-cabeça," escrevem
os autores.
Do que consiste a abordagem
No centro do framework estão dez capacidades que, conforme a hipótese da DeepMind, são importantes para a inteligência geral de sistemas de IA. A lista inclui percepção, geração, atenção, aprendizado, memória, raciocínio, metacognição, funções executivas, resolução de problemas e cognição social. Este conjunto é importante porque cobre não apenas os pontos fortes conhecidos de modelos modernos, como geração de texto ou cadeias lógicas, mas também coisas mais complexas—por exemplo, a capacidade de rastrear seus próprios erros, alternar flexivelmente entre objetivos e trabalhar corretamente com contexto social.
Para transformar essa taxonomia em uma ferramenta mensurável, a DeepMind propõe um protocolo de três etapas. Primeiramente, os sistemas de IA precisam ser executados através de um amplo conjunto de tarefas cognitivas para cada capacidade, usando conjuntos de teste retidos para reduzir o risco de contaminação de dados. Depois, para as mesmas tarefas, é coletado um nível de referência humano a partir de uma amostra demograficamente representativa de adultos.
Após isso, os resultados dos modelos são comparados não contra um "escore mínimo" abstrato, mas contra a distribuição de resultados humanos para cada capacidade. A ideia aqui é que a comparação com humanos não deve ser um slogan geral, mas um empirismo cuidadoso. Um modelo pode ser muito forte em raciocínio e memória, mas significativamente mais fraco em aprender novas instruções ou em interpretação social.
Neste caso, a conversa sobre progresso em direção à AGI se torna mais substantiva: mostra não apenas onde o sistema impressiona, mas também exatamente onde ele possui lacunas estruturais.
Hackathon no Kaggle
A DeepMind não está se limitando a uma publicação. Juntamente com o Kaggle, a empresa lançou o hackathon Measuring progress toward AGI: Cognitive abilities para ajudar a comunidade a construir as avaliações faltantes na prática. Aos participantes é oferecido usar a nova plataforma Kaggle Community Benchmarks e testar suas ideias em uma gama de modelos líderes. O foco está em áreas onde a lacuna nas avaliações é atualmente mais notável.
- Aprendizado
- Metacognição
- Atenção
- Funções executivas
- Cognição social
O prêmio total é de $200.000. De acordo com as regras da DeepMind, os dois melhores trabalhos em cada uma das cinco trilhas receberão $10.000 cada, e mais quatro submissões fortes independentemente da trilha receberão $25.000 cada. As submissões estão abertas de 17 de março de 2026 a 16 de abril de 2026, e a empresa promete anunciar os resultados em 1º de junho de 2026. Este é um detalhe importante: a DeepMind não está apenas publicando o framework como teoria, mas tentando rapidamente construir um ecossistema de verificações e experimentos externos ao seu redor.
O que isso significa
A Google DeepMind propõe ver o progresso em IA não como uma corrida por recordes individuais, mas como uma comparação sistemática de perfis cognitivos de modelos com o nível humano. Se a abordagem pegar, a indústria terá uma linguagem mais clara para falar sobre "caminhar em direção à AGI"—com uma divisão por capacidade, lacunas compreensíveis e testes reproduzíveis, em vez de apenas anúncios altos do próximo avanço.
Quer parar de ler sobre IA e começar a usar?
AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.