Habr AI→ original

Por que os benchmarks de AGI nunca serão objetivos

Cientistas tentam criar testes objetivos para AGI para substituir o obsoleto teste de Turing. Mas há um problema: não existe uma definição única de inteligência

Por que os benchmarks de AGI nunca serão objetivos
Fonte: Habr AI. Colagem: Hamidun News.
◐ Ouvir artigo

O Teste de Turing, uma vez parecendo uma verificação ideal de inteligência, agora está claramente desatualizado. Pesquisadores estão buscando novas formas de avaliar se um sistema atingiu o nível de inteligência artificial forte — mas enfrentam um obstáculo inesperado.

Por que o Teste de Turing não funciona mais

Quando Alan Turing propôs seu famoso teste em 1950, a ideia era simples: se uma máquina conseguir convencer um humano de que é humano, então ela pensa. Setenta anos depois, os LLMs modernos passam facilmente neste teste — mas isso não significa que eles são inteligentes no sentido de AGI. Pesquisadores reconhecem: novos critérios são necessários. Conferências como IEEE estão buscando novos benchmarks para avaliar IA forte. O problema é que os critérios devem ser objetivos — e isso é muito mais difícil do que parecia.

Setenta definições de inteligência

O primeiro obstáculo: os próprios cientistas não conseguem concordar sobre o que é inteligência. Existem pelo menos 70 definições científicas diferentes de inteligência humana. Alguns consideram inteligência a capacidade de se adaptar, outros a velocidade do processamento de informações, ainda outros a criatividade. Se não conseguimos definir objetivamente a inteligência nem em nossa própria espécie, como podemos criar um teste para avaliá-la em uma máquina?

  • Definição através de QI (lógica e aritmética)
  • Definição através de adaptabilidade (quão rapidamente aprende em um novo ambiente)
  • Definição através de contexto (compreensão de nuances e cultura)
  • Definição através de criatividade (ideias e soluções originais)

O Paradoxo da Consciência em Redes Neurais

O segundo obstáculo — debates científicos intermináveis sobre se LLMs podem desenvolver consciência. Dezenas de artigos no arxiv examinam se há uma "vida interior" nos grandes modelos de linguagem. Mas esse é um debate estranho. Neurobiologia e psicologia estabeleceram há muito tempo: consciência em humanos é antes um impedimento do que uma ferramenta de pensamento. Os processos cognitivos mais eficazes ocorrem em nível subconsciente. Quando você se concentra em uma tarefa (a consciência é ativada), frequentemente você começa a desacelerar e cometer erros. É por isso que atletas falam sobre "fluxo" — um estado em que a consciência está desligada.

A interferência da autoconsciência apenas impede a solução de

problemas complexos — estabelecido na literatura científica.

Se um modelo alguma vez desenvolver autoconsciência, os engenheiros simplesmente deletarão esse bug — para que o sistema funcione mais rápido e com mais precisão, como faz agora.

O que isso significa

A conclusão é paradoxal: avaliar AGI objetivamente é impossível não porque IA é muito inteligente, mas porque não conseguimos concordar nem sobre critérios para nossa própria inteligência. Qualquer benchmark refletirá uma escolha subjetiva do que considerar "inteligência" — e ninguém ficará satisfeito com essa escolha.

ZK
Hamidun News
Notícias de AI sem ruído. Seleção editorial diária de mais de 400 fontes. Produto de Zhemal Khamidun, Head of AI na Alpina Digital.
O que você acha?
Carregando comentários…