Jiqizhixin (机器之心)→ original

Google DeepMind ganha prata: IA resolve problemas de olimpíada, mas a que custo?

Enquanto o mundo inteiro discute se o ChatGPT algum dia aprenderá a não errar em receitas de bolos, o Google DeepMind decidiu tentar algo sagrado — a…

Processado por IA de Jiqizhixin (机器之心); editado por Hamidun News
Google DeepMind ganha prata: IA resolve problemas de olimpíada, mas a que custo?
Fonte: Jiqizhixin (机器之心). Colagem: Hamidun News.
◐ Ouvir artigo

Enquanto o mundo inteiro discute se o ChatGPT algum dia aprenderá a não errar em receitas de bolos, o Google DeepMind decidiu tentar algo sagrado — a Olimpíada Internacional de Matemática (IMO). Os resultados do AlphaProof e AlphaGeometry 2 fizeram a indústria estremecer: os sistemas resolveram quatro problemas em seis, o que corresponde ao nível de um medalhista de prata. Parecia ser aquele momento de singularidade, quando o silício finalmente derrotou o carbono na lógica pura.

Mas se você observar os detalhes mais de perto, o triunfo parece mais uma vitória heroica sobre as circunstâncias do que um passeio tranquilo. A matemática sempre foi o calcanhar de Aquiles dos modelos de linguagem. LLMs comuns funcionam em probabilidades, prevendo a próxima palavra, o que no mundo rigoroso das provas leva a alucinações inevitáveis.

Para resolver esse problema, os engenheiros do DeepMind seguiram o caminho da hibridização. O AlphaProof combina a flexibilidade do aprendizado por reforço com a disciplina severa da linguagem de verificação formal Lean. Isso permite que a inteligência artificial não apenas adivinhe a resposta, mas escreva código que se verifica a cada passo lógico.

O AlphaGeometry 2, por sua vez, recebeu uma injeção poderosa na forma do modelo Gemini, o que permitiu que resolvesse quebra-cabeças geométricos dez vezes mais rápido que seu antecessor. No entanto, por trás do brilho da medalha de prata existe uma realidade dura. Enquanto os participantes vivos da olimpíada resolviam problemas em duas sessões de quatro horas e meia, a inteligência artificial necessitou de vários dias de computação contínua para algumas provas.

Isso destaca o principal problema dos sistemas modernos: eles são colossalmente ineficientes em comparação com o cérebro humano. Vemos um exemplo clássico de colher frutos baixos da árvore. Sim, a IA aprendeu a trabalhar dentro dos marcos rigorosos das linguagens formais, mas ainda gasta recursos computacionais colossais onde um adolescente talentoso precisaria apenas de um pedaço de papel e um par de horas de reflexão.

A lacuna na eficiência energética entre a inteligência biológica e a digital permanece imensa. Por que isso é importante agora? Estamos testemunhando uma mudança fundamental na estratégia de desenvolvimento de IA.

A indústria percebeu que simplesmente escalar dados não fornece mais ganhos explosivos de qualidade em tarefas verdadeiramente complexas. O futuro pertence aos sistemas que conseguem raciocinar e verificar suas conclusões. O Google está essencialmente criando o que é chamado de Sistema 2 para IA — pensamento lento e deliberado que complementa o rápido e intuitivo Sistema 1 dos chatbots comuns.

Isso é crítico não apenas para a matemática pura, mas também para programação, cibersegurança e o design de sistemas de engenharia complexos, onde um único erro de um bit pode levar a uma catástrofe. No entanto, Demis Hassabis e sua equipe reconhecem honestamente: o processo de treinamento e operação desses modelos permanece difícil. Para que o AlphaProof funcione, os problemas devem ser traduzidos para a linguagem Lean manualmente — a IA ainda não consegue interpretar independentemente as condições do problema em linguagem natural com precisão suficiente.

Adquirimos uma ferramenta poderosa que ainda requer todo um exército de engenheiros tradutores para funcionar. Isso nos lembra os primeiros computadores, que ocupavam salas inteiras e exigiam cartões perfurados. O potencial é enorme, mas levará anos até que um matemático no seu bolso, capaz de fazer descobertas em tempo real, surja.

O resultado final: o Google DeepMind provou que a IA pode lidar com lógica de ordem superior sem erros, mas o preço dessa infalibilidade ainda é exorbitante. A empresa conseguirá acelerar radicalmente o raciocínio de seus sistemas até o final do ano?

ZK
Hamidun News
Notícias de AI sem ruído. Seleção editorial diária de mais de 400 fontes. Produto de Zhemal Khamidun, Head of AI na Alpina Digital.

Quer parar de ler sobre IA e começar a usar?

AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.

O que você acha?
Carregando comentários…