Habr AI→ original

Epoch AI: 14 tarefas que ninguém conseguiu resolver (ainda)

Lembra daqueles tempos gloriosos quando brincávamos com redes neurais que não conseguiam somar dois números de três dígitos sem alucinar? Esses tempos…

Processado por IA de Habr AI; editado por Hamidun News
Epoch AI: 14 tarefas que ninguém conseguiu resolver (ainda)
Fonte: Habr AI. Colagem: Hamidun News.
◐ Ouvir artigo

Lembra daqueles tempos gloriosos quando brincávamos com redes neurais que não conseguiam somar dois números de três dígitos sem alucinar? Esses tempos terminaram oficialmente. Passamos rapidamente da era do "veja como é engraçado o robô escreve poesia" para a era do "veja como o algoritmo tenta quebrar o fundamento do universo".

Ainda em meados de 2024, o GPT-4 tropeçava em problemas de nível de ensino médio, mas até o final de 2025, novos modelos começaram a resolver problemas de olimpíada como se fossem fáceis. Mas as olimpíadas ainda são problemas com respostas conhecidas. Pesquisadores da Epoch AI decidiram que era hora de parar de dar cola para redes neurais e lançaram o FrontierMath.

Esta é uma lista de 14 problemas que ninguém no planeta resolveu.

A essência do projeto FrontierMath é testar a capacidade da IA de gerar conhecimento fundamentalmente novo. Estes não são exercícios de livros didáticos que podem ser encontrados em conjuntos de dados de treinamento. Cada um desses quatorze problemas foi formulado por um cientista pesquisador ativo, cada um foi tentado por pelo menos dois profissionais de alto nível, e cada um é digno de publicação em uma revista científica de destaque. Não há dicas na internet e não há algoritmos prontos. Estas são "manchas brancas" no mapa da matemática moderna que foram ignoradas por décadas ou simplesmente não puderam ser superadas pelas mentes humanas.

Vamos mergulhar nos detalhes para entender a escala do desafio. Um dos problemas diz respeito ao grupo de Mathieu M23. Matemáticos adoram simetrias, mas grupos esporádicos são "monstros matemáticos" que não se encaixam em nenhuma série geral.

Para a maioria deles, cientistas já encontraram polinômios com os correspondentes grupos de Galois, mas M23 permanece o último bastião, uma lacuna em pesquisas que estão em andamento há muitos anos. Encontrar este polinômio significaria fechar um capítulo inteiro da álgebra. Outro problema parece mais simples apenas à primeira vista: você precisa criar um algoritmo que determine se um nó pode ser desatado em um único movimento.

Topologistas chamam isso de "número de desatamento igual a um". Esta é uma questão fundamental na topologia de baixa dimensão que ainda não tem uma resposta clara.

Por que isso é importante agora? A indústria de IA chegou a um ponto em que simplesmente aumentar a quantidade de dados não produz mais um crescimento explosivo na qualidade. Treinamos modelos para imitar a fala humana e compilar conhecimento existente, mas ainda estamos esperando pelo momento em que uma rede neural faz uma descoberta científica.

Se um modelo resolver nem que seja um destes problemas, não será simplesmente uma "realização tecnológica". Será um resultado científico completo que vai para uma revista revisada por pares não por causa do hype da IA, mas por causa do valor da solução em si. Estamos falando sobre transformar a IA de um mecanismo de busca avançado em um colega de pesquisa de pleno direito.

A conexão com eventos anteriores é claramente rastreável aqui. Depois que os modelos começaram a vencer massivamente testes como MATH ou GSM8K, ficou claro que precisamos de novos instrumentos de medição. FrontierMath é uma tentativa de encontrar o limite onde a memória termina e a inteligência começa. Este é um desafio não apenas para OpenAI ou Anthropic, mas para todo o conceito de escalabilidade. Agora não é o suficiente ter o maior cluster de GPUs; você precisa de um algoritmo capaz de raciocínio lógico profundo em condições de incerteza total. Este é um teste de resistência para todas as promessas sobre "IA forte" ou AGI.

O que isso significa para nós? Estamos à beira de uma situação em que a IA poderia se tornar a chave para resolver problemas em ciência dos materiais, criptografia ou física quântica através da matemática. Se uma rede neural conseguir com topologia de nós ou grupos de Mathieu, ela será capaz de projetar novas moléculas ou otimizar cadeias de suprimentos em um nível inacessível aos humanos. Isso significaria que finalmente obtemos uma ferramenta que é mais inteligente que nós nas áreas abstratas mais complexas. E a ironia aqui é que talvez não entendamos imediatamente como exatamente a IA chegou à solução, mas o resultado mudará nossa realidade física.

O ponto principal: FrontierMath é o chefe final para a geração atual de redes neurais. Será que algo como GPT-5 ou Claude 4 conseguirá ultrapassar essa barreira, ou teremos que esperar por arquiteturas fundamentalmente novas?

ZK
Hamidun News
Notícias de AI sem ruído. Seleção editorial diária de mais de 400 fontes. Produto de Zhemal Khamidun, Head of AI na Alpina Digital.

Quer parar de ler sobre IA e começar a usar?

AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.

O que você acha?
Carregando comentários…