MIT News→ original

MIT Abre MathNet — Maior Conjunto de Problemas de Olimpíadas de Matemática do Mundo

MIT abre MathNet — o maior conjunto aberto de problemas de olimpíadas de matemática do mundo. Inclui mais de 30 mil problemas e soluções de 47 países, 17…

Processado por IA de MIT News; editado por Hamidun News
MIT Abre MathNet — Maior Conjunto de Problemas de Olimpíadas de Matemática do Mundo
Fonte: MIT News. Colagem: Hamidun News.
◐ Ouvir artigo

O MIT abriu o MathNet — a maior coleção aberta de problemas de Olimpíadas de Matemática até agora, que é simultaneamente necessária para pesquisadores de IA e estudantes se preparando para competições. O banco de dados inclui mais de 30 mil problemas e soluções detalhadas de Olimpíadas Nacionais de Matemática de 47 países. Para a indústria, este é um teste mais rigoroso de raciocínio matemático do que os benchmarks convencionais em inglês.

Para os alunos — uma biblioteca unificada de problemas de alta qualidade que antes estavam espalhados por coleções em papel, fóruns e arquivos pessoais. O projeto foi criado por pesquisadores do MIT CSAIL, KAUST e pela empresa HUMAIN. De acordo com a equipe, o MathNet cobre 17 idiomas, 143 competições e aproximadamente quatro décadas de matemática de Olimpíada.

Os autores tiveram que coletar 1.595 volumes em PDF com um total de mais de 25 mil páginas: desde documentos digitais modernos até scans antigos que existiam apenas em coleções pessoais há anos. Uma parte substancial do arquivo veio de uma coleção privada de um dos coautores, que digitalizava manualmente compilações de Olimpíadas desde 2006.

O conjunto de dados resultante, segundo o MIT, é aproximadamente cinco vezes maior que o análogo mais próximo, já foi disponibilizado publicamente e será apresentado na conferência ICLR 2026 no Brasil. A principal diferença do MathNet não é apenas na escala, mas também na qualidade das fontes. Enquanto muitos conjuntos de dados matemáticos existentes foram coletados de fóruns como Art of Problem Solving, aqui os problemas são retirados apenas de compilações nacionais oficiais.

Isso é importante porque as soluções nesses materiais geralmente são escritas por especialistas, passam por verificação e muitas vezes exploram vários métodos de solução diferentes para um problema. Além disso, a coleção é muito mais ampla geograficamente: cobre seis continentes, inclui problemas textuais e visuais e não está limitada às tradições em inglês e chinês. Para validação adicional, a equipe reuniu um grupo de mais de 30 revisores de diferentes países que verificaram conjuntamente milhares de soluções.

Para pesquisadores, esta é uma oportunidade de treinar modelos em uma cultura matemática mais diversa, em vez de em um conjunto restrito de formulações familiares. Como benchmark para IA, o MathNet oferece resultados bastante desconfortáveis até para modelos fortes. No conjunto principal de 6.

400 problemas, o GPT-5 mostrou aproximadamente 69,3%, o que significa que ele falhou em quase um terço dos problemas de nível olímpico. Quando o problema contém ilustrações, os resultados dos modelos caem ainda mais notavelmente, indicando fraqueza persistente no raciocínio visual. A equipe também testou como os modelos funcionam com idiomas menos comuns: vários sistemas de código aberto marcaram 0% em problemas em mongol.

Separadamente, os pesquisadores adicionaram um benchmark de recuperação, onde é necessário reconhecer a similaridade estrutural entre dois problemas. Até mesmo os melhores modelos de embedding encontraram a correspondência correta na primeira tentativa em apenas cerca de 5% dos casos. Isso é importante não apenas para IA, mas para as próprias Olimpíadas: problemas semelhantes em essência já apareceram em exames reais e rastrear equivalentes matemáticos entre diferentes idiomas, notações e formatos é extremamente difícil até para especialistas.

Outro teste mostrou que a geração aumentada por recuperação realmente ajuda, mas apenas se o problema sugerido for realmente próximo em estrutura: para o DeepSeek-V3.2-Speciale a melhoria atingiu até 12 pontos percentuais, enquanto dicas irrelevantes pioraram o resultado em aproximadamente 22% dos casos. O significado prático do MathNet se estende além da IA acadêmica.

Para estudantes e professores, este é um caso raro em que materiais de alta qualidade de Olimpíadas de dezenas de países são coletados em um único lugar e padronizados. Para desenvolvedores de modelos, este é um lembrete de que as declarações ousadas sobre matemática "quase resolvida" ainda são prematuras: assim que os problemas se tornam verdadeiramente internacionais, multimodais e menos padronizados, a lacuna de qualidade ainda é claramente visível. Por isso, o MathNet pode se tornar um dos testes mais úteis para o verdadeiro pensamento matemático de modelos nos próximos anos e simultaneamente uma das bibliotecas abertas mais valiosas para se preparar para Olimpíadas de Matemática.

ZK
Hamidun News
Notícias de AI sem ruído. Seleção editorial diária de mais de 400 fontes. Produto de Zhemal Khamidun, Head of AI na Alpina Digital.

Quer parar de ler sobre IA e começar a usar?

AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.

O que você acha?
Carregando comentários…