MIT News→ original

MIT Abre MathNet — La Mayor Colección de Problemas de Olimpiadas de Matemáticas del Mundo

MIT abre MathNet — la mayor colección abierta de problemas de olimpiadas de matemáticas del mundo. Incluye más de 30 mil problemas y soluciones de 47 países…

Procesado por IA desde MIT News; editado por Hamidun News
MIT Abre MathNet — La Mayor Colección de Problemas de Olimpiadas de Matemáticas del Mundo
Fuente: MIT News. Collage: Hamidun News.
◐ Escuchar artículo

El MIT ha abierto MathNet — la mayor colección abierta de problemas de Olimpíadas de Matemáticas hasta ahora, que es simultáneamente necesaria para investigadores de IA y escolares que se preparan para competiciones. La base de datos incluye más de 30.000 problemas y soluciones detalladas de las Olimpíadas Nacionales de Matemáticas de 47 países.

Para la industria, esta es una prueba más rigurosa del razonamiento matemático que los estándares convencionales en lengua inglesa. Para los estudiantes — una biblioteca unificada de problemas de alta calidad que antes estaban dispersos en colecciones en papel, foros y archivos personales. El proyecto fue creado por investigadores del MIT CSAIL, KAUST y la empresa HUMAIN.

Según el equipo, MathNet cubre 17 idiomas, 143 competiciones y aproximadamente cuatro décadas de matemáticas de Olimpíadas. Los autores tuvieron que recopilar 1.595 volúmenes en PDF con un total de más de 25.

000 páginas: desde documentos digitales modernos hasta escaneos antiguos que existían solo en colecciones personales durante años. Una parte sustancial del archivo provino de una colección privada de uno de los coautores, quien escaneaba manualmente compilaciones de Olimpíadas desde 2006. El conjunto de datos resultante, según el MIT, es aproximadamente cinco veces mayor que su análogo más cercano, ya ha sido puesto en acceso público y será presentado en la conferencia ICLR 2026 en Brasil.

La diferencia clave de MathNet no es solo la escala, sino también la calidad de las fuentes. Mientras que muchos conjuntos de datos matemáticos existentes fueron recopilados de foros como Art of Problem Solving, aquí los problemas se toman solo de compilaciones nacionales oficiales. Esto es importante porque las soluciones en tales materiales suelen ser escritas por expertos, se someten a verificación y a menudo exploran varios métodos de solución diferentes para un problema.

Además, la colección es mucho más amplia geográficamente: cubre seis continentes, incluye problemas de texto e imagen y no se limita a la tradición anglosajona y china. Para validación adicional, el equipo reunió a más de 30 revisores de diferentes países que verificaron conjuntamente miles de soluciones. Para investigadores, esta es una oportunidad de entrenar modelos en una cultura matemática más diversa, en lugar de en un conjunto estrecho de formulaciones familiares.

Como estándar de referencia para IA, MathNet proporciona resultados bastante incómodos incluso para modelos fuertes. En el conjunto principal de 6.400 problemas, GPT-5 mostró aproximadamente el 69,3%, lo que significa que falló en casi un tercio de los problemas de nivel olímpico.

Cuando el problema contiene ilustraciones, los resultados de los modelos caen aún más notablemente, lo que apunta a una debilidad persistente en el razonamiento visual. El equipo también probó cómo los modelos funcionan con idiomas menos comunes: varios sistemas de código abierto obtuvieron 0 puntos en problemas en mongol. Por separado, los investigadores añadieron un estándar de recuperación, donde es necesario reconocer la similitud estructural entre dos problemas.

Incluso los mejores modelos de incrustación encontraron la coincidencia correcta al primer intento en solo aproximadamente el 5% de los casos. Esto es importante no solo para la IA, sino para las propias Olimpíadas: problemas similares en esencia ya han aparecido en exámenes reales, y rastrear equivalentes matemáticos a través de diferentes idiomas, notaciones y formatos es extremadamente difícil incluso para expertos. Otra prueba mostró que la generación aumentada por recuperación realmente ayuda, pero solo si el problema sugerido es realmente similar en estructura: para DeepSeek-V3.

2-Speciale la mejora alcanzó hasta 12 puntos porcentuales, mientras que las sugerencias irrelevantes empeoraron el resultado en aproximadamente el 22% de los casos. El significado práctico de MathNet va más allá de la IA académica. Para estudiantes y profesores, este es un caso raro donde materiales de Olimpíadas de alta calidad de docenas de países se recopilan en un solo lugar y se estandarizan.

Para desarrolladores de modelos, este es un recordatorio de que las afirmaciones audaces sobre matemáticas "casi resueltas" aún son prematuras: tan pronto como los problemas se vuelven verdaderamente internacionales, multimodales y menos estandarizados, la brecha de calidad sigue siendo claramente visible. Es por eso que MathNet podría convertirse en una de las pruebas más útiles para el verdadero pensamiento matemático de modelos en los próximos años y simultáneamente en una de las bibliotecas abiertas más valiosas para prepararse para Olimpíadas de Matemáticas.

ZK
Hamidun News
Noticias de AI sin ruido. Selección editorial diaria de más de 400 fuentes. Producto de Zhemal Khamidun, Head of AI en Alpina Digital.

¿Quieres dejar de leer sobre IA y empezar a usarla?

AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.

¿Qué te parece?
Cargando comentarios…