Epoch AI: 14 tâches que personne n'a résolu (pour le moment)
Исследователи из Epoch AI выкатили FrontierMath — набор из 14 фундаментальных задач, у которых на данный момент нет решения. Это не школьные примеры, а вопросы

Помните те славные времена, когда мы подшучивали над нейросетями, которые не могли сложить два трехзначных числа без галлюцинаций? Эти времена официально закончились. Мы стремительно перешли из эры «посмотри, как забавно робот пишет стихи» в эру «посмотри, как алгоритм пытается взломать фундамент мироздания». Еще в середине 2024 года GPT-4 спотыкалась на задачах уровня средней школы, а уже к концу 2025-го новые модели начали щелкать олимпиадные задачи как орехи. Но олимпиады — это все еще задачи с известными ответами. Исследователи из Epoch AI решили, что пора перестать давать нейросетям шпаргалки, и выкатили FrontierMath. Это список из 14 задач, которые не решил вообще никто на планете.
Суть проекта FrontierMath в том, чтобы проверить способность ИИ к генерации принципиально нового знания. Это не упражнения из учебников, которые можно найти в обучающей выборке. Каждую из этих четырнадцати задач формулировал действующий ученый-практик, каждую пытались решить минимум двое профессионалов высокого уровня, и каждая из них достойна публикации в ведущем научном журнале. Здесь нет подсказок в интернете и нет готовых алгоритмов. Это «белые пятна» на карте современной математики, которые десятилетиями игнорировали или просто не могли преодолеть человеческие умы.
Давайте заглянем в детали, чтобы понять масштаб вызова. Одна из задач касается группы Матьё M23. Математики обожают симметрии, но спорадические группы — это такие «математические чудовища», которые не вписываются ни в какие общие серии. Для большинства из них ученые уже нашли полиномы с соответствующими группами Галуа, но M23 остается последним бастионом, пробелом в исследовании, которое ведут уже много лет. Найти этот полином — значит закрыть целую главу в алгебре. Другая задача кажется проще только на первый взгляд: нужно придумать алгоритм, определяющий, можно ли развязать узел за одно движение. Топологи называют это «unknotting number равный единице». Это фундаментальный вопрос низкоразмерной топологии, на который до сих пор нет внятного ответа.
Почему это важно именно сейчас? Индустрия ИИ подошла к моменту, когда простое увеличение количества данных больше не дает взрывного роста качества. Мы научили модели имитировать человеческую речь и компилировать существующие знания, но мы все еще ждем момента, когда нейросеть совершит научное открытие. Если модель решит хотя бы одну из этих задач, это не будет просто «достижением технологий». Это станет полноценным научным результатом, который пойдет в рецензируемый журнал не из-за хайпа вокруг ИИ, а из-за ценности самого решения. Мы говорим о трансформации ИИ из продвинутого поисковика в полноценного коллегу-исследователя.
Связь с предыдущими событиями здесь прослеживается четко. После того как модели начали массово побеждать в тестах типа MATH или GSM8K, стало ясно, что нам нужны новые инструменты измерения. FrontierMath — это попытка нащупать границу, где заканчивается память и начинается интеллект. Это вызов не только для OpenAI или Anthropic, но и для всей концепции масштабирования. Теперь мало иметь самый большой кластер видеокарт, нужно иметь алгоритм, способный к глубокому логическому выводу в условиях полной неопределенности. Это проверка на прочность для всех обещаний о «сильном ИИ» или AGI.
Что это значит для нас? Мы стоим на пороге ситуации, когда ИИ может стать ключом к решению проблем в материаловедении, криптографии или квантовой физике через математику. Если нейросеть справится с топологией узлов или группами Матьё, она сможет проектировать новые молекулы или оптимизировать логистические цепочки на уровне, недоступном человеку. Это будет означать, что мы наконец-то получили инструмент, который умнее нас в самых сложных абстрактных областях. И ирония здесь в том, что мы можем даже не сразу понять, как именно ИИ пришел к решению, но результат изменит нашу физическую реальность.
Главное: FrontierMath — это финальный босс для текущего поколения нейросетей. Сможет ли условная GPT-5 или Claude 4 взять этот барьер, или нам придется ждать принципиально новых архитектур?