Habr AI→ оригинал

ChatGPT 5.2 Pro против Gemini 3 Pro: кто из них на самом деле умеет думать?

Мы дождались эпохи, когда ИИ перестал просто угадывать слова и начал по-настоящему рассуждать. В недавнем тесте ChatGPT 5.2 Pro и Gemini 3 Pro решали восемь сло

ChatGPT 5.2 Pro против Gemini 3 Pro: кто из них на самом деле умеет думать?
Источник: Habr AI. Коллаж: Hamidun News.

Помните те славные времена, когда ChatGPT не мог перемножить два трехзначных числа, не превратившись в генератор случайных цифр? Забудьте. Мы вошли в эпоху, где нейросети спорят за звание лучшего математика-олимпийца, а мы лишь лениво наблюдаем за тем, как они жонглируют интегралами и геометрическими инверсиями. Выход ChatGPT 5.2 Pro и Gemini 3 Pro ознаменовал собой окончательный переход индустрии от «угадывания следующего слова» к полноценному планированию и логическому выводу. Это уже не просто чат-боты, это полноценные движки рассуждений, способные методично жевать одну задачу, пока не найдут элегантное решение.

OpenAI со своей версией 5.2 Pro явно метит в глубокий научный сектор. После того как предыдущие итерации моделей научились сносно писать код, возник фундаментальный вопрос: а что у нас с «System 2 thinking» — тем самым медленным, осознанным процессом мышления? Google в ответ выкатила Gemini 3 Pro, обещая, что их модель понимает контекст и многослойные логические связи лучше конкурентов. Мы решили проверить это на практике, подсунув им восемь задач, которые заставили бы попотеть даже выпускника престижного технического вуза. Никакого доступа к поиску — только голая вычислительная мощь и умение писать Python-скрипты на лету для верификации своих догадок.

Результаты этого противостояния оказались крайне показательны для будущего всей индустрии. ChatGPT 5.2 Pro демонстрирует пугающую стабильность в построении длинных цепочек рассуждений. Он больше не бросается выдавать ответ мгновенно, имитируя человеческую интуицию. Модель берет паузу, строит внутреннее дерево решений и, что самое важное, умеет находить ошибки в собственных выкладках до того, как представит их пользователю. Это критический навык для использования ИИ в реальном программировании или проектировании сложных систем, где цена ошибки слишком велика.

Gemini 3 Pro, в свою очередь, показал себя как невероятно эрудированный, но иногда излишне торопливый студент. В задачах на комбинаторику и чистую алгебру модель от Google была великолепна, иногда находя решения быстрее конкурента. Однако, как только дело доходило до задач с «двойным дном» или сложных геометрических построений, Gemini начинала срезать углы. Там, где ChatGPT 5.2 Pro терпеливо проверял каждый шаг через код, Gemini иногда полагалась на вероятностные паттерны, что приводило к досадным промахам в финальных расчетах. Это классическая проблема баланса между скоростью генерации и глубиной проработки.

Что это значит для рынка в ближайшей перспективе? Мы на пороге того, что ИИ станет полноценным партнером в R&D-отделах крупных компаний. Если модель может безошибочно решить олимпиадную задачу по математике, она сможет оптимизировать логистические цепочки, искать уязвимости в смарт-контрактах или помогать в дизайне микросхем с той же дотошностью. Разрыв между «творческим» ИИ, который пишет стихи, и «аналитическим» ИИ, который считает налоги, окончательно сократился. Теперь вопрос не в том, может ли нейросеть считать, а в том, как скоро мы доверим ей доказательство гипотез, над которыми человечество билось десятилетиями.

Главное: ChatGPT 5.2 Pro пока удерживает корону в дисциплине чистой логики благодаря продвинутым механизмам самопроверки, но Google сократила отставание до минимума. Станет ли 2026 год временем, когда ИИ совершит первое самостоятельное математическое открытие?

ЖХ
Hamidun News
AI‑новости без шума. Ежедневный редакторский отбор из 400+ источников. Продукт Жемала Хамидуна, Head of AI в Alpina Digital.
Загружаем комментарии…