Qwen 2.5-Max: Alibaba alcançou Google enquanto você dormia
Alibaba представила Qwen 2.5-Max, свою самую мощную языковую модель. На тестах она идет вровень с Gemini 1.5 Pro и GPT-4o, а в программировании и логике местами

Мир ИИ привык к дуополии OpenAI и Google, но китайские инженеры из Alibaba Cloud решили, что пора менять правила игры. Без лишнего шума и пафосных презентаций компания выкатила свою самую мощную модель — Qwen 2.5-Max.
Если верить свежим бенчмаркам, мы получили полноценного конкурента Gemini 1.5 Pro и GPT-4o, который не просто «хорош для Китая», а объективно силен в мировом масштабе. Разработчики замахнулись на лидерство в самых сложных дисциплинах: математике, написании кода и логическом мышлении.
Чтобы понять масштаб события, стоит взглянуть на контекст. Линейка Qwen долгое время считалась крепким середняком, который отлично справлялся с локальными задачами, но пасовал перед флагманами из Долины. Все изменилось с выходом версии 2.
5. Alibaba применила архитектуру Mixture-of-Experts (MoE), которая позволяет модели быть одновременно огромной по знаниям и эффективной в вычислениях. В тестах MMLU и HumanEval новая Qwen 2.
5-Max показывает результаты, которые заставляют инженеров из Маунтин-Вью нервно проверять свои графики. Особенно впечатляет прогресс в программировании: модель справляется с архитектурными задачами, которые раньше были под силу только топовым версиям Claude. Китайский гигант не просто скопировал западные наработки, а оптимизировал их под реальные бизнес-задачи.
Qwen 2.5-Max поддерживает контекстное окно, позволяющее анализировать целые библиотеки кода или огромные финансовые отчеты. При этом Alibaba сохраняет агрессивную ценовую политику.
Доступ к API стоит в разы дешевле, чем у конкурентов, что делает модель крайне привлекательной для стартапов и крупных корпораций, которые умеют считать деньги. Это классический ход Alibaba: взять технологию, сделать её массовой и обрушить цены на рынке. Интересно, как быстро Qwen адаптируется к сложным языковым нюансам.
Если раньше китайские модели часто «галлюцинировали» при попытке рассуждать на темы, выходящие за рамки их обучающей выборки, то 2.5-Max демонстрирует поразительную стабильность. Она одинаково уверенно пишет стихи на мандаринском и отлаживает Python-скрипты.
Это ставит Google в неудобное положение: их Gemini 1.5 Pro долгое время считалась эталоном мультимодальности и логики, но теперь на пятки наступает игрок, у которого нет проблем с доступом к производственным мощностям и огромным массивам данных. Что это значит для индустрии в целом?
Мы входим в фазу, когда технологическое преимущество перестает быть эксклюзивом одной страны. Пока в США обсуждают регуляции и замедление темпов обучения новых моделей, в Ханчжоу просто наращивают стек. Qwen 2.
5-Max доказывает, что открытые и полуоткрытые модели (Open-weights) развиваются быстрее, чем закрытые экосистемы. Если завтра Alibaba решит выложить веса этой модели в открытый доступ, это может полностью перекроить ландшафт разработки ИИ-приложений по всему миру. Главное: Сможет ли Google удержать лидерство с выходом полноценной Gemini 2.
0, или китайские модели теперь будут задавать темп всей индустрии?