MarkTechPost→ оригинал

Z.ai выпустила GLM-5.2: реальный миллион токенов и два уровня глубокого обдумывания

Z.ai выпустила GLM-5.2 — кодовую модель с реальным контекстным окном в 1 миллион токенов и двумя режимами обдумывания: High и Max. Модель сразу встраивается…

AI-обработка оригинала MarkTechPost; редакция Hamidun News
Z.ai выпустила GLM-5.2: реальный миллион токенов и два уровня глубокого обдумывания
Источник: MarkTechPost. Коллаж: Hamidun News.
◐ Слушать статью

Z.ai выпустила GLM-5.2 — обновлённую кодовую модель с реально работающим контекстным окном в миллион токенов, двумя режимами глубокого обдумывания и мгновенной интеграцией в популярные инструменты разработки.

Миллион токенов: «usable» — это принципиально

Длинные контекстные окна давно превратились в стандартную строчку маркетинговых описаний. Заявить миллион токенов несложно — куда сложнее обеспечить, чтобы модель действительно с ними работала. Большинство конкурентов деградируют у границы лимита: «теряют» информацию из середины длинного документа, начинают игнорировать ранние инструкции или выдают заметно менее точные ответы. Z.ai намеренно вынесла слово «usable» в описание релиза. Это значит, что команда ставит именно на реальную обработку всего контекста, а не на цифру в спецификации. Для разработчиков это открывает конкретные сценарии: загрузить в один запрос крупную кодовую базу целиком, несколько длинных документов сразу или полную историю обсуждений в issue-трекере — и работать с ними без потери контекста.

Два уровня «думания»

Вместо единственного режима генерации GLM-5.2 предлагает два уровня усилий: High — сбалансированный режим для повседневных задач: быстро, точно, без лишних затрат вычислений Max — расширенное обдумывание: модель строит внутреннюю цепочку рассуждений перед ответом, что даёт больше глубины в сложных задачах Подобный подход уже знаком по продуктам OpenAI (серия o1/o3) и Anthropic (extended thinking в Claude 3.7). Преимущество GLM-5.2 — оба режима доступны в одной модели через один endpoint, без переключения между версиями. High удобен для рефакторинга и автодополнения, Max — для архитектурного ревью, написания тестов и дебаггинга запутанных ошибок.

Интеграция за минуты GLM-5.2 поставляется через Anthropic-совместимый API-формат.

Для разработчика, уже использующего один из поддерживаемых инструментов, подключение занимает минуты — никаких адаптеров или переписывания логики: Claude Code — terminal-first AI-ассистент от Anthropic Cline — популярный open-source агент внутри VS Code * OpenClaw — многоагентная платформа самой Z.ai Релиз охватывает все тарифные планы GLM Coding Plan без исключений. Никаких waitlist'ов или программ приоритетного доступа.

Без бенчмарков — пока Z.ai не опубликовала стандартных оценок вместе с релизом.

Для рынка, где принято открывать анонс таблицами сравнения на HumanEval, MMLU и Codeforces, это нетипичный ход. Взамен компания обещает открытые MIT-веса уже в течение следующей недели. Когда веса выйдут, независимые исследователи смогут проверить возможности модели самостоятельно, без опоры на цифры из пресс-релиза. Это либо сигнал уверенности в результатах, либо сознательный выбор не раскрывать детали до выхода открытой версии.

Что это значит GLM-5.2 появляется в рабочем окружении разработчика без

трения: один endpoint, два режима мышления, большой реальный контекст. Z.ai продолжает занимать позицию между закрытыми коммерческими моделями и open-source сообществом — и MIT-веса через неделю сделают её доступной для локального развёртывания без каких-либо ограничений.

ЖХ
Hamidun News
AI‑новости без шума. Ежедневный редакторский отбор из 400+ источников. Продукт Жемала Хамидуна, Head of AI в Alpina Digital.

Хотите не читать про ИИ, а внедрить его?

«AI News» — это полезные новости из мира ИИ. Системно научиться работать с нейросетями и применять их в работе — в Hamidun Academy.

Что вы думаете?
Загружаем комментарии…