Anthropic представила Claude Opus 4.8 с улучшениями для кодирования и агентских задач
Anthropic выпустила Claude Opus 4.8 — обновление Opus 4.7 с улучшениями в кодировании, агентских задачах и длительной работе. Новая модель превосходит GPT-5.5 н

Anthropic представила Claude Opus 4.8 — обновление флагманской модели с улучшенным суждением для агентских задач. Модель доступна по той же цене, что и Opus 4.7, и работает в системе с новыми фишками claude.ai и Claude Code.
Три новых фишки вместе с
Opus 4.8 Помимо самой модели, Anthropic запустила инструменты для лучшего контроля: На claude.ai — слайдер для контроля effort: от быстрого режима до глубокого анализа Claude Code получил Dynamic Workflows для решения очень больших задач (на дни работы) * Fast Mode для Opus 4.8 теперь в три раза дешевле и работает в 2.5× быстрее обычного На стандартных бенчмарках кодирования, рассуждений и практических задач Opus 4.8 опережает Opus 4.7 и конкурирует с GPT-5.5.
Что показали тесты Opus 4.8 уникальна своей надёжностью на длительных задачах.
На бенчмарке Super-Agent она — единственная модель, завершившая все задачи end-to-end и обыгравшая Opus 4.7 и GPT-5.5. На CursorBench (тест редактора кода) модель превышает все уровни сложности, вызывая инструменты эффективнее. На Legal Agent Benchmark Opus 4.8 — первая модель, перешедшая рубеж 10% на all-pass standard. Это значит, что юрист может теперь доверить ей более сложную работу. На Online-Mind2Web (браузер-агенты) модель набрала 84% — заметный прыжок над Opus 4.7 и GPT-5.5.
Что говорят разработчики
Инженеры на Devin отметили, что Opus 4.8 работает с инструментами чище и следует инструкциям с нужной для автономной работы последовательностью. Модель исправила проблемы многословности, которые были в 4.7.
«Opus 4.8 — это качественное обновление: быстрее, легче сотрудничать, и лучше держит контекст и стиль на протяжении долгой сессии», — говорит один из ранних тестеров.
Команда CoCounsel видит, что Opus 4.8 дает лучше рассуждений в сложных анализах и быстрее завершает работу с более плотными результатами. На Super-Agent бенчмарке модель доказала, что может вести длительные рабочие потоки без ошибок и без человеческого вмешательства.
Что это значит
Opus 4.8 — это не просто версионный апдейт, но сигнал того, что базовые модели развиваются очень быстро. За один квартал Anthropic сделала её практически полезнее для коммерческих агентов: агенты Devin надежнее, юристы делегируют больше, инженеры экономят время на ревью кода. Для бизнеса это значит, что инвестиции в AI-инструменты становятся выгоднее.