MarkTechPost→ оригинал

Anthropic выпустила Claude Opus 4.7 для агентного программирования, зрения и автономных задач

Anthropic выпустила Claude Opus 4.7 — прямое обновление Opus 4.6 с упором на агентное программирование, зрение и длинные автономные задачи. Модель заметно сильн

Anthropic выпустила Claude Opus 4.7 для агентного программирования, зрения и автономных задач
Источник: MarkTechPost. Коллаж: Hamidun News.

Anthropic 16 апреля 2026 года выпустила Claude Opus 4.7 — точечное, но очень заметное обновление флагманской модели, которое бьет не по абстрактным бенчмаркам, а по практическим болям разработчиков: агентному программированию, работе с детализированными изображениями и длинным автономным задачам, где модель должна не просто отвечать, а планировать, проверять себя и доводить процесс до конца. Компания позиционирует Opus 4.

7 как прямой апгрейд Opus 4.6, а не новую линейку. Но именно в инженерных сценариях разница оказалась существенной.

По словам Anthropic, модель лучше следует инструкциям, аккуратнее обращается с многошаговыми процессами и чаще сама находит способ проверить результат перед тем, как вернуть его пользователю. Это особенно важно для среды, где ИИ не пишет один фрагмент кода по запросу, а действует как полуавтономный исполнитель: читает репозиторий, запускает инструменты, исправляет ошибки, продолжает работу после сбоев и держит в памяти промежуточные решения. На бенчмарках Anthropic и партнеров прирост выглядит не косметическим.

На внутреннем 93-задачном бенчмарке по программированию Opus 4.7 улучшила показатель решенных задач на 13% относительно Opus 4.6, включая четыре задания, с которыми не справились ни Opus 4.

6, ни Sonnet 4.6. В CursorBench модель показала 70% против 58% у предыдущей версии.

В кейсах Notion для сложных многошаговых процессов прирост составил 14% при меньшем расходе токенов и втрое меньшем числе ошибок при вызове инструментов. Rakuten отдельно заявляет, что на Rakuten-SWE-Bench новая модель закрывает в три раза больше production-задач, чем Opus 4.6.

Второй крупный апгрейд — зрение. Claude Opus 4.7 умеет принимать изображения до 2576 пикселей по длинной стороне, то есть примерно до 3,75 мегапикселя.

Это больше чем втрое выше лимита предыдущих моделей Claude. Для обычного чат-режима такая цифра кажется второстепенной, но для агентных сценариев это критично: модель может разбирать плотные скриншоты интерфейсов, технические диаграммы, схемы, химические структуры и документы, где важны мелкие элементы. Anthropic приводит пример из области computer use: на визуальном бенчмарке XBOW новая версия набрала 98,5% против 54,5% у Opus 4.

6. Фактически это переводит ряд задач из категории «иногда работает» в категорию «можно встраивать в продукт». Anthropic также усилила инструменты для длинного автономного выполнения.

У Opus 4.7 появился новый уровень reasoning effort — xhigh, расположенный между high и max. В API компания запустила публичную бету task budgets, чтобы разработчики могли ограничивать токеновый бюджет на длинных прогонах и управлять приоритетом шагов.

В Claude Code появился режим ultrareview для более глубокого ревью изменений, а auto mode теперь позволяет реже прерывать длинные задачи запросами разрешений. При этом миграция с Opus 4.6 не полностью бесплатна: обновленный токенизатор может увеличивать число входных токенов примерно в 1,0–1,35 раза в зависимости от типа контента, а более глубокое рассуждение на поздних этапах агентных задач повышает объем выходных токенов.

Отдельно Anthropic подчеркивает тему безопасности. Opus 4.7 выходит вскоре после анонса Mythos Preview — более мощной модели, доступ к которой компания решила ограничить из-за рисков в кибербезопасности.

Поэтому Opus 4.7 стала первой публичной моделью, на которой Anthropic обкатывает автоматические блокировки для высокорисковых cyber-запросов. Для легитимных сценариев вроде pentest, red teaming и исследований уязвимостей компания параллельно открыла программу верификации.

По собственным оценкам Anthropic, профиль безопасности Opus 4.7 в целом близок к 4.6: модель стала лучше по честности и устойчивости к prompt injection, хотя по отдельным категориям неидеальна и все еще уступает Mythos Preview по общей выверенности поведения.

Главный вывод простой: Claude Opus 4.7 — не новое поколение ради нового номера, а прагматичный релиз для тех, кто строит поверх модели реальные рабочие процессы. Если твой сценарий — это IDE-ассистент, агент для ревью кода, документный анализ, компьютерное зрение по интерфейсам или длинные цепочки действий с инструментами, обновление выглядит значимым уже сейчас.

Для массового пользователя разница может быть не всегда очевидна, но для разработчиков и команд, которые меряют качество не демо, а количеством доведенных до конца задач, Opus 4.7 выглядит как один из самых полезных апдейтов Anthropic за последнее время.

ЖХ
Hamidun News
AI‑новости без шума. Ежедневный редакторский отбор из 400+ источников. Продукт Жемала Хамидуна, Head of AI в Alpina Digital.
Загружаем комментарии…