MarkTechPost→ оригинал

Anthropic sort Claude Opus 4.7 pour la programmation d'agents, la vision et les tâches autonomes

Anthropic a lancé Claude Opus 4.7 — une mise à jour directe d'Opus 4.6 axée sur la programmation d'agents, la vision et les tâches autonomes longues. Le modèle

Anthropic sort Claude Opus 4.7 pour la programmation d'agents, la vision et les tâches autonomes
Источник: MarkTechPost. Коллаж: Hamidun News.

Anthropic 16 апреля 2026 года выпустила Claude Opus 4.7 — точечное, но очень заметное обновление флагманской модели, которое бьет не по абстрактным бенчмаркам, а по практическим болям разработчиков: агентному программированию, работе с детализированными изображениями и длинным автономным задачам, где модель должна не просто отвечать, а планировать, проверять себя и доводить процесс до конца. Компания позиционирует Opus 4.

7 как прямой апгрейд Opus 4.6, а не новую линейку. Но именно в инженерных сценариях разница оказалась существенной.

По словам Anthropic, модель лучше следует инструкциям, аккуратнее обращается с многошаговыми процессами и чаще сама находит способ проверить результат перед тем, как вернуть его пользователю. Это особенно важно для среды, где ИИ не пишет один фрагмент кода по запросу, а действует как полуавтономный исполнитель: читает репозиторий, запускает инструменты, исправляет ошибки, продолжает работу после сбоев и держит в памяти промежуточные решения. На бенчмарках Anthropic и партнеров прирост выглядит не косметическим.

На внутреннем 93-задачном бенчмарке по программированию Opus 4.7 улучшила показатель решенных задач на 13% относительно Opus 4.6, включая четыре задания, с которыми не справились ни Opus 4.

6, ни Sonnet 4.6. В CursorBench модель показала 70% против 58% у предыдущей версии.

В кейсах Notion для сложных многошаговых процессов прирост составил 14% при меньшем расходе токенов и втрое меньшем числе ошибок при вызове инструментов. Rakuten отдельно заявляет, что на Rakuten-SWE-Bench новая модель закрывает в три раза больше production-задач, чем Opus 4.6.

Второй крупный апгрейд — зрение. Claude Opus 4.7 умеет принимать изображения до 2576 пикселей по длинной стороне, то есть примерно до 3,75 мегапикселя.

Это больше чем втрое выше лимита предыдущих моделей Claude. Для обычного чат-режима такая цифра кажется второстепенной, но для агентных сценариев это критично: модель может разбирать плотные скриншоты интерфейсов, технические диаграммы, схемы, химические структуры и документы, где важны мелкие элементы. Anthropic приводит пример из области computer use: на визуальном бенчмарке XBOW новая версия набрала 98,5% против 54,5% у Opus 4.

6. Фактически это переводит ряд задач из категории «иногда работает» в категорию «можно встраивать в продукт». Anthropic также усилила инструменты для длинного автономного выполнения.

У Opus 4.7 появился новый уровень reasoning effort — xhigh, расположенный между high и max. В API компания запустила публичную бету task budgets, чтобы разработчики могли ограничивать токеновый бюджет на длинных прогонах и управлять приоритетом шагов.

В Claude Code появился режим ultrareview для более глубокого ревью изменений, а auto mode теперь позволяет реже прерывать длинные задачи запросами разрешений. При этом миграция с Opus 4.6 не полностью бесплатна: обновленный токенизатор может увеличивать число входных токенов примерно в 1,0–1,35 раза в зависимости от типа контента, а более глубокое рассуждение на поздних этапах агентных задач повышает объем выходных токенов.

Отдельно Anthropic подчеркивает тему безопасности. Opus 4.7 выходит вскоре после анонса Mythos Preview — более мощной модели, доступ к которой компания решила ограничить из-за рисков в кибербезопасности.

Поэтому Opus 4.7 стала первой публичной моделью, на которой Anthropic обкатывает автоматические блокировки для высокорисковых cyber-запросов. Для легитимных сценариев вроде pentest, red teaming и исследований уязвимостей компания параллельно открыла программу верификации.

По собственным оценкам Anthropic, профиль безопасности Opus 4.7 в целом близок к 4.6: модель стала лучше по честности и устойчивости к prompt injection, хотя по отдельным категориям неидеальна и все еще уступает Mythos Preview по общей выверенности поведения.

Главный вывод простой: Claude Opus 4.7 — не новое поколение ради нового номера, а прагматичный релиз для тех, кто строит поверх модели реальные рабочие процессы. Если твой сценарий — это IDE-ассистент, агент для ревью кода, документный анализ, компьютерное зрение по интерфейсам или длинные цепочки действий с инструментами, обновление выглядит значимым уже сейчас.

Для массового пользователя разница может быть не всегда очевидна, но для разработчиков и команд, которые меряют качество не демо, а количеством доведенных до конца задач, Opus 4.7 выглядит как один из самых полезных апдейтов Anthropic за последнее время.

ЖХ
Hamidun News
AI‑новости без шума. Ежедневный редакторский отбор из 400+ источников. Продукт Жемала Хамидуна, Head of AI в Alpina Digital.
Загружаем комментарии…