أطلقت Anthropic Opus 4.7، وحولت OpenAI Codex إلى وكيل للعمل على الحاسوب
وضعت Anthropic Opus 4.7 كرائد في المهام المعقدة للوكلاء وأطلقت Claude Design مباشرة، بينما حولت OpenAI Codex إلى وكيل حاسوب مع السيطرة عبر واجهة المستخدم الرسوم

Неделя показала, что гонка ИИ снова сместилась от чат-ботов к полноценным рабочим агентам. Anthropic усилила свой флагман Opus 4.7 и сразу подвела под него новый продукт для дизайна, OpenAI научила Codex видеть экран и управлять компьютером, а Google и Baidu расширили набор доступных инструментов для голоса и изображений.
На этом фоне особенно заметно, как ИИ выходит из лабораторий в повседневную работу, рынок софта и даже биржевые спекуляции. Главный релиз недели — Claude Opus 4.7.
Anthropic называет модель самым сильным публичным релизом компании для длинных кодовых пайплайнов, многошагового рассуждения и агентных задач. По SWE-bench Pro результат вырос с 53,4% до 64,3% по сравнению с Opus 4.6.
Модель лучше работает со зрением и читает более плотные скриншоты и схемы с разрешением до 3,75 мегапикселя. Для сложных сценариев появился новый уровень рассуждений xhigh, в Claude Code он теперь включён по умолчанию. Дополнительно компания ввела Task Budgets в бете, чтобы ограничивать расход токенов на задачу, и улучшила память в длинных многосессионных сценариях.
Цена API не изменилась, но новый токенизатор может расходовать до 35% больше токенов на том же тексте. Параллельно Anthropic запустила Claude Design — отдельный инструмент, который превращает бриф в несколько вариантов интерфейсов, лендингов и презентаций, а затем даёт экспорт в Canva, PDF, PPTX и HTML. OpenAI ответила не новой моделью, а новым режимом работы Codex.
После обновления агент получил computer use: он видит экран, двигает курсор и выполняет действия через графический интерфейс. На старте функция доступна на macOS, причём несколько агентов могут работать параллельно и не перехватывать фокус пользователя. Внутри продукта появился встроенный браузер для работы с localhost, генерация изображений прямо в потоке задач, память между сессиями и больше 90 интеграций с популярными сервисами вроде Jira, GitLab, Microsoft 365, Notion и Slack.
Добавили и автоматизации по расписанию, когда агент сам поднимает контекст и готовит задачи на день. Это важный сдвиг: конкуренция всё меньше сводится к качеству ответов в чате и всё больше — к тому, насколько глубоко модель умеет встраиваться в реальную рабочую среду. Google и Baidu в эту же неделю усилили прикладной слой.
Gemini 3.1 Flash TTS поддерживает более 70 языков, 30 готовых голосов и свыше 200 аудиотегов, которые можно вставлять прямо в текст, чтобы модель шептала, кашляла или меняла интонацию по сценарию. Google предлагает превью через AI Studio и Vertex AI и автоматически маркирует результат водяным знаком SynthID.
Baidu, в свою очередь, открыла ERNIE Image — генератор изображений на 8 млрд параметров, который можно запускать на 24 ГБ видеопамяти. Сильной стороной модели называют рендеринг текста внутри картинки: от постеров до интерфейсов и раскадровок. Но почти одновременно исследователь показал reverse-SynthID — открытый способ удалить невидимую метку Google из сгенерированных изображений с заявленной точностью около 91%.
Получается показательная развилка: компании быстро делают генерацию доступнее, но защитные механизмы вокруг ИИ-контента остаются хрупкими. Самые показательные сюжеты недели пришли не из лабораторий. Обувной бренд Allbirds продал активы и своё имя примерно за 39 млн долларов, после чего объявил разворот в GPU-as-a-Service под новым названием NewBird AI и на волне ажиотажа увидел рост акций более чем в шесть раз за день.
Одновременно ИИ-кавер «Седой ночи» с синтетическим голосом западной суперзвезды добрался до вершины мирового чарта Shazam и сразу превратился в спор о правах, авторстве и роялти. Ещё один кейс — выдуманная шведской исследовательницей «биксонимания»: фиктивный диагноз убедил не только несколько популярных LLM, но и авторов реальной научной публикации, которые сослались на фальшивый препринт как на настоящий источник. Такие истории бьют точнее любых бенчмарков: они показывают, как ИИ вмешивается в музыку, финансы, медиа и даже научное цитирование.
Вывод недели простой: рынок ИИ входит в фазу, где ценность определяют не абстрактные заявления о том, что модель стала умнее, а её способность брать на себя кусок реальной работы, действовать внутри интерфейсов и влиять на процессы за пределами чата. Чем увереннее агенты переходят от текста к действиям, тем важнее становятся контроль, проверка фактов, права на результат и устойчивость защитных механизмов. И именно здесь ближайшие месяцы будут не менее важны, чем очередная гонка по бенчмаркам.