Anthropic выпустила Opus 4.7, а OpenAI превратила Codex в агента для работы за компьютером
Anthropic вывела Opus 4.7 в лидеры по сложным агентным задачам и сразу запустила Claude Design, а OpenAI превратила Codex в компьютерного агента с управлением ч

Неделя показала, что гонка ИИ снова сместилась от чат-ботов к полноценным рабочим агентам. Anthropic усилила свой флагман Opus 4.7 и сразу подвела под него новый продукт для дизайна, OpenAI научила Codex видеть экран и управлять компьютером, а Google и Baidu расширили набор доступных инструментов для голоса и изображений.
На этом фоне особенно заметно, как ИИ выходит из лабораторий в повседневную работу, рынок софта и даже биржевые спекуляции. Главный релиз недели — Claude Opus 4.7.
Anthropic называет модель самым сильным публичным релизом компании для длинных кодовых пайплайнов, многошагового рассуждения и агентных задач. По SWE-bench Pro результат вырос с 53,4% до 64,3% по сравнению с Opus 4.6.
Модель лучше работает со зрением и читает более плотные скриншоты и схемы с разрешением до 3,75 мегапикселя. Для сложных сценариев появился новый уровень рассуждений xhigh, в Claude Code он теперь включён по умолчанию. Дополнительно компания ввела Task Budgets в бете, чтобы ограничивать расход токенов на задачу, и улучшила память в длинных многосессионных сценариях.
Цена API не изменилась, но новый токенизатор может расходовать до 35% больше токенов на том же тексте. Параллельно Anthropic запустила Claude Design — отдельный инструмент, который превращает бриф в несколько вариантов интерфейсов, лендингов и презентаций, а затем даёт экспорт в Canva, PDF, PPTX и HTML. OpenAI ответила не новой моделью, а новым режимом работы Codex.
После обновления агент получил computer use: он видит экран, двигает курсор и выполняет действия через графический интерфейс. На старте функция доступна на macOS, причём несколько агентов могут работать параллельно и не перехватывать фокус пользователя. Внутри продукта появился встроенный браузер для работы с localhost, генерация изображений прямо в потоке задач, память между сессиями и больше 90 интеграций с популярными сервисами вроде Jira, GitLab, Microsoft 365, Notion и Slack.
Добавили и автоматизации по расписанию, когда агент сам поднимает контекст и готовит задачи на день. Это важный сдвиг: конкуренция всё меньше сводится к качеству ответов в чате и всё больше — к тому, насколько глубоко модель умеет встраиваться в реальную рабочую среду. Google и Baidu в эту же неделю усилили прикладной слой.
Gemini 3.1 Flash TTS поддерживает более 70 языков, 30 готовых голосов и свыше 200 аудиотегов, которые можно вставлять прямо в текст, чтобы модель шептала, кашляла или меняла интонацию по сценарию. Google предлагает превью через AI Studio и Vertex AI и автоматически маркирует результат водяным знаком SynthID.
Baidu, в свою очередь, открыла ERNIE Image — генератор изображений на 8 млрд параметров, который можно запускать на 24 ГБ видеопамяти. Сильной стороной модели называют рендеринг текста внутри картинки: от постеров до интерфейсов и раскадровок. Но почти одновременно исследователь показал reverse-SynthID — открытый способ удалить невидимую метку Google из сгенерированных изображений с заявленной точностью около 91%.
Получается показательная развилка: компании быстро делают генерацию доступнее, но защитные механизмы вокруг ИИ-контента остаются хрупкими. Самые показательные сюжеты недели пришли не из лабораторий. Обувной бренд Allbirds продал активы и своё имя примерно за 39 млн долларов, после чего объявил разворот в GPU-as-a-Service под новым названием NewBird AI и на волне ажиотажа увидел рост акций более чем в шесть раз за день.
Одновременно ИИ-кавер «Седой ночи» с синтетическим голосом западной суперзвезды добрался до вершины мирового чарта Shazam и сразу превратился в спор о правах, авторстве и роялти. Ещё один кейс — выдуманная шведской исследовательницей «биксонимания»: фиктивный диагноз убедил не только несколько популярных LLM, но и авторов реальной научной публикации, которые сослались на фальшивый препринт как на настоящий источник. Такие истории бьют точнее любых бенчмарков: они показывают, как ИИ вмешивается в музыку, финансы, медиа и даже научное цитирование.
Вывод недели простой: рынок ИИ входит в фазу, где ценность определяют не абстрактные заявления о том, что модель стала умнее, а её способность брать на себя кусок реальной работы, действовать внутри интерфейсов и влиять на процессы за пределами чата. Чем увереннее агенты переходят от текста к действиям, тем важнее становятся контроль, проверка фактов, права на результат и устойчивость защитных механизмов. И именно здесь ближайшие месяцы будут не менее важны, чем очередная гонка по бенчмаркам.