Bloomberg Tech→ оригинал

Le Trésor américain Cherche l'Accès au Modèle Mythos d'Anthropic pour Tester les Vulnérabilités

Le Trésor américain veut accéder au modèle Mythos d'Anthropic pour commencer la recherche de vulnérabilités. Il ne s'agit pas de mise en œuvre pour l'efficacité

Le Trésor américain Cherche l'Accès au Modèle Mythos d'Anthropic pour Tester les Vulnérabilités
Источник: Bloomberg Tech. Коллаж: Hamidun News.

Минфин США хочет получить доступ к модели Mythos от Anthropic, чтобы начать поиск уязвимостей в системе еще до ее более широкого использования в чувствительных сценариях. Сам факт такого запроса показывает, что американские ведомства переходят от общих разговоров об ИИ к практической проверке конкретных моделей на надежность, управляемость и устойчивость к злоупотреблениям. По имеющейся информации, доступ к Mythos пытается получить технологическая команда американского Минфина.

Целью выглядит не внедрение модели ради продуктивности, а именно аудит безопасности: специалисты хотят понять, где система может давать сбои, как она ведет себя под нетипичными запросами и можно ли заставить ее выходить за собственные ограничения. Официальных деталей о формате проверки пока нет, как и подтверждения того, что Anthropic уже предоставила доступ. Не раскрываются и технические характеристики самой Mythos, поэтому пока рано судить, идет ли речь о внутреннем, специализированном или готовящемся к более широкому применению продукте.

Для правительства США такая работа выглядит логично. Чем активнее государственные структуры рассматривают ИИ для анализа данных, подготовки документов, поддержки сотрудников и автоматизации внутренних процессов, тем выше цена ошибок. В случае с федеральными системами проблемы могут быть не только репутационными.

Речь может идти об утечках чувствительной информации, обходе защитных механизмов, генерации недостоверных рекомендаций или о поведении модели, которое можно спровоцировать специально. Поэтому доступ к модели на раннем этапе важен не меньше, чем публичные обещания разработчика о безопасности. Если команда Минфина действительно начнет тестирование, она, вероятно, будет искать типовые слабые места современных генеративных систем.

Обычно в такую проверку входят попытки обойти встроенные ограничения, получить опасные ответы, извлечь скрытые инструкции, проверить устойчивость к инъекциям в подсказки, а также оценить, как модель работает с конфиденциальными данными и длинным контекстом. Это не значит, что именно такие проблемы уже обнаружены у Mythos. Скорее, речь идет о стандартном наборе вопросов, которые сегодня возникают к любой продвинутой модели, особенно если ее потенциально могут использовать структуры с высоким уровнем ответственности.

Отдельный интерес вызывает выбор компании. Anthropic давно строит репутацию разработчика, который делает ставку на безопасность и контролируемое поведение моделей. Если даже к таким системам государство хочет получить прямой доступ для собственного стресс тестирования, это подчеркивает новый стандарт отношений между властями и AI-компаниями: недостаточно общих заверений, нужны реальные проверки на стороне заказчика или регулятора.

Для самих разработчиков это означает дополнительное давление — придется готовиться не только к рыночной конкуренции, но и к все более глубокому техническому аудиту. История важна и потому, что меняет саму логику государственного интереса к ИИ. Еще недавно чиновники в основном обсуждали правила, риски и рамочные подходы.

Теперь фокус смещается к конкретным моделям, конкретным сценариям и конкретным уязвимостям. Это более практичный этап: вместо абстрактного регулирования появляются попытки понять, как система ведет себя в реальных стрессовых условиях. Для рынка это сигнал, что доверие к передовым моделям будет все чаще строиться не на презентациях, а на результатах независимых проверок.

Главный вывод простой: государство начинает относиться к передовым ИИ системам так же, как к другой критически важной технологии — сначала доступ, затем тестирование, и только потом возможное внедрение. Для Anthropic это может стать проверкой на зрелость ее подхода к безопасности, а для всего рынка — признаком того, что эпоха неформальных обещаний заканчивается и начинается эпоха обязательной верификации.

ЖХ
Hamidun News
AI‑новости без шума. Ежедневный редакторский отбор из 400+ источников. Продукт Жемала Хамидуна, Head of AI в Alpina Digital.
Загружаем комментарии…