Bloomberg Tech→ оригинал

Минфин США хочет получить доступ к модели Anthropic Mythos для поиска уязвимостей

Минфин США хочет получить доступ к модели Mythos от Anthropic, чтобы начать поиск уязвимостей. Речь идет не о внедрении ради эффективности, а о проверке безопас

Минфин США хочет получить доступ к модели Anthropic Mythos для поиска уязвимостей
Источник: Bloomberg Tech. Коллаж: Hamidun News.

Минфин США хочет получить доступ к модели Mythos от Anthropic, чтобы начать поиск уязвимостей в системе еще до ее более широкого использования в чувствительных сценариях. Сам факт такого запроса показывает, что американские ведомства переходят от общих разговоров об ИИ к практической проверке конкретных моделей на надежность, управляемость и устойчивость к злоупотреблениям. По имеющейся информации, доступ к Mythos пытается получить технологическая команда американского Минфина.

Целью выглядит не внедрение модели ради продуктивности, а именно аудит безопасности: специалисты хотят понять, где система может давать сбои, как она ведет себя под нетипичными запросами и можно ли заставить ее выходить за собственные ограничения. Официальных деталей о формате проверки пока нет, как и подтверждения того, что Anthropic уже предоставила доступ. Не раскрываются и технические характеристики самой Mythos, поэтому пока рано судить, идет ли речь о внутреннем, специализированном или готовящемся к более широкому применению продукте.

Для правительства США такая работа выглядит логично. Чем активнее государственные структуры рассматривают ИИ для анализа данных, подготовки документов, поддержки сотрудников и автоматизации внутренних процессов, тем выше цена ошибок. В случае с федеральными системами проблемы могут быть не только репутационными.

Речь может идти об утечках чувствительной информации, обходе защитных механизмов, генерации недостоверных рекомендаций или о поведении модели, которое можно спровоцировать специально. Поэтому доступ к модели на раннем этапе важен не меньше, чем публичные обещания разработчика о безопасности. Если команда Минфина действительно начнет тестирование, она, вероятно, будет искать типовые слабые места современных генеративных систем.

Обычно в такую проверку входят попытки обойти встроенные ограничения, получить опасные ответы, извлечь скрытые инструкции, проверить устойчивость к инъекциям в подсказки, а также оценить, как модель работает с конфиденциальными данными и длинным контекстом. Это не значит, что именно такие проблемы уже обнаружены у Mythos. Скорее, речь идет о стандартном наборе вопросов, которые сегодня возникают к любой продвинутой модели, особенно если ее потенциально могут использовать структуры с высоким уровнем ответственности.

Отдельный интерес вызывает выбор компании. Anthropic давно строит репутацию разработчика, который делает ставку на безопасность и контролируемое поведение моделей. Если даже к таким системам государство хочет получить прямой доступ для собственного стресс тестирования, это подчеркивает новый стандарт отношений между властями и AI-компаниями: недостаточно общих заверений, нужны реальные проверки на стороне заказчика или регулятора.

Для самих разработчиков это означает дополнительное давление — придется готовиться не только к рыночной конкуренции, но и к все более глубокому техническому аудиту. История важна и потому, что меняет саму логику государственного интереса к ИИ. Еще недавно чиновники в основном обсуждали правила, риски и рамочные подходы.

Теперь фокус смещается к конкретным моделям, конкретным сценариям и конкретным уязвимостям. Это более практичный этап: вместо абстрактного регулирования появляются попытки понять, как система ведет себя в реальных стрессовых условиях. Для рынка это сигнал, что доверие к передовым моделям будет все чаще строиться не на презентациях, а на результатах независимых проверок.

Главный вывод простой: государство начинает относиться к передовым ИИ системам так же, как к другой критически важной технологии — сначала доступ, затем тестирование, и только потом возможное внедрение. Для Anthropic это может стать проверкой на зрелость ее подхода к безопасности, а для всего рынка — признаком того, что эпоха неформальных обещаний заканчивается и начинается эпоха обязательной верификации.

ЖХ
Hamidun News
AI‑новости без шума. Ежедневный редакторский отбор из 400+ источников. Продукт Жемала Хамидуна, Head of AI в Alpina Digital.
Загружаем комментарии…