Anthropic представила Claude Mythos 5 и Fable 5 с защитой от кибератак
Anthropic выпустила две версии Claude: Mythos 5 для доверенных партнёров и Fable 5 для широкой публики. Fable 5 приходит со встроенной защитой от кибератак — ог
AI-обработка оригинала Wired; редакция Hamidun News
Anthropic представила две новые версии Claude: Mythos 5 для доверенных организаций и Fable 5 для широкой публики. Вторая версия разработана специально с механизмами, которые затрудняют её использование в кибератаках.
Разделение по назначению
Anthropic идёт по пути разделения своих AI-моделей в зависимости от целевой аудитории и потенциальных рисков. Claude Mythos 5 предназначена для доверенных партнёров, включая компании в сфере кибербезопасности, исследовательские организации и корпоративных клиентов, которым нужны полные возможности языковой модели без ограничений. Claude Fable 5 выходит в открытый доступ для широкой публики. Компания встроила в эту версию специальные ограничения, направленные на предотвращение использования модели в кибернетических атаках и других вредоносных целях. Это стратегия, которая позволяет Anthropic предлагать мощный инструмент AI, но минимизирует прямую ответственность за его потенциальное неправомерное использование.
Защита встроена в архитектуру
Ключевое отличие Fable 5 в том, что механизм защиты основан не просто на инструкциях или запретах на уровне API (которые легко обойти), а на изменениях в архитектуре и процессе обучения самой модели. Anthropic считает, что такой подход более надёжен и долгоживущ, чем системы контроля на уровне приложения.
- Встроенные ограничения в процессе обучения модели Архитектурные изменения, препятствующие определённым классам задач Публичная доступность без лицензионных барьеров, но с ограничениями В отличие от простого фильтра, который ловит вредоносные запросы в реальном времени, встроенные ограничения изменяют поведение модели на фундаментальном уровне. Это означает, что даже при попытках обхода система будет менее полезна для кибератак.
Растущее давление на индустрию
Решение Anthropic отражает растущее давление от регуляторов, политиков и общественности, которые требуют от AI-компаний взять ответственность за потенциальный вред. На фоне дебатов о возможности использования больших языковых моделей в кибератаках, выпуск «безопасной» версии выглядит как стратегический ход. Другие компании, включая OpenAI и Google, также испытывают давление и разрабатывают собственные подходы к контролю. Однако до сих пор нет единого стандарта в индустрии. Подход Anthropic с двухуровневым разделением выглядит прагматичным: дать доверенным партнёрам полный доступ, а публике предложить ограниченную, но безопасную версию.
Что это значит
Anthropic демонстрирует, что безопасность AI начинает рассматриваться как отдельная линейка продукта, а не как дополнительный модуль. Это может стать трендом в индустрии: вместо одной модели для всех, компании предложат несколько версий с разными уровнями ограничений. Однако остаются вопросы о практической эффективности встроенных ограничений и о том, согласятся ли пользователи с ограничениями в обмен на обещание безопасности.
Хотите не читать про ИИ, а внедрить его?
«AI News» — это полезные новости из мира ИИ. Системно научиться работать с нейросетями и применять их в работе — в Hamidun Academy.