Anthropic considera Mythos perigosa demais: modelo encontrou falhas no software fundamental da internet
Anthropic não lançou Mythos ao acesso público após testes internos nos quais o modelo encontrou e encadeou vulnerabilidades complexas em navegadores, Linux e ou

Anthropic создала Mythos как универсальную передовую модель, но довольно быстро поняла, что получила не просто еще один сильный ИИ для кода. Во внутренних тестах Mythos начала находить и превращать в рабочие эксплойты уязвимости в том самом базовом софте, на котором держится большая часть современной вычислительной инфраструктуры. После этого компания решила не выпускать модель в открытый доступ и перевела ее в закрытый режим для ограниченного круга партнеров.
Поворотный момент наступил во время внутренних проверок, когда исследователь Anthropic Николас Карлини начал целенаправленно тестировать модель на вредоносные сценарии. Mythos поразила даже людей, которые профессионально занимаются стресс-тестами ИИ и кибербезопасностью. Внутренняя команда Anthropic пришла к выводу, что модель способна находить и эксплуатировать zero-day уязвимости во всех основных операционных системах и во всех основных браузерах.
Важно, что Mythos не создавали как специализированный киберинструмент: ее опасные навыки, по словам компании, выросли как побочный эффект общего скачка в программировании, рассуждении и автономной работе с инструментами. Дальше выяснилось, что речь не о демонстрационных трюках. Anthropic раскрыла несколько примеров уже исправленных проблем: 27-летнюю уязвимость в OpenBSD, 16-летний баг в FFmpeg, который автоматические системы прогоняли миллионы раз и так и не заметили, а также цепочки уязвимостей в ядре Linux, позволявшие перейти от обычного пользовательского доступа к полному контролю над машиной.
В одном из тестов Mythos сама собрала браузерный эксплойт из четырех уязвимостей и смогла обойти сразу несколько уровней изоляции. По данным блога команды безопасности Anthropic, более 99% найденных моделью проблем на момент публикации еще не были исправлены, поэтому компания не раскрывает технические детали и работает через координированное раскрытие уязвимостей. Ответом на это стал Project Glasswing, который Anthropic анонсировала 7 апреля 2026 года.
Вместо обычного релиза компания открыла доступ только избранным участникам: среди стартовых партнеров названы AWS, Apple, Google, Microsoft, NVIDIA, Cisco, CrowdStrike, Palo Alto Networks, Linux Foundation и JPMorganChase. Кроме них, доступ получили еще более 40 организаций, которые отвечают за критически важное ПО и инфраструктуру. Anthropic отдельно подчеркивает, что хочет дать защитникам фору: компания выделила до 100 миллионов долларов в виде кредитов на использование Mythos Preview и еще 4 миллиона долларов на поддержку open source-безопасности.
Публичного запуска для всех пользователей сейчас не планируется. На этом история не заканчивается, потому что последствия выходят далеко за рамки одной лаборатории. Банки и государственные структуры начали срочно оценивать, что произойдет, если модели такого класса попадут не только к защитникам, но и к преступным группам или государственным хакерам.
Финансовый сектор нервничает особенно сильно: если окно между обнаружением уязвимости и ее эксплуатацией сократится с недель и месяцев до часов, под ударом окажутся системы, через которые проходят платежи, расчеты и хранение данных. Именно поэтому вокруг Mythos быстро возникли обсуждения не только в крупнейших технологических компаниях, но и среди регуляторов и крупных финансовых институтов. Главный вывод здесь в том, что индустрия вошла в новую фазу.
До сих пор спор шел в основном о том, могут ли языковые модели помочь написать вредоносный код. История Mythos показывает более жесткий сценарий: передовая модель способна сама искать слабые места в сложных кодовых базах, собирать из них рабочие цепочки атак и делать это на масштабе, недоступном большинству человеческих команд. Для рынка это означает смену логики: вопрос уже не в том, выпускать ли такие системы как обычный продукт, а в том, успеют ли разработчики, поставщики инфраструктуры и государства построить защиту раньше, чем аналогичные возможности станут массовыми.
Решение Anthropic притормозить релиз выглядит не маркетинговой перестраховкой, а признанием того, что граница между полезным ИИ для разработки и инструментом кибернаступления стала намного тоньше.