Anthropic об AI-агентах в кибербезопасности: возможности и подводные камни
Anthropic выпустила исследование о применении AI-агентов в кибербезопасности. Агенты справляются с типовыми задачами — поиском SQL-инъекций, XSS, построением…
AI-обработка оригинала Habr AI; редакция Hamidun News
Anthropic опубликовала исследование о применении AI-агентов в задачах кибербезопасности. Эдгар Сипки, автор Habr и основатель easyp & sipki tech, взялся разобрать документ и задать неудобный вопрос: насколько этим агентам можно доверять на практике?
Что говорит
Anthropic Компания тестировала Claude-агентов на широком спектре задач информационной безопасности — статический анализ кода, поиск уязвимостей, построение threat-моделей, оценка защищённости инфраструктуры. В типовых сценариях агенты показали результаты выше среднего уровня специалиста: быстрее обрабатывали большие кодовые базы и замечали распространённые паттерны уязвимостей, которые легко пропустить при ручном ревью под дедлайн. Направления, где агенты уже приносят практическую пользу: Статический анализ кода — поиск SQL-инъекций, XSS, небезопасных зависимостей и захардкоженных секретов Автоматическое построение threat-моделей для новых сервисов Ускорение пентестинга: агент картирует поверхность атаки, специалист фокусируется на сложных векторах Генерация детализированных отчётов о рисках и рекомендаций по приоритизации исправлений * Мониторинг изменений в кодовой базе на предмет регрессий в безопасности На бумаге звучит убедительно.
Но при более детальном взгляде картина усложняется.
Где агенты подводят Главная проблема — качество работы на граничных случаях.
Агенты галлюцинируют уязвимости, которых нет, и одновременно пропускают реальные проблемы, замаскированные нестандартным кодом или специфической бизнес-логикой. В контексте кибербезопасности это особенно критично. Ложноположительный результат тратит ресурсы команды на разбор несуществующей угрозы. Ложноотрицательный — оставляет реальную дыру открытой и при этом формирует ложное ощущение защищённости. Второй сценарий хуже отсутствия проверки вообще: он усыпляет бдительность. Ещё одна слабость — ограниченный системный контекст. Агент видит только то, что ему предоставили. Уязвимости, завязанные на взаимодействие нескольких компонентов, специфику деплоя или конкретное облачное окружение, он часто не замечает — они требуют понимания всей архитектуры, а не отдельных файлов.
Права доступа — отдельная проблема
Серьёзный вопрос, который редко звучит в маркетинговых материалах: какие разрешения нужны агенту для эффективной работы в security-контексте? Полноценное сканирование инфраструктуры требует расширенных прав. А расширенные права сами по себе становятся вектором атаки: если агент скомпрометирован или допускает ошибку с последствиями — масштаб проблемы нарастает быстро. Anthropic рекомендует принцип минимальных привилегий и изолированные окружения для агентных задач в безопасности. Но правильная настройка требует дополнительной инженерной работы — и в условиях сжатых сроков её часто пропускают. Это создаёт ровно ту дыру, которую агент призван закрывать.
«Агенты — не замена специалистам по безопасности, а инструмент для ускорения их работы» — ключевой тезис исследования
Anthropic.
Что это значит AI-агенты уже приносят пользу в рутинных
security-задачах: типовой code review, первичное сканирование, подготовка отчётов. Но передавать им автономные полномочия на критической инфраструктуре пока преждевременно. Главный вывод, который делает и Эдгар Сипки: агенты меняют не состав security-команды, а её инструментарий. Человек в петле остаётся обязательным — особенно там, где цена ошибки высока.
Хотите не читать про ИИ, а внедрить его?
«AI News» — это полезные новости из мира ИИ. Системно научиться работать с нейросетями и применять их в работе — в Hamidun Academy.