Ars Technica→ оригинал

Как устроены AI-агенты для написания кода и что важно о них знать

Ars Technica опубликовала подробный разбор того, как работают AI-агенты для кодинга — от Cursor и GitHub Copilot до Devin и Claude Code. Ключевые механизмы: сжа

Как устроены AI-агенты для написания кода и что важно о них знать
Источник: Ars Technica. Коллаж: Hamidun News.

Программист 2025 года всё реже пишет код с нуля. Он формулирует задачу, запускает AI-агента и наблюдает, как тот генерирует десятки файлов, рефакторит архитектуру и даже запускает тесты. Инструменты вроде Cursor, GitHub Copilot Workspace, Devin и Claude Code за последний год превратились из экзотических экспериментов в повседневную реальность для сотен тысяч разработчиков. Но мало кто из пользователей по-настоящему понимает, что происходит под капотом. Ars Technica выпустила подробный разбор внутренней механики AI-агентов для кодинга, и выводы заслуживают внимания каждого, кто доверяет машине хотя бы часть своей работы.

Фундамент любого кодингового агента — это большая языковая модель, будь то GPT-4o, Claude 3.5 Sonnet или Gemini. Но сама по себе модель — лишь двигатель.

Агент — это целая инженерная обвязка вокруг неё. Первая и, пожалуй, самая критичная проблема, которую решают разработчики агентов, — ограничение контекстного окна. Даже у самых продвинутых моделей оно конечно: 128 или 200 тысяч токенов звучит внушительно, но реальный программный проект может содержать миллионы строк кода.

Агенты справляются с этим через набор трюков: они индексируют кодовую базу, строят семантические карты репозитория, извлекают только релевантные фрагменты и сжимают контекст, отбрасывая то, что модель уже «обработала». По сути, агент выполняет роль умного библиотекаря, который подносит модели именно те книги, которые нужны для ответа на конкретный вопрос, а не вываливает всю библиотеку на стол.

Второй ключевой механизм — цепочки рассуждений, или chain-of-thought. Вместо того чтобы генерировать ответ одним махом, агент разбивает сложную задачу на последовательные шаги. Сначала он анализирует структуру проекта, затем формулирует план изменений, потом реализует каждый шаг, проверяет результат и при необходимости корректирует курс. Это не просто стилистический приём — исследования показывают, что пошаговое рассуждение радикально снижает количество ошибок при решении сложных задач. Некоторые агенты идут дальше и используют так называемую мультиагентную архитектуру: одна модель выступает «архитектором» и декомпозирует задачу, другая пишет код, третья занимается ревью, четвёртая — тестированием. Они общаются между собой через структурированные промпты, имитируя работу реальной команды разработчиков. Именно так устроен Devin от Cognition и ряд других продвинутых систем.

Но за впечатляющими демонстрациями скрываются серьёзные ограничения, о которых стоит помнить. Главное из них — галлюцинации. Агент может уверенно использовать несуществующий API, вызывать функции с неправильными аргументами или создавать код, который выглядит безупречно, но содержит тонкие логические ошибки. Проблема усугубляется тем, что агенты действуют автономно: если классический автодополнитель вроде раннего Copilot предлагал одну строчку, которую разработчик тут же оценивал, то современный агент может сгенерировать сотни строк в десятке файлов. Проверять такой объём вручную — задача нетривиальная, и соблазн просто нажать «принять всё» велик.

Отдельная головная боль — безопасность. Исследования уже зафиксировали случаи, когда AI-агенты вносили в код уязвимости: от SQL-инъекций до небезопасной обработки пользовательского ввода. Модель оптимизирует код на «работает», а не на «безопасен», и без явного указания на security-требования она может выбрать простейший, но небезопасный путь. Для команд, работающих с чувствительными данными или финансовыми системами, это не абстрактный риск, а конкретная угроза.

Есть и более тонкий эффект, который индустрия только начинает осознавать. Когда разработчик полагается на агента для написания значительной части кода, он постепенно теряет глубокое понимание собственной кодовой базы. Код, написанный машиной, часто стилистически чужд команде, использует непривычные паттерны и сложнее поддаётся отладке. Возникает парадокс: инструмент, призванный ускорить разработку, может замедлить сопровождение продукта в долгосрочной перспективе.

Всё это не означает, что от AI-агентов нужно отказываться. Они действительно ускоряют рутинные задачи, помогают осваивать незнакомые фреймворки и снижают порог входа в программирование. Но относиться к ним стоит как к очень способному, но неопытному стажёру: он может сделать многое, однако каждый его результат требует ревью старшего коллеги. Понимание того, как именно агент принимает решения — как он сжимает контекст, как разбивает задачу, где его слепые зоны — превращается из академического любопытства в практический навык. В мире, где AI-агенты пишут всё больше кода, грамотность в их механике становится такой же базовой компетенцией разработчика, как знание Git или умение читать логи.

ЖХ
Hamidun News
AI‑новости без шума. Ежедневный редакторский отбор из 400+ источников. Продукт Жемала Хамидуна, Head of AI в Alpina Digital.
Загружаем комментарии…