Habr AI→ оригинал

Как устроен AI-агент изнутри: семь инструментов, которые превращают LLM в исполнителя

Что происходит, если языковая модель получает доступ к терминалу, файловой системе и интернету? Именно так работают Claude Code и Codex — агент сам читает…

AI-обработка оригинала Habr AI; редакция Hamidun News
Как устроен AI-агент изнутри: семь инструментов, которые превращают LLM в исполнителя
Источник: Habr AI. Коллаж: Hamidun News.
◐ Слушать статью

Если дать языковой модели терминал, файловую систему и выход в интернет, она перестаёт быть болтливым ассистентом и превращается в агента — именно так под капотом устроены Claude Code, Codex и другие инструменты для разработчиков. Вторая часть туториала объясняет, как добавить модели семь базовых инструментов и научить её самостоятельно выбирать нужный в зависимости от задачи.

Что такое инструменты агента

Языковая модель сама по себе умеет только одно — генерировать текст на основе входного контекста. Чтобы она стала агентом, ей нужны инструменты: конкретные функции, которые агентный фреймворк выполняет по команде модели и возвращает результат обратно в контекст. Принцип простой: модель получает промпт с описанием доступных инструментов — название, параметры, что делает.

В процессе работы она оценивает задачу и сама решает, нужно ли что-то вызывать, и если да — что именно и с какими аргументами. Разработчик определяет набор доступных функций; выбор конкретного инструмента под конкретную ситуацию — за моделью. В туториале агенту добавляют семь базовых инструментов: Чтение файлов из файловой системы Запись и редактирование файлов Выполнение команд в терминале Навигация по директориям и листинг содержимого Запуск Python-скриптов на лету Поиск информации в интернете * Получение информации о системе и окружении Этот набор уже позволяет агенту самостоятельно читать чужой код, вносить правки, запускать тесты и проверять их результат — без участия человека на каждом шаге.

Как модель выбирает инструмент Ключевой момент — не сам набор инструментов, а механизм выбора.

Это называется tool calling или function calling, и именно здесь современные LLM принципиально отличаются от чат-ботов прошлого поколения. Когда модель решает, что для задачи нужен инструмент, она возвращает не просто текст, а структурированный JSON: имя функции и аргументы. Агентный фреймворк перехватывает этот JSON, выполняет реальную операцию — запускает команду, читает файл, делает HTTP-запрос — и возвращает результат обратно в контекст.

Модель смотрит на результат, снова думает и либо вызывает следующий инструмент, либо завершает работу. Именно эта петля — думать, вызвать инструмент, получить результат, думать снова — превращает статичную языковую модель в динамическую систему. При этом модель не следует жёсткому скрипту: каждый раз она заново анализирует ситуацию с учётом всего накопленного контекста — предыдущих шагов, промежуточных результатов, исходной задачи.

Именно это делает агент гибким: он может корректировать план на ходу, если промежуточный результат оказался неожиданным.

Петля и проблема остановки

Агент работает в цикле: генерирует ответ → если нужен инструмент, вызывает его → получает результат → генерирует снова. Цикл продолжается, пока задача не выполнена или пока агент не решит, что дальнейшие вызовы не нужны. Здесь скрывается главная инженерная сложность: как модель понимает, что пора завершить петлю?

В простых реализациях используют один из двух подходов. Первый — лимит итераций: если после N шагов задача не выполнена, агент принудительно останавливается. Второй — специальный сигнал завершения: модель возвращает маркер «готово», и фреймворк выходит из цикла.

Claude Code и Codex решают это значительно сложнее: с учётом контекста задачи, стоимости каждого вызова и анализа промежуточных результатов. Но фундаментальный принцип тот же — петля с явным условием выхода. Именно это условие определяет, будет агент полезным инструментом или зависнет в бесконечном цикле.

Что это значит

Туториал наглядно показывает: разница между простым чат-ботом и мощным инструментом вроде Claude Code — не в размере модели и не в магии, а в архитектуре. Добавь петлю, несколько функций и правило остановки — получишь систему, которая умеет работать с реальным миром: читает код, правит файлы, запускает тесты и ищет информацию в сети. Именно это делает современные AI-агенты практически полезными для разработчиков, а не просто впечатляющими на демо.

ЖХ
Hamidun News
AI‑новости без шума. Ежедневный редакторский отбор из 400+ источников. Продукт Жемала Хамидуна, Head of AI в Alpina Digital.

Хотите не читать про ИИ, а внедрить его?

«AI News» — это полезные новости из мира ИИ. Системно научиться работать с нейросетями и применять их в работе — в Hamidun Academy.

Что вы думаете?
Загружаем комментарии…