MarkTechPost→ оригинал

Nous Research выпустила Tool Search для Hermes Agent: точность выросла на 49–74% на Opus 4

Nous Research добавила Tool Search в Hermes Agent для оптимизации MCP. Вместо загрузки всех инструментов система находит только релевантные схемы через BM25. На

Nous Research выпустила Tool Search для Hermes Agent: точность выросла на 49–74% на Opus 4
Источник: MarkTechPost. Коллаж: Hamidun News.
◐ Слушать статью

Nous Research представила обновление для Hermes Agent — добавила функцию Tool Search, которая решает давнюю проблему AI-агентов при работе с MCP (Model Context Protocol). Новый подход позволяет агенту выбирать только релевантные инструменты вместо загрузки полного описания всех доступных инструментов в контекст.

Контекстная перегрузка в MCP

Когда AI-агент взаимодействует с системой инструментов через MCP, традиционный подход требует загрузить описание всех доступных инструментов в контекст модели прямо с самого начала. Если инструментов тридцать, пятьдесят или сто, и каждый имеет подробное описание параметров и примеров использования, это быстро становится проблемой: контекст раздувается, токены кончаются раньше, чем нужно, а сама модель может теряться в морях информации. Nous Research заметила это узкое место и решила применить классический подход из информационного поиска — BM25-ранжирование. Это алгоритм полнотекстового поиска, который учитывает релевантность документа (в данном случае — описание инструмента) запросу пользователя. Вместо загрузки всего каталога, система теперь ищет самые подходящие инструменты и передаёт их схемы в контекст прогрессивно.

Как Tool Search работает на практике Механика простая, но эффективная.

При инициализации агента система индексирует метаданные всех доступных инструментов — их названия, описания, назначение. Когда пользователь даёт команду, агент не смотрит на полный список, а сначала ищет топ-K инструментов, релевантных к запросу: Первый шаг: выполнить BM25-поиск по названиям и описаниям инструментов Второй шаг: загрузить краткие схемы для топ-результатов в контекст модели Третий шаг: если нужно, раскрыть полные параметры только для выбранного инструмента Результат: контекст остаётся управляемым, агент выбирает точнее Такое устройство решает несколько проблем одновременно: сокращается размер контекста, улучшается скорость работы, и главное — повышается точность выбора инструмента, потому что модель не отвлекается на нерелевантные опции.

Цифры от

Anthropic Nous Research протестировала Tool Search на стандартных бенчмарках Anthropic Evals и получила результаты, которые стоит отметить. На модели Claude Opus 4 прирост точности составил от 49% до 74% в зависимости от типа задачи и набора инструментов. Это не просто статистическая погрешность — это значимое улучшение, которое говорит о том, что сужение контекста до релевантных инструментов действительно помогает модели лучше сосредоточиться на нужном выборе. Интересно, что эффект наиболее заметен именно на больших наборах инструментов — чем больше выбор, тем выше прирост от умного фильтра.

Что это значит для AI-агентов

Tool Search — это маленький, но показательный пример того, как правильное управление контекстом может быть важнее сырой мощности модели. Вместо того, чтобы просто увеличивать context window, иногда достаточно умнее подойти к тому, какую информацию загружать в этот контекст. Это применимо не только к MCP, но и к RAG-системам, интеграциям с API, системам автоматизации, где агент должен выбирать из множества вариантов действий. По мере роста сложности AI-систем такие оптимизации будут становиться всё более критичными. Это означает, что будущее за не самыми большими моделями, а за самыми умными в выборе того, на что смотреть.

ЖХ
Hamidun News
AI‑новости без шума. Ежедневный редакторский отбор из 400+ источников. Продукт Жемала Хамидуна, Head of AI в Alpina Digital.

Хотите не читать про ИИ, а внедрить его?

«AI News» — это полезные новости из мира ИИ. Системно научиться работать с нейросетями и применять их в работе — в Hamidun Academy.

Что вы думаете?
Загружаем комментарии…