NVIDIA Developer Blog→ оригинал

NVIDIA выпустила AI-Q для глубоких исследований в агентских фреймворках

NVIDIA запустила AI-Q — расширение для агентов (Claude Code, Codex), добавляющее глубокое исследование через отдельный backend. Система обрабатывает запросы в ч

NVIDIA выпустила AI-Q для глубоких исследований в агентских фреймворках
Источник: NVIDIA Developer Blog. Коллаж: Hamidun News.
◐ Слушать статью

NVIDIA представила AI-Q — систему для добавления специализированных навыков глубокого исследования к агентским фреймворкам. Вместо встраивания исследовательских возможностей в общие агенты, AI-Q отделяет эту функцию в отдельный backend, позволяя оркестраторам типа Claude Code сосредоточиться на управлении потоками.

Почему обычные агенты не справляются

Фреймворки типа Claude Code, Codex и LangChain Deep Agents отлично работают как оркестраторы: управляют сессиями, цепочками инструментов, выполняют код и понимают намерения разработчика. Но когда речь идет о серьёзных исследованиях — синтезе множества документов, создании обоснованных обзоров, анализе с указанием источников — сложность взлетает. Встраивать эту логику в агент неэффективно и неудобно.

Как устроен AI-Q AI-Q работает как отдельный skill — дополнительная

способность, которую агент может вызвать. Система включает полный pipeline исследования: классификацию намерения, диалог с пользователем для уточнения, поверхностный поиск для быстрых ответов и глубокий анализ для многоточечного синтеза.

  • Классификация запроса — определить, нужна быстрая справка или полное исследование Уточнение с человеком — если вопрос неясен, система задаёт уточняющие вопросы Поверхностный поиск — для простых запросов быстро найти ответ * Глубокий анализ — синтезировать многие источники и давать ссылки Качество оценивается по стандартам вроде FreshQA и Deep Research Bench — NVIDIA использует реальные бенчмарки, чтобы убедиться, что система даёт надёжные результаты.

Корпоративные данные встроены

Классный момент: AI-Q поддерживает аутентифицированные серверы MCP (Model Context Protocol) как источники данных. Это значит, что агент может исследовать внутренние документы компании, не выплёвывая их наружу. NVIDIA предусмотрела три паттерна аутентификации: открытые серверы, сервис-аккаунты для общих корпоративных данных и bearer-токены для сохранения идентичности пользователя.

«Полный pipeline исследования, включая классификацию, уточнение,

поверхностный и глубокий анализ, предоставляется как высокоуровневая способность»

Гибкое развёртывание

Организации могут развернуть AI-Q на своём оборудовании — Docker Compose на ноутбуке разработчика или Helm в регулируемом data center. Чувствительные исходные данные остаются внутри, наружу выходят только цитируемые результаты. Это критично для компаний, которые не хотят отправлять внутренние документы в облако.

Что это значит AI-Q демонстрирует тренд 2026 года: специализация компонентов вместо универсальности.

Агенты становятся лучше, когда могут делегировать сложные задачи узким инструментам. Для разработчиков это значит, что глубокие исследования теперь встроены не в сам LLM, а в экосистему — надёжнее, понятнее, со своими источниками.

ЖХ
Hamidun News
AI‑новости без шума. Ежедневный редакторский отбор из 400+ источников. Продукт Жемала Хамидуна, Head of AI в Alpina Digital.
Что вы думаете?
Загружаем комментарии…