KDnuggets→ оригинал

LangChain: крупные компании быстрее стартапов выводят в продакшн агентов на базе ИИ

LangChain опросила 1300 специалистов и выяснила, что большие компании уже активнее стартапов запускают AI-агентов в продакшн. При этом 89% команд следят за рабо

◐ Слушать статью

LangChain выпустила отчет State of Agent Engineering на основе опроса 1300 специалистов из разных компаний. Главный вывод звучит неожиданно: AI-агенты уже выходят в реальный бизнес не там, где меньше бюрократии, а там, где больше ресурсов и жестче требования к надежности.

Кто уже в продакшне

Под AI-агентами в отчете понимаются системы, которые не просто отвечают на запрос, как обычный чат-бот, а сами выбирают шаги для достижения цели: ищут данные, вызывают инструменты, отправляют письма или запускают действия в других сервисах. А «продакшн» в этом контексте — это не демо и не пилот, а живая среда, где продуктом уже пользуются сотрудники, клиенты или партнеры. Именно здесь отчет ломает популярный стереотип о том, что крупные компании слишком медленны для новых технологий.

По данным LangChain, 67% организаций с численностью более 10 тысяч сотрудников уже вывели агентные приложения в продакшн. Среди компаний со штатом менее 100 человек этот показатель составляет 50%. Причина выглядит прагматично: для надежных агентов нужны инфраструктура, интеграции, мониторинг и команда, которая может все это поддерживать, а у enterprise-бизнеса таких ресурсов обычно больше.

Где слабое место Вторая важная часть отчета касается не запуска, а контроля качества.

Здесь полезно различать два термина. Первый — observability, или наблюдаемость: команда видит, что делает агент, какие инструменты вызывает, на каком шаге ошибается и почему пришел к конкретному результату. Второй — offline evaluation, то есть проверка на тестовом наборе задач с заранее известными правильными ответами.

Это уже не наблюдение за последствиями, а попытка измерить качество до реального использования. Разрыв между этими практиками оказался заметным. 89% опрошенных команд внедрили механизмы наблюдаемости, но только 52,4% проводят офлайн-оценку.

Иначе говоря, рынок намного лучше научился смотреть на поведение агентов после запуска, чем системно проверять их заранее. Такой подход можно описать как «сначала выкатываем, потом разбираемся». Для обычного софта это рискованно, а для агентных систем тем более: ошибка здесь может превратиться не просто в неверный текст, а в неверное действие.

Почему уперлись в качество Еще один сдвиг касается денег.

Несколько кварталов назад разговор об AI-агентах почти всегда сводился к стоимости моделей и инфраструктуры. В новом отчете картина другая: 32% респондентов называют главным барьером не цену, а качество. Под качеством здесь понимают не абстрактное «чтобы было умно», а вполне прикладные вещи, которые напрямую влияют на доверие к системе и на готовность бизнеса расширять внедрение.

  • Точность ответов и действий агента Стабильность результатов от запуска к запуску Минимизация галлюцинаций и ложных выводов Приемлемая задержка между запросом и ответом Безопасность и соответствие требованиям compliance При этом второй по значимости барьер зависит от масштаба компании. Стартапы чаще жалуются на latency — задержку, которая делает взаимодействие с агентом медленным и раздражающим. Крупные компании с численностью свыше 2 тысяч сотрудников чаще указывают на безопасность и compliance. Логика понятна: чем больше бизнес, тем выше цена ошибки, тем жестче требования к данным, аудиту, доступам и воспроизводимости каждого шага.

Что это значит Рынок AI-агентов быстро взрослеет.

Вопрос уже не в том, можно ли собрать красивый демо-сценарий, а в том, можно ли стабильно и безопасно встроить агента в рабочий процесс. Поэтому следующий этап конкуренции пройдет не по линии «у кого дешевле модель», а по линии инженерной дисциплины: кто лучше тестирует, наблюдает и ограничивает ошибки до того, как агент начнет действовать от имени пользователя.

ЖХ
Hamidun News
AI‑новости без шума. Ежедневный редакторский отбор из 400+ источников. Продукт Жемала Хамидуна, Head of AI в Alpina Digital.
Загружаем комментарии…