AWS Machine Learning Blog→ оригинал

Amazon Bedrock: кастомные Lambda-evaluators для контроля AI-агентов

AWS выпустила гайд по созданию Lambda-based evaluators для Amazon Bedrock AgentCore. Они проверяют ответы агентов в real-time: fact-checking, поиск личных данны

Amazon Bedrock: кастомные Lambda-evaluators для контроля AI-агентов
Источник: AWS Machine Learning Blog. Коллаж: Hamidun News.
◐ Слушать статью

Amazon Bedrock AgentCore теперь поддерживает кастомные Lambda-based evaluators — функции, которые проверяют ответы AI-агентов на лету перед тем, как они попадут к пользователю.

Что такое evaluators в

AgentCore Evaluators — это валидаторы, которые проверяют качество, безопасность и фактическую корректность ответов, сгенерированных агентом. Amazon Bedrock уже поставляет встроенные проверки на hallucinations и стиль, но новый функционал позволяет написать свои, ориентированные на конкретный domain. Зачем? Потому что generic проверки не ловят domain-specific ошибки. Финансовому агенту нужно проверять котировки на достоверность. Healthcare-агенту — на соответствие FDA guidelines. Юридическому агенту — на соответствие местному законодательству.

Как работают

Lambda-evaluators Кастомные evaluators живут в AWS Lambda и интегрируются с AgentCore через API. Когда агент генерирует ответ, Bedrock отправляет его на проверку перед выдачей пользователю. Lambda-функция анализирует текст и возвращает вердикт: пропустить как есть, отредактировать или заблокировать. Evaluators работают в двух режимах: On-demand — проверка по требованию, по инициативе DevOps Online — проверка в real-time, интегрированная в flow агента без задержки для пользователя Второй режим полезнее в production: система гарантирует, что плохой ответ не выходит, но пользователь не ждёт длительной проверки.

Четыре типа проверок AWS показал четыре

Lambda-функции для финансового market-intelligence агента: Fact-checking — сравнение ответа с достоверными источниками через AWS сервисы, например DynamoDB с историческими данными PII detection — поиск персональных данных (SSN, номера кредитных карт, телефоны) с использованием AWS Comprehend Real-time alerting — отправка оповещения через SNS, Slack или webhook при обнаружении проблем Custom domain logic — проверка реалистичности финансовых показателей, поиск противоречий, валидация по бизнес-правилам ## Интеграция с AWS экосистемой Финансовый агент комбинирует кастомные Lambda-проверки с встроенными evaluators Bedrock. Встроенные ловят hallucinations и грамматику. Lambda'ы ловят специфичные для финдома ошибки. Интеграция с другими AWS сервисами встроена: Lambda может вызвать AWS Comprehend, Kendra, SNS, SageMaker — всё в одной экосистеме, без overhead на интеграцию.

Что это значит AWS делает серьёзный шаг в сторону human-in-the-loop AI для regulated industries.

Раньше контроль качества был либо мануальным, либо требовал proprietary решения — теперь это нативно в Bedrock. Для финансового и healthcare-сектора это критично: регуляторы требуют полной прозрачности, аудита всех решений и возможности заблокировать неправильный ответ перед выпуском. Lambda-evaluators дают ровно это.

ЖХ
Hamidun News
AI‑новости без шума. Ежедневный редакторский отбор из 400+ источников. Продукт Жемала Хамидуна, Head of AI в Alpina Digital.
Что вы думаете?
Загружаем комментарии…