AWS Machine Learning Blog→ оригинал

PwC и AWS показали AI-систему для разбора контрактов с сокращением проверки до 90%

PwC вместе с AWS представила AIDA — платформу для анализа договоров на базе Amazon Bedrock. Она вытаскивает из контрактов структурированные данные по шаблонам,

PwC и AWS показали AI-систему для разбора контрактов с сокращением проверки до 90%
Источник: AWS Machine Learning Blog. Коллаж: Hamidun News.

PwC и AWS представили AIDA — систему для анализа договоров, которая превращает длинные неструктурированные контракты в структурированные данные и ответы на естественном языке. Платформа построена на AWS и использует Amazon Bedrock, чтобы находить ключевые условия, сроки и обязательства без ручного поиска по десяткам страниц.

Как работает AIDA AIDA рассчитана на юристов, compliance-команды и

закупки — там, где объём договоров растёт быстрее, чем ресурс на их чтение. Вместо привычного поиска по ключевым словам система сочетает OCR, пользовательские правила извлечения и LLM-модели в Amazon Bedrock. На выходе команда получает не просто найденные фразы, а структурированные поля с привязкой к конкретным фрагментам контракта.

Это снимает часть ручной нагрузки с команд, которые обычно собирают такие данные вручную для согласования, учёта и отчётности. В демо PwC загрузила в систему образцы из открытого юридического датасета CUAD. После этого AIDA строит семантическое представление документов, индексирует его и использует Retrieval-Augmented Generation, чтобы отвечать на вопросы с опорой на текст договора.

Это важно для юридических сценариев: ответ можно проверить по ссылке на исходный абзац, а не доверять модели на слово, когда речь идёт о сроках, штрафах или обязанностях сторон.

Три ключевых режима

Главная идея AIDA — не один интерфейс для чата с PDF, а несколько режимов под разные этапы контрактного анализа. В AWS выделяют три базовых сценария, которые дают наибольший выигрыш по времени: массовое извлечение полей по шаблонам, точечные вопросы по одному документу и сквозной поиск по целому набору соглашений. За счёт этого сервис подходит и для первичной разметки массива договоров, и для быстрых проверок по ходу переговоров или аудита.

Шаблонное извлечение — команда один раз задаёт поля вроде срока расторжения, условий продления или прав на использование, а затем применяет одинаковые правила к тысячам договоров. Чат по одному документу — можно спросить у системы о конкретной дате, обязательстве или ограничении и получить ответ, привязанный к нужному месту в тексте. * Глобальный чат по проекту — AIDA сравнивает сразу несколько контрактов, ищет общие оговорки, различия в обязательствах и сводит выводы в один ответ.

* Фильтрация по метаданным — результаты можно сузить по типу договора, дате, бизнес-юниту или юрисдикции, чтобы не смешивать разные классы документов. По данным PwC, в клиентских внедрениях AIDA сокращала время ручной проверки контрактов до 90%. AWS отдельно приводит пример крупной кино- и телестудии, где система так же ускорила исследование прав по лицензиям: она выделяет broadcast, streaming, theatrical и derivative rights, чтобы быстрее понимать, что можно показывать, переупаковывать или выводить на новые рынки.

Для медиа и entertainment это особенно важно, потому что стоимость ошибки в правах обычно выше стоимости самой автоматизации.

Безопасность и системные интеграции

Архитектура AIDA построена как корпоративный сервис, а не экспериментальный прототип. На входе стоят AWS WAF, балансировщик и NGINX, доступ управляется через Amazon Cognito с подключением к Microsoft Entra ID или Okta, а права можно настраивать и на уровне приложения, и на уровне проекта. Данные шифруются в транзите и в покое: документы и OCR-выгрузки хранятся в Amazon S3, структурированные результаты — в Amazon RDS.

Для обработки больших объёмов система использует Amazon ECS на AWS Fargate и очередь Amazon SQS, поэтому загрузка сотен и тысяч документов не блокирует интерфейс. Векторный поиск строится на Amazon Bedrock Knowledge Bases и Amazon OpenSearch Serverless, а Guardrails в Amazon Bedrock отвечают за фильтрацию контента, защиту персональных данных и безопасность промптов. Перед отправкой результатов в downstream-системы AIDA может включать human-in-the-loop-проверку, а сами данные передаются дальше в CLM, ERP, CRM и хранилища через Lambda, EventBridge и SQS.

Что это значит

PwC и AWS показывают, как GenAI уходит из демонстраций в узкие, дорогие для бизнеса процессы. Если система действительно стабильно извлекает поля, отвечает с цитатами и встраивается в CLM или ERP, то юридический AI начинает окупаться не обещаниями, а конкретной экономикой: короче циклы проверки, меньше ручного труда, быстрее поиск рисков, сроков и обязательств по контрактам.

ЖХ
Hamidun News
AI‑новости без шума. Ежедневный редакторский отбор из 400+ источников. Продукт Жемала Хамидуна, Head of AI в Alpina Digital.
Загружаем комментарии…