AWS Machine Learning Blog→ оригинал

PwC et AWS présentent un système d'IA pour l'analyse de contrats avec réduction de la vérification jusqu'à 90%

PwC et AWS ont présenté AIDA — une plateforme d'analyse de contrats basée sur Amazon Bedrock. Elle extrait les données structurées des contrats selon des modèle

PwC et AWS présentent un système d'IA pour l'analyse de contrats avec réduction de la vérification jusqu'à 90%
Источник: AWS Machine Learning Blog. Коллаж: Hamidun News.

PwC и AWS представили AIDA — систему для анализа договоров, которая превращает длинные неструктурированные контракты в структурированные данные и ответы на естественном языке. Платформа построена на AWS и использует Amazon Bedrock, чтобы находить ключевые условия, сроки и обязательства без ручного поиска по десяткам страниц.

Как работает AIDA AIDA рассчитана на юристов, compliance-команды и

закупки — там, где объём договоров растёт быстрее, чем ресурс на их чтение. Вместо привычного поиска по ключевым словам система сочетает OCR, пользовательские правила извлечения и LLM-модели в Amazon Bedrock. На выходе команда получает не просто найденные фразы, а структурированные поля с привязкой к конкретным фрагментам контракта.

Это снимает часть ручной нагрузки с команд, которые обычно собирают такие данные вручную для согласования, учёта и отчётности. В демо PwC загрузила в систему образцы из открытого юридического датасета CUAD. После этого AIDA строит семантическое представление документов, индексирует его и использует Retrieval-Augmented Generation, чтобы отвечать на вопросы с опорой на текст договора.

Это важно для юридических сценариев: ответ можно проверить по ссылке на исходный абзац, а не доверять модели на слово, когда речь идёт о сроках, штрафах или обязанностях сторон.

Три ключевых режима

Главная идея AIDA — не один интерфейс для чата с PDF, а несколько режимов под разные этапы контрактного анализа. В AWS выделяют три базовых сценария, которые дают наибольший выигрыш по времени: массовое извлечение полей по шаблонам, точечные вопросы по одному документу и сквозной поиск по целому набору соглашений. За счёт этого сервис подходит и для первичной разметки массива договоров, и для быстрых проверок по ходу переговоров или аудита.

Шаблонное извлечение — команда один раз задаёт поля вроде срока расторжения, условий продления или прав на использование, а затем применяет одинаковые правила к тысячам договоров. Чат по одному документу — можно спросить у системы о конкретной дате, обязательстве или ограничении и получить ответ, привязанный к нужному месту в тексте. * Глобальный чат по проекту — AIDA сравнивает сразу несколько контрактов, ищет общие оговорки, различия в обязательствах и сводит выводы в один ответ.

* Фильтрация по метаданным — результаты можно сузить по типу договора, дате, бизнес-юниту или юрисдикции, чтобы не смешивать разные классы документов. По данным PwC, в клиентских внедрениях AIDA сокращала время ручной проверки контрактов до 90%. AWS отдельно приводит пример крупной кино- и телестудии, где система так же ускорила исследование прав по лицензиям: она выделяет broadcast, streaming, theatrical и derivative rights, чтобы быстрее понимать, что можно показывать, переупаковывать или выводить на новые рынки.

Для медиа и entertainment это особенно важно, потому что стоимость ошибки в правах обычно выше стоимости самой автоматизации.

Безопасность и системные интеграции

Архитектура AIDA построена как корпоративный сервис, а не экспериментальный прототип. На входе стоят AWS WAF, балансировщик и NGINX, доступ управляется через Amazon Cognito с подключением к Microsoft Entra ID или Okta, а права можно настраивать и на уровне приложения, и на уровне проекта. Данные шифруются в транзите и в покое: документы и OCR-выгрузки хранятся в Amazon S3, структурированные результаты — в Amazon RDS.

Для обработки больших объёмов система использует Amazon ECS на AWS Fargate и очередь Amazon SQS, поэтому загрузка сотен и тысяч документов не блокирует интерфейс. Векторный поиск строится на Amazon Bedrock Knowledge Bases и Amazon OpenSearch Serverless, а Guardrails в Amazon Bedrock отвечают за фильтрацию контента, защиту персональных данных и безопасность промптов. Перед отправкой результатов в downstream-системы AIDA может включать human-in-the-loop-проверку, а сами данные передаются дальше в CLM, ERP, CRM и хранилища через Lambda, EventBridge и SQS.

Что это значит

PwC и AWS показывают, как GenAI уходит из демонстраций в узкие, дорогие для бизнеса процессы. Если система действительно стабильно извлекает поля, отвечает с цитатами и встраивается в CLM или ERP, то юридический AI начинает окупаться не обещаниями, а конкретной экономикой: короче циклы проверки, меньше ручного труда, быстрее поиск рисков, сроков и обязательств по контрактам.

ЖХ
Hamidun News
AI‑новости без шума. Ежедневный редакторский отбор из 400+ источников. Продукт Жемала Хамидуна, Head of AI в Alpina Digital.
Загружаем комментарии…