CNews AI→ оригинал

Smart Engines received a U.S. patent for AI that recognizes documents without hallucinations

Smart Engines received a U.S. patent for an AI technology for document recognition without hallucinations. The company says the system does not 'invent' fields

◐ Слушать статью

Российская Smart Engines сообщила, что получила патент США на технологию ИИ для распознавания документов без галлюцинаций. По заявлению компании, разработка снижает риск того, что система начнет «додумывать» символы и поля, если изображение документа оказалось шумным, размытым или неполным.

Что запатентовали

Речь идет о технологии, которая должна повысить надежность распознавания документов в условиях, где обычные модели часто ошибаются: на плохих сканах, фотографиях с бликами, смазанных кадрах или данных с потерями. Для Smart Engines американский патент — это не просто формальность, а подтверждение того, что решение удалось оформить как отдельную инженерную разработку на одном из самых конкурентных рынков интеллектуальной собственности. Сама новость важна еще и потому, что речь идет не о новом чат-боте, а о глубокой инфраструктурной задаче.

Чем шире компании автоматизируют KYC, архивы и входящий поток документов, тем сильнее им нужны модели, которые умеют не только распознавать, но и корректно работать с неопределенностью, не скрывая слабые места за внешне правдоподобным ответом. В сегменте распознавания документов цена ошибки особенно высока. Если система неверно прочитала номер, дату, фамилию или другой важный реквизит, это может повлиять на проверку клиента, оформление заявки, антифрод-процедуры или внутренний документооборот.

Поэтому задача здесь не в том, чтобы модель выдала наиболее «правдоподобный» ответ, а в том, чтобы она работала консервативно и не подменяла реальные данные собственными догадками.

Почему это важно

Проблема галлюцинаций обычно обсуждается в контексте больших языковых моделей, но в прикладном AI она возникает и в более узких задачах. Системы OCR и document AI тоже могут ошибочно восстанавливать пропущенные фрагменты, если входные данные слишком плохие. В итоге пользователь видит не просто низкую точность, а уверенную, но неверную интерпретацию документа.

«додумывания» системы распознавания из-за плохого качества данных.

Для бизнеса это критично по нескольким причинам: ошибка может попасть в анкету, договор или учетную запись клиента; неверно распознанный реквизит способен сломать автоматическую проверку; верификация и антифрод начинают требовать больше ручной перепроверки; каждая такая ошибка ухудшает доверие к AI в операционных процессах. По описанию Smart Engines, ключевая ценность технологии именно в том, что она должна убрать склонность системы заполнять пробелы вымышленными данными. На практике это означает более предсказуемое поведение: если качество входа недостаточно, система должна скорее сигнализировать о проблеме, чем выдавать красивый, но ложный результат. Для корпоративных внедрений такой подход обычно важнее, чем агрессивная попытка распознать все любой ценой.

Где пригодится

Подобные решения нужны везде, где документы обрабатываются массово и без участия оператора на каждом шаге. Это банки, страхование, телеком, логистика, сервисы onboarding, HR-процессы, государственные и окологосударственные сервисы. В таких сценариях документы часто загружают не из идеального сканера, а со смартфона, в спешке, при плохом освещении и с частично закрытыми полями.

Именно там разница между «распознать любой ценой» и «не исказить данные» становится принципиальной. Американский патент также усиливает позицию Smart Engines в международной конкуренции. Для B2B-заказчиков это сигнал, что компания пытается защищать не только бренд, но и конкретную технологическую основу продукта.

Для российского AI-рынка это еще и показательный кейс: локальные команды могут создавать не только прикладные сервисы поверх глобальных моделей, но и собственные базовые решения для надежного computer vision и распознавания документов.

Что это значит Рынок AI постепенно смещает фокус с эффектных демо к надежности в рабочих процессах.

История Smart Engines показывает, что одной из главных ценностей становится не максимальная «умность» модели, а ее способность не придумывать данные там, где цена ошибки слишком высока. Для компаний, которые автоматизируют документооборот, это практичный и очень прикладной сигнал.

ЖХ
Hamidun News
AI‑новости без шума. Ежедневный редакторский отбор из 400+ источников. Продукт Жемала Хамидуна, Head of AI в Alpina Digital.
Загружаем комментарии…