Sberbank: a Rússia precisa de IA soberana, mas não pode prescindir de dados estrangeiros controlados
O Sberbank afirmou que a IA soberana continua sendo a forma mais confiável de reduzir a dependência de tecnologias estrangeiras. Mas um caminho totalmente fecha
Сбербанк считает, что России нужен суверенный искусственный интеллект, чтобы не зависеть критически от зарубежных моделей и сервисов. При этом полностью изолированная стратегия в 2026 году выглядит слишком дорогой и нереалистичной: без ограниченного доступа к иностранным данным качественную модель собрать трудно.
Почему нужен контроль
Логика Сбербанка проста: если ключевая модель, API или инфраструктурный компонент контролируется извне, то в любой момент правила доступа могут измениться. Для банков, госсектора и крупных корпораций это не абстрактный риск, а прямой операционный вопрос. Сегодня модель доступна, завтра меняются лицензии, экспортные ограничения, тарифы или условия использования, и целые процессы начинают зависеть от чужих решений.
На фоне такой неопределенности идея суверенного ИИ превращается из политического лозунга в задачу технологической устойчивости. Под суверенностью в этом контексте имеется в виду не просто запуск локального чат-бота, а контроль над всей цепочкой: вычислениями, данными, дообучением, безопасностью и правилами внедрения. Для компаний из регулируемых отраслей это особенно важно, потому что они работают с чувствительной информацией и не могут строить долгосрочные продукты на сервисах, доступ к которым нельзя гарантировать.
Поэтому ставка на собственные модели и платформы выглядит как страховка от внешнего отключения и от навязанных ограничений.
Цена собственной модели Но у такого курса есть высокая цена.
Обучение сильной базовой модели с нуля в 2026 году — это уже не история про одну исследовательскую команду и пару удачных экспериментов. Нужны большие вычислительные мощности, стабильные поставки оборудования, длинные циклы настройки, команды инженеров и месяцы, а иногда и годы итераций. Даже если деньги есть, это все равно медленный путь: качество приходит не сразу, а ошибки на ранних этапах обходятся очень дорого.
Практически это означает сразу несколько тяжелых инвестиций: закупка и загрузка GPU-кластеров сбор и очистка больших датасетов команды ML-, data- и infra-инженеров юридический и безопасностный контроль данных Именно поэтому тезис Сбербанка звучит прагматично, а не максималистски. Речь не о том, что изоляция любой ценой даст лучший результат, а о том, что полный технологический суверенитет сегодня слишком дорог, если строить его в отрыве от мировой базы знаний. Можно создать собственный контур и собственную модель, но это не отменяет фундаментальной проблемы: для конкурентного качества нужны масштаб, время и доступ к разнообразному материалу для обучения.
Компромисс с данными
Здесь появляется вторая часть позиции: полностью отказаться от иностранных данных на практике невозможно. Современные модели учатся на огромных массивах текстов, кода, научных публикаций, технической документации и мультиязычного контента, значительная часть которого создана за пределами России. Если искусственно отсечь этот слой, модель быстро упрется в пробелы: хуже будет понимать международный контекст, слабее работать с кодом, терять точность в науке, финансах и инженерных задачах.
Оптимальной стратегией в Сбербанке называют смешанный подход: опора на отечественные разработки плюс ограниченное и контролируемое использование зарубежных датасетов. Ключевое слово здесь — контроль. То есть не бесконтрольное подключение к внешним сервисам, а понятные правила отбора данных, локальное хранение, фильтрация, проверка прав использования и возможность в любой момент продолжить работу внутри собственного контура.
Такой подход снижает зависимость, но не обрезает качество там, где без глобального корпуса данных пока не обойтись.
Что это значит
Для российского AI-рынка это сигнал, что спор смещается от лозунга «свое или чужое» к более практичной формуле. Побеждать будут те, кто сможет собрать локальную инфраструктуру и модельный стек, но при этом аккуратно использовать мировой массив данных без прямой зависимости от иностранных платформ. Иначе либо качество окажется слабым, либо риск отключения останется слишком высоким.