OpenAI وQwen وGigaChat: لماذا يزداد اختيار نماذج AI صعوبة بالنسبة إلى الشركات الروسية
تواجه الشركات الروسية بشكل متزايد مفترقًا غير مريح: أصبحت نماذج LLM الغربية أقل إتاحة، وتكلفة النماذج المحلية بالكامل مرتفعة جدًا، فيما تظل الأنظمة الصينية المُ

Российский рынок ИИ входит в фазу, где выбор модели перестаёт быть просто вопросом качества ответов. Для компаний это уже связка из трёх факторов: доступности западных сервисов, требований к данным и цены локальной инфраструктуры.
Как сужается выбор
Автор статьи описывает ситуацию, в которой западные модели вроде OpenAI и Anthropic становятся всё менее доступными для российского бизнеса не только технически, но и юридически. Блокировки по странам и IP уже работают у части вендоров, а в регулируемых отраслях даже формально допустимый доступ через прокси мало что решает. Если в запросе к внешнему API есть имя, телефон или голос клиента, это уже похоже на трансграничную передачу персональных данных и упирается в требования 152-ФЗ.
Из-за этого ИИ-агенты для поддержки, продаж и контакт-центров попадают в зону повышенного риска. Там через модель проходит не абстрактный текст, а реальные пользовательские данные. На этом фоне внутри России усиливается спрос на «суверенные» решения, но под этим словом часто скрываются не собственные модели, а адаптированные версии зарубежных open-source систем.
И именно здесь начинается главный компромисс: чем выше формальная независимость, тем тяжелее экономика.
Три рабочих сценария На рынке фактически сложились три подхода.
Первый — строить базовую модель с нуля, как это делает Сбер с семейством GigaChat. Второй — брать сильную открытую модель, чаще всего из семейства Qwen, и дообучать её на русском корпусе и доменных данных, как делают Яндекс, Т-Банк и Авито. Третий — продолжать использовать западные API через серую зону, если бизнес готов принять юридический риск.
GigaChat — максимум контроля и локальности, но очень дорогие обучение и инференс. Qwen после дообучения — заметно дешевле и быстрее в запуске, но суверенность тут условная. * OpenAI и Anthropic — сильное качество и понятная экономика, но доступ становится всё менее стабильным.
* Гибридные схемы — компромисс для среднего бизнеса: старт в облаке, потом перенос в свой контур. Проблема в том, что у каждого пути есть издержка, которую нельзя игнорировать. Обучение с нуля требует десятков или даже сотен миллионов долларов, большого объёма данных и дефицитных GPU уровня H100 или H200.
Дообучение Qwen выглядит реалистичнее, но базовая архитектура и веса всё равно остаются китайскими. С точки зрения жёсткой регуляторной логики это уже не полная независимость, а аккуратно локализованный компромисс.
Где теряются деньги Самый болезненный аргумент в статье — не качество моделей, а цена инференса.
По расчётам автора на собственной агентной платформе, минута работы сопоставимой модели OpenAI обходится дешевле 1 рубля, тогда как минута на GigaChat-Max — около 80 рублей. Для голосовых агентов и контакт-центров это разница не в проценты, а почти в два порядка. В такой модели затрат можно сделать хороший продукт технически, но не вытянуть его экономически.
«Полностью российское решение — безумно дорого»
Дополнительный удар — инфраструктура. Сервер, который способен обслуживать около тысячи одновременных агентских сессий, автор оценивает примерно в 55 млн рублей. Дальше включается ещё одна ловушка: чтобы токен оставался относительно дешёвым, GPU нужно загружать на 80-90%. При небольшом и неравномерном спросе это сложно. Оборудование простаивает, а расходы на электроэнергию, обслуживание и амортизацию никуда не исчезают. Поэтому ИИ окупается в первую очередь там, где есть дорогой человеческий труд и постоянная нагрузка: поддержка, контакт-центры, юридические функции.
Что это значит
Для продуктовых команд вывод довольно жёсткий: ставить всю архитектуру на одного провайдера уже опасно. Если компания работает с русскоязычными LLM, ей нужна модельно-агностичная схема с быстрым переключением между OpenAI, GigaChat, Qwen-подобными решениями и локальным контуром. Иначе любой новый виток блокировок, цен или требований к данным быстро превращает технический выбор в бизнес-проблему.