Habr AI→ оригинал

OpenAI, Qwen et GigaChat : pourquoi il devient de plus en plus difficile pour les entreprises russes de choisir des modèles d'AI

Les entreprises russes se heurtent de plus en plus à une alternative inconfortable : les LLM occidentaux deviennent moins accessibles, les modèles entièrement l

OpenAI, Qwen et GigaChat : pourquoi il devient de plus en plus difficile pour les entreprises russes de choisir des modèles d'AI
Источник: Habr AI. Коллаж: Hamidun News.
◐ Слушать статью

Российский рынок ИИ входит в фазу, где выбор модели перестаёт быть просто вопросом качества ответов. Для компаний это уже связка из трёх факторов: доступности западных сервисов, требований к данным и цены локальной инфраструктуры.

Как сужается выбор

Автор статьи описывает ситуацию, в которой западные модели вроде OpenAI и Anthropic становятся всё менее доступными для российского бизнеса не только технически, но и юридически. Блокировки по странам и IP уже работают у части вендоров, а в регулируемых отраслях даже формально допустимый доступ через прокси мало что решает. Если в запросе к внешнему API есть имя, телефон или голос клиента, это уже похоже на трансграничную передачу персональных данных и упирается в требования 152-ФЗ.

Из-за этого ИИ-агенты для поддержки, продаж и контакт-центров попадают в зону повышенного риска. Там через модель проходит не абстрактный текст, а реальные пользовательские данные. На этом фоне внутри России усиливается спрос на «суверенные» решения, но под этим словом часто скрываются не собственные модели, а адаптированные версии зарубежных open-source систем.

И именно здесь начинается главный компромисс: чем выше формальная независимость, тем тяжелее экономика.

Три рабочих сценария На рынке фактически сложились три подхода.

Первый — строить базовую модель с нуля, как это делает Сбер с семейством GigaChat. Второй — брать сильную открытую модель, чаще всего из семейства Qwen, и дообучать её на русском корпусе и доменных данных, как делают Яндекс, Т-Банк и Авито. Третий — продолжать использовать западные API через серую зону, если бизнес готов принять юридический риск.

GigaChat — максимум контроля и локальности, но очень дорогие обучение и инференс. Qwen после дообучения — заметно дешевле и быстрее в запуске, но суверенность тут условная. * OpenAI и Anthropic — сильное качество и понятная экономика, но доступ становится всё менее стабильным.

* Гибридные схемы — компромисс для среднего бизнеса: старт в облаке, потом перенос в свой контур. Проблема в том, что у каждого пути есть издержка, которую нельзя игнорировать. Обучение с нуля требует десятков или даже сотен миллионов долларов, большого объёма данных и дефицитных GPU уровня H100 или H200.

Дообучение Qwen выглядит реалистичнее, но базовая архитектура и веса всё равно остаются китайскими. С точки зрения жёсткой регуляторной логики это уже не полная независимость, а аккуратно локализованный компромисс.

Где теряются деньги Самый болезненный аргумент в статье — не качество моделей, а цена инференса.

По расчётам автора на собственной агентной платформе, минута работы сопоставимой модели OpenAI обходится дешевле 1 рубля, тогда как минута на GigaChat-Max — около 80 рублей. Для голосовых агентов и контакт-центров это разница не в проценты, а почти в два порядка. В такой модели затрат можно сделать хороший продукт технически, но не вытянуть его экономически.

«Полностью российское решение — безумно дорого»

Дополнительный удар — инфраструктура. Сервер, который способен обслуживать около тысячи одновременных агентских сессий, автор оценивает примерно в 55 млн рублей. Дальше включается ещё одна ловушка: чтобы токен оставался относительно дешёвым, GPU нужно загружать на 80-90%. При небольшом и неравномерном спросе это сложно. Оборудование простаивает, а расходы на электроэнергию, обслуживание и амортизацию никуда не исчезают. Поэтому ИИ окупается в первую очередь там, где есть дорогой человеческий труд и постоянная нагрузка: поддержка, контакт-центры, юридические функции.

Что это значит

Для продуктовых команд вывод довольно жёсткий: ставить всю архитектуру на одного провайдера уже опасно. Если компания работает с русскоязычными LLM, ей нужна модельно-агностичная схема с быстрым переключением между OpenAI, GigaChat, Qwen-подобными решениями и локальным контуром. Иначе любой новый виток блокировок, цен или требований к данным быстро превращает технический выбор в бизнес-проблему.

ЖХ
Hamidun News
AI‑новости без шума. Ежедневный редакторский отбор из 400+ источников. Продукт Жемала Хамидуна, Head of AI в Alpina Digital.
Загружаем комментарии…