Habr AI→ original

OpenAI, Qwen y GigaChat: por qué a las empresas rusas les resulta cada vez más difícil elegir modelos de AI

Las empresas rusas se encuentran cada vez más ante una disyuntiva incómoda: los LLM occidentales son cada vez menos accesibles, los modelos totalmente…

Procesado por IA desde Habr AI; editado por Hamidun News
OpenAI, Qwen y GigaChat: por qué a las empresas rusas les resulta cada vez más difícil elegir modelos de AI
Fuente: Habr AI. Collage: Hamidun News.
◐ Escuchar artículo

El mercado de IA ruso está entrando en una fase donde la elección de modelo ya no es simplemente una cuestión de calidad de respuesta. Para las empresas, ahora es una combinación de tres factores: la disponibilidad de servicios occidentales, requisitos de datos y el costo de la infraestructura local.

Cómo se reduce la elección

El autor describe una situación en la que los modelos occidentales como OpenAI y Anthropic se están volviendo cada vez menos accesibles para el negocio ruso no solo técnicamente, sino también legalmente. El bloqueo geográfico y las restricciones de IP ya funcionan para algunos proveedores, y en industrias reguladas, incluso el acceso formalmente permitido a través de proxy poco resuelve. Si el nombre, teléfono o voz de un cliente aparece en una solicitud a una API externa, parece una transferencia transfronteriza de datos personales y choca con los requisitos de la Ley Federal 152-FZ.

Esto coloca los agentes de IA para soporte, ventas y centros de contacto en una zona de mayor riesgo. A través de estos modelos pasa no texto abstracto, sino datos reales del usuario. En este contexto, la demanda está creciendo dentro de Rusia por soluciones "soberanas", pero esta palabra a menudo oculta no modelos propios, sino versiones adaptadas de sistemas de código abierto extranjeros.

Y aquí es donde comienza el principal compromiso: cuanto mayor sea la independencia formal, más pesada será la economía.

Tres escenarios funcionales

El mercado ha establecido esencialmente tres enfoques. El primero es construir un modelo base desde cero, como hace Sber con la familia GigaChat. El segundo es tomar un modelo abierto fuerte, generalmente de la familia Qwen, y ajustarlo en corpus ruso y datos de dominio, como hacen Yandex, T-Bank y Avito. El tercero es continuar usando APIs occidentales a través de la zona gris, si el negocio está dispuesto a aceptar el riesgo legal.

  • GigaChat — máximo control y localidad, pero entrenamiento e inferencia muy costosos.
  • Qwen después del ajuste fino — notablemente más barato y más rápido de lanzar, pero la soberanía aquí es condicional.
  • OpenAI y Anthropic — calidad sólida y economía clara, pero el acceso se vuelve cada vez más inestable.
  • Esquemas híbridos — un compromiso para negocios de mercado medio: comienza en la nube, luego migra a tu propio perímetro.

El problema es que cada camino tiene costos que no se pueden ignorar. El entrenamiento desde cero requiere decenas o incluso cientos de millones de dólares, un gran volumen de datos y GPUs escasas de nivel H100 o H200. El ajuste fino de Qwen se ve más realista, pero la arquitectura base y los pesos siguen siendo chinos. Desde la perspectiva de la lógica regulatoria estricta, esto no es independencia completa, sino un compromiso cuidadosamente localizado.

Dónde se pierde el dinero

El argumento más doloroso del artículo — no la calidad del modelo, sino el precio de la inferencia. Según los cálculos del autor en su propia plataforma de agentes, un minuto de trabajo en un modelo OpenAI comparable cuesta menos de 1 rublo, mientras que un minuto en GigaChat-Max cuesta alrededor de 80 rublos. Para agentes de voz y centros de contacto, esta es una diferencia no en porcentajes, sino en casi dos órdenes de magnitud. En tal modelo de costos, puedes hacer un buen producto técnicamente, pero no puedes justificarlo económicamente.

"Una solución completamente rusa es terriblemente cara"

Un golpe adicional — infraestructura. Un servidor capaz de servir alrededor de mil sesiones de agentes simultáneas, el autor lo estima en aproximadamente 55 millones de rublos. Luego entra otra trampa: para mantener el token relativamente barato, las GPUs deben cargarse al 80-90%. Con una demanda pequeña e irregular, esto es difícil. El equipo está inactivo, y los costos de electricidad, mantenimiento y depreciación no desaparecen. Por eso la IA se amortiza en primer lugar donde hay trabajo humano caro y carga constante: soporte, centros de contacto, funciones legales.

Qué significa esto

Para los equipos de producto, la conclusión es bastante dura: construir toda tu arquitectura en un único proveedor ya es peligroso. Si una empresa trabaja con LLMs en ruso, necesita un esquema agnóstico de modelo con cambio rápido entre OpenAI, GigaChat, soluciones similares a Qwen y un perímetro local. De lo contrario, cualquier nueva ronda de bloqueos, cambios de precio o requisitos de datos rápidamente convierte una opción técnica en un problema empresarial.

ZK
Hamidun News
Noticias de AI sin ruido. Selección editorial diaria de más de 400 fuentes. Producto de Zhemal Khamidun, Head of AI en Alpina Digital.

¿Quieres dejar de leer sobre IA y empezar a usarla?

AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.

¿Qué te parece?
Cargando comentarios…