Hugging Face añade DeepInfra a Inference Providers para ejecutar modelos mediante API unificada

Q: ¿Cuál es la fuente?

Publicado originalmente en Hugging Face Blog. Hamidun News procesa y adapta los materiales con IA.

Q: ¿Cuándo se publicó?

30 abr 2026. Tiempo de lectura: 3 min.

Hugging Face añadió DeepInfra a Inference Providers en el Hub. Los modelos DeepSeek, Kimi y GLM ahora pueden ejecutarse directamente desde las páginas de…

Redacción de Hamidun News

Monitoreo de AI · Hugging Face Blog

30 abr 2026· 3 min

Procesado por IA desde Hugging Face Blog; editado por Hamidun News

Hugging Face añade DeepInfra a Inference Providers para ejecutar modelos mediante API unificada — Fuente: Hugging Face Blog. Collage: Hamidun News.

◐ Escuchar artículo

Hugging Face ha añadido DeepInfra a la lista de Inference Providers en Hub. Ahora los desarrolladores pueden ejecutar modelos disponibles a través de DeepInfra directamente desde páginas de modelos, a través de SDKs de cliente y del router unificado de Hugging Face sin integración personalizada separada.

Qué se lanzó

La nueva integración expande el ecosistema de inferencia sin servidor dentro de Hugging Face. DeepInfra se convirtió en un proveedor soportado en Hub, lo que significa que sus modelos pueden seleccionarse justo donde los desarrolladores ya buscan conjuntos de datos, tarjetas de modelos y ejemplos de código listos para ejecutar modelos. En el propio anuncio, DeepInfra se describe como una plataforma de inferencia de IA con más de 100 modelos y uno de los precios por token más bajos del mercado. Para Hugging Face, este es otro paso hacia un modelo donde Hub funciona no solo como catálogo, sino como punto unificado de lanzamiento de modelos.

En el lanzamiento, la integración cubre escenarios conversacionales y generación de texto estándar. A través de DeepInfra en Hugging Face, ya puedes acceder a modelos populares de peso abierto como DeepSeek V4, Kimi-K2.6 y GLM-5.1. Al mismo tiempo, el equipo ya ha esbozado la siguiente etapa: en el futuro, text-to-image, text-to-video, embeddings y otros tipos de tareas deberían aparecer a través de la misma capa. En otras palabras, no se trata de una integración única de uno o dos LLMs, sino de conectar un canal computacional más amplio a la infraestructura de Hugging Face.

Cómo funciona

Desde la perspectiva del usuario, todo está integrado en la interfaz Hub familiar. En la configuración de cuenta, puedes agregar tus propias claves de proveedor y establecer el orden de preferencia, y en las páginas de modelos de Hugging Face, muestra proveedores externos compatibles y genera widgets y ejemplos de código para ellos. Si no se especifica una clave, las solicitudes pueden ir a través del propio Hugging Face. Si se proporciona una clave, las llamadas se envían directamente a DeepInfra. Esto elimina la configuración manual innecesaria y hace que cambiar entre proveedores sea notablemente más fácil.

Tu propia clave de API de DeepInfra para llamadas directas sin intermediarios
Modo enrutado por HF, cuando no se necesita una clave de proveedor separada
Clasificación de proveedores por prioridad del usuario
El mismo enfoque en interfaz Hub, SDK de Python y SDK de JavaScript
Integración con harnesses de agentes populares sin configuración adicional

Para código, el esquema también es maximamente simple. DeepInfra está disponible a través de `huggingface_hub` para Python y `@huggingface/inference` para JavaScript, y los ejemplos del anuncio utilizan un cliente compatible con OpenAI con la URL base `https://router.huggingface.co/v1` y un token de Hugging Face. El modelo se especifica en el formato `model:provider`, por ejemplo para llamar a DeepSeek a través de DeepInfra.

Se enfatiza por separado que la integración ya funciona en varios harnesses de agentes, por lo que los modelos pueden conectarse no solo en código sin procesar, sino también en herramientas de agentes encima de la API común.

Precios y acceso

Con la facturación, Hugging Face dejó dos escenarios claros. Si un desarrollador utiliza su propia clave de DeepInfra, el pago va a DeepInfra con sus tarifas. Si la solicitud se enruta a través del Hub de Hugging Face, el cargo va a través de la cuenta de Hugging Face, pero sin margen adicional de la plataforma: la compañía dice que simplemente transmite el costo estándar de la API del proveedor. Para equipos, este es un detalle importante, porque el router unificado no se convierte en otra capa de precios sobre la infraestructura ya existente.

También hay una forma clara de probar la integración sin gastos importantes. Los usuarios del plan PRO obtienen $2 en créditos de inferencia por mes, que pueden gastarse con diferentes proveedores dentro de este sistema. Las cuentas gratuitas también tienen un pequeño límite de inferencia, aunque Hugging Face empuja directamente a los usuarios activos a cambiar a PRO. En términos prácticos, esto reduce la barrera de entrada: puedes comparar rápidamente DeepInfra con otros proveedores en los mismos modelos sin construir una configuración de prueba separada ni configurar varios SDKs diferentes.

Qué significa

Hugging Face está transformando cada vez más Hub en una capa de orquestración sobre múltiples proveedores de IA, no solo una vitrina de modelos. Para los desarrolladores, esto significa menos integración manual, pruebas más rápidas de LLMs de peso abierto y un camino más fácil hacia arquitectura multi-proveedor sin reescribir código de cliente.

Hamidun News

Noticias de AI sin ruido. Selección editorial diaria de más de 400 fuentes. Producto de Zhemal Khamidun, Head of AI en Alpina Digital.

Canal de Telegram RSS hamidun.com

¿Quieres dejar de leer sobre IA y empezar a usarla?

AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.

🎓 Academy — 7 días gratis Consulta gratuita