Mistral presenta Small 4 — el modelo que unificó razonamiento, código y visión
Mistral ha lanzado Small 4 — un modelo unificado que reemplaza tres sistemas especializados: Magistral para razonamiento, Pixtral para visión y Devstral para có
Procesado por IA desde Mistral AI News; editado por Hamidun News
Mistral AI presentó Mistral Small 4 — un modelo que unifica en un solo sistema tres modelos especializados separados: Magistral para razonamiento complejo, Pixtral para análisis de imágenes y Devstral para código. Hasta ahora, los desarrolladores tenían que elegir qué modelo usar para cada tarea específica. Ahora, una única opción universal resuelve todos los problemas sin necesidad de cambiar entre sistemas.
Un modelo unificado en lugar de tres
Mistral Small 4 es una arquitectura híbrida optimizada para chat, codificación, tareas de agentes y razonamiento complejo. Admite entradas tanto de texto como gráficas, lo que abre un amplio espectro de aplicaciones: desde sistemas conversacionales y gestión de documentos hasta análisis de información visual y creación de agentes autónomos. La compañía señala que el lanzamiento de Small 4 confirma su compromiso con el código abierto — el modelo se distribuye bajo la licencia Apache 2.
0. Mistral se enorgullece de haberse unido a NVIDIA Nemotron Coalition como fundador, promoviendo la colaboración e innovación en el desarrollo de IA. Esta es una señal de que la industria se está moviendo hacia soluciones abiertas y modulares que las empresas pueden adaptar a sus necesidades.
Qué hay dentro del modelo
La arquitectura se construye sobre principios modernos de escalabilidad y eficiencia:
- Mixture of Experts (MoE): 128 expertos con 4 activos simultáneamente por token — distribución eficiente de cálculos sin cargar todos los parámetros
- Parámetros: 119B en total, 6B activos por token (8B incluyendo capas de embedding y salida)
- Contexto: 256k tokens — soporte para documentos largos, informes multipágina y análisis
- Multimodalidad: soporte integrado para texto e imágenes sin módulos de transición
- Razonamiento flexible: el parámetro reasoning_effort permite ajustar la profundidad del análisis según la tarea
Este diseño permite que el modelo se escale sin pérdida de eficiencia. Solo 6B parámetros están activos por token, lo que reduce los requisitos de memoria y acelera la inferencia. En comparación con los modelos tradicionales de 120B, Small 4 ahorra recursos computacionales gracias al enrutamiento de expertos — cada token va solo a los expertos necesarios.
Razonamiento sobre la marcha
La innovación principal es el parámetro reasoning_effort, que permite cambiar dinámicamente el comportamiento del modelo según la tarea específica. Si reasoning_effort="none", el modelo responde lo más rápido posible, como Mistral Small 3.2. Si reasoning_effort="high", cambia al modo de análisis detallado paso a paso, equivalente a las versiones anteriores de Magistral para razonamiento complejo. Gracias a esto, un único modelo puede funcionar tanto como un chatbot rápido para tareas cotidianas, como un compañero de investigación para tareas analíticas complejas. Esto es especialmente conveniente para sistemas empresariales, donde no todas las solicitudes requieren análisis profundo, y el poder computacional excesivo lleva a gastos innecesarios. Los desarrolladores incluso pueden ajustar niveles intermedios de razonamiento si los modos estándar no se ajustan.
Rendimiento y optimización
En modo de optimización de velocidad (configuración de baja latencia), Small 4 funciona un 40% más rápido que sus predecesores — retrasos mínimos en la respuesta. En modo de rendimiento (rendimiento optimizado), el sistema procesa 3 veces más solicitudes por segundo que Mistral Small 3. La optimización de la inferencia se realizó conjuntamente con NVIDIA.
El modelo está completamente optimizado para vLLM y SGLang, lo que garantiza un despliegue de alto rendimiento eficiente en diferentes escenarios de infraestructura. Los desarrolladores tienen acceso a vLLM, llama.cpp, SGLang y Transformers, lo que simplifica la integración en pipelines existentes.
Infraestructura mínima para despliegue: 4 NVIDIA HGX H100, 2 NVIDIA HGX H200 o 1 NVIDIA DGX B200. Para rendimiento máximo, se recomienda duplicar estos recursos.
Lo que esto significa
Mistral Small 4 es una señal de que la era de los modelos especializados está llegando a su fin. En el futuro, una única opción universal con parámetros configurables podría reemplazar toda una gama de herramientas especializadas. Para los desarrolladores, esto es una simplificación: no hay necesidad de elegir y cambiar entre modelos. Para las empresas, es una reducción en la complejidad de la arquitectura, el despliegue y el mantenimiento del sistema.
¿Quieres dejar de leer sobre IA y empezar a usarla?
AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.