Alibaba libera Qwen3.6-35B-A3B — un modelo MoE multimodal centrado en la codificación orientada a agentes
Alibaba liberó los pesos de Qwen3.6-35B-A3B, un modelo MoE multimodal con 35.000 millones de parámetros totales y 3.000 millones activos. La novedad está…
Procesado por IA desde MarkTechPost; editado por Hamidun News
El equipo Qwen de Alibaba ha abierto los pesos de Qwen3.6-35B-A3B — un nuevo modelo multimodal con arquitectura sparse MoE. Con 35 mil millones de parámetros totales, solo 3 mil millones se activan durante la inferencia, y el enfoque principal está en la codificación agnóstica, el uso de herramientas y la comprensión multimodal.
Qué se lanzó
Qwen3.6-35B-A3B se convirtió en la primera versión de la línea Qwen3.6 con pesos abiertos tras el lanzamiento de Qwen3.
6-Plus. El modelo se distribuye bajo la licencia Apache 2.0, disponible para auto-hospedaje en Hugging Face y ModelScope, así como a través de la API Alibaba Cloud Model Studio.
Este no es solo un modelo de texto: incluye un codificador de visión, por lo que acepta imágenes y vídeo, y tiene un contexto nativo de 262.144 tokens con la capacidad de expandirse a aproximadamente 1,01 millones. La idea clave del lanzamiento es alto rendimiento con un bajo número de parámetros activos.
Internamente, el modelo tiene 35 mil millones de parámetros, pero en cada paso solo alrededor de 3 mil millones realmente funcionan. Según la tarjeta del modelo, la arquitectura utiliza 256 expertos, de los cuales 8 expertos enrutados y 1 experto compartido se activan simultáneamente. En la práctica, esto significa inferencia más barata en comparación con modelos densos grandes.
Qwen3.6 también funciona en modo thinking por defecto, pero admite respuestas directas sin razonamiento intermedio.
Apuesta por el código
Qwen posiciona directamente este lanzamiento como un modelo para codificación agnóstica, no solo otro chatbot de propósito general. Los desarrolladores enfatizan que Qwen3.6-35B-A3B maneja mejor las tareas frontend, la navegación del repositorio y el trabajo multi-paso con herramientas. El modelo se integra con Qwen-Agent, OpenClaw, Qwen Code e incluso Claude Code a través de APIs compatibles. Para sesiones largas, hay una función preserve_thinking separada: guarda cadenas de razonamiento de mensajes anteriores para que el agente no reconstruya el contexto desde cero en cada paso.
- Llamada de herramientas y trabajo con canalizaciones agnósticas
- Análisis de repositorio en múltiples archivos
- Generación y edición de código frontend
- Sesiones iterativas largas con contexto de razonamiento preservado
Según Qwen, el modelo se destaca principalmente en pruebas de codificación y agnósticas. En SWE-bench Verified obtiene 73,4, en Terminal-Bench 2.0 — 51,5, en NL2Repo — 29,4, y en QwenWebBench interno — 1397. Esto es notablemente superior a Qwen3.5-35B-A3B, y en una serie de tareas mejor que el mayor modelo denso Qwen3.5-27B. En otras palabras, Qwen intenta demostrar que un modelo MoE de peso abierto puede ser útil no solo para chat local, sino también para flujos de trabajo de desarrollo completos donde necesitas herramientas, memoria de pasos anteriores y trabajo con una base de código completa.
Multimodalidad sin compromisos
Se hace especial énfasis en la visión y el razonamiento multimodal. Según las tablas de Qwen, el modelo muestra 85,3 en RealWorldQA, 92,8 en MMBench EN, 89,9 en OmniDocBench1.5 y 81,9 en CC-OCR.
En tareas de comprensión espacial los resultados son aún más interesantes: 92,0 en RefCOCO y 50,8 en ODInW13. Para vídeo también hay métricas sólidas — 83,7 en VideoMMMU y 86,2 en MLVU. Para un modelo con 3 mil millones de parámetros activos, esta es una afirmación seria de universalidad, no una especialización estrecha solo para código.
El significado práctico es que Qwen3.6-35B-A3B se puede poner en pilas de inferencia familiares como vLLM y SGLang, con modos para uso de herramientas y ejecución solo de lenguaje si necesitas liberar memoria. En los ejemplos de Qwen, el modelo se ejecuta con contexto completo 262K en ocho GPU, pero recomiendan por separado no descender por debajo de 128K si las capacidades thinking son importantes.
Para equipos que desean mantener el modelo internamente y no depender de SaaS cerrado, esto ya parece no como un experimento, sino como una solución operativa.
Qué significa esto
Qwen continúa desplazando el mercado de peso abierto hacia modelos más prácticos: no tamaño máximo por su propio bien, sino un equilibrio entre costo de inferencia, contexto largo, multimodalidad y utilidad real en desarrollo. Si los resultados afirmados se confirman en escenarios del mundo real, Qwen3.6-35B-A3B se convertirá en una de las opciones abiertas más interesantes para equipos que necesiten un asistente IA para código, documentos, imágenes y tareas agnósticas sin dependencia obligatoria de plataformas cerradas.
¿Quieres dejar de leer sobre IA y empezar a usarla?
AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.