Alibaba libera Qwen3.6-35B-A3B — un modelo MoE multimodal centrado en la codificación orientada a agentes

Q: ¿Cuál es la fuente?

Publicado originalmente en MarkTechPost. Hamidun News procesa y adapta los materiales con IA.

Q: ¿Cuándo se publicó?

2 may 2026. Tiempo de lectura: 3 min.

Alibaba liberó los pesos de Qwen3.6-35B-A3B, un modelo MoE multimodal con 35.000 millones de parámetros totales y 3.000 millones activos. La novedad está…

Redacción de Hamidun News

Monitoreo de AI · MarkTechPost

2 may 2026· 3 min

Procesado por IA desde MarkTechPost; editado por Hamidun News

Alibaba libera Qwen3.6-35B-A3B — un modelo MoE multimodal centrado en la codificación orientada a agentes — Fuente: MarkTechPost. Collage: Hamidun News.

◐ Escuchar artículo

El equipo Qwen de Alibaba ha abierto los pesos de Qwen3.6-35B-A3B — un nuevo modelo multimodal con arquitectura sparse MoE. Con 35 mil millones de parámetros totales, solo 3 mil millones se activan durante la inferencia, y el enfoque principal está en la codificación agnóstica, el uso de herramientas y la comprensión multimodal.

Qué se lanzó

Qwen3.6-35B-A3B se convirtió en la primera versión de la línea Qwen3.6 con pesos abiertos tras el lanzamiento de Qwen3.

6-Plus. El modelo se distribuye bajo la licencia Apache 2.0, disponible para auto-hospedaje en Hugging Face y ModelScope, así como a través de la API Alibaba Cloud Model Studio.

Este no es solo un modelo de texto: incluye un codificador de visión, por lo que acepta imágenes y vídeo, y tiene un contexto nativo de 262.144 tokens con la capacidad de expandirse a aproximadamente 1,01 millones. La idea clave del lanzamiento es alto rendimiento con un bajo número de parámetros activos.

Internamente, el modelo tiene 35 mil millones de parámetros, pero en cada paso solo alrededor de 3 mil millones realmente funcionan. Según la tarjeta del modelo, la arquitectura utiliza 256 expertos, de los cuales 8 expertos enrutados y 1 experto compartido se activan simultáneamente. En la práctica, esto significa inferencia más barata en comparación con modelos densos grandes.

Qwen3.6 también funciona en modo thinking por defecto, pero admite respuestas directas sin razonamiento intermedio.

Apuesta por el código

Qwen posiciona directamente este lanzamiento como un modelo para codificación agnóstica, no solo otro chatbot de propósito general. Los desarrolladores enfatizan que Qwen3.6-35B-A3B maneja mejor las tareas frontend, la navegación del repositorio y el trabajo multi-paso con herramientas. El modelo se integra con Qwen-Agent, OpenClaw, Qwen Code e incluso Claude Code a través de APIs compatibles. Para sesiones largas, hay una función preserve_thinking separada: guarda cadenas de razonamiento de mensajes anteriores para que el agente no reconstruya el contexto desde cero en cada paso.

Llamada de herramientas y trabajo con canalizaciones agnósticas
Análisis de repositorio en múltiples archivos
Generación y edición de código frontend
Sesiones iterativas largas con contexto de razonamiento preservado

Según Qwen, el modelo se destaca principalmente en pruebas de codificación y agnósticas. En SWE-bench Verified obtiene 73,4, en Terminal-Bench 2.0 — 51,5, en NL2Repo — 29,4, y en QwenWebBench interno — 1397. Esto es notablemente superior a Qwen3.5-35B-A3B, y en una serie de tareas mejor que el mayor modelo denso Qwen3.5-27B. En otras palabras, Qwen intenta demostrar que un modelo MoE de peso abierto puede ser útil no solo para chat local, sino también para flujos de trabajo de desarrollo completos donde necesitas herramientas, memoria de pasos anteriores y trabajo con una base de código completa.

Multimodalidad sin compromisos

Se hace especial énfasis en la visión y el razonamiento multimodal. Según las tablas de Qwen, el modelo muestra 85,3 en RealWorldQA, 92,8 en MMBench EN, 89,9 en OmniDocBench1.5 y 81,9 en CC-OCR.

En tareas de comprensión espacial los resultados son aún más interesantes: 92,0 en RefCOCO y 50,8 en ODInW13. Para vídeo también hay métricas sólidas — 83,7 en VideoMMMU y 86,2 en MLVU. Para un modelo con 3 mil millones de parámetros activos, esta es una afirmación seria de universalidad, no una especialización estrecha solo para código.

El significado práctico es que Qwen3.6-35B-A3B se puede poner en pilas de inferencia familiares como vLLM y SGLang, con modos para uso de herramientas y ejecución solo de lenguaje si necesitas liberar memoria. En los ejemplos de Qwen, el modelo se ejecuta con contexto completo 262K en ocho GPU, pero recomiendan por separado no descender por debajo de 128K si las capacidades thinking son importantes.

Para equipos que desean mantener el modelo internamente y no depender de SaaS cerrado, esto ya parece no como un experimento, sino como una solución operativa.

Qué significa esto

Qwen continúa desplazando el mercado de peso abierto hacia modelos más prácticos: no tamaño máximo por su propio bien, sino un equilibrio entre costo de inferencia, contexto largo, multimodalidad y utilidad real en desarrollo. Si los resultados afirmados se confirman en escenarios del mundo real, Qwen3.6-35B-A3B se convertirá en una de las opciones abiertas más interesantes para equipos que necesiten un asistente IA para código, documentos, imágenes y tareas agnósticas sin dependencia obligatoria de plataformas cerradas.

Hamidun News

Noticias de AI sin ruido. Selección editorial diaria de más de 400 fuentes. Producto de Zhemal Khamidun, Head of AI en Alpina Digital.

Canal de Telegram RSS hamidun.com

¿Quieres dejar de leer sobre IA y empezar a usarla?

AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.

🎓 Academy — 7 días gratis Consulta gratuita