Arcee AI Lanzó Trinity Large Thinking — Modelo de Razonamiento Abierto para Agentes IA

Q: ¿Cuál es la fuente?

Publicado originalmente en MarkTechPost. Hamidun News procesa y adapta los materiales con IA.

Q: ¿Cuándo se publicó?

28 abr 2026. Tiempo de lectura: 3 min.

Arcee AI lanzó Trinity Large Thinking — un modelo de razonamiento abierto bajo Apache 2.0 para tareas de agentes de largo plazo y uso de herramientas. Es una…

Redacción de Hamidun News

Monitoreo de AI · MarkTechPost

28 abr 2026· 2 min

Procesado por IA desde MarkTechPost; editado por Hamidun News

Arcee AI Lanzó Trinity Large Thinking — Modelo de Razonamiento Abierto para Agentes IA — Fuente: MarkTechPost. Collage: Hamidun News.

◐ Escuchar artículo

Arcee AI lanzó Trinity Large Thinking el 1 de abril de 2026 — un modelo de reasoning abierto diseñado no para respuestas de chat cortas, sino para escenarios agentivos largos con múltiples pasos, llamadas de herramientas y preservación del contexto entre turnos. Para el mercado, esta es una señal importante: en un segmento donde los modelos cerrados de grandes laboratorios fijan el tono, ha aparecido una variante abierta con licencia Apache 2.0 que no solo puede ser llamada por API, sino también ejecutada, ajustada e incrustada en sus propios sistemas sin zonas grises de licenciamiento.

Trinity Large Thinking es la versión de reasoning de la familia Trinity Large, que Arcee está desarrollando como alternativa abierta a modelos propietarios mayores. La empresa lanzó los pesos en Hugging Face y simultáneamente lanzó el modelo en su propia API. La apuesta clave aquí no es en un "chat universal para todo", sino en tareas donde un agente necesita mantener un plan, recordar los pasos anteriores, usar herramientas cuidadosamente y no desmoronarse después de varias iteraciones.

Estos son precisamente los escenarios que se están convirtiendo en fundamentales para el desarrollo de IA: agentes de código, operadores de sistemas internos, asistentes corporativos y pipelines con múltiples llamadas de servicios externos. Por arquitectura, el modelo pertenece a la clase sparse MoE: Trinity Large Thinking tiene aproximadamente 398-400 mil millones de parámetros, pero aproximadamente 13 mil millones se activan por token. Dentro hay 256 expertos, con solo cuatro trabajando simultáneamente.

Este diseño es necesario para mantener un techo de calidad elevado sin hacer la inferencia completamente impráctica. Arcee también menciona soporte para contexto de hasta 512 mil tokens después de la expansión de ventana, lo cual es especialmente importante para ciclos agentivos largos, repositorios grandes, documentación voluminosa y tareas complejas de múltiples pasos. Otro detalle — el modelo genera una "capa de reasoning" explícita antes de la respuesta, y se recomienda a los desarrolladores que preserven este contexto de reasoning entre turnos, de lo contrario la calidad del trabajo de múltiples pasos puede degradarse notablemente.

La parte más interesante del lanzamiento no es solo la licencia, sino también el enfoque declarado en agencia práctica. Según Arcee, Trinity Large Thinking ocupa el segundo lugar en PinchBench, cediendo solo a Claude Opus 4.6, y es significativamente más fuerte que el Trinity Large Preview temprano precisamente en trabajo de múltiples pasos con herramientas, seguimiento de instrucciones y mantenimiento de coherencia en ejecuciones largas.

En la tarjeta del modelo, la empresa también lista resultados fuertes en varios benchmarks agentivos, incluyendo τ²-Bench y LiveCodeBench. Simultáneamente, Arcee enfatiza la economía: en el momento del anuncio, la empresa valoró el costo de inferencia en aproximadamente $0,90 por millón de tokens de salida, posicionando el modelo como una alternativa sustancialmente más barata a sistemas de reasoning cerrados para agentes de producción. El contexto alrededor del lanzamiento también es importante.

Trinity Large Preview, presentado a finales de enero de 2026, según la empresa, procesó 3,37 billones de tokens a través de OpenRouter en sus primeros dos meses. Arcee afirma que la versión preview se convirtió en el modelo abierto más utilizado en los Estados Unidos en la colección OpenClaw y el cuarto globalmente. Para un equipo pequeño, esta es una forma de demostrar que ya existe demanda de modelos abiertos en escenarios agentivos reales — no a nivel de demostración, sino a nivel de carga de trabajo de producción constante.

Técnicamente, el proyecto resultó no trivial: Trinity Large fue preentrenado en 17 billones de tokens, usó 2048 GPU NVIDIA B300, y la empresa valoró anteriormente todo el camino hasta la familia Large en aproximadamente $20 millones. La conclusión principal del lanzamiento es esta: el mercado de IA de código abierto se está desplazando de la carrera "quién escribe mejor texto" a la carrera "qué modelo realiza trabajo largo de manera confiable." Trinity Large Thinking es importante no porque superó instantáneamente a los líderes cerrados en todas las métricas, sino porque proporciona a desarrolladores y empresas otra opción genuinamente abierta para construir sistemas agentivos sin limitaciones de solo API.

Ahora la pregunta no es si puede lanzarse un modelo de reasoning abierto de esta clase, sino qué tan establemente funcionará en producción, donde las hermosas demostraciones no importan — lo que importa son ciclos de varias horas, el costo de errores y la previsibilidad del comportamiento.

Hamidun News

Noticias de AI sin ruido. Selección editorial diaria de más de 400 fuentes. Producto de Zhemal Khamidun, Head of AI en Alpina Digital.

Canal de Telegram RSS hamidun.com

¿Quieres dejar de leer sobre IA y empezar a usarla?

AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.

🎓 Academy — 7 días gratis Consulta gratuita