Habr AI→ original

La estructura alrededor de un LLM genera ganancias multiplicativas: qué cambió tras un año con Claude Code

Después de un año y medio con Claude Code, un ingeniero concluyó que la principal palanca de calidad de un LLM no está en las nuevas versiones de los modelos, s

La estructura alrededor de un LLM genera ganancias multiplicativas: qué cambió tras un año con Claude Code
Fuente: Habr AI. Collage: Hamidun News.
◐ Escuchar artículo

Después de dieciocho meses de trabajo intensivo con Claude Code, ejecución de decenas de lanzamientos experimentales y observaciones de equipos de ingeniería, un desarrollador experimentado llegó a una conclusión inesperada: la palanca principal para mejorar la calidad del LLM no es la generación del modelo ni la actualización a una versión más reciente, sino un sistema sofisticado de harness a su alrededor.

Qué es harness

En la comunidad de ingeniería, este harness se llama—un circuito completo en el cual opera el modelo de lenguaje. No es simplemente un prompt pasado en un chat, ni es una única regla de comportamiento. Es un sistema complejo de la interacción del modelo con el mundo externo: sus reglas, límites, herramientas disponibles y el alcance del contexto visible. Sin este circuito, incluso el modelo más poderoso funciona de manera ineficiente—como una excavadora sin brazos que tiene un motor pero no tiene nada para cavar o mover tierra.

Por qué el harness proporciona una mejora mayor que los nuevos modelos

Durante un año de observación, quedó claro que cambiar a una nueva versión del modelo proporciona ganancias de calidad notables pero limitadas. La transición de Claude 3 a Claude 4 es una mejora, pero representa solo unos pocos puntos porcentuales de ganancia de desempeño. Mientras tanto, cada nueva capa de harness alrededor del mismo modelo es un salto exponencial.

Agregue un prompt de sistema que describe claramente el papel del modelo—la calidad salta. Conecte herramientas a través de las cuales el modelo pueda interactuar con la realidad—otro salto. Expanda el contexto, agregue skills, configure permisos—cada vez la calidad crece exponencialmente.

Esto desplaza el foco de ingeniería lejos de la búsqueda de nuevas versiones hacia la construcción del circuito en el cual opera el modelo.

Componentes de un harness efectivo

Un harness efectivo consiste en varias capas clave, cada una contribuyendo su propio valor:

  • Prompt de sistema — instrucciones explícitas que definen el comportamiento, el estilo de comunicación y los límites
  • Herramientas — acceso del modelo a APIs externas, bases de datos, navegadores y recursos computacionales
  • Contexto — gestión sofisticada de lo que el modelo ve, recuerda y puede usar como referencia
  • Skills — patrones preentrenados y algoritmos para resolver tareas típicas
  • Hooks — eventos y disparadores que se activan bajo condiciones específicas
  • Permisos — el límite entre lo que el modelo puede y no puede hacer, qué archivos puede leer y escribir
  • Memoria — retención a largo plazo y corto plazo del contexto del proyecto, decisiones e ideas

Cada una de estas capas puede optimizarse de forma independiente, proporcionando mejoras de desempeño para tipos de tareas específicas.

"Existe poder, pero no hay nada para usarlo"—así es como un ingeniero

experimentado describe un modelo sin harness.

Lo que esto significa

El foco del desarrollador cambia de la carrera por modelos más nuevos y poderosos hacia la construcción de un circuito inteligente alrededor de los existentes. Las inversiones en ingeniería de prompt de sistema, gestión de contexto, desarrollo de skills y optimización de permisos se amortizan más rápidamente y proporcionan resultados mayores que esperar a la próxima versión del modelo. Esto abre nuevas posibilidades de personalización a tareas y equipos específicos, sin requerir actualizaciones costosas de hardware o licencias.

ZK
Hamidun News
Noticias de AI sin ruido. Selección editorial diaria de más de 400 fuentes. Producto de Zhemal Khamidun, Head of AI en Alpina Digital.
¿Qué te parece?
Cargando comentarios…