MarkTechPost→ original

Nous Research lanzó Tool Search para Hermes Agent: la precisión aumentó un 49–74% con Opus 4

Nous Research añadió Tool Search a Hermes Agent para optimizar MCP. En lugar de cargar todas las herramientas, el sistema encuentra solo los esquemas relevantes

Nous Research lanzó Tool Search para Hermes Agent: la precisión aumentó un 49–74% con Opus 4
Fuente: MarkTechPost. Collage: Hamidun News.
◐ Escuchar artículo

Nous Research presentó una actualización para Hermes Agent — agregando una función Tool Search que resuelve un antiguo problema de los agentes de IA al trabajar con MCP (Model Context Protocol). El nuevo enfoque permite al agente seleccionar solo herramientas relevantes en lugar de cargar la descripción completa de todas las herramientas disponibles en el contexto.

Sobrecarga de Contexto en MCP

Cuando un agente de IA interactúa con un sistema de herramientas a través de MCP, el enfoque tradicional requiere cargar descripciones de todas las herramientas disponibles en el contexto del modelo desde el principio. Si hay treinta, cincuenta o cien herramientas, y cada una tiene descripciones detalladas de parámetros y ejemplos de uso, esto rápidamente se convierte en un problema: el contexto se infla, los tokens se agotan antes de lo necesario, y el propio modelo puede perderse en mares de información. Nous Research notó este cuello de botella y decidió aplicar un enfoque clásico de recuperación de información — clasificación BM25.

Este es un algoritmo de búsqueda de texto completo que tiene en cuenta la relevancia de un documento (en este caso, una descripción de herramienta) para la consulta del usuario. En lugar de cargar el catálogo completo, el sistema ahora busca las herramientas más adecuadas y pasa sus esquemas al contexto progresivamente.

Cómo Funciona Tool Search en la Práctica

La mecánica es simple pero efectiva. Al inicializar el agente, el sistema indexa los metadatos de todas las herramientas disponibles — sus nombres, descripciones y propósitos. Cuando un usuario da un comando, el agente no mira la lista completa, sino que primero busca las K herramientas principales relevantes para la consulta:

  • Primer paso: ejecutar búsqueda BM25 en nombres y descripciones de herramientas
  • Segundo paso: cargar esquemas breves para los resultados principales en el contexto del modelo
  • Tercer paso: si es necesario, revelar parámetros completos solo para la herramienta seleccionada
  • Resultado: el contexto se mantiene manejable, el agente elige con más precisión

Este arreglo resuelve varios problemas a la vez: se reduce el tamaño del contexto, mejora la velocidad de funcionamiento, y lo más importante — aumenta la precisión de la selección de herramientas, porque el modelo no se distrae con opciones irrelevantes.

Cifras de Anthropic

Nous Research probó Tool Search en los estándares de referencia Anthropic Evals y obtuvo resultados dignos de mención. En el modelo Claude Opus 4, la mejora de precisión fue de 49% a 74% dependiendo del tipo de tarea y del conjunto de herramientas. Esto no es simplemente ruido estadístico — es una mejora significativa que muestra que restringir el contexto a herramientas relevantes realmente ayuda al modelo a enfocarse mejor en la opción correcta. Interesantemente, el efecto es más notable precisamente con grandes conjuntos de herramientas — cuantas más opciones para elegir, mayor la ganancia del filtro inteligente.

Qué Significa Esto para Agentes de IA

Tool Search es un pequeño pero revelador ejemplo de cómo la gestión adecuada del contexto puede ser más importante que el poder bruto del modelo. En lugar de simplemente aumentar la ventana de contexto, a veces es suficiente abordarlo de manera más inteligente qué información cargar en ese contexto. Esto se aplica no solo a MCP, sino también a sistemas RAG, integraciones con API, sistemas de automatización donde el agente debe elegir entre muchas opciones de acción. A medida que crece la complejidad de los sistemas de IA, estas optimizaciones se vuelven cada vez más críticas. Esto significa que el futuro pertenece no a los modelos más grandes, sino a los más inteligentes al elegir en qué mirar.

ZK
Hamidun News
Noticias de AI sin ruido. Selección editorial diaria de más de 400 fuentes. Producto de Zhemal Khamidun, Head of AI en Alpina Digital.

Хотите не читать про ИИ, а внедрить его?

«AI News» — это полезные новости из мира ИИ. Системно научиться работать с нейросетями и применять их в работе — в Hamidun Academy.

¿Qué te parece?
Cargando comentarios…