MarkTechPost→ original

HKUDS Presenta OpenSpace en Detalle — Motor de Auto-Evolución de Habilidades para Agentes IA

HKUDS lanzó un tutorial detallado sobre OpenSpace — un motor que permite que agentes IA aprendan de tareas completadas y reutilicen habilidades. El desglose…

Procesado por IA desde MarkTechPost; editado por Hamidun News
HKUDS Presenta OpenSpace en Detalle — Motor de Auto-Evolución de Habilidades para Agentes IA
Fuente: MarkTechPost. Collage: Hamidun News.
◐ Escuchar artículo

HKUDS lanzó un análisis detallado de OpenSpace — un motor de habilidades de código abierto que permite a los agentes de IA no comenzar cada tarea desde cero, sino acumular plantillas de trabajo y reutilizarlas. El material muestra el ciclo completo: desde la configuración de un modelo OpenAI hasta la comparación de inicios "fríos" y "cálidos", donde la reutilización de habilidades reduce el consumo de tokens y mejora la calidad de la respuesta.

Desde el inicio frío

OpenSpace se implementa desde un repositorio de GitHub y en el tutorial se configura para modelos OpenAI, incluido gpt-4o-mini. A continuación, al agente se le asigna su primera tarea sin ninguna biblioteca de habilidades preconstruida. El sistema la ejecuta como un agente LLM regular, pero en paralelo captura pasos exitosos, soluciones alternativas e instrucciones de trabajo que se pueden reutilizar posteriormente.

Las habilidades no viven solo en el contexto del diálogo: se guardan como archivos siguiendo la convención SKILL.md y se registran en una base de datos SQLite, para que se puedan ver, versionar y analizar por separado de la ejecución real. Después de esto, los autores lanzan una tarea similar nuevamente y muestran la diferencia entre inicio frío e inicio cálido.

Aquí OpenSpace ya no razona desde cero, sino que selecciona habilidades apropiadas mediante búsqueda híbrida en BM25 y embeddings. En la demostración, crean manualmente tres habilidades básicas: validación de datos, generación de informes con escenarios de fallback y un mecanismo de recuperación de errores. Esto es necesario para sembrar patrones útiles de antemano y luego dejar que el motor evolutivo los cultive en tareas reales.

Cómo crecen las habilidades

La idea clave de OpenSpace es que una habilidad aquí se considera no como un prompt estático, sino como una entidad viva. Después de cada ejecución, el sistema analiza qué funcionó, dónde ocurrieron fallos, qué herramientas se degradaron y qué se puede mejorar en la siguiente versión. Por lo tanto, el motor no solo acumula escenarios exitosos, sino que también sabe cómo arreglarlos, especializarlos para nuevas tareas y extraer nuevas habilidades de ejecuciones individuales exitosas.

  • FIX — arregla una habilidad rota u obsoleta sin cambiar su rol.
  • DERIVED — crea una versión derivada para un escenario más específico o nueva clase de tareas.
  • CAPTURED — extrae un nuevo patrón reutilizable directamente de la ejecución exitosa.
  • BM25 + embeddings — ayuda a encontrar rápidamente la habilidad más relevante para una descripción de tarea. * open-space.cloud — proporciona un catálogo compartido donde las habilidades se pueden buscar, descargar, cargar y compartir entre equipos. Una parte importante de la arquitectura es la capa colectiva. A través de una comunidad en la nube, los agentes pueden intercambiar habilidades ya evolucionadas, ver el historial de versiones y construir repositorios compartidos para equipos. El artículo presenta esto como una transición de un asistente único a una red de agentes que aprenden no solo de sus propios errores. Si un agente encuentra una solución confiable para la generación de PDF, análisis de tablas o investigación web, otro puede tomar esa habilidad y no repetir el mismo ciclo de intentos y fracasos.

Economía de tokens de

OpenSpace La parte más fuerte del material no es la configuración, sino los números. El repositorio de OpenSpace proporciona un benchmark GDPVal en una selección de 50 tareas profesionales en seis categorías: documentos, formularios de cumplimiento, medios, ingeniería, hojas de cálculo y estrategia. Para una comparación justa, OpenSpace se comparó con un agente ClawWork básico en el mismo modelo backbone Qwen 3.

5-Plus, por lo que la diferencia se explica precisamente por la acumulación de habilidades y no por la sustitución del modelo. El resultado: retorno económico 4,2 veces mayor, calidad promedio del 70,8% y 45,9% menos tokens en ejecuciones de tareas repetidas. El desglose por categoría muestra dónde la auto-evolución proporciona el máximo.

En documentos y correspondencia, la ejecución cálida redujo el consumo de tokens en un 56%, en tareas de formularios y cumplimiento — en un 51%, en medios — en un 46%, en hojas de cálculo — en un 37%. Al mismo tiempo, los autores enfatizan que de las 165 habilidades evolucionadas, la mayoría no pertenece a la experiencia de dominio estrecho, sino a la confiabilidad de ejecución: manejo de formatos de archivo, recuperación de errores, generación de documentos y verificación de calidad. Es decir, el principal beneficio no proviene del "conocimiento del dominio", sino del hecho de que el agente deja de romperse en puntos técnicos típicos.

Qué significa esto

OpenSpace muestra bien hacia dónde se dirigen los frameworks de agentes: de prompts puntuales a memoria de trabajo persistente, donde cada tarea completada hace que el sistema sea más barato y más robusto. Para equipos de producto, esta es una señal de que la próxima ola de eficiencia vendrá no solo de nuevos modelos, sino también de infraestructura de habilidades reutilizables a su alrededor.

ZK
Hamidun News
Noticias de AI sin ruido. Selección editorial diaria de más de 400 fuentes. Producto de Zhemal Khamidun, Head of AI en Alpina Digital.

¿Quieres dejar de leer sobre IA y empezar a usarla?

AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.

¿Qué te parece?
Cargando comentarios…