Stanford presentó OpenJarvis — una stack de agentes de AI locales con memoria y aprendizaje
Stanford lanzó OpenJarvis — un framework open-source para agentes de AI personales que funcionan localmente en un portátil o PC. El proyecto incluye no solo…
Procesado por IA desde MarkTechPost; editado por Hamidun News
Investigadores de Stanford han lanzado OpenJarvis — un framework de código abierto para agentes de IA personales que funcionan completamente en el dispositivo del usuario. El proyecto ha sido concebido como un stack listo para usar en IA local: desde la ejecución de modelos y orquestración de agentes hasta memoria, herramientas, benchmarks y entrenamiento posterior en datos locales.
Por Qué Esto Es Importante
La mayoría de los sistemas de IA personales hasta ahora se ven locales solo en la superficie: la interfaz se ejecuta en el portátil, pero el razonamiento principal va a APIs en la nube. Para tareas que implican archivos, notas, correos electrónicos y contexto persistente del usuario, esto significa latencia, costos recurrentes y transferencia innecesaria de datos sensibles. OpenJarvis propone un modelo diferente: ejecución local por defecto, con la nube como opción solo cuando es realmente necesario.
En Stanford, el lanzamiento está conectado a su propio trabajo sobre Inteligencia Por Vatio. Según el laboratorio, los modelos de lenguaje locales y los aceleradores locales ya son capaces de servir correctamente el 88,7% de las solicitudes de chat y razonamiento de una sola vuelta a velocidades de respuesta interactivas, y la eficiencia según la métrica "inteligencia por vatio" ha aumentado 5,3 veces de 2023 a 2025. La idea detrás de OpenJarvis es que el hardware y los modelos ya están casi listos, pero al mercado le falta una capa de software unificada para tales sistemas.
Cómo Funciona el Stack
OpenJarvis se construye alrededor de cinco primitivos que pueden ser reemplazados, probados y optimizados de forma independiente entre sí. Este enfoque pretende eliminar la confusión típica en configuraciones de IA local, donde la inferencia, la lógica de agentes, el manejo de herramientas, la memoria y el aprendizaje están entrelazados en un proyecto difícil de reproducir. Como resultado, los desarrolladores pueden comparar no el sistema completo como un todo, sino una capa específica — el modelo, motor, memoria o comportamiento del agente. Esto hace que los experimentos y la implementación en producción sean considerablemente más simples.
- Intelligence — una capa de modelos con un catálogo unificado de LLMs locales y abstracción sobre su selección.
- Engine — un runtime para ejecución a través de Ollama, vLLM, SGLang, llama.cpp y otros motores.
- Agents — roles de agentes, incluyendo Orchestrator para descomposición de tareas y Operative para escenarios recurrentes.
- Tools & Memory — acceso a herramientas, memoria local, búsqueda semántica, MCP y comunicación agente-a-agente a través de A2A.
- Learning — un ciclo de mejora que utiliza trazas locales para ajuste fino y optimización.
Se enfatiza especialmente que el sistema no se limita al chat. OpenJarvis puede trabajar con búsqueda local en notas y documentos, conectar herramientas como búsqueda web, calculadora, entrada/salida de archivos e interpretación de código, así como comunicarse con servidores MCP externos. Por esto, el framework se posiciona no como un envoltorio alrededor de un único modelo, sino como infraestructura para un agente personal con memoria a largo plazo y acceso al entorno real del usuario.
Qué Está Disponible Ahora
Desde un punto de vista práctico, el proyecto se ve bastante fundamentado. OpenJarvis tiene una CLI, SDK de Python, interfaz de navegador y aplicaciones de escritorio para macOS, Windows y Linux. El comando `jarvis init` determina el hardware disponible y recomienda una combinación apropiada de motor y modelo, `jarvis doctor` ayuda a diagnosticar la configuración, y `jarvis serve` levanta un servidor de API compatible con OpenAI en FastAPI para que los desarrolladores puedan conectar clientes y frontends existentes con cambios mínimos. Los escenarios básicos, según la documentación, pueden funcionar sin red.
Otro punto fuerte es medir la eficiencia, no solo la calidad de la respuesta. El framework recopila telemetría sobre energía, latencia, FLOPs y costo monetario de una solicitud, admite perfilado en NVIDIA, AMD y Apple Silicon, y estandariza benchmarks a través de `jarvis bench`. Al mismo tiempo, OpenJarvis preserva trazas locales de interacciones: desde pares prompt-completion hasta secuencias de acciones de agentes y llamadas de herramientas. Sobre esta base, se puede optimizar no solo los pesos del modelo, sino también prompts, lógica de agentes y el propio motor de inferencia — por ejemplo, a través de cuantización, DSPy, GEPA, SFT, DPO o GRPO.
Qué Significa Esto
OpenJarvis muestra que la IA local se está desplazando de configuraciones experimentales hacia un stack de ingeniería completo. Si el enfoque de Stanford tiene éxito, los desarrolladores obtendrán una base estándar para agentes personales que almacenan datos en el usuario, son más baratos de operar y se vuelven más útiles con el tiempo a través del entrenamiento en sus propios escenarios locales. Para el mercado, esta es otra señal: parte de las tareas de IA cotidianas pronto comenzará a migrar de la nube a los dispositivos personales.
¿Quieres dejar de leer sobre IA y empezar a usarla?
AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.