Ant Group enseña a los robots a vivir: nuevo modelo VLA supera a Pi0.5
Mientras que los capitalistas de riesgo occidentales están invirtiendo dinero en startups como Physical Intelligence, ha aparecido en el horizonte un jugador…
Procesado por IA desde Jiqizhixin (机器之心); editado por Hamidun News
Mientras que los capitalistas de riesgo occidentales están invirtiendo dinero en startups como Physical Intelligence, ha aparecido en el horizonte un jugador que claramente no esperaban. Ant Group, una empresa que hemos estado acostumbrados a asociar con pagos y fintech, ha decidido que los robots también necesitan cerebros. Y no solo cerebros, sino un modelo VLA abierto (Vision-Language-Action) que en muchos aspectos deja atrás al favorito actual de la industria — Pi0.
5. Si pensabas que la batalla por la IA física se limitaba al Valle del Silicio, tengo noticias para ti. Primero, aclaremos qué es VLA.
No es simplemente otro chatbot que escribe poesía. Es un intento de crear una red neuronal unificada que vea el mundo, entienda comandos de texto y, lo más importante, sepa cómo mover "brazos" mecánicos para completar una tarea. Durante mucho tiempo, los robots fueron entrenados en cada manipulación por separado, pero VLA promete universalidad.
Imagina que le das a un robot la tarea "tráeme esa taza roja", y no solo reconoce el objeto, sino que construye una trayectoria de movimiento en tiempo real, teniendo en cuenta los obstáculos. Esta es la liga en la que Ant Group está jugando ahora. La intriga aquí es que Pi0.
5 de Physical Intelligence era considerado el estándar de oro para modelos fundacionales abiertos en robótica. Era algo como GPT-3 para manipuladores. Sin embargo, Ant Group afirma que su nuevo desarrollo supera a Pi0.
5 en precisión de ejecución de comandos y adaptabilidad a nuevas condiciones. Este es un golpe serio al orgullo de los ingenieros americanos. La empresa china no simplemente copió la arquitectura; optimizó la manera en que el modelo conecta datos visuales con acciones físicas, lo que permitió lograr movimientos más suaves y precisos.
¿Por qué es esto importante ahora? Estamos en el umbral de un auge de robots humanoides. El hardware se está volviendo más barato y accesible, pero el problema principal sigue siendo el software — la inteligencia universal que permitirá a un robot salir del laboratorio estéril e ingresar a un almacén real o a un apartamento residencial.
Ant Group está apostando por la apertura. Al lanzar el modelo como código abierto, están invitando efectivamente a miles de desarrolladores en todo el mundo a probar y mejorar su código. Este es un movimiento clásico: si no puedes ganar a través de patentes cerrados, crea un estándar que todos usarán.
Es interesante observar cómo se está transformando la propia Ant Group. Después de toda la turbulencia regulatoria en China, la empresa está buscando nuevos puntos de apoyo, y las tecnologías profundas (DeepTech) parecen un refugio ideal. La robótica no es solo hype, sino también un mercado enorme para la automatización logística, de la cual China tiene más que en cualquier otro lugar.
Quizás su modelo VLA fue originalmente entrenado con datos de almacenes reales de Alibaba, lo que le da una enorme ventaja sobre modelos entrenados en simulaciones. Hay otra capa importante en esta historia — la geopolítica. Mientras que EE.
UU. impone sanciones a chips, China responde con un impulso en algoritmos. Un modelo abierto de tal complejidad es una herramienta poderosa de influencia.
Si mañana cada segunda startup de fabricación de robots en Europa o Asia usa una base de Ant Group, la cuestión de qué ecosistema ganó se resuelve por sí sola. Estamos presenciando cómo la lucha por el liderazgo en IA se desplaza de los chats de texto al mundo físico. El punto clave: Ant Group ha establecido un precedente serio al lanzar un modelo que supera a los análogos occidentales en acceso abierto.
¿Podrán Physical Intelligence u OpenAI responder con algo más impresionante, o el liderazgo en "cerebros para robots" se consolidará firmemente en Oriente?
¿Quieres dejar de leer sobre IA y empezar a usarla?
AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.