Ant Group enseigne aux robots la vie : une nouvelle base VLA dépasse Pi0.5
Alors que les capitalistes-risqueurs occidentaux inondent d'argent des startups comme Physical Intelligence, un acteur apparaît à l'horizon que personne ne…
Traité par IA depuis Jiqizhixin (机器之心) ; édité par Hamidun News
Alors que les capitalistes-risqueurs occidentaux inondent d'argent des startups comme Physical Intelligence, un acteur apparaît à l'horizon que personne ne s'attendait à voir. Ant Group, une entreprise que nous avions l'habitude d'associer aux paiements et à la fintech, a décidé que les robots avaient aussi besoin de cerveaux. Et pas seulement des cerveaux, mais un modèle VLA ouvert (Vision-Language-Action) qui surpasse à bien des égards le chouchou actuel de l'industrie — Pi0.
5. Si vous pensiez que la bataille pour l'IA physique se limitait à la Silicon Valley, j'ai des nouvelles pour vous. Commençons d'abord par comprendre ce qu'est VLA.
Ce n'est pas simplement un autre chatbot qui écrit de la poésie. C'est une tentative de créer un réseau de neurones unifié qui voit le monde, comprend les commandes textuelles et, surtout, sait comment déplacer des « bras » mécaniques pour accomplir une tâche. Pendant longtemps, les robots ont été entraînés à chaque manipulation séparément, mais VLA promet l'universalité.
Imaginez que vous donniez à un robot la tâche « apporte-moi cette tasse rouge », et il ne se contente pas de reconnaître l'objet, mais construit une trajectoire de mouvement en temps réel, en tenant compte des obstacles. C'est dans cette ligue que joue maintenant Ant Group. L'intrigue ici est que Pi0.
5 de Physical Intelligence était considéré comme l'étalon-or des modèles fondamentaux ouverts en robotique. C'était une sorte de GPT-3 pour manipulateurs. Cependant, Ant Group affirme que son nouveau développement surpasse Pi0.
5 en précision d'exécution des commandes et en adaptabilité à de nouvelles conditions. C'est un coup sérieux à l'orgueil des ingénieurs américains. L'entreprise chinoise n'a pas simplement copié l'architecture ; elle a optimisé la manière dont le modèle relie les données visuelles aux actions physiques, ce qui a permis d'obtenir des mouvements plus fluides et plus précis.
Pourquoi est-ce important maintenant ? Nous sommes à la veille d'un boom des robots humanoïdes. Le matériel devient moins cher et plus accessible, mais le problème principal reste le logiciel — une intelligence universelle qui permettra à un robot de quitter le laboratoire stérile et d'entrer dans un vrai entrepôt ou un appartement résidentiel.
Ant Group mise sur l'ouverture. En libérant le modèle en tant que code ouvert, elle invite effectivement des milliers de développeurs du monde entier à tester et améliorer son code. C'est un coup classique : si vous ne pouvez pas gagner grâce aux brevets fermés, créez une norme que tout le monde utilisera.
C'est intéressant d'observer comment Ant Group elle-même se transforme. Après toutes les turbulences réglementaires en Chine, l'entreprise cherche de nouveaux appuis, et les technologies profondes (DeepTech) semblent être un refuge idéal. La robotique n'est pas seulement du battage médiatique, mais aussi un énorme marché pour l'automatisation logistique, dont la Chine dispose plus que n'importe où ailleurs.
Il est possible que leur modèle VLA ait été initialement entraîné sur des données provenant d'entrepôts réels d'Alibaba, ce qui lui donne un énorme avantage par rapport aux modèles entraînés en simulation. Il y a une autre couche importante à cette histoire — la géopolitique. Tandis que les États-Unis imposent des sanctions sur les puces, la Chine répond par une vague d'algorithmes.
Un modèle ouvert d'une telle complexité est un outil puissant d'influence. Si demain chaque deuxième startup de fabrication de robots en Europe ou en Asie utilise une base d'Ant Group, la question de savoir quel écosystème a gagné devient sans objet. Nous voyons la lutte pour la primauté en IA se déplacer des chats textuels vers le monde physique.
L'essentiel : Ant Group a établi un précédent sérieux en libérant un modèle qui surpasse les analogues occidentaux en accès ouvert. Physical Intelligence ou OpenAI pourront-elles répondre avec quelque chose de plus impressionnant, ou le leadership en « cerveaux pour robots » sera-t-il solidement assuré par l'Orient ?
Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?
AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.