LingBot-VLA : Ant Group apprend aux robots à comprendre le monde sans détours
Imaginez que vous avez acheté un nouveau téléphone et que vous n'aviez pas besoin de réapprendre à l'utiliser — vos doigts savent déjà où appuyer. Dans le…
Traité par IA depuis Jiqizhixin (机器之心) ; édité par Hamidun News
Imaginez que vous avez acheté un nouveau téléphone et que vous n'aviez pas besoin de réapprendre à l'utiliser — vos doigts savent déjà où appuyer. Dans le monde de la robotique, les choses ont été différentes : chaque 'machine' exigeait son propre code unique et des milliers d'heures d'entraînement dans des simulations. Mais l'équipe de Lingbo, une division du géant technologique chinois Ant Group, a décidé qu'il était temps d'en finir avec cela. Ils ont lancé LingBot-VLA dans le domaine public — un modèle qui prétend être le cerveau universel pour tout ce qui a des moteurs et des manipulateurs.
Le cœur du problème de l'« IA physique » a toujours reposé sur ce que nous appelons l'ontologie croisée. Si vous entraînez un réseau de neurones à contrôler une pince spécifique, il est complètement désemparé lorsqu'on le transfère à un humanoïde bipède. LingBot-VLA tente de résoudre cette dissonance cognitive. Étant un modèle de classe Vision-Language-Action (VLA), il ne fait pas simplement 'voir' une image et 'lire' du texte. Il traduit ces données en vecteurs de mouvement spécifiques que différents types de robots peuvent comprendre. C'est comme si un conducteur pouvait opérer avec une égale virtuosité à la fois une bicyclette et un camion benne sans entraînement supplémentaire.
Pourquoi cela se produit-il maintenant ? Nous vivons une transition de l'« IA bavarde » à l'« IA agissante ». Les chatbots ont appris à écrire de la poésie, mais ils ne peuvent toujours pas essuyer la poussière d'une table sans casser un vase. Pour qu'un robot soit utile au quotidien, il a besoin d'une capacité de généralisation. LingBot-VLA affiche des résultats record dans les tests de généralisation des tâches : elle comprend la commande 'apporte une pomme' même dans une pièce inconnue et avec un type de pince inconnu. Les développeurs ont utilisé un énorme ensemble de données combinant des images visuelles et des trajectoires de mouvement, permettant au modèle de construire une logique interne de l'espace.
Le contexte politique est également intéressant. Tandis que des entreprises américaines comme Figure ou Tesla gardent leurs développements sous le sceau du secret, le géant technologique chinois Ant Group choisit la voie de l'open source. C'est un mouvement stratégique : si LingBot-VLA devient la norme pour les petits fabricants de robots du monde entier, la Chine capturera effectivement le système d'exploitation de l'« internet physique » du futur. C'est un jeu classique à long terme où la domination au niveau des normes est plus importante que les profits immédiats de la vente de licences.
Pour l'industrie, cela signifie une baisse drastique de la barrière à l'entrée. Maintenant, une startup n'a pas besoin d'embaucher une centaine de doctorants pour entraîner les mouvements de base d'un robot — elle peut prendre une 'base' prête à l'emploi et l'adapter à une tâche spécifique. Nous nous approchons d'un moment où le matériel devient secondaire et le logiciel devient déterminant. Si LingBot-VLA est vraiment aussi bonne en adaptation que le prétendent les développeurs, dans quelques années nous verrons une invasion de robots qui cesseront enfin de faire les imbéciles devant une porte fermée.
Bien sûr, il y a des questions sur la sécurité et la précision — dans le monde physique, une erreur coûte plus cher qu'une faute de frappe dans un chatbot. Mais le vecteur est clair : l'IA sort des écrans des téléphones intelligents pour entrer dans la réalité. Il ne nous reste qu'à observer avec quelle rapidité ces 'cerveaux' acquerront des 'corps' dignes de ce nom.
L'essentiel : LingBot-VLA pourrait devenir l'« Android » du monde de la robotique, rendant le contrôle universel des robots accessible à tous. Sommes-nous prêts pour que le code source ouvert puisse désormais bouger des objets dans notre appartement ?
Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?
AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.