Le plafond de verre percé : Ant Group a appris aux robots à voir l'invisible
Imaginez que vous ayez acheté un robot assistant pour des dizaines de milliers de dollars, et que le premier jour il se soit écrasé contre une fenêtre…
Traité par IA depuis Jiqizhixin (机器之心) ; édité par Hamidun News
Imaginez que vous ayez acheté un robot assistant pour des dizaines de milliers de dollars, et que le premier jour il se soit écrasé contre une fenêtre panoramique ou ait essayé de saisir de l'air au lieu d'un verre de Chardonnay coûteux. Amusant ? Seulement si ce n'est pas en train de vous arriver.
Le problème des objets transparents a été pendant des années le "talon d'Achille" de la robotique. Tandis que nous débattons sur le fait que l'IA acquerra la conscience, les ingénieurs s'efforcent de la faire cesser d'agir bêtement face à une simple porte en verre. Récemment, le géant chinois Ant Group a décidé qu'il était temps de combler cette lacune gestaltiste et a présenté sa première recherche sérieuse dans le domaine de l'IA Incarnée (Embodied AI).
Pourquoi est-ce même un problème ? La plupart des robots modernes s'appuient sur des LIDARs et des caméras RGB-D. Les LIDARs fonctionnent selon le principe de la réflexion du faisceau laser : si le faisceau traverse du verre ou se réfracte de manière chaotique, le robot pense qu'il n'y a rien devant lui. Les caméras de profondeur deviennent également folles en essayant de calculer la distance jusqu'à une surface transparente. En résultat, nous obtenons des machines avancées qui se comportent dans un salon ordinaire comme des chatons désorientés.
Ant Group a proposé un framework qui combine les données visuelles et l'apprentissage profond pour restaurer correctement la forme et la position des objets transparents dans l'espace. L'entrée d'Ant Group dans ce créneau semble être une continuation logique de leur stratégie. Après que les régulateurs aient refroidi l'ardeur de leur direction fintech, l'entreprise a commencé à diversifier activement son portefeuille vers les technologies fondamentales.
La recherche dans le domaine de l'IA Incarnée n'est pas simplement une tentative de créer un robot serveur. C'est une lutte pour le leadership dans le prochain paradigme technologique, où l'IA dépasse les chatbots et commence à manipuler des objets physiques. Le fait qu'ils aient immédiatement publié leur travail en tant que code ouvert témoigne d'un désir de construire rapidement une communauté de développeurs autour d'eux et d'établir les normes de l'industrie.
En analysant la solution proposée, on comprend que l'accent s'est déplacé de la simple reconnaissance de formes à la compréhension de la physique de la lumière. Les algorithmes d'Ant Group enseignent aux réseaux de neurones à prédire comment la lumière se réfractera à travers un milieu transparent. Cela permet au robot non seulement de "voir" le verre, mais de comprendre son volume et ses limites. Pour l'industrie, cela signifie un saut qualitatif : des robots d'entrepôt fonctionnant dans des conditions stériles avec des boîtes en carton, nous passons à des assistants domestiques capables d'interagir adéquatement avec le monde fragile et complexe de l'habitat humain.
Qu'est-ce que cela signifie pour nous ? Probablement, dans les prochaines années, nous verrons une vague de nouvelles startups utilisant ce code ouvert pour créer des aspirateurs plus intelligents, des manipulateurs et même des chariots sans pilote dans les centres commerciaux. La Chine prouve une fois de plus que son approche de l'innovation ne consiste pas seulement à copier, mais aussi à résoudre des problèmes d'ingénierie fondamentaux que les entreprises occidentales contournent parfois, préférant se concentrer sur les logiciels. Ant Group le fait clairement comprendre : ils sont là sérieusement et pour de bon, et leurs ambitions s'étendent bien au-delà des portefeuilles numériques.
L'essentiel : Ant Group est entrée avec succès dans le territoire de l'IA physique, en résolvant le problème de l'"invisibilité" du verre. La recherche en code ouvert accélérera l'émergence de robots qui cesseront enfin d'être une menace pour vos fenêtres et votre vaisselle. Sera-ce le début de la fin des capteurs spécialisés au profit de la pure vision par machine ?
Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?
AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.