Bloomberg Tech→ original

Apple apprend à lire sur les lèvres : pourquoi Cupertino a besoin du startup israélien Q.ai

Apple fait ce qu'elle sait faire de mieux une fois de plus : acquérir silencieusement des technologies que dans quelques années nous percevrons comme quelque…

Traité par IA depuis Bloomberg Tech ; édité par Hamidun News
Apple apprend à lire sur les lèvres : pourquoi Cupertino a besoin du startup israélien Q.ai
Source : Bloomberg Tech. Collage: Hamidun News.
◐ Écouter l'article

Apple fait ce qu'elle sait faire de mieux une fois de plus : acquérir silencieusement des technologies que dans quelques années nous percevrons comme quelque chose de tout à fait naturel. Cette fois-ci, le foyer de l'attention s'est porté sur la startup israélienne Q.ai. Ces gars-là s'occupent de quelque chose d'assez spécifique, mais extrêmement prometteur — ils enseignent aux algorithmes à comprendre les expressions faciales humaines et à lire littéralement les signaux non verbaux. Si votre iPhone reconnaissait autrefois simplement votre visage pour le déverrouiller, bientôt il commencera à comprendre ce que vous ressentez et ce que vous êtes sur le point de faire, même si vous ne prononcez pas un mot.

Pour comprendre l'ampleur de cet événement, il faut se souvenir de l'historique des relations d'Apple avec les ingénieurs israéliens. Ce n'est loin d'être la première fois que Cupertino cherche des talents dans cette région. C'est là que sont nées les technologies qui ont jeté les bases du FaceID après l'acquisition de PrimeSense. Apple construit méthodiquement un écosystème où l'interaction avec un appareil devient aussi naturelle que possible. Nous avons déjà parcouru le chemin des boutons aux écrans tactiles et des écrans tactiles à la voix. Vient maintenant l'ère de l'interface silencieuse, où même la voix devient redondante.

Que peut exactement faire Q.ai et pourquoi est-ce si important en ce moment ? Leurs développements permettent d'analyser les microexpressions et les mouvements musculaires faciaux avec une précision incroyable.

Dans le contexte de Vision Pro, cela semble être la pièce manquante du puzzle. L'un des principaux problèmes des casques VR et AR modernes reste la transmission des émotions vivantes de l'avatar et le contrôle sans contrôleurs encombrants. Si le système sait que vous avez légèrement serré les mâchoires ou plissé les yeux, il pourra interpréter cela comme une commande ou un changement de contexte.

Cela résout le problème de maladresse sociale, lorsque l'utilisateur doit donner des commandes à Siri à voix haute dans les lieux publics, attirant une attention indésirable.

Mais il ne s'agit pas seulement des casques de réalité mixte. Imaginez un Siri qui ne fait pas que d'attendre un mot-clé, mais qui comprend par votre expression faciale que vous êtes insatisfait de la réponse ou que vous cherchez une confirmation de votre pensée. C'est une transition fondamentale d'une IA réactive, qui répond simplement aux requêtes, à une IA proactive qui lit le contexte avant que vous le formuliez. Apple mise clairement sur la multimodalité. Alors que Google et OpenAI se font concurrence pour savoir dont le chatbot écrit le mieux, Tim Cook et son équipe construisent un pont entre la biologie et le silicium, transformant la caméra en un véritable organe sensoriel.

Bien sûr, une question raisonnable sur la confidentialité se pose ici. Si Apple commence à collecter des données détaillées sur la façon dont les muscles de notre visage se déplacent en réponse à un certain contenu, cela deviendra une mine d'or pour l'analyse comportementale et, en même temps, un cauchemar potentiel pour les défenseurs de la confidentialité. Cependant, l'entreprise a passé des années à construire une image en tant que défenseur de la confidentialité, en déplaçant tous les calculs vers l'appareil lui-même.

Très probablement, les algorithmes de Q.ai fonctionneront localement dans les puces des séries A et M, ce qui donnera à Apple un énorme avantage sur les solutions cloud des concurrents, qui doivent envoyer les données vers des serveurs.

La technologie de la parole silencieuse ou silent speech — ce n'est pas seulement une question de commodité, mais aussi d'inclusivité. Pour les personnes ayant des troubles de la parole, les développements de Q.ai pourraient devenir un véritable sauveur, leur permettant de communiquer avec le monde par l'intermédiaire d'un médiateur numérique qui comprend la moindre articulation. Apple a toujours accordé une énorme attention aux fonctions d'accessibilité, et cette acquisition s'inscrit parfaitement dans sa philosophie. Nous voyons comment l'entreprise réunit différentes directions : des moteurs de réseaux de neurones aux capteurs avancés de capture d'image, créant une plateforme pour le prochain bond technologique.

À long terme, cela pourrait conduire à l'abandon complet des méthodes de saisie auxquelles nous sommes habitués dans certains scénarios. Pourquoi taper ou parler si l'appareil comprend vos intentions par vos expressions faciales ? Cela ouvre la porte à l'utilisation de gadgets dans des conditions de silence absolu ou dans des lieux très bruyants où la voix est inutile. Cupertino joue le long jeu, et Q.ai est un investissement dans la décennie où la frontière entre l'humain et l'ordinateur deviendra presque transparente, et les appareils commenceront à nous comprendre mieux que nous ne nous comprenons nous-mêmes.

Point principal : Apple prépare le terrain pour les interfaces du futur, où le contrôle se fera au niveau des intentions et des expressions faciales. Sommes-nous prêts pour que nos smartphones en sachent plus sur notre état d'esprit que nos proches ?

ZK
Hamidun News
Actualités IA sans bruit. Sélection éditoriale quotidienne de plus de 400 sources. Produit de Zhemal Khamidun, Head of AI chez Alpina Digital.

Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?

AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.

Qu'en pensez-vous ?
Chargement des commentaires…