The Verge→ оригинал

Mira Murati développe des modèles AI pour une interaction simultanée en temps réel

Mira Murati a présenté des interaction models — des modèles AI capables de traiter simultanément l’audio, la vidéo et le texte et de réagir en temps réel. Contr

Mira Murati développe des modèles AI pour une interaction simultanée en temps réel
Source : The Verge. Коллаж: Hamidun News.
◐ Слушать статью

Mira Murati, ancienne directrice de la technologie chez OpenAI, a fondé Thinking Machines et présenté un nouveau paradigme d'interaction avec l'IA. L'entreprise travaille sur les interaction models — des modèles qui perçoivent l'audio, la vidéo et le texte simultanément et répondent en temps réel, imitant la collaboration naturelle entre les personnes.

Nouveau Paradigme d'Interaction

Les interaction models ne sont pas simplement de nouvelles versions de modèles de langage. Ils représentent une approche fondamentalement différente de la façon dont les gens interagissent avec l'IA. Au lieu d'écrire une requête et d'attendre une réponse, l'utilisateur peut parler, partager son écran, changer de contexte — et le modèle répond en parallèle, comme un interlocuteur dans une conversation naturelle.

Selon Thinking Machines, les modèles actuels perçoivent la réalité "dans un seul flux". Tandis que l'utilisateur parle ou tape, le modèle est passif — il ne voit rien, n'entend rien, ne comprend pas ce qui se passe. Le traitement ne commence que lorsque toutes les informations ont été reçues. Cela crée des délais et une certaine innaturalité dans le dialogue.

Les interaction models doivent fonctionner différemment : percevoir continuellement le flux entrant, penser en parallèle avec l'utilisateur et réagir en temps réel. C'est plus proche de la façon dont les gens conversent réellement — les deux participants écoutent, traitent l'information et répondent simultanément.

Ce Qui Change

Le passage de l'interaction séquentielle à l'interaction parallèle a des implications importantes :

  • Naturel — les conversations avec l'IA seront aussi fluides qu'une conversation avec une personne
  • Contexte — le modèle perçoit le ton de la voix, le langage corporel, le contexte visuel, pas seulement les mots
  • Vitesse — il n'y a pas de délais entre la pensée de l'utilisateur et la réaction du modèle
  • Multitâche — le modèle peut simultanement écouter, observer, analyser et répondre
  • Adaptabilité — le système peut détecter quand un utilisateur est confus et l'aider immédiatement

Historique et Signification

Mira Murati a quitté OpenAI en septembre 2024. En quelques mois, elle a rassemblé une équipe et lancé Thinking Machines avec un objectif clair : redéfinir ce que signifie "la collaboration avec l'IA". Pour elle, ce n'est pas simplement un autre startup — c'est une tentative de résoudre un problème fondamental des interfaces d'IA actuelles.

Si Thinking Machines parvient à réaliser cette idée, cela pourrait transformer la façon dont les gens travaillent avec l'IA dans tous les domaines — du travail professionnel à l'éducation et aux pratiques créatives.

Ce Que Cela Signifie

Les interaction models représentent l'étape suivante dans l'évolution de l'interaction avec l'IA. Si les modèles actuels sont des chatbots, alors les interaction models sont presque un dialogue en direct. Pour les utilisateurs, cela signifie une communication plus naturelle avec l'IA. Pour les entreprises, c'est la capacité de créer des interfaces que les utilisateurs n'ont pas besoin d'apprendre avec des syntaxes spéciales et des commandes.

ЖХ
Hamidun News
AI‑новости без шума. Ежедневный редакторский отбор из 400+ источников. Продукт Жемала Хамидуна, Head of AI в Alpina Digital.
Qu'en pensez-vous ?
Chargement des commentaires…