OpenAI intègre à ChatGPT Bidi 1 — un modèle vocal qui parle et écoute en même temps
OpenAI transforme ChatGPT en super app. Une mise à jour majeure est en cours de développement avec trois composants clés : Codex (un assistant de…
Traité par IA depuis 3DNews AI ; édité par Hamidun News
OpenAI accélère la transformation de ChatGPT en super app : l'entreprise développe simultanément un modèle vocal bidirectionnel Bidi 1, intègre un assistant programmeur Codex et étend les capacités des agents.
Qu'est-ce que GPT Bidi 1 ?
Dans le code de l'application mobile ChatGPT, les chercheurs ont découvert des traces d'un nouveau modèle audio portant le nom de code GPT Bidi 1. « Bidi » signifie bidirectional — bidirectionnel. C'est une approche fondamentalement différente par rapport au mode vocal actuel, où le modèle alterne séquentiellement entre l'écoute et la réponse : d'abord il écoute, puis il parle — comme une radio avec un bouton « transmission ».
Le mode duplex change la dynamique même du dialogue. L'utilisateur pourra interrompre l'assistant en pleine phrase, et l'assistant pourra réagir à l'intonation, aux pauses et au rythme de la parole en temps réel, sans attendre une pause. Le délai entre les échanges est considérablement réduit, et la conversation devient moins robotique.
C'est ainsi que fonctionnent les interfaces vocales les plus avancées : Apple Intelligence sur iOS 18 et Google Duplex soutiennent depuis longtemps l'échange duplex complet.
Ce qui change avec Bidi 1 :
- la voix et l'audition fonctionnent simultanément — sans attendre l'« air »
- l'utilisateur peut interrompre la réponse à tout moment
- le temps de réponse entre les échanges est réduit
- l'assistant entend l'intonation et réagit aux pauses
- la conversation semble plus naturelle et plus proche d'un dialogue avec un humain
La date de lancement spécifique de Bidi 1 n'a pas encore été annoncée, mais la présence du modèle dans le code de production de ChatGPT suggère que le lancement est imminent.
Codex dans ChatGPT
En parallèle avec le développement vocal, OpenAI intègre son assistant programmeur Codex dans ChatGPT. Jusqu'à présent, Codex existait comme un produit séparé avec sa propre interface. Après l'intégration, vous pourrez écrire, déboguer et expliquer le code directement dans la fenêtre de chat principal sans changer d'onglets. Pour les développeurs qui ont déjà intégré ChatGPT dans leur flux de travail, c'est une simplification significative : au lieu de deux outils distincts, il y aura un espace de travail unifié. Codex sera disponible dans le même dialogue que la recherche web, la génération d'images, l'analyse de fichiers et — bientôt — le mode vocal Bidi 1.
Les agents — le troisième front
Le troisième élément de la mise à jour à grande échelle est les outils pour les agents d'IA. ChatGPT se transforme systématiquement d'un chatbot réactif en un assistant proactif capable d'exécuter des tâches multi-étapes de manière autonome : réserver des billets, comparer des produits sur les marchés, remplir des formulaires en ligne, rechercher et synthétiser des informations de différentes sources.
«
Nous voulons faire de ChatGPT une application qui fait tout pour vous que vous faites normalement sur internet », disent des sources familiarisées avec la stratégie d'OpenAI.
Les trois composants — voix en direct Bidi 1, Codex intégré et agents autonomes — se renforcent mutuellement. Un agent avec voix duplex et la capacité d'écrire du code est une classe d'outils fondamentalement différente, pas simplement un chatbot mis à jour.
Ce que cela signifie
OpenAI se dirige délibérément vers un format de super app — un seul produit qui couvre la plupart des scénarios quotidiens : voix, code, automatisation des tâches, recherche d'informations. Pour l'utilisateur moyen, la conséquence immédiate est que les conversations avec ChatGPT seront notablement plus vivantes et naturelles. Pour les entreprises, cela signifie un nouveau niveau d'automatisation des tâches opérationnelles qui auparavant nécessitaient un humain ou un ensemble d'outils SaaS distincts. Les concurrents — de Google à Anthropic — devront accélérer à nouveau.
Besoin d'une IA qui travaille dans votre entreprise — pas seulement dans votre fil d'actualité?
Je construis de l'IA en production pour les entreprises — CRM sur mesure, outils internes, agents autonomes, automatisation des processus. Vous en êtes propriétaire, adaptée à votre processus, sans coût par utilisateur. Réalisé par Zhemal Khamidun, CPO d'AlpinaGPT (plateforme IA, 6 000+ utilisateurs).