OpenAI تدمج Bidi 1 في ChatGPT — نموذجًا صوتيًا يتحدث ويستمع في الوقت نفسه
تحوّل OpenAI ChatGPT إلى تطبيق فائق. ويجري تطوير تحديث كبير بثلاثة مكونات رئيسية: Codex (مساعد برمجة يعمل بـ AI)، وأدوات للوكلاء المستقلين، ونموذج الصوت…
معالج بواسطة الذكاء الاصطناعي من 3DNews AI؛ بتحرير Hamidun News
تسرع OpenAI تحول ChatGPT إلى تطبيق فائق: الشركة تطور في نفس الوقت نموذج صوت ثنائي الاتجاه Bidi 1، وتدمج مساعد المبرمج Codex، وتوسع قدرات الوكلاء.
ما هو GPT Bidi 1؟
في رمز تطبيق ChatGPT للهواتف الذكية، اكتشف الباحثون آثار نموذج صوتي جديد باسم الكود GPT Bidi 1. "Bidi" تعني bidirectional — ثنائي الاتجاه. هذا نهج مختلف جذريًا مقارنة بوضع الصوت الحالي، حيث ينتقل النموذج بالتتابع بين الاستماع والرد: أولاً يستمع، ثم يتحدث — مثل جهاز لاسلكي بزر "إرسال". يغير وضع الدوبليكس ديناميكية الحوار ذاتها. سيتمكن المستخدم من مقاطعة المساعد في منتصف الجملة، والمساعد سيتمكن من الاستجابة للتنغيم والفواصل وسرعة الكلام في الوقت الفعلي، دون انتظار فاصل. ينخفض التأخير بين الحوارات بشكل ملحوظ، والمحادثة تصبح أقل آلية. هكذا تعمل أكثر واجهات الصوت تقدمًا: Apple Intelligence في iOS 18 و Google Duplex يدعمان التبادل الكامل ثنائي الاتجاه منذ فترة طويلة.
ما يتغير مع Bidi 1:
- الصوت والاستماع يعملان في نفس الوقت — بدون الانتظار على "الموجات"
- يمكن للمستخدم مقاطعة الرد في أي لحظة
- يقل وقت الاستجابة بين الحوارات
- يسمع المساعد التنغيم ويستجيب للفواصل
- تبدو المحادثة أكثر طبيعية وأقرب إلى حوار مع إنسان
لم يتم الإعلان عن تاريخ الإصدار المحدد لـ Bidi 1 حتى الآن، لكن وجود النموذج في رمز الإنتاج الخاص بـ ChatGPT يشير إلى أن الإصدار قريب جدًا.
Codex داخل ChatGPT
بالتوازي مع تطوير الصوت، تدمج OpenAI مساعد المبرمج Codex في ChatGPT. حتى الآن، كان Codex موجودًا كمنتج منفصل بواجهة خاصة به. بعد التكامل، ستتمكن من كتابة وتصحيح وشرح الأكواد مباشرة في نافذة الدردشة الرئيسية دون تبديل علامات التبويب. بالنسبة للمطورين الذين جعلوا ChatGPT جزءًا من سير عملهم، هذا تبسيط كبير: بدلاً من أداتين منفصلتين، سيكون هناك مساحة عمل موحدة. سيكون Codex متاحًا في نفس الحوار مثل البحث على الويب وتوليد الصور وتحليل الملفات و— قريبًا — وضع الصوت Bidi 1.
الوكلاء — الجبهة الثالثة
المكون الثالث للتحديث على نطاق واسع هو أدوات وكلاء الذكاء الاصطناعي. يتحول ChatGPT بشكل منهجي من روبوت دردشة سلبي إلى مساعد استباقي قادر على تنفيذ مهام متعددة الخطوات بشكل مستقل: حجز التذاكر ومقارنة المنتجات في الأسواق وملء النماذج عبر الإنترنت والبحث عن المعلومات وتجميعها من مصادر مختلفة.
"نريد أن نجعل
ChatGPT تطبيقًا يفعل كل شيء تفعله عادة على الإنترنت"، تقول مصادر ملمة بإستراتيجية OpenAI.
المكونات الثلاثة — صوت مباشر Bidi 1 و Codex المدمج والوكلاء المستقلون — يعززان بعضهما البعض. وكيل يتمتع بصوت ثنائي الاتجاه وقدرة كتابة الأكواد هو فئة أداة مختلفة جذريًا، وليس مجرد روبوت دردشة محدّث.
ماذا يعني هذا
تتحرك OpenAI بقصد نحو تنسيق تطبيق فائق — منتج واحد يغطي معظم السيناريوهات اليومية: الصوت والأكواد وأتمتة المهام والبحث عن المعلومات. بالنسبة للمستخدم العادي، النتيجة الفورية هي أن المحادثات مع ChatGPT ستصبح أكثر حيوية وطبيعية بشكل ملحوظ. بالنسبة للأعمال، يعني هذا مستوى جديد من أتمتة المهام التشغيلية التي كانت تتطلب في السابق شخصًا أو مجموعة من أدوات SaaS المنفصلة. على المنافسين — من Google إلى Anthropic — أن يسرعوا مرة أخرى.
هل تحتاج إلى ذكاء اصطناعي يعمل داخل شركتك — وليس فقط في موجز الأخبار؟
أبني ذكاءً اصطناعياً جاهزاً للإنتاج للشركات — أنظمة CRM مخصّصة، أدوات داخلية، وكلاء مستقلون، أتمتة سير العمل. ملك لك، مصمّم وفق عمليتك، دون رسوم لكل مستخدم. من إعداد جمال خميدون، مدير المنتجات في AlpinaGPT (منصة ذكاء اصطناعي، أكثر من 6000 مستخدم).