CollectivIQ تريد جعل AI أكثر موثوقية من خلال سؤال 14 نموذجًا دفعة واحدة
تقترح شركة CollectivIQ الناشئة مقاربة جديدة لموثوقية إجابات AI: فبدلًا من روبوت دردشة واحد، يوجّه النظام السؤال في الوقت نفسه إلى ما يصل إلى 14 نموذجًا، بما…
معالج بواسطة الذكاء الاصطناعي من TechCrunch؛ بتحرير Hamidun News
مشكلة الهلوسات في نماذج اللغة تظل من بين الحواجز الرئيسية أمام الثقة الجماعية في الذكاء الاصطناعي. أي شخص تلقى من ChatGPT معلومات معروضة بثقة لكنها مختلقة تماماً يعرف هذا الشعور: التكنولوجيا تثير الإعجاب، لكن الثقة العمياء فيها خطيرة. قررت شركة CollectivIQ الناشئة مهاجمة هذه المشكلة من زاوية غير متوقعة — لا بتحسين نموذج واحد، بل باستجواب أربعة عشر نموذجاً في الوقت ذاته.
الفكرة، التي أفادت بها TechCrunch، أنيقة في بساطتها. تجمع CollectivIQ الإجابات من ChatGPT و Gemini و Claude و Grok وعشرة نماذج لغة أخرى في آن واحد. يدخل المستخدم استعلاماً واحداً ويحصل على لوحة من الإجابات، حيث يمكنه مقارنة الصيغ وتحديد نقاط الاتفاق والأهم من ذلك ملاحظة نقاط الاختلاف. إذا قال ثلاثة عشر من أصل أربعة عشر نموذجاً شيئاً واحداً وقال الآخر شيئاً مختلفاً، فهذا إشارة قوية. وإذا اختلفت النماذج بالتساوي، فهذه أيضاً معلومات قيمة: تعني أن السؤال أكثر تعقيداً مما يبدو، ولا يستحق الثقة العمياء في أي إجابة واحدة.
لفهم سبب نجاح هذا النهج، تستحق الإشارة إلى ظاهرة تسمى في نظرية اتخاذ القرار "حكمة الجماهير". اكتشف فرانسيس جالتون عام 1906 أن المتوسط المحسوب من تقييمات مجموعة كبيرة من الناس يكون أدق من رأي أي خبير واحد. تنقل CollectivIQ بشكل أساسي هذا المبدأ إلى عالم نماذج اللغة الكبيرة. يتم تدريب كل منها على بيانات مختلفة وبتركيزات وقيود مختلفة. GPT-4o قوية في التفكير، Claude — في الدقة واتباع التعليمات، Gemini — في التعددية الوسائطية والعمل مع المعلومات الحالية، Grok — في النبرة غير الرسمية والوصول إلى بيانات وسائل التواصل الاجتماعي. عندما يتم دمج إجاباتها، يتم تعويض ضعف نموذج واحد بنقاط قوة آخر.
من الناحية التقنية، يطرح تنفيذ مثل هذه الخدمة عدة أسئلة جادة. أولاً وقبل كل شيء — التكلفة. كل طلب إلى واجهة برمجية تجارية يكلف رموزاً، والضرب في أربعة عشر يحول الفلسات إلى مبالغ ملموسة. بالنسبة للمستخدم العادي الذي يطلب وصفة الحساء، هذا مفرط. لكن بالنسبة للمحترفين — المحامين والأطباء والمحللين والصحفيين — الذين تكون الدقة بالغة الأهمية بالنسبة لهم، قد تنجح الاقتصاديات. السؤال الثاني هو السرعة. الطلبات المتوازية إلى واجهات برمجية مختلفة لها أوقات استجابة مختلفة، والمستخدم سيضطر إما إلى الانتظار للنموذج الأبطأ أو الحصول على الإجابات بشكل غير متزامن، مع وصولها. الثالث هو تصميم الواجهة. عرض أربعة عشر إجابة بطريقة لا يتيه الإنسان في المعلومات بل يستخلص الجوهر بسرعة — هذه مسألة تصميم خطيرة.
لا تظهر CollectivIQ في الفراغ. يوجد بالفعل في السوق محركات بحث فوقية لنماذج الذكاء الاصطناعي: يوفر Poe من Quora الوصول إلى عدة نماذج في واجهة واحدة، والخدمات مثل TypingMind و OpenRouter تسمح بالتبديل بين الموفرين. لكن لا أحد منها يراهن على المقارنة المتزامنة كأداة للتحقق. تضع CollectivIQ التعددية الوسائطية ليس كراحة، بل كطريقة لزيادة الموثوقية — وهذا سرد أساسي مختلف تماماً. بدلاً من "اختر أفضل نموذج" — "لا تثق بأي واحد، قارن الجميع".
هناك أيضاً سياق أعمق. تعاني صناعة الذكاء الاصطناعي من أزمة ثقة. تظهر الأبحاث أن المستخدمين يزدادون تشكيكاً في إجابات برامج الدردشة، لكنهم يستمرون في استخدامها — ببساطة لأنه لا توجد بدائل. تقدم CollectivIQ حلاً وسيطاً: لا تفرض الثقة العمياء ولا تتطلب التخلي عن الذكاء الاصطناعي، بل توفر أداة للتحليل النقدي. بمعنى ما، هذا عودة إلى مبدأ صحفي هو التحقق المتقاطع من المصادر، إلا أن المصادر هي شبكات عصبية.
السؤال الرئيسي هو ما إذا كان هذا النموذج قابلاً للتوسع. إذا بدأ الموفرون الكبار في تقييد الوصول إلى الواجهة البرمجية للمجمعات أو رفع الأسعار، ستكون أعمال CollectivIQ مهددة. علاوة على ذلك، مع أن النماذج تصبح أكثر وأكثر تشابهاً مع بعضها البعض، متعلمة من مجموعات البيانات المتداخلة، قد تنخفض قيمة المقارنة متعددة النماذج. لكن طالما يظل التنوع في المناهج قائماً، فإن فكرة المساهمة الجماعية بين الذكاء الاصطناعي تبدو ذكية وعملية في آن واحد. ربما يكون المستقبل للذكاء الاصطناعي الموثوق ليس نموذجاً واحداً مثالياً، بل جوقة من النماذج الناقصة، حيث يُسمع النغمة الكاذبة فوراً.
هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟
AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.