Alphabet تناقش مع Marvell شريحتين جديدتين للـ AI لتسريع الاستدلال في خدمات Google
تجري Alphabet محادثات مع Marvell لتطوير شريحتين للـ AI مخصصتين للاستدلال. يفترض أن تسرّع الأولى نقل البيانات عبر وحدة ذاكرة متخصصة، فيما يفترض أن تكون…
معالج بواسطة الذكاء الاصطناعي من 3DNews AI؛ بتحرير Hamidun News
تناقش Alphabet مع Marvell تطوير شريحتي ذكاء اصطناعي متخصصتين للاستدلال — المرحلة التي تعالج فيها نموذج مدرب بالفعل طلبات المستخدمين الحقيقية. إذا تحققت هذه الخطة، ستحصل Google على معدات مصممة ليس لتحطيم الأرقام القياسية في المختبر، بل لتقديم استجابات سريعة وضخمة في الخدمات التفاعلية.
ما الشرائح التي تحت النقاش
في صلب النقاش يوجد مكونان مختلفان. الأول عبارة عن وحدة ذاكرة يجب أن تعجل نقل البيانات داخل نظام الذكاء الاصطناعي. بالنسبة للاستدلال، هذا حساس جداً: حتى المعجل القوي يفقد قيمته إذا اصطدم النموذج بقيود نطاق الذاكرة والتأخيرات في تبادل البيانات والتسليم البطيء للمعلومات. في نماذج اللغات الكبيرة، غالباً ما تحدد هذه الاختناقات مدى سرعة واقتصادية استجابة النظام لتدفق طلبات المستخدمين اليومي.
المكون الثاني نسخة محدثة من TPU، معالجات Google المملوكة للعمليات الموترية، موجهة نحو التطبيقات التفاعلية. نتحدث عن سيناريوهات يتوقع فيها المستخدم إجابة فورية: البحث، والمساعدات الذكية، وتوليد النصوص، والاقتراحات في الواجهة. يشير هذا الاختيار إلى تحول في الأولويات: تُنشأ القيمة بشكل متزايد ليس في لحظة تدريب النموذج، بل في لحظة تشغيله المستمر عبر ملايين الطلبات القصيرة، حيث يكون للكمون المستقر والقابلية للتنبؤ وتكلفة كل إجابة أهمية.
لماذا تحتاج Alphabet إلى Marvell
بالنسبة إلى Alphabet، يبدو الشراكة مع Marvell عملية. Marvell قوية في البنية التحتية لمراكز البيانات والرقائق المتخصصة، بينما طورت Google خط TPU الخاص بها لسنوات عديدة. بدلاً من القيام بكل شيء داخلياً بالكامل، يمكن لـ Alphabet تقسيم المسؤولية: الاحتفاظ بالتحكم في معمارية المعجل والاستفادة من شريك للأجزاء التي تكون فيها الذاكرة والوصلات البينية والتعبئة وتبادل البيانات السريع بين المكونات مهمة بشكل خاص.
للصفقة أيضاً منطق اقتصادي. يتحول الاستدلال بسرعة إلى أحد أغلى طبقات البنية التحتية للذكاء الاصطناعي، لأنه يعمل على حركة مرور المستخدم المستمرة. كلما تم معايرة الأجهزة بدقة أكبر لنوع حمل معين، كان من الأسهل توسيع الخدمة دون نمو متفجر في التكاليف. بالنسبة إلى Google، هذه فرصة لتقليل التكلفة لكل إجابة والتحكم بشكل أفضل في مجموعة التكنولوجيا الخاصة بها؛ بالنسبة إلى Marvell، فهي وسيلة لتعزيز موقعها في سوق معجلات الذكاء الاصطناعي الساخن.
- يمكن لوحدة ذاكرة منفصلة أن تقلل الاختناقات عند العمل مع نماذج كبيرة
- معالج TPU محدث أكثر ملاءمة للحوار والسيناريوهات التفاعلية الأخرى
- عادة ما توفر الشرائح المتخصصة كفاءة أكبر لكل واط ولكل دولار
- بالنسبة إلى Google، هذه وسيلة لتعزيز التحكم في البنية التحتية الخاصة بها للذكاء الاصطناعي
- بالنسبة إلى Marvell، فهي دخول أعمق إلى سوق التسريع لأحمال الذكاء الاصطناعي
حيث سيلاحظ التأثير
إذا تقدمت التفاوضات نحو عمليات تسليم حقيقية، سيلاحظ التأثير أولاً ليس من قبل المستخدمين، بل من قبل الفرق المسؤولة عن البنية التحتية لـ Google. الاستدلال ليس تشغيلاً لمرة واحدة للنموذج، بل تشغيل مستمر تحت الحمل، حيث يجب على النظام الرد بسرعة على عدد ضخم من الطلبات على التوالي. في هذا النمط، ما يهم ليس الحسابات فقط، بل وقت الاستجابة القابل للتنبؤ والكفاءة في استهلاك الطاقة وعدم وجود اختناقات عند نقل البيانات بين الذاكرة والمعجل.
عملياً، هذا يعني معايرة أكثر دقة للأجهزة لمنتجات معينة. يتحرك السوق تدريجياً بعيداً عن فكرة شريحة عالمية واحدة تعمل بنفس الجودة لجميع مهام الذكاء الاصطناعي. بدلاً من ذلك، تجمع الشركات مجموعات منفصلة من المكونات للتدريب والاستدلال والأنماط التفاعلية. تتناسب التفاوضات بين Alphabet و Marvell بشكل جيد مع هذا الاتجاه: الفائزون لن يكونوا أولئك الذين لديهم معالجات GPU أكثر، بل أولئك الذين يصممون بدقة أكبر السلسلة الكاملة لتنفيذ النموذج تحت الحمل الفعلي.
ما معنى هذا
تظهر التفاوضات بين Alphabet و Marvell أن سباق الذكاء الاصطناعي الجديد ينشر ليس فقط حول النماذج، بل أيضاً حول الأجهزة المتخصصة للخدمات اليومية. من يستطيع تقديم إجابة سريعة بطريقة أرخص وأكثر موثوقية سيحصل على الميزة.
هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟
AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.