توسيع منصة Together AI: تدريب النماذج بـ 100 مليار+ معامل
وسعت Together AI منصتها للضبط الدقيق. وتدعم الآن نماذج بـ 100+ مليار معامل: DeepSeek-R1 و Qwen3-235B و Llama 4. تم إضافة دعم السياقات الموسعة والتكامل مع Huggin
معالج بواسطة الذكاء الاصطناعي من Together AI Blog؛ بتحرير Hamidun News
حصلت منصة الضبط الدقيق Together AI على تحديث كبير. يمكن للمطورين الآن تدريب أكبر النماذج المفتوحة - تلك التي تحتوي على مئات المليارات من المعاملات.
النماذج العملاقة في التدريب
في عام 2025، تم إطلاق العديد من النماذج بـ 100+ مليار معامل. DeepSeek-R1 و Qwen3-235B و Llama 4 Maverick تُظهر نتائج قريبة من أفضل النماذج المملوكة في بعض المهام. يسمح الضبط الدقيق بتخصيص هذه العمالقة لمهام محددة للشركة - لكن في السابق كان هذا معقداً وباهظ التكلفة وتطلب خبرة عميقة في هندسة التعلم الآلي. قامت Together AI بتحسين معمارية منصتها بحيث أصبح تدريب النماذج الكبيرة بسيطاً وبأسعار معقولة.
أضافت الشركة دعم أحدث إصدارات أكبر النماذج:
- DeepSeek: V3 و R1 والإصدارات الأساسية الخاصة بهما
- Qwen: Qwen3-235B و Qwen3-Coder-480B بسياق يصل إلى 32,000 رمز
- Meta Llama: Llama 4 Scout و Llama 4 Maverick
- OpenAI: gpt-oss-120b كمشروع تجريبي
الدعم القياسي: سياق 16,000 رمز للضبط الدقيق الموجه (SFT) و 8,000 لتحسين التفضيل المباشر (DPO). تحصل بعض النماذج على سياقات أكبر. بعد اكتمال التدريب، يمكن للمطور نشر نقطة نهاية مخصصة للاستدلال أو تحميل نقاط تفتيش وسيطة للتحليل.
السياقات الموسعة للتدريب
المستندات الطويلة والقواعد البيانات الكبيرة وسلاسل تفكير وكلاء الذكاء الاصطناعي - كل هذا يتطلب نموذجاً يفهم السياقات الموسعة. المشكلة: إذا كانت أمثلة التدريب أقصر من المهام الحقيقية، قد يفقد النموذج طريقه في الإنتاج. أضافت Together AI دعم السياقات الكبيرة مباشرة في عملية التدريب. هذا يزيل عدم التطابق بين التدريب والتطبيق. على سبيل المثال، يمكن لـ Qwen3-235B الآن التدريب بسياق يصل إلى 32,000 رمز لمهام SFT. هذا مفيد بشكل خاص لتدريب النماذج على تحرير الملفات الكبيرة وكتابة التوثيق وتحليل المراسلات الطويلة.
التكامل وأساليب التدريب الجديدة
حسنت المنصة التكامل مع Hugging Face Hub - أكبر مستودع للنماذج المفتوحة والمجموعات البيانية. يمكن للمطورين الآن تحميل النماذج من Hub بنقرة واحدة وتشغيل التدريب وتحميل النتيجة مرة أخرى. هذا يقلل الوقت من الفكرة إلى النموذج المدرب الجاهز. تمت إضافة خيارات DPO الجديدة أيضاً - طرق تدريب تجعل النماذج أكثر استجابة لتفضيلات الإنسان. يتطلب DPO بيانات أقل من الطرق القديمة وغالباً ما يحقق نتائج أفضل في المهام الحقيقية.
ماذا يعني هذا
ينتقل تدريب النماذج الكبيرة من مهمة حصرية مكلفة إلى أداة شاملة. يمكن للشركات الناشئة والمختبرات البحثية والشركات متوسطة الحجم الآن تكييف DeepSeek أو Qwen أو Llama مع احتياجاتها، دون الحاجة إلى ميزانية بملايين الدولارات. هذا يسرع تبني الذكاء الاصطناعي ويقلل الاعتماد على النماذج المغلقة.
*تم الاعتراف بـ Meta كمنظمة متطرفة وممنوعة في الاتحاد الروسي.
هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟
AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.