أحدث المنشورات

أطلقت Together AI نظام ATLAS: مسرّع تخمين يسرّع نماذج اللغة الكبيرة 4 مرات
تقنية ATLAS الجديدة من Together AI، وهي مسرّع تخمين قابل للتعلم التكيفي، تسرّع استدلال نماذج اللغة الكبيرة بمعامل 4 مرات دون الحاجة لأي ضبط يدوي — وتتكيف تلقائياً مع حمل العمل لدى المستخدم.

شركة Together AI تطلق مجموعات GPU ذاتية الخدمة Instant Clusters على معالجات NVIDIA H100 و B200
أطلقت شركة Together AI رسمياً منصة Instant Clusters - وهي مجموعات GPU ذاتية الخدمة المستندة إلى معالجات NVIDIA H100 و B200، التي يتم نشرها في دقائق وجاهزة للإنتاج دون موافقات طويلة.

رفعت Together AI حدود Batch Inference API بمقدار 3000 مرة وخفضت الأسعار بنسبة 50%
أصبحت Batch Inference API الآن تدعم 30 مليار توكن (بدلاً من 10 ملايين) وتكلف نصف سعر real-time API. وهي تدعم جميع نماذج المنصة البالغ عددها 40+.

توسيع منصة Together AI: تدريب النماذج بـ 100 مليار+ معامل
منصة الضبط الدقيق Together AI تدرب الآن أقوى النماذج المفتوحة - DeepSeek-R1 و Qwen3-235B و Llama 4 - مع دعم السياقات الموسعة والتكامل مع Hugging Face.

FlashAttention-3 سيسرع المحولات بمعدل الضعف مع استخدام 75% من سعة معالج الرسومات
أطلقت Together AI تقنية FlashAttention-3 — خوارزمية تسرّع المحولات 1.5-2 مرة وتستخدم 75% من أداء معالج الرسومات H100 مع دعم دقة منخفضة FP8.

Together AI تحقق تسريعًا بنسبة 90% في التدريب على NVIDIA Blackwell
أعلنت Together AI إتاحة الوصول إلى عناقيد GPU من NVIDIA Blackwell مع تحسيناتها الخاصة، محققة تسريعًا بنسبة 90% في تدريب Llama 70B و15,264 توكن في الثانية لكل GPU.

ThunderKittens من Together AI: لغة جديدة لكتابة نوى GPU فعالة
قدمت Together AI لغة ThunderKittens للعمل مع نوى GPU - تُكتب مثل PyTorch لكن تعمل مثل CUDA النقي. على معالجات H100، يعمل الكود حتى أسرع من FlashAttention2 الكلاسيكية.

DSGym: فريمورك لتدريب وكلاء العلوم البيانات مع 90+ مهمة علمية
نشرت Together AI إطار عمل DSGym الموحد لتقييم وتدريب وكلاء LLM على مهام العلوم البيانية. يتضمن أكثر من 90 مهمة من المعلوماتية الحيوية و92 مسابقة Kaggle، مع نموذج بـ 4 مليارات معامل مدرب على بيانات اصطناعية وحقق نتائج متق

شرحت Together AI لماذا السحابة المخصصة للذكاء الاصطناعي تتطلب معمارية مختلفة تماماً
شركات الذكاء الاصطناعي الناشئة مثل Cursor تجري تحديثاتها أسبوعياً وتستهلك معالجات GPU بكثافة عالية. اكتشفت Together AI كيف يجب أن تكون السحابة لمواكبة سرعة الشركات الأصلية للذكاء الاصطناعي.

Together AI: كيف تغلق تحسينات النوى الفجوة بين النماذج ومعالجات GPU
طور فريق Together AI تقنية تسرع أداء GPU بمعامل 2-3 مرات. في أسبوع واحد، كيّفوا النوى لمعالجات Blackwell الجديدة - عمل استغرقت NVIDIA سنة كاملة.

FlashAttention-4: كيف سرعت Together AI خوارزمية الانتباه على معالج Blackwell
أطلقت Together AI نسخة FlashAttention-4 — تحسين لخوارزمية الانتباه على معالج Blackwell يصل إلى 1605 تيرافلوب/الثانية ويعمل بسرعة أكبر بـ 2.7 مرة من Triton.