Токены ИИ взвинчивают корпоративные облачные счета — ZDNet фиксирует тренд
ZDNet фиксирует тревожный тренд: корпоративные счета за AI-токены уже напоминают ранний cloud — непредсказуемо, дорого и без понятного ROI. Тогда хотя бы…
معالج بواسطة الذكاء الاصطناعي من ZDNet AI؛ بتحرير Hamidun News
تحول نفقات المؤسسات على رموز الذكاء الاصطناعي إلى بند ميزانية جديد لا يعرف أحد كيفية السيطرة عليه. يسجل محللو ZDNet اتجاهاً مقلقاً: تكرار منحنى التكاليف لتاريخ السحابة المبكر — نمو متفجر بدون أدوات تحسين واضحة وبدون إجابة على سؤال ما الذي تحصل عليه الشركة بالمقابل.
ديجافو من سنة 2012 في الأيام الأولى للسحابة، كان مديرو تكنولوجيا
المعلومات يتلقون فواتير EC2 و S3 و RDS التي تنمو أسرع من أي توقع. في ذلك الوقت، لم يكن أحد يعرف كيفية حساب النفقات لكل وحدة قيمة عمل. استغرق الأمر سنوات وعشرات أدوات FinOps وأقسام كاملة لإدارة تكاليف السحابة لوضع هذه النفقات تحت السيطرة. مع رموز الذكاء الاصطناعي، تتكرر القصة نفسها، لكن بوتيرة متسارعة. يقوم المطورون بربط GPT-4o و Claude Opus والنماذج المخصصة المحسنة بأنظمة المنتجات. يمكن لكل سير عمل الوكيل مع استدعاءات الأدوات وبحث RAG والسياق الطويل أن ينفق من 20000 إلى 100000 رمز لكل معاملة واحدة. اضرب هذا في آلاف المستخدمين يومياً — وستحصل على فاتورة لم تكن أبداً في أي ميزانية وتستمر في النمو كل ربع سنة.
"ستذكر رموز الذكاء الاصطناعي العديد من عملاء المؤسسات بأسعار السحابة
المبكرة"، تلاحظ ZDNet.
مشكلة لم تحل: كيفية قياس القيمة المشكلة الرئيسية التي حددتها ZDNet
ليست النفقات نفسها، بل أن الشركات لا تعرف كيفية قياس القيمة التي ينتجها رموز الذكاء الاصطناعي. في عالم السحابة كان كل شيء شفافاً نسبياً: تقوم نسخة واحدة بتنفيذ مهمة، للمهمة تكلفة بالساعات البشرية، والفرق هو الأرباح. مع الذكاء الاصطناعي، ينهار المخطط في كل خطوة: يسرع مساعد الذكاء الاصطناعي كتابة البريد الإلكتروني، لكن بكم بالضبط — لا أحد يقيس هذا بشكل منهجي يؤتمت الوكيل عملية، لكن جودة عمله ذاتية وغير متسقة يخفف الروبوت الدردشة من الدعم، لكن مقاييس الرضا في الحالات المعقدة تنخفض يقلل مساعد الكود وقت التطوير، لكن الديون التقنية لا تختفي * يحسن نظام RAG دقة الإجابات، لكن المقاييس تعتمد على مجموعة البيانات والمهمة المحددة على عكس ساعات CPU أو غيغابايت حركة المرور، لا تمتلك الرموز مراسلة واضحة لنتائج الأعمال.
لا يستطيع الرئيس المالي أن يقول: "لقد حصلنا على هذه القيمة المحددة القابلة للقياس لهذا المليون رمز". حتى يتم حل هذه المشكلة، ستتم الموافقة على ميزانيات الذكاء الاصطناعي بالإيمان وليس بالبيانات.
كيفية رد السوق يشهد بعض عملاء المؤسسات الكبار AWS و
Azure و Google Cloud بالفعل نمواً في نفقات الذكاء الاصطناعي بمعدل 3 إلى 10 مرات من سنة إلى أخرى. يرد المزودون بإطلاق أدوات مراقبة استهلاك الرموز — لكنهم حتى الآن يعرضون أساساً أرقاماً بدلاً من المساعدة في تحسين النفقات. يتشكل تخصص جديد — AI FinOps، مهمته إدارة تكلفة استنتاج LLM في الإنتاج.
من بين الأدوات التكتيكية الأولى: تخزين مؤقت للمحفزات للطلبات المتكررة توجيه المهام إلى نماذج أرخص حسب التعقيد تحديد عمق السياق وعدد الخطوات في سلاسل الوكيل معالجة الدفعات للطلبات بدلاً من الاستدعاءات الفردية في الوقت الفعلي * عمليات تدقيق منتظمة للتكاملات غير المستخدمة أو ذات الأداء الضعيفة لكن هذا تكتيك وليس استراتيجية. لا تزال الصناعة بلا إجابة على السؤال "كم عدد الرموز التي يجب أن ننفقها للحصول على نتيجة عمل محددة؟".
ما معنى هذا يقع الذكاء الاصطناعي في المؤسسات في نفس الفخ الذي وقعت فيه
السحابة عام 2012: يتم اعتماد التكنولوجيا على نطاق واسع، تنمو النفقات بسرعة، يصعب قياس العائد على الاستثمار. يجب على الشركات التي نشرت بالفعل LLMs في الإنتاج أن تستثمر في أدوات رؤية التكاليف وبناء مقاييس القيمة الآن — وإلا فإن المحادثة مع المدير المالي ستتحول إلى اختبار محرج لم يستعد أحد له.
هل تحتاج إلى ذكاء اصطناعي يعمل داخل شركتك — وليس فقط في موجز الأخبار؟
أبني ذكاءً اصطناعياً جاهزاً للإنتاج للشركات — أنظمة CRM مخصّصة، أدوات داخلية، وكلاء مستقلون، أتمتة سير العمل. ملك لك، مصمّم وفق عمليتك، دون رسوم لكل مستخدم. من إعداد جمال خميدون، مدير المنتجات في AlpinaGPT (منصة ذكاء اصطناعي، أكثر من 6000 مستخدم).
أهم ما في عالم الذكاء الاصطناعي — مرة كل أسبوع
سبع قصص مهمة فعلاً هذا الأسبوع، مختارة بعناية. بلا ضجيج ولا بيانات صحفية.
تم! تحقق من بريدك للتأكيد.