تقدم مايكروسوفت ثلاثة نماذج لمعالجة النصوص والصوت والصور
قدمت مايكروسوفت AI ثلاثة نماذج جديدة: MAI-Transcribe-1 لتحويل الكلام إلى نص، و MAI-Voice-1 لتوليف الصوت، و MAI-Image-2 لتوليد الصور. تراهن الشركة على بنيتها…
معالج بواسطة الذكاء الاصطناعي من 3DNews AI؛ بتحرير Hamidun News
تعرض Microsoft AI نطاقها الخاص من الخدمات التوليدية وتُظهر أنها لا تريد الاعتماد فقط على نماذج الشركاء. قدمت قسم البحث التابع للشركة ثلاثة حلول جديدة في وقت واحد: MAI-Transcribe-1 لتحويل الكلام إلى نص، و MAI-Voice-1 لتوليف الصوت، و MAI-Image-2 لتوليد الصور بناءً على الأوصاف النصية. بالنسبة لـ Microsoft، هذا ليس مجرد إطلاق جديد آخر، بل رهان على دور أكثر استقلالية في سباق منصات الذكاء الاصطناعي. يغطي النطاق الجديد عدة سيناريوهات رئيسية يحتاج إليها في المنتجات القائمة والخدمات السحابية.
يمكن لـ MAI-Transcribe-1 تحويل الكلام إلى نص في 25 لغة، وبحسب Microsoft، يعمل بسرعة 2.5 مرة أسرع من خدمة Azure Fast. هذا مهم لمراكز الاتصالات وتفريغ الاجتماعات وتحليل محادثات العملاء وتوطين المحتوى في الوقت الفعلي. يوليّد MAI-Voice-1 مسارًا صوتيًا مدته دقيقة تقريبًا في حوالي ثانية واحدة ويدعم تخصيص الأصوات لمختلف المهام — من تصويت الواجهات إلى المساعدات الصوتية وأتمتة الإنتاج الإعلامي. MAI-Image-2 مسؤول عن إنشاء محتوى بصري بناءً على طلبات نصية، وبالتالي يكمل وظائف النص والصوت بوحدة بصرية كاملة.
يُظهر إطلاق ثلاثة نماذج في وقت واحد أن Microsoft تراهن ليس على منتجات توضيحية فردية، بل على بنية تحتية متعددة الأنماط خاصة بها. داخل الشركة، يتم إجراء هذا العمل بواسطة فريق MAI Superintelligence، الذي يشغل نفسه بأبحاث الأنظمة الذكية المتقدمة. يرأس القسم مصطفى سليمان، الذي جاء لتعزيز اتجاه الذكاء الاصطناعي في Microsoft وبناء دارة تكنولوجية أكثر استقلالية.
المنطق واضح: إذا كانت الشركة تملك نماذجها الخاصة للنص والصوت والصور، فإنها تحصل على تحكم أكثر في الجودة والسرعة والتكلفة وسرعة تطوير المنتجات. بالنسبة لشركة بهذا الحجم، هذا أيضًا مسألة موقع تفاوضي: كلما قل الاعتماد على مورد نماذج خارجي، كان من الممكن بناء استراتيجيات المنتجات والسحابة بمرونة أكبر.
تم التركيز بشكل خاص على تكاليف الاستخدام. تحاول Microsoft أن تتنافس ليس فقط على الجودة، بل أيضًا على الاقتصاد الحسابي مقارنة مع البدائل من Google و OpenAI. تبدأ تسعير النسخ من 0.36 دولار في الساعة. يتم تسعير توليف الكلام بـ 22 دولارًا لكل مليون حرف. بالنسبة لتوليد الصور، يتم الإعلان عن 5 دولارات لكل مليون رمز إدخال و 33 دولارًا لكل مليون رمز إخراج. هذا النهج مهم بشكل خاص للشركات التي تأخذ في الاعتبار ليس فقط قدرات النماذج، بل أيضًا تكلفة كل سيناريو — من معالجة المكالمات إلى إنشاء الوسائط تلقائيًا.
إذا تم تأكيد المقاييس المعلنة في الممارسة العملية، ستتمكن Microsoft من الترويج للنماذج الجديدة كأداة عمل للمهام الجماعية، وليس فقط التجريبية. تم نشر جميع النماذج الثلاثة بالفعل على منصة Microsoft Foundry، وحلول النسخ وتوليف الكلام متاحة أيضًا في MAI Playground. هذا يعني أن الشركة لم تقتصر على إعلان بحثي، بل أحضرت النماذج مباشرة للاستخدام العملي من قبل المطورين والعملاء العام.
هذه الخطوة مهمة لأن السوق لا يهتم كثيرًا بالعروض التجريبية المعزولة بعد الآن: تظهر القيمة حيث يمكن دمج النموذج بسرعة في المنتج واختباره على حملك الخاص وحساب الاقتصاد النهائي. يغلق Foundry و Playground هذا المسار من الإعلان إلى التنفيذ.
في الوقت نفسه، لا تتخلى Microsoft عن استراتيجية الشراكة السابقة. تواصل الشركة تعاونها مع OpenAI والعقد متعدد السنوات، على الرغم من أنها استثمرت بالفعل أكثر من 13 مليار دولار في شريكها. في الواقع، تبني Microsoft كومة متنوعة حيث تكمل حلولها الخاصة حلول الشركاء بدلاً من استبدالها على الفور. هذا مشابه لاستراتيجية في عمل الأجهزة، حيث يتم شراء المكونات الحرجة من موردين متعددين لتقليل المخاطر وعدم الاعتماد على خط تكنولوجي واحد.
الخلاصة الرئيسية هي أن Microsoft تعيد هيكلة استراتيجية الذكاء الاصطناعي نحو استقلالية أكبر. تظل الشركة واحدة من الحلفاء الرئيسيين لـ OpenAI، لكنها الآن تطور بشكل ملحوظ نماذجها الخاصة والبنية التحتية من حولها بشكل أكثر نشاطًا. بالنسبة للسوق، هذه إشارة إلى أن المنافسة بين كبار لاعبي الذكاء الاصطناعي ستتم ليس فقط على جودة الإنتاج، بل أيضًا على السرعة والتكلفة وعمق التكامل في سير العمل. بالنسبة لعملاء Microsoft، هذا من المحتمل أن يعني مجموعة أوسع من الأدوات داخل نظام بيئي واحد واعتماد أقل على مورد نماذج واحد.
هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟
AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.