MarkTechPost→ المصدر

أطلقت Google نظام Gemini-SQL2: حققت Gemini 3.1 Pro نسبة 80% في معيار BIRD

أعلنت Google Research عن Gemini-SQL2 — نظام تحويل النصوص إلى SQL المبني على Gemini 3.1 Pro. في معيار BIRD في فئة النموذج الفردي، حقق النظام دقة تنفيذ بنسبة…

معالج بواسطة الذكاء الاصطناعي من MarkTechPost؛ بتحرير Hamidun News
أطلقت Google نظام Gemini-SQL2: حققت Gemini 3.1 Pro نسبة 80% في معيار BIRD
المصدر: MarkTechPost. كولاج: Hamidun News.
◐ استمع للمقال

قدمت Google Research نظام Gemini-SQL2 — وهو نظام لتحويل استعلامات النصوص إلى SQL بناءً على Gemini 3.1 Pro، وحقق دقة تنفيذ بنسبة 80.04٪ على معيار BIRD في فئة single-model.

ما هو معيار BIRD

BIRD (Big Bench for Large-scale Database Grounded Text-to-SQL) هو اختبار أكاديمي قياسي لتقييم الأنظمة التي تترجم أسئلة اللغة الطبيعية إلى استعلامات SQL. بخلاف مجموعات البيانات السابقة مثل Spider، يعمل BIRD مع بيانات حقيقية و"غير نظيفة": تحتوي الجداول على أخطاء إملائية وتنسيقات تاريخ غير قياسية وقيم NULL واختصارات بدون شروحات. لهذا السبب، يُعتبر المعيار أكثر تمثيلاً للمهام الصناعية.

توضح مقياس دقة التنفيذ النسبة المئوية للحالات التي أعطى فيها SQL المُولَّد الإجابة الصحيحة عند تنفيذه على قاعدة بيانات الاختبار. تعتبر نتيجة 80.04٪ من بين أعلى الدرجات العامة في فئة single-model: بدون طرق التجميع التي تجمع عدة نماذج أو خطوط أنابيب معالجة خاصة أو وكلاء تحقق إضافيين. احتفظ الرواد السابقون في هذه الفئة بدرجات في نطاق 73-77٪.

كيفية عمل Gemini-SQL2

وفقاً لوصف Google Research، يستخدم Gemini-SQL2 نهج schema-grounded. يتلقى النموذج البنية الكاملة لقاعدة البيانات — أسماء الجداول وأنواع الأعمدة والمفاتيح الأجنبية وأمثلة القيم — وينشئ SQL مع مراعاة الهندسة المعمارية الحقيقية لقاعدة البيانات المحددة. هذا يقلل من الأخطاء النموذجية: أسماء الحقول المهلوسة والوصلات غير الصحيحة والتجميع الخاطئ. وهذا مهم بشكل خاص عند العمل مع قواعد البيانات العملاقة، حيث تمثل أسماء الأعمدة في كثير من الأحيان اختصارات غير واضحة أو أكواد تقنية.

تشمل حالات الاستخدام النموذجية:

  • التحليلات بدون متخصصي SQL — يطرح مستخدم الأعمال سؤالاً باللغة الطبيعية ويتلقى استعلاماً جاهزاً للاستخدام
  • واجهات BI فوق مستودعات البيانات العملاقة مع إدخال صوتي أو نصي
  • الإكمال التلقائي وتوليد الاستعلامات المعقدة للمطورين بناءً على وصف المهمة نصياً
  • الإنشاء السريع للنماذج الأولية لتحليل البيانات الاستكشافي
  • الإنشاء التلقائي لـ SQL للتقارير التجارية المنتظمة

لتطبيق عملي، تقترح Google نمطاً: أولاً، مرر للنموذج مخطط DDL وعدة صفوف عينة من كل جدول، ثم سؤال المستخدم. بهذه الطريقة، يرى النموذج البنية الحقيقية لقاعدة البيانات ولا ينشئ استعلاماً بشكل أعمى.

ما لم تكشفه Google

تحتوي المنشورة على عدة فجوات مهمة. لم تنشر Google تفاصيل الهندسة المعمارية ومنهجية الضبط الدقيق وتكوين بيانات التدريب. لا يزال غير واضح ما إذا كان Gemini-SQL2 نموذجاً تم ضبطه بشكل مستقل أو استراتيجية prompting خاصة فوق Gemini 3.1 Pro الأساسي. من غير الواضح أيضاً ما إذا كان النظام متاحاً عبر API الآن أم أنه لا يزال نتيجة تجربة بحثية بدون إطلاق منتج فوري. لا توجد معلومات حول دعم اللغات بخلاف اللغة الإنجليزية والتوافق مع لهجات SQL التي تتضمن وظائف النافذة و CTEs العودية.

« 80 بالمائة على BIRD هي نتيجة خطيرة، لكن بدون تقرير تقني من الصعب فهم

ما إذا كانت قابلة للتكرار لقواعد البيانات العملاقة التعسفية » — رد فعل نموذجي من مجتمع ML على مثل هذه الإعلانات.

ماذا يعني هذا

عتبة 80٪ على BIRD هي إشارة إلى أن text-to-SQL يتوقف عن كونه مهمة أكاديمية وينضج إلى أداة قابلة للتطبيق عملياً لمعظم استعلامات الأعمال القياسية. تملك الشركات التي تريد إعطاء الموظفين غير التقنيين الوصول المباشر إلى البيانات أساساً متيناً لمشاريع تجريبية مع التحليلات المدعومة بـ LLM. ستوضح الأشهر القادمة ما إذا كانت Google ستترجم هذه النتيجة إلى منتج ملموس — على سبيل المثال، ميزة BigQuery المدمجة — وما إذا كان سيتبع المنافسون مع معايير عامة قابلة للمقارنة.

ZK
Hamidun News
أخبار الذكاء الاصطناعي بدون ضوضاء. اختيار تحريري يومي من أكثر من 400 مصدر. منتج من جمال حميدون، رئيس الذكاء الاصطناعي في Alpina Digital.

هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟

AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.

ما رأيك؟
جارٍ تحميل التعليقات…