أوضحت VK كيف تحول محرر الصور بالـ AI «Otredach» من مزحة إلى فائز في Dev Grants 2025
سردت VK قصة التطبيق المصغر «Otredach»، الذي تحول من مشروع شخصي ساخر إلى محرر صور AI يعمل فعليًا. وخلال ستة أشهر، جمعت الخدمة أكثر من 109 آلاف مستخدم فريد،…
معالج بواسطة الذكاء الاصطناعي من Habr AI؛ بتحرير Hamidun News
نشرت VK دراسة حالة للمطور أنطون لينيف، الذي حول مشروع ذكاء اصطناعي تجريبي إلى تطبيق صغير "أوتريداتش" على منصة VK Mini Apps. انتهت القصة ليس فقط بالفوز في VK Dev Grants 2025، بل أيضًا بمنتج يعمل: خلال الأشهر الستة الماضية، تم زيارة الخدمة من قبل أكثر من 109 آلاف مستخدم فريد.
من الفكرة إلى المنتج
بدأت القصة في عام 2023، ليس محرر صور، بل خدمة فكاهية لـ "التنبؤ" على أساس GPT-3.5. أنشأ لينيف واجهة بسيطة على Next.js وأضاف توليد الإجابات المتدفق وربط التطبيق بطابعة Bluetooth للأطفال، بحيث يمكن طباعة التنبؤات على الفور. انطلقت الفكرة بشكل غير متوقع: انتشرت مقاطع الفيديو التوضيحية بسرعة على وسائل التواصل الاجتماعي، واهتم منظمو الفعاليات بالخدمة، معجبين بهذه الطريقة للتفاعل مع الشبكات العصبية.
ظهرت النسخة التالية في عام 2024، عندما بدأت النماذج تعمل بثقة مع الصور كمدخلات. ثم قام المطور بتجميع نموذج أولي جديد: قام المستخدم بتحميل صورة من قاع القهوة أو أوراق الشاي، وفسرت النموذج الصورة وأنتجت "تنبؤًا" نصيًا. تفاعل التجربة مرة أخرى مع الجمهور، وتم دمج المشروع مع VK Bridge، وتم الحفاظ على تحقيق الدخل من الإعلانات، وفي النهاية فازوا بـ VK Fresh Code 2024 معها، الذي أصبح الإشارة الأولى الخطيرة حول جدوى الفكرة.
في عام 2025، انحرف لينيف بقصد عن شكل الترفيه البحت. بدلاً من مشروع شخصي آخر، قررت تجميع منتج كامل بأقتصاديات أوضح وحالة استخدام جماهيرية. في ضوء ظهور Nano Banana وOpenAI GPT Image 1.5 وSeedream 4.5، اختار المطور حالة بسيطة ولكن واضحة: يقوم المستخدم بتحميل صورة ويتلقى نسخة منمقة من الصورة — من صورة شخصية عصور وسطى إلى بطاقة بريدية بأسلوب ريترو أو جلسة صور رأس السنة.
كيف تعمل الخدمة
من الناحية التقنية، تم بناء "أوتريداتش" بدون تعقيد غير ضروري. يستخدم الواجهة الأمامية SPA قياسي مع أولوية UX الموجهة للهاتف المحمول، والتكامل عبر VK Bridge، و VK UI Kit المقتبس. بين الواجهة وموفري النماذج توجد طبقة BFF: تتحقق من توقيعات VK، وتتحقق من صحة بيانات الإدخال، وترسل الطلبات إلى واجهات برمجة تطبيقات النموذج، وتقبل المحاكيات عند الانتهاء، وتدير منطق العمل حول الأجيال بحيث لا ينهار سيناريو المستخدم على أخطاء الخدمات الخارجية.
بدلاً من البنية التحتية الثقيلة مع PostgreSQL والنسخ المتماثلة وKubernetes، اختار المطور PocketBase على Go فوق SQLite. للحمل المعتدل، ثبت أن هذا كافٍ: قدمت الحل لوحة تحكم مدمجة وترحيلات وخطافات للمنطق واستهلاك موارد منخفض جدًا. يعكس هذا المكدس بشكل جيد نهج المنتج لدى لينيف: تحقق بسرعة من الطلب والاقتصاد الفردي، بدلاً من قضاء أشهر في توسع نظام لم يثبت بعد أن أحدًا بحاجة إليه فعلاً.
النهج تجاه النماذج مثير للاهتمام بشكل خاص. رفض لينيف تدريب نماذجه الخاصة والضبط الدقيق، لأن المشروع المستقل يكون مكلفًا جدًا وثقيلًا من الناحية التنظيمية. بدلاً من ذلك، يعمل "أوتريداتش" من خلال محاور واجهات برمجة التطبيقات مثل Replicate ويختار نموذجًا لقالب مرئي محدد، وليس لفكرة مجردة عن "أفضل جودة بأي ثمن". يساعد هذا النهج على الحفاظ على الجودة وسرعة الاستجابة وتكلفة الإنشاء تحت السيطرة في نفس الوقت.
- السيناريوهات المرئية المعقدة تستخدم نماذج أقوى وأكثر تكلفة
- تتصل القوالب الجماهيرية بتكوينات أرخص بجودة مقبولة
- لكل نمط، يتم كتابة موجه منفصل بقيود صارمة على التركيب والتعرف على الوجه
- تعود الخدمة تلقائيًا بالنقاط إذا فشلت الإنشاء أو تحللت مع موفر الخدمة
- تقتصر الطلبات المتكررة والحمل غير الضروري على حدود المعدل وحماية ازدواجية
"الاتجاه المختار ليس مثيرًا للاهتمام من الناحية التقنية فحسب، بل ذو
مغزى المنتج أيضًا", كما يكتب لينيف.
الاقتصاد والمنحة
الجزء الرئيسي من هذه الدراسة ليس توليد الصور نفسه، بل التحكم في النفقات. يكتب لينيف أنه كان واضحًا بالفعل في مرحلة مبكرة: بدون اقتصاد صارم، سيحترق هذا المنتج بسرعة من خلال الميزانية. فقط في أكتوبر 2025، تجاوزت تكاليف الإنشاء 500 دولار، لذلك تم تصميم التطبيق على الفور ليكون على الأقل لا يدخل الحمراء. بالنسبة للمؤلف، هذا ليس إنفاقًا سحابيًا مجردًا، بل أموالًا حقيقية تحتاج إلى استرجاع من خلال نموذج تحقيق دخل يعمل داخل VK.
للحفاظ على المشروع على قيد الحياة، لم يطارد المطور أغلى النماذج في كل سيناريو، بل اختار توازنًا بين السعر والنتائج. تم تحسين الموجهات للتكوينات الأرخص، وتم إدخال بعض القيود ليس من أجل جمال الواجهة، بل من أجل البقاء الاقتصادي: حدود الإنشاء وحماية ازدواجية وعودة العملة الداخلية عند الفشل والتحكم في تكرار الطلب.
نتيجة لذلك، وفقًا للمؤلف، يتعادل التطبيق مع ربح صغير بالنسبة إلى تكاليف الإنشاء والبنية التحتية والمدفوعات الإلزامية. في المرحلة الأولى من VK Dev Grants 2025، قدم لينيف فكرة لتطبيق مختلف — "Live Photos"، الذي ينشط الصور. بعد ذلك، على بنية مماثلة، ظهر "أوتريداتش"، وبدأ كلا المنتجين في التكامل مع بعضهما البعض: أولاً ينشئ المستخدم صورة، ثم يحولها إلى مقطع فيديو قصير.
بحلول نهاية المسابقة، لم تكن مفهومًا على شرائح، بل خدمة مباشرة مع مستخدمين وبنية تحتية تعمل واقتصاد يعمل وحالة استخدام واضحة، مما جلب في النهاية الفوز في برنامج المنح.
ماذا يعني هذا
تُظهر دراسة حالة "أوتريداتش" أنه في منتجات الذكاء الاصطناعي، الفائز ليس أكثر المكدسات تعقيدًا وليس نموذجًا خاصًا، بل فرضية تم التحقق منها بسرعة وتحقيق دخل مفهوم وتعبئة دقيقة للسيناريو لمنصة جماهيرية. بالنسبة للمطورين المستقلين، هذا إشارة مهمة: الطريق من تجربة ساخرة إلى منتج بجمهور من ستة أرقام ومنحة VK لا يزال ممكنًا إذا كان المشروع لديه طلب وانضباط الإنفاق والصبر الكافي لجعل الفكرة خدمة تعمل.
هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟
AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.