Habr AI

Anthropic وETH Zurich: ملف CLAUDE.md الطويل يضعف أداء الوكيل ويرفع التكاليف
أظهرت دراسة من ETH Zurich شملت 138 مستودعًا أن ملفات CLAUDE.md وAGENTS.md الطويلة كثيرًا ما تخفض معدل نجاح وكلاء coding وتزيد في الوقت نفسه

تفوقت Gemini 3.1 Pro على ChatGPT 5.4 وClaude Opus 4.6 في اختبار لتوليد النصوص
أظهرت مقارنة أجراها المؤلف بين ثلاثة من أبرز النماذج عبر أربع مهام أدبية أن Gemini 3.1 Pro حافظت بشكل أفضل على النوع الأدبي والعاطفة والإيجا

Anthropic وOpenAI وCursor: ثمانية مستويات لنضج هندسة الوكلاء
حللت Habr AI ثمانية مستويات لهندسة الوكلاء، من tab-complete وcontext engineering إلى background agents والفرق الذاتية التي تغيّر تطوير البرم

AMD RX580 شغّلت LLM محليًا: كيف تتغلب على ROCm وOllama وتحقق الاستدلال على GPU
أظهر مهندس كيف يمكن جعل AMD RX580 قديمة تشغّل LLM بشكل مستقر عبر ROCm وOllama، مع توضيح المؤشرات الزائفة لعمل GPU، وأعطال hipMemGetInfo، ودو

لماذا لا يكفي Claude 4.6 من دون سياق: أبرز نقطة عمياء في التطوير باستخدام LLM
حتى نموذج قوي مثل Claude 4.6 يفقد فعاليته من دون سياق مُجمّع بشكل منهجي: knowledge base، والروابط بين الخدمات، وقواعد البيئة أهم من prompt م

مطور يبني مجمّع أخبار مدعومًا بـ AI مع MCP وDeepSeek وبوت على Telegram
بعد هجوم الطائرات المسيّرة فوق دبي، أنشأ مطور مجمّع أخبار متعدد اللغات: 80+ مصدرًا، وخادم MCP لوكلاء AI، ودردشة AI، وبوت على Telegram مع ملخ

BorisovAI اختبرت MoE على RTX 4090 وأظهرت لماذا تُفسد perplexity تقييم LLM
اختبرت BorisovAI نموذج MoE مع خبراء plug-in على بطاقة RTX 4090 واحدة، وخلصت إلى أن perplexity الجيدة ظاهريًا لا تضمن تحسنًا حقيقيًا في الجود

تجربة على LLM أظهرت كيف تتشكل «شخصية» النموذج في الفضاء الكامن
أظهرت تجربة على LLM مكوّنة من وحدات أن متجهًا كامنًا منفصلًا يمكنه تخزين ليس فقط أسلوب النص، بل أيضًا سمات سلوكية مستقرة تشبه البنية الأساسي

Nvidia تلمّح قبل GTC 2026 إلى شريحة ضوئية قادرة على إعادة تشكيل مراكز بيانات AI
قبل كلمتها في 16 مارس 2026، أثارت Nvidia توقعات السوق بوعد «شريحة ستهز العالم»، ويُنظر إلى الفوتونيات السيليكونية باعتبارها المرشح الأبرز لل

لماذا لا تجيب إنجازات DeepMind في AGI عن السؤال الأهم حول الوعي الآلي
يوضح الكاتب لماذا لا يعني نمو القدرة الحاسوبية وإنجازات DeepMind في AGI ظهور الوعي: يمكن محاكاة الذكاء، بينما تظل التجربة الذاتية مرتبطة حتى

Habr AI حول مستقبل العمل: كيف يمكن لـ AI والروبوتات أن تعيد المجتمع إلى حقبة قديمة جديدة
يرى Habr AI أن الجمع بين AI والروبوتات والزرعات العصبية قد لا يغيّر سوق العمل فحسب، بل قد يقسم المجتمع إلى طبقة ضيقة من مشغلي الأنظمة وكل ال

عرضت Unity كيفية بناء شخصيات غير قابلة للعب صوتية مع ذاكرة وسياق للعالم
يوضح دليل خطوة بخطوة كيفية بناء شخصيات غير قابلة للعب صوتية في Unity بنموذج محلي، وذاكرة للمحادثات، ومعرفة بعالم اللعبة، وردود صوتية بدلًا م

هارفارد: AI يقلّص توظيف المبتدئين، وخلال ثلاث سنوات قد يؤثر ذلك على القطاع كله
ترصد هارفارد تراجع توظيف المبتدئين بعد اعتماد AI، بينما تشير METR إلى تزايد اعتماد المطورين ذوي الخبرة على مساعدي AI، ما يهدد بنقص الكوادر و

DeepSeek وGLM-5 تفوقا على Yandex في اختبار شمل 34 نموذج AI للمديرين من دون VPN
خلص مؤلفو اختبار كبير لسيناريوهات الإدارة إلى أن DeepSeek V3.2 وGLM-5، المتاحين في روسيا من دون VPN، أقوى بوضوح من حلول Yandex ويقتربان من ص

أطلقت Google نموذج Gemini Embedding 2 لـ RAG متعدد الوسائط مع الفيديو والصوت وPDF
أطلقت Google نموذج Gemini Embedding 2، وهو نموذج يحول النصوص والصور والفيديو والصوت وPDF إلى تمثيلات متجهية ضمن مساحة واحدة ويبسّط بناء RAG

Bitrix24 سرد ثمانية أخطاء شائعة عند تطوير خوادم MCP لـ LLMs
شرح مطور من Bitrix24 لماذا تتعطل خوادم MCP عند التفويض، وسلاسل الاستدعاء، ووصف الأدوات بشكل سيئ، والاختبارات، والأمان، وتجاوز سعة السياق.

لماذا لا تحل فكرة world model لدى Yann LeCun الأزمة الرئيسية في تطور LLM
بعد مغادرة Yann LeCun شركة Meta، يُعاد طرح مفهومه world model كمسار يتجاوز LLM، لكن المنتقدين يرون أن فيزياء العالم محدودة أكثر من اللازم لت

تم تجميع pipeline لـ Physical AI خاص بـ SO-101 بالاعتماد على ROS2 وLeRobot مقابل 30 ألف روبل
تتيح stack مفتوحة المصدر مبنية على ROS2 وLeRobot تجميع pipeline كامل لـ Physical AI على SO-101 منخفض التكلفة: teleoperation، وتسجيل الحلقات،

أطلقت SimpleOne أداة SimpleGen — أداة AI للتطوير والنشر على المنصة
قدّمت SimpleOne أداة SimpleGen — أداة AI لتوليد الحلول على منصتها: يكفي للمطور تجهيز مستودع، والوصول إلى بيئة، واتباع workflow في Cursor.

Google AI Ultra: كيف تحوّل الاشتراك إلى مجموعة من الوكلاء المتوازيين وتوافق بين النماذج
يُقترح استخدام Google AI Ultra كأساس لبنية متعددة الوكلاء: تشغيل وحدات Gemini بالتوازي، وتفويض المهام الروتينية، ومراجعة القرارات عبر نموذج

سام ألتمان والبنتاغون: كيف يمكن للعقود العسكرية أن تصبح بوليصة تأمين لـ OpenAI
تقول مقالة رأي عن العلاقة بين OpenAI والبنتاغون إن العقود العسكرية تمنح شركة سام ألتمان ليس فقط المال والبيانات، بل أيضاً حماية من ضغوط السو

أطلقت OpenAI نموذج GPT-5.4 Pro: أرقام قياسية جديدة في ARC-AGI-2 وFrontierMath والمنطق
كشفت OpenAI عن GPT-5.4 Pro، وهو نموذج حقق قفزة واضحة في الاختبارات المعيارية الصعبة، ويحل مسائل الاستدلال بشكل أفضل، ويتعامل بثقة أكبر مع ال

تفوّق nullClaw المبني على Zig على OpenClaw في الذاكرة وزمن البدء في اختبارات محلية لوكلاء AI
أظهر nullClaw، وهو بيئة تشغيل AI خفيفة مبنية على Zig، بدءًا شبه فوري واستهلاكًا للذاكرة أقل بعدة مرات في مقارنة محلية مع OpenClaw، حتى في سي

تفوق ChatGPT 5.4 من OpenAI على Claude Opus 4.6 وGemini 3.1 Pro في مقارنة على Habr
نشر Habr مقارنة بين ثلاثة نماذج رائدة في مهام روتينية: جاء ChatGPT 5.4 في المركز الأول بإجمالي النقاط، وكان Gemini 3.1 Pro الأرخص، بينما كان

دراسة: يسرّع Cursor بداية التطوير، لكنه يزيد لاحقًا الدين التقني للفريق
أظهرت دراسة حول Cursor أن مساعد AI يسرّع إنتاج الكود بشكل حاد في الأسابيع الأولى، لكنه يرفع لاحقًا التعقيد وعدد التحذيرات ويبطئ الفريق.

عرضت Yandex في AI Dev Day كيف يغير الذكاء الاصطناعي بالفعل التطوير في Avito و Ozon و T-Bank
في AI Dev Day، عرضت شركات Yandex و Avito و Ozon و T-Bank و Sber أين يسرع الذكاء الاصطناعي التطوير بالفعل وأين لا يزال التأثير محدوداً بالمقا

كيف يغيّر AI التطوير المستقل: أصبح من الأصعب على المطورين المنفردين المنافسة
يرى كاتب العمود أن AI سرّع إطلاق نماذج MVP، لكنه في الوقت نفسه رفع حاجز الدخول، وأشعل المنافسة التسويقية، وأضعف مزايا المطورين المنفردين.

شركة بلا مديرين: ثلاث فخاخ تقع فيها الشركات عند تطبيق AI
من بين 50 قائداً في ProIT Fest، قال ثلاثة فقط إن AI سهّل فعلاً اتخاذ القرار، رغم أن عدد المديرين في الشركات يتراجع باستمرار.

أظهرت Bitrix24 كيفية إضافة أربعة روبوتات للأتمتة إلى بوابة أعمال
أطلقت Bitrix24 الجزء التالي من سلسلتها العملية وأظهرت كيفية دمج أربعة روبوتات في بوابة أعمال: لتنظيف أرقام الهواتف، وتوحيد الأسماء، وجمع الب

شرحت Anthropic كيفية إنشاء skills لـ Claude Code ولماذا تحتاج الفرق إلى marketplace خاص بها
أوضحت Anthropic أي skills تعمل فعلاً في Claude Code، وكيفية كتابتها من دون ضجيج غير ضروري، ولماذا تحتاج الفرق الكبيرة إلى marketplace خاص لل