مختبر شنغهاي للذكاء الاصطناعي الصيني يطرح إطار "Self-Harness" لتحسين أداء الوكلاء الأذكياء بنسبة 60%
2026-06-23 10:40
المفضلة

أخبار ar.wedoany.com، اقترح باحثون في مختبر شنغهاي للذكاء الاصطناعي (Shanghai Artificial Intelligence Laboratory) نموذجًا جديدًا يُعرف باسم "Self-Harness"، يسمح للوكلاء الأذكياء القائمين على نماذج اللغة الكبيرة (LLM) بتحسين قواعد تشغيلهم بشكل منهجي، دون الاعتماد على مهندسين بشريين أو نماذج خارجية أقوى.

لا يعتمد أداء الوكلاء الأذكياء القائمين على نماذج اللغة الكبيرة على النموذج الأساسي فحسب، بل يعتمد أيضًا على إطار عملهم، الذي يشمل توجيهات النظام، والأدوات، والذاكرة، وقواعد التحقق، واستراتيجيات وقت التشغيل، ومنطق التنسيق، وإجراءات استعادة الأعطال. غالبًا ما تنشأ الأعطال الشائعة للوكلاء الأذكياء من الإطار وليس من النموذج نفسه. على سبيل المثال، قد يبلغ الوكيل عن نجاح دون التحقق من استجابة النموذج، أو يعيد محاولة العمليات الفاشلة بشكل متكرر. تُعد SWE-agent وClaude Code وCodex وOpenHands أمثلة شائعة على أطر العمل هذه.

صرح هانغفان تشانغ، المؤلف الأول لورقة Self-Harness، أن العقبة الحقيقية في هندسة الأطر اليدوية تكمن في الاعتماد على التصحيح المؤقت بدلاً من حلقات التغذية الراجعة المنهجية. تعتمد العديد من التعديلات على الحدس أو عدد قليل من حالات الفشل، مما يصعب مواكبة التطور السريع لنماذج اللغة الكبيرة. يتيح نموذج Self-Harness للوكلاء الأذكياء القائمين على نماذج اللغة الكبيرة تحقيق التطور الذاتي من خلال دورة تكرارية من ثلاث مراحل.

تبدأ الدورة بمرحلة استكشاف نقاط الضعف: حيث ينفذ الوكيل المهام لتوليد مسارات التنفيذ، ويصنف المسارات الفاشلة، ويكتشف أنماط الفشل الخاصة بالنموذج. تليها مرحلة اقتراح الإطار: حيث يستخدم الوكيل دور "المقترح" لتوليد مجموعة متنوعة وأدنى حد من التعديلات على الإطار، يستهدف كل تعديل آلية فشل محددة. وأخيرًا، مرحلة التحقق من الاقتراحات: حيث يقوم النظام بتقييم التعديلات المرشحة من خلال اختبارات الانحدار، ولا يتم اعتماد التعديل إلا إذا لم يؤدِ إلى تدهور أداء المهام المحتفظ بها. إذا اجتازت عدة مرشحات الاختبارات، يتم دمجها في الإصدار التالي من الإطار.

قام الباحثون بتقييم Self-Harness على معيار Terminal-Bench-2.0، الذي يختبر التنفيذ القائم على الأدوات، بما في ذلك إدارة القطع الأثرية، واستخدام الأوامر، وسلوك التحقق، والتعافي من أخطاء التنفيذ. طبقوا Self-Harness على نماذج MiniMax M2.5 وQwen3.5-35B-A3B وGLM-5. أظهرت النتائج الكمية أن الوكلاء الأذكياء حسّنوا أداءهم من خلال تحرير الإطار تلقائيًا، حيث تراوحت التحسينات النسبية بين 33% و60% عبر النماذج المختلفة في المهام المحتفظ بها.

إطار Self-Harness

أظهرت التجارب أن Self-Harness يُدخل تغييرات مستهدفة تعكس المشكلات المتكررة لكل نموذج أثناء التنفيذ. على سبيل المثال، كان نموذج MiniMax M2.5 يستكشف تكوينات مجموعة البيانات بلا نهاية تحت الإطار الأساسي حتى انتهاء المهلة، فقام النظام بإصلاح ذلك عن طريق كتابة قاعدة "كسر الحلقة" (التوقف بعد 50 استدعاء أداة وإعادة توجيه الأسلوب) وإضافة شرط لإنشاء إصدار أولي في أقرب وقت. واجه نموذج Qwen-3.5 مشكلة تكرار نفس الأمر بعد مواجهة خطأ في الكتابة فوق الملف، فأدخل النظام انضباطًا صارمًا لإعادة المحاولة (منع تكرار الأمر بالكامل) وآلية لإعادة إنشاء القطع الأثرية المفقودة فورًا بعد أخطاء الملف. واجه نموذج GLM-5 صعوبة في الحفاظ على تغييرات البيئة بين الأوامر المختلفة، فأدخل إطاره المُنشأ ذاتيًا قواعد مثل استمرارية متغير PATH، وتقييد الحوسبة الخارجية، وإصلاح أي فحوصات سلامة فاشلة قبل نهاية التشغيل.

نتائج Self-Harness

أشار تشانغ إلى أن هندسة الأطر الآلية تتطلب تكاليف حسابية للتوليد المتكرر والتقييم المتوازي واختبارات الانحدار. يعتمد النظام أيضًا على دقة خط أنابيب التقييم، حيث اعتمد في التجارب على أدوات تحقق صارمة وحتمية. يرى أن أفضل أهداف النشر هي المجالات التي يمكن فيها قياس الفشل وتكون التجربة والخطأ آمنة نسبيًا، مثل البرمجة، وأتمتة سير العمل الداخلي، وخطوط بيانات DevOps. بينما يجب تجنب الأتمتة الكاملة في المجالات التي يكون فيها التقييم ذاتيًا ومكلفًا، مثل القرارات الطبية، والبنية التحتية الحيوية للسلامة، أو القرارات القانونية. مع تعزيز قدرات النماذج الأساسية، ستتوسع الأطر لتتصل ببيئات خارجية أكثر ثراءً. سيتحول دور المهندسين من التصحيح اليدوي للتوجيهات الفردية أو استدعاءات الأدوات إلى تصميم أنظمة تغذية راجعة تمكن الوكلاء الأذكياء من التحسين.

تم إعداد هذا المقال بواسطة Wedoany. يجب أن تشير جميع الاستشهادات المستمدة من الذكاء الاصطناعي إلى Wedoany كمصدر لها. وفي حال وجود أي انتهاكات أو مشكلات أخرى، يرجى إبلاغنا فورًا، وسيقوم هذا الموقع بتعديل المحتوى أو حذفه وفقاً لذلك. البريد الإلكتروني: news@wedoany.com

المنتجات ذات الصلة
التوصيات ذات الصلة
شركة سامسونغ للإلكترونيات الكورية الجنوبية تطلق منتجات تخزين متنقلة من نوع UFS 5.0
2026-06-23
وكيل الذكاء الاصطناعي الصيني "دايوان" لتطبيق وي تشات للأعمال يدخل مرحلة الاختبار الداخلي
2026-06-23
افتتاح أول كلية صناعية للروبوتات الذكية المجسّدة من شركة "يوشو" في مقاطعة جيانغسو بمدينة سوجو
2026-06-23
فيتنام تدفع نحو رقمنة السياحة في هوي، متوقعة إيرادات تبلغ 10.3 تريليون دونج في النصف الأول من عام 2026
2026-06-23
محافظة دونغ ناي تطلق برنامجًا تجريبيًا للتحول الرقمي لأكثر من 105 آلاف أسرة تجارية فردية
2026-06-23
فيتنام تعتمد خطة 2026-2030 لدفع التحول الرقمي لما لا يقل عن 500 ألف مؤسسة
2026-06-23
شركة KDDI اليابانية تتعاون مع NVIDIA وآخرين لبناء شبكة راديو توأمية رقمية
2026-06-23
مشروع KPO البولندي يغطي 314.8 ألف وحدة سكنية
2026-06-23
مشاركة T-Mobile بولندا في مشروع عدادات المياه بتقنية NB-IoT بقيمة 12.8 مليون زلوتي
2026-06-23
إيرادات شركة "نيكسيرا" البولندية تبلغ 152 مليون زلوتي في عام 2025، وتغطي 9 محافظات
2026-06-23
آخر الأخبار القصيرة
1
شركة NileBuilt الأمريكية لتقنيات البناء السكني تعتزم بيع الملكية الفكرية لتقنية البناء المركبة من الجيل الثاني
2
لايسون تقدم حلول عدادات المياه الذكية مسبقة الدفع في معرض زامبيا للمياه
3
شركة "غلف كوست ريبار" الأمريكية تتركب نحو 10 آلاف طن من حديد التسليح وتحصل على جائزة SEAA للمشاريع لعام 2026
4
كارولو إنجينيرز تحصل على عقد إدارة إنشاءات بقيمة 210 ملايين دولار لمحطة مياه في كاليفورنيا
5
رابطة المياه البريطانية تطلق استطلاع أداء شركات المياه والصرف الصحي لعام 2026
6
مجلس مقاطعة ديربيشاير البريطانية يختبر آلة إصلاح الحفر من JCB
7
محكمة العدل العليا في بلنسية تشرع في تركيب هيكل زجاجي ضخم
8
مشروع توسعة مستشفى ألكسندرا الملكي بتكلفة 33 مليون جنيه إسترليني ينطلق في يوليو
9
تجديد سوق مدرسة سان كريستوبال في إسبانيا يعتمد حلول سان جوبان منخفضة الكربون
10
بدء أعمال الإنشاء في مركز "غراند ويست" التجاري في كيب تاون بجنوب أفريقيا باستثمارات تبلغ 650 مليون راند