أخبار ar.wedoany.com، طوّر باحثو شركة "علي بابا" إطارًا يُسمى "SkillWeaver" لحل مشكلة توجيه الأدوات في المهام متعددة الخطوات للوكلاء الذكيين (AI agents)، حيث يعمل هذا الإطار على تقليل استهلاك الرموز المميزة (tokens) بنسبة تتجاوز 99% من خلال طريقة توجيه المهارات المركّبة.
عند توسع أنظمة الذكاء الاصطناعي في المؤسسات، يحتاج الوكلاء الذكيون إلى التعامل مع عدد كبير من الأدوات والمهارات، وتواجه طرق اختيار المهارات الفردية الحالية صعوبة في التعامل مع الطلبات التجارية التي تتطلب تنفيذًا متعدد الخطوات، مثل "تنزيل مجموعة بيانات، تحويل البيانات، وإنشاء تقرير مرئي". عرّف فريق البحث هذه المشكلة باسم "توجيه المهارات المركّبة" (Compositional Skill Routing)، والتي تتطلب من الوكيل الذكي تحديد كيفية تقسيم المهمة، وكيفية تعيين المهام الفرعية للمهارات، وكيفية دمجها في خطة قابلة للتنفيذ في الوقت نفسه.
يحقق "SkillWeaver" هذه العملية من خلال ثلاث مراحل: التحليل، والاسترجاع، والتركيب. في مرحلة التحليل، يقوم نموذج اللغة الكبير (LLM) بتقسيم استعلام المستخدم إلى سلسلة من المهام الفرعية؛ وفي مرحلة الاسترجاع، يستخدم نموذج التضمين (embedding model) لاستخراج قائمة مختصرة من الأدوات المرشحة لكل مهمة فرعية من مكتبة المهارات؛ وفي مرحلة التركيب، يتم تقييم توافق الأدوات المرشحة وإنشاء خطة تنفيذ على شكل رسم بياني موجه غير دوري (DAG). كما أدخل فريق البحث تقنية "التحليل التكراري الواعي بالمهارات" (Iterative Skill-Aware Decomposition - SAD)، والتي تسمح لنموذج اللغة الكبير بإعادة كتابة التحليل بناءً على معلومات المهارات المسترجعة الأولية من خلال حلقة تغذية راجعة، مما يجعل مستوى التفصيل متوافقًا مع مكتبة الأدوات.

لتقييم الأداء، أنشأ الباحثون معيارًا مرجعيًا يُسمى "CompSkillBench" يحتوي على 300 استعلام متعدد الخطوات، باستخدام مكتبة مهارات تضم 2,209 مهارة من النظام البيئي العام لـ MCP، تغطي 24 فئة وظيفية تشمل البنية التحتية السحابية، والمالية، وقواعد البيانات، وغيرها. استخدم المحرك الأساسي نموذج Qwen2.5-7B-Instruct لتحليل المهام، ومسترد البحث الدلالي MiniLM للعثور على الأدوات. أظهرت التجارب أنه في الإعداد العادي بدون تقنية SAD، بلغت دقة تحليل النموذج 7B 51.0%، وقفزت إلى 67.7% بعد تفعيل حلقة التغذية الراجعة لـ SAD، بينما وصل النموذج الأكبر Qwen-Max إلى 92%. في المهام الصعبة التي تتطلب أربع إلى خمس مهارات، رفعت تقنية SAD الدقة بنسبة 50%. مقارنة بطريقة LLM-Direct التي تعرض جميع الأدوات للنموذج، أدى إعادة التوجيه عبر الاسترجاع في "SkillWeaver" إلى تحسين الدقة بشكل كبير، وخفض استهلاك نافذة السياق لكل استعلام من حوالي 884,000 رمز مميز إلى حوالي 1,160 رمزًا مميزًا، أي بانخفاض نسبته 99.9%.

أشار فريق البحث إلى أن هذا الإطار مبني على مكونات مفتوحة المصدر جاهزة، بما في ذلك نموذج التضمين all-MiniLM-L6-v2 وفهرس FAISS، حيث يستغرق تضمين وفهرسة 2,209 مهارة 15 ثانية فقط. يمكن للمطورين تنفيذه بأنفسهم باستخدام مكتبات التنسيق مثل LangChain و LlamaIndex. حاليًا، تفتقر مرحلة التنفيذ في "SkillWeaver" إلى القدرة على استرداد الأخطاء، مما يؤدي إلى انقطاع السلسلة عند فشل استدعاء API في الخطوة الثانية، ويوصي الفريق بضرورة بناء آليات للتراجع وإعادة المحاولة في عمليات النشر الإنتاجية.










