مايكروسوفت تطلق إطار عمل مفتوح المصدر ASSERT لتبسيط اختبار وتقييم سلوك الذكاء الاصطناعي
2026-06-03 09:48
المفضلة

أخبار ar.wedoany.com، أطلقت شركة مايكروسوفت يوم الثلاثاء إطار عمل مفتوح المصدر باسم ASSERT (Adaptive Spec-driven Scoring for Evaluation and Regression Testing)، والذي يهدف إلى تبسيط عملية اختبار وتقييم سلوك تطبيقات الذكاء الاصطناعي.

يستخدم هذا الإطار تقنيات الذكاء الاصطناعي لتحويل الأوصاف النصية عالية المستوى المتعلقة بالأهداف أو الاستراتيجيات أو السلوكيات المتوقعة إلى حالات اختبار قابلة للتنفيذ والتقييم. يستقبل ASSERT الأوصاف باللغة الطبيعية حول السلوكيات والاستراتيجيات المتوقعة لنموذج الذكاء الاصطناعي، ويحولها إلى مجموعة منظمة من السلوكيات المقبولة وغير المقبولة، ويولد سيناريوهات الأسئلة وحالات الاختبار، ويشغلها على النظام المستهدف، ثم يقوم بتقييم النتائج. كما يمكن للإطار تسجيل المسار الذي سلكه نظام الذكاء الاصطناعي، بما في ذلك الإجراءات الوسيطة واستدعاءات الأدوات، مما يسهل على المطورين تحديد موقع الأعطال.

يمكن للمطورين إضافة سياق النظام والأدوات والقيود بشكل إضافي لتخصيص نطاق التقييم. على سبيل المثال، يمكن للمطور تحديد أن وكيل الذكاء الاصطناعي المخصص لأبحاث المستندات لا ينبغي له إرسال رسائل بريد إلكتروني إلى أشخاص خارج الشركة، ويجب أن يقتصر المعلومات السرية على نطاق كبار المسؤولين التنفيذيين، مع تقديم ملخصات موجزة مع مراعاة السياق السابق. سيستخدم ASSERT هذه القواعد لتوليد حالات اختبار والتحقق باستمرار من امتثال النظام لهذه القواعد.

أوضحت مايكروسوفت أن ASSERT يسد الفجوة التي لا تغطيها التقييمات العامة الواسعة عندما يحتاج سلوك نموذج الذكاء الاصطناعي إلى التشكيل وفقًا لسياق التطبيق أو المنتج وسياساته وأدواته. وقالت سارة بيرد (Sarah Bird)، كبيرة مسؤولي المنتجات في مجال الذكاء الاصطناعي المسؤول في مايكروسوفت: "أحد الأشياء التي تعلمناها هو أن التقييم أمر بالغ الأهمية لاتخاذ القرارات الصحيحة، لأنه من دون فهم سلوك نظام الذكاء الاصطناعي، يصعب معرفة ما إذا كان يفي بمعايير المؤسسة... لقد اكتشفنا أنه إذا أردنا حقًا الحصول على نظام موثوق، فيجب علينا تقييم أبعاد أكثر تحديدًا بالتطبيق." وأضافت بيرد أنه يمكن استخدام ASSERT أثناء بناء النظام، وبعد النشر، وحتى في المراقبة المستمرة لإجراء التقييمات.

يأتي هذا الإطلاق في وقت تشهد فيه قدرات التقييم في صناعة الذكاء الاصطناعي تحسنًا تدريجيًا. مع تزايد قدرات النماذج، بدأ الباحثون في التركيز على الاختبارات القابلة للتكرار وفحوصات الانحدار، حيث أطلقت جهات مثل HELM من جامعة ستانفورد، وAILuminate من MLCommons، وفريق التقييم METR معايير مرجعية لقياس سلوك النماذج في ظل ظروف مختلفة.

تم إعداد هذا المقال بواسطة Wedoany. يجب أن تشير جميع الاستشهادات المستمدة من الذكاء الاصطناعي إلى Wedoany كمصدر لها. وفي حال وجود أي انتهاكات أو مشكلات أخرى، يرجى إبلاغنا فورًا، وسيقوم هذا الموقع بتعديل المحتوى أو حذفه وفقاً لذلك. البريد الإلكتروني: news@wedoany.com

المنتجات ذات الصلة
التوصيات ذات الصلة
جامعة كانبيرا الأسترالية توقع مذكرة تعاون ثلاثية مع أومرون في مجال الروبوتات والذكاء الاصطناعي
2026-06-03
جامعة سوينبرن للتكنولوجيا وشركة Geotab تطلقان مركزًا مشتركًا لابتكار النقل
2026-06-03
لأول مرة، معالج "لونغسون" يُستخدم في نظام التحكم الأساسي للصاروخ الصيني "تشانغ تشنغ-12 بي"
2026-06-03
شركة "تي دي تيك" الصينية تطرح حلولاً متكاملة للفضاء والأرض لتعزيز مرونة البنية التحتية الرقمية
2026-06-03
من المتوقع أن يدعم مقبس LGA1954 من إنتل أجيالاً متعددة من المعالجات، بدءًا من Nova Lake وRazor Lake وصولاً إلى البنى اللاحقة، مما يجعله منصة طويلة العمر نادرة لدى إنتل.
2026-06-03
شركة شينشون للإلكترونيات الدقيقة توقع عقدًا للاستقرار في حديقة أويي التكنولوجية بمنطقة نانشا في قوانغتشو
2026-06-03
في عام 2025، تصدرت شركة "يوشو تكنولوجي" قائمة الشحنات العالمية للروبوتات البشرية بـ 5500 وحدة
2026-06-03
شبكة AI WAN الصينية تشكل قاعدة حوسبة، وخسائر الأداء عبر المناطق لا تتجاوز 5%
2026-06-03
إدراج شركة "يوشو تكنولوجي" الصينية في بورصة العلوم والتكنولوجيا (Sci-Tech Innovation Board) يوم 1 يونيو
2026-06-03
CMLink تطلق باقات جديدة لعام 2026 في المملكة المتحدة
2026-06-03
آخر الأخبار القصيرة
1
جامعة كانبيرا الأسترالية توقع مذكرة تعاون ثلاثية مع أومرون في مجال الروبوتات والذكاء الاصطناعي
2
جامعة سوينبرن للتكنولوجيا وشركة Geotab تطلقان مركزًا مشتركًا لابتكار النقل
3
لأول مرة، معالج "لونغسون" يُستخدم في نظام التحكم الأساسي للصاروخ الصيني "تشانغ تشنغ-12 بي"
4
شركة "تي دي تيك" الصينية تطرح حلولاً متكاملة للفضاء والأرض لتعزيز مرونة البنية التحتية الرقمية
5
من المتوقع أن يدعم مقبس LGA1954 من إنتل أجيالاً متعددة من المعالجات، بدءًا من Nova Lake وRazor Lake وصولاً إلى البنى اللاحقة، مما يجعله منصة طويلة العمر نادرة لدى إنتل.
6
شركة شينشون للإلكترونيات الدقيقة توقع عقدًا للاستقرار في حديقة أويي التكنولوجية بمنطقة نانشا في قوانغتشو
7
في عام 2025، تصدرت شركة "يوشو تكنولوجي" قائمة الشحنات العالمية للروبوتات البشرية بـ 5500 وحدة
8
شبكة AI WAN الصينية تشكل قاعدة حوسبة، وخسائر الأداء عبر المناطق لا تتجاوز 5%
9
إدراج شركة "يوشو تكنولوجي" الصينية في بورصة العلوم والتكنولوجيا (Sci-Tech Innovation Board) يوم 1 يونيو
10
الدورة الرابعة والتسعون من معرض CMEF تنعقد في بكين في أكتوبر 2026 بمساحة 200 ألف متر مربع