المعهد الكوري لسلامة الذكاء الاصطناعي ينشر لأول مرة تفاصيل تقييم سلامة نماذج الذكاء الاصطناعيالأخبار القصيرة العالمية

المعهد الكوري لسلامة الذكاء الاصطناعي ينشر لأول مرة تفاصيل تقييم سلامة نماذج الذكاء الاصطناعي

2026-06-21 10:22

المفضلة

أخبار ar.wedoany.com، منذ تأسيس معهد سلامة الذكاء الاصطناعي الكوري (AISI) في نوفمبر 2024، سيتم الكشف تدريجياً عن نتائج تقييم سلامة نماذج الذكاء الاصطناعي التي لم تُنشر علناً من قبل. يهدف المعهد إلى نشر استنتاجات تقييم السلامة لنماذج الذكاء الاصطناعي الرئيسية المحلية والدولية (بما في ذلك النماذج مفتوحة المصدر) بطريقة أكثر تفصيلاً، مما يعزز نظام تقييم شفاف.

وفقاً لمصادر في القطاع يوم 19 الجاري، أصدر المعهد عبر موقعه الرسمي في 15 من الشهر الجاري "التقرير التفصيلي لنتائج الاختبارات المشتركة لمخاطر تسرب بيانات وكلاء الذكاء الاصطناعي" الذي تم إنجازه بالتعاون مع نظيره السنغافوري في النصف الأول من هذا العام. يكشف هذا التقرير بالتفصيل الحالات التي قد تؤدي فيها أخطاء الحكم لدى وكلاء الذكاء الاصطناعي أثناء تنفيذ التعليمات الروتينية إلى الاستعلام عن المعلومات الحساسة ونقلها وتسريبها بشكل خاطئ، مما يتسبب في أخطاء فادحة.

يُعد هذا التقرير المشترك بين كوريا وسنغافورة أول نشر من نوعه، حيث لا يتضمن قائمة التقييم فحسب، بل يوفر أيضاً أرقاماً تفصيلية ونتائج. تم التعامل مع أسماء النماذج العالمية الواردة في التقرير بشكل مجهول باستخدام رموز مثل A وB وC، لكن التقييم الكمي أكد وجود حالات متعددة من "عدم التطابق بين الإدراك والسلوك"، أي أنه حتى لو كانت قدرة الوكيل على تنفيذ المهام ممتازة، فإن قدرته على معالجة البيانات بشكل آمن لا يمكن ضمانها. بالإضافة إلى ذلك، أكد التقرير عوامل خطر فريدة لوكلاء الذكاء الاصطناعي، مثل الادعاء بإكمال المهمة دون تشغيل الأدوات الفعلية (أي ظاهرة الهلوسة "التقارير الكاذبة").

النتائج التجريبية الرئيسية في بيئة اختبار المعهد الكوري لسلامة الذكاء الاصطناعي (صورة: لقطة شاشة من التقرير المشترك بين المعهدين الكوري والسنغافوري)

في الواقع، هذه هي المرة الأولى التي يصدر فيها المعهد تقريراً يتضمن أرقاماً تفصيلية وتوصيات. في السابق، كان نطاق نشر نتائج تقييم سلامة نماذج الذكاء الاصطناعي من قبل المعهد محدوداً، مما جعل من الصعب ليس فقط تأكيد نتائج التقييم بأسماء النماذج الفعلية، بل أيضاً التحقق من المحتوى. التقرير الذي أصدره المعهد الشهر الماضي بعنوان "أداء تقييم سلامة 42 نموذجاً للذكاء الاصطناعي" غطى 42 نموذجاً رئيسياً محلياً ودولياً تم التحقق منها على مدى حوالي 16 شهراً من يناير 2025 إلى أبريل 2026، لكنه نشر فقط قائمة بأسماء النماذج وعناصر التقييم، دون بيانات محددة.

باستثناء أول حالة تقييم سلامة للذكاء الاصطناعي في كوريا التي أصدرها المعهد بالتعاون مع جمعية تكنولوجيا المعلومات والاتصالات الكورية (TTA) - وهي نموذج "Kanana" من شركة Kakao - لم يتم الكشف عن مستويات السلامة أو المؤشرات التفصيلية لمعظم النماذج. يعود سبب التساؤلات الخارجية حول أداء ودور المعهد إلى حد كبير إلى الحذر المفرط في نشر نتائج تقييم السلامة، وهي الوظيفة الجوهرية للمعهد. يرى المحللون في القطاع أن هذا يرجع بشكل أساسي إلى المخاوف من كشف الفجوة في المستوى بين نماذج عمالقة التكنولوجيا العالمية والنماذج المحلية ضمن مشروع "تطوير نموذج أساسي مستقل للذكاء الاصطناعي" الذي تقوده وزارة العلوم وتكنولوجيا المعلومات والاتصالات الكورية، مما قد يشكل عبئاً.

صرح مدير المعهد كيم ميونغ-جو قائلاً: "بالنسبة لتقييمات السلامة التي سنجريها في المستقبل، نخطط لنشر جميع المحتويات قدر الإمكان، ما لم تعترض الشركة المستهدفة." لكنه أضاف: "بناءً على طلبات الشركات وغيرها، قد يتم التعامل مع أسماء بعض النماذج بشكل مجهول."

المعهد، وهو منظمة تابعة لمعهد أبحاث الإلكترونيات والاتصالات الكوري (ETRI) التابع لوزارة العلوم وتكنولوجيا المعلومات والاتصالات، يمثل كوريا في التعاون المتخصص مع معاهد سلامة الذكاء الاصطناعي أو المؤسسات ذات الصلة في مختلف الدول. من المتوقع أن تشكل سلسلة الشراكات التي أقامها المعهد مؤخراً مع ثلاثة من كبار مطوري الذكاء الاصطناعي في العالم - Google DeepMind وOpenAI وAnthropic - قوة دافعة أساسية لبناء شبكة عالمية لسلامة الذكاء الاصطناعي.

فيما يتعلق بـ Google DeepMind، وبناءً على مذكرة التفاهم (MOU) التي وقعتها وزارة العلوم وتكنولوجيا المعلومات والاتصالات الكورية في أبريل، ستستمر المناقشات حول بناء إطار السلامة ومنهجيات الاختبار. وفيما يتعلق بـ OpenAI، وقع المعهد مذكرة تفاهم مباشرة في 17 الجاري، تقرر بموجبها تبادل المعرفة حول منهجيات تقييم السلامة والمعايير الأساسية في المجالات عالية المخاطر. على وجه الخصوص، سيطبق المعهد بياناته المعيارية باللغة الكورية التي طورها بنفسه لإجراء تقييم مشترك للهلوسة والسلامة من منظور كوري، والتعاون في وضع المعايير الدولية.

أما فيما يتعلق بـ Anthropic، فبالتزامن مع مذكرة التفاهم التي وقعتها وزارة العلوم وتكنولوجيا المعلومات والاتصالات في 18 الجاري، سيتم دفع عملية تقييم فريق أحمر لوكلاء الذكاء الاصطناعي المستقلين، وتقييم سلامة النماذج ومخاطر إساءة الاستخدام في سياق اللغة الكورية. بالإضافة إلى ذلك، سيتم تبادل المعلومات حول الثغرات الأمنية والتهديدات السيبرانية للذكاء الاصطناعي في القطاعات الرئيسية مثل القطاع المالي بسرعة، مما يتيح تعاوناً فعلياً في مجال الأمن السيبراني.

أكد المدير كيم ميونغ-جو قائلاً: "سنواصل توسيع قاعدة التعاون مع عمالقة التكنولوجيا العالمية مثل Google DeepMind وOpenAI وAnthropic، والتحقق علمياً من مخاطر أحدث النماذج المتطورة، والريادة في نظام تقييم كوري النموذجي المقبول دولياً."

تم إعداد هذا المقال بواسطة Wedoany. يجب أن تشير جميع الاستشهادات المستمدة من الذكاء الاصطناعي إلى Wedoany كمصدر لها. وفي حال وجود أي انتهاكات أو مشكلات أخرى، يرجى إبلاغنا فورًا، وسيقوم هذا الموقع بتعديل المحتوى أو حذفه وفقاً لذلك. البريد الإلكتروني: news@wedoany.com