أخبار ar.wedoany.com، أعلنت شركة KT في 16 من الشهر الجاري عن تطويرها بالتعاون مع جامعة كوريا لمعيار السلامة متعدد الوسائط للنماذج اللغوية الكبيرة تحت اسم "KSAFE-MM"، وذلك لتقييم سلامة نماذج الذكاء الاصطناعي في السياق الاجتماعي والثقافي الكوري.
يجمع هذا المعيار بين القضايا الاجتماعية الكورية والخلفية الثقافية، ويتكون من مجموعتين فرعيتين: "KSAFE-MM-G" التي تحول المخاطر العالمية المشتركة إلى سياق ثقافي كوري للتقييم، و"KSAFE-MM-C" المخصصة للقضايا الخاصة بالمجتمع الكوري، مثل الاحتيال في نظام الإيجار الشامل (Jeonse) ونزاعات صخور دوكدو. تحتوي مجموعة البيانات الإجمالية على 14,135 عينة تقييم، مما يجعلها أكبر مجموعة بيانات تقييم سلامة متعددة الوسائط باللغة الكورية في كوريا حتى الآن. وحتى الآن، تم التحقق من صحة هذا المعيار على 12 نموذجًا لغويًا كبيرًا متعدد الوسائط عالميًا، بما في ذلك Gemma وHyperCLOVA X.

يعتمد هذا المعيار على عملية آلية عامة. يحقق "KSAFE-MM" عملية آلية من أربع خطوات تغطي المراحل الكاملة، وتشمل جمع الموضوعات الحساسة القائمة على المجتمعات المحلية، وتوليد الاستعلامات القائمة على القوالب، وتوليد الصور الاصطناعية، وتوليد استعلامات الاختراق (Jailbreak) التي تهدف إلى تجاوز أجهزة السلامة أو القيود الأخلاقية للذكاء الاصطناعي. وأوضحت KT أن هذه العملية لا تتطلب خبراء في المجال الثقافي المحدد، ويمكنها بناء معايير سلامة تعكس الخصائص المحلية بسرعة، مما يقلل التكاليف ويزيد الكفاءة.
أثبت فريق البحث المشترك بين KT وجامعة كوريا، من خلال تطبيق نفس العملية في تجربة تجريبية باللغة اليابانية، أن هذا المعيار يمكن تطبيقه فورًا على أي دائرة ثقافية عالمية. يمكن استخدام نتائج البحث لأغراض التحقق من السلامة في بيئات خدمات الذكاء الاصطناعي الفعلية، واختبار الفريق الأحمر (Red Teaming)، وتقييم نماذج الحماية (Guardrails). سيتم نشر نتائج البحث والمعيار على منصتي arXiv وHugging Face.
صرح بارك جاي هيونغ، رئيس مختبر الذكاء الاصطناعي المتقدم (Frontier AI Lab) في معهد KT لتقنيات المستقبل (AX Future Technology Institute)، بأن نشر المعيار لا يقتصر على توزيع البيانات فحسب، بل يهدف إلى وضع الأساس للتطوير المشترك للنظام البيئي الكامل لأبحاث سلامة الذكاء الاصطناعي، متوقعًا أن يصبح KSAFE-MM معيارًا عامًا للتحقق من سلامة الذكاء الاصطناعي في سياق اللغة الكورية والثقافة الكورية في الأوساط الأكاديمية والصناعية.
تم إعداد هذا المقال بواسطة Wedoany. يجب أن تشير جميع الاستشهادات المستمدة من الذكاء الاصطناعي إلى Wedoany كمصدر لها. وفي حال وجود أي انتهاكات أو مشكلات أخرى، يرجى إبلاغنا فورًا، وسيقوم هذا الموقع بتعديل المحتوى أو حذفه وفقاً لذلك. البريد الإلكتروني: news@wedoany.com









