أخبار ar.wedoany.com، في 8 يونيو، احتل نموذج العالم الخماسي الأبعاد EvoPhys-World، الذي طوره فريق EvoPhys من جامعة بكين، المركز الأول في مسار "توليد العالم" ضمن التقييم المفتوح WorldScore الذي تجريه جامعة ستانفورد. يركز هذا النموذج على الإنسان، وهو موجه لمهام التوليد القابل للتحكم على مستوى المشهد والتفاعل الفيزيائي، وتم إكمال تدريبه الأصلي بالكامل باستخدام وحدات معالجة الرسوميات MTT S5000 من شركة Moore Threads ومجموعة البرمجيات MUSA.
يكمن التركيز التقني لنموذج EvoPhys-World في دفع نموذج العالم من "توليد مشاهد قابلة للمشاهدة" إلى "توليد أنظمة مشهدية قابلة للتفاعل والتحكم والتطور". وفقًا لما تم الكشف عنه في صفحة المشروع، يستخدم هذا النموذج بيانات التفاعل من منظور الشخص الأول وذاكرة المشهد لبناء توأم رقمي عالمي يركز على الإنسان، ويقدم آليات التفاعل القابل للتحكم والتطور الذاتي، مما يمكن حالة مشهدية واحدة من استنتاج مستقبلات مختلفة تحت فروع حركية مختلفة. يتضمن نموذجه الأساسي شكلين: محرك العالم وسياسة العالم. يركز الأول على إمكانية توأمة كل شيء والتفاعل الفيزيائي، بينما يركز الثاني على إمكانية التنبؤ بالعالم واختيار الإجراءات. ويشكلان معًا حلقة مغلقة من توليد المشهد، والتنبؤ بالحالة، والتنبؤ بالإجراءات، وصولاً إلى التطور القائم على التغذية الراجعة. بالنسبة للذكاء الجسدي، وتدريب الروبوتات، والمحاكاة الافتراضية، وتوليد المشاهد المعقدة، تكمن قيمة هذا النموذج في تمكين الذكاء الاصطناعي ليس فقط من فهم العلاقات المكانية داخل الصورة، بل أيضًا من فهم الروابط بين الإجراءات والسببية والتغذية الراجعة الفيزيائية ونتائج المهام.
WorldScore هو معيار تقييم موحد لمهام توليد العالم، ويغطي تقييمه قدرة نماذج 3D و4D والفيديو على توليد عوالم وفقًا للتعليمات، مع تركيز المؤشرات الرئيسية على قابلية التحكم والجودة والأداء الديناميكي. يُظهر التصنيف العام أن EvoPhys-World يحتل مراتب متقدمة في مؤشرات مثل WorldScore-Static.
يضع هذا التقدم أيضًا قدرة وحدات معالجة الرسوميات الصينية ومجموعات البرمجيات على التكيف في تدريب النماذج المتطورة في موقع أكثر وضوحًا. يفرض تدريب نماذج العالم متطلبات عالية على إنتاجية البيانات المتسلسلة طويلة الأمد، واستقرار التدريب الموزع، والنمذجة الزمانية المكانية متعددة الوسائط، ودعم المشغلين، وكفاءة التعاون بين البرمجيات والأجهزة. تم إكمال التدريب الأصلي لنموذج EvoPhys-World بالكامل باستخدام وحدات معالجة الرسوميات MTT S5000 من Moore Threads ومجموعة البرمجيات MUSA، مما يعني أن فريق تطوير النموذج لم يستخدم القدرة الحاسوبية المحلية فقط في مرحلة الاستدلال أو التكيف اللاحق، بل أكمل التحقق من صحة الأجهزة ومجموعة البرمجيات وسير عمل النموذج في المسار الرئيسي للتدريب. بالنسبة لصناعة البنية التحتية للذكاء الاصطناعي في الصين، فإن مثل هذه الحالات أكثر تعقيدًا من مجرد تشغيل تدريب نماذج اللغة، لأن نماذج العالم تتضمن أنواعًا متعددة من الأحمال مثل توليد الفيديو والتفاعل الفيزيائي والتنبؤ بالحالة واستراتيجيات الإجراءات، مما يتطلب متطلبات أعلى على مجموعات وحدات معالجة الرسوميات وكفاءة الاتصال وتوافق أطر التدريب.
توجهات تطبيق EvoPhys-World أقرب أيضًا إلى العالم المادي. تُظهر المشاهد المعروضة في صفحة المشروع بيئات متعددة مثل العمليات اليدوية، والتفاعل على الطاولة، وتحريك الأكواب، والتخزين، والمصانع الكيميائية، والمدن، والبلدات القديمة، مما يشير إلى أن هذا النموذج يحاول تغطية مهام التوليد متعددة المستويات بدءًا من الحركات اليدوية المحلية وصولاً إلى التجوال في المشاهد الكبيرة، ومن ملامسة الأشياء إلى استنتاج المهام. إذا استمر هذا المسار في التقدم، فمن المتوقع أن يصبح نموذج العالم قاعدة مهمة لتدريب الذكاء الجسدي، مما يوفر للروبوتات بيئة تدريب افتراضية منخفضة التكلفة وعالية التحكم وقابلة للتطور المتكرر قبل النشر الفعلي، ويمكن استخدامه أيضًا في المحاكاة الصناعية، والتوأمة الرقمية، والتدريب المسبق على العمليات المعقدة، والتحقق من التعاون بين الإنسان والروبوت، وغيرها من السيناريوهات.
في المرحلة القادمة، سيعتمد تأثير EvoPhys-World على درجة انفتاح قدرات النموذج، وبناء النظام البيئي للمطورين، ونتائج التحقق من صحة المهام الحقيقية الإضافية، والاستقرار المستمر لمجموعة برمجيات وحدات معالجة الرسوميات الصينية في التدريب على نطاق أوسع. يُظهر هذا التصدر لتصنيف WorldScore، على الأقل، أن فريقًا جامعيًا صينيًا قد دخل بالفعل في طليعة التقييمات المفتوحة الدولية في اتجاه نماذج العالم، كما يوفر عينة قابلة للمراقبة لدعم القدرة الحاسوبية المحلية للذكاء الاصطناعي لتدريب النماذج المتطورة متعددة الوسائط.
تم إعداد هذا المقال بواسطة Wedoany. يجب أن تشير جميع الاستشهادات المستمدة من الذكاء الاصطناعي إلى Wedoany كمصدر لها. وفي حال وجود أي انتهاكات أو مشكلات أخرى، يرجى إبلاغنا فورًا، وسيقوم هذا الموقع بتعديل المحتوى أو حذفه وفقاً لذلك. البريد الإلكتروني: news@wedoany.com









