أخبار ar.wedoany.com، أطلقت شركة إنفيديا (NVIDIA) نموذج NVIDIA Cosmos 3، وهو نموذج أساسي مفتوح للعالم موجه للذكاء الاصطناعي الفيزيائي، مبني على بنية Transformer هجينة، تدمج الاستدلال البصري وتوليد العالم والتنبؤ بالحركة في نظام واحد.
يُعد Cosmos 3 أول نموذج متعدد القدرات مفتوح بالكامل على مستوى العالم، قادر على فهم وتوليد النصوص والصور والفيديو والأصوات المحيطة والحركات بشكل أصلي، ويتمتع بدقة فيزيائية رائدة، مما يقلص دورة تدريب وتقييم الذكاء الاصطناعي الفيزيائي من أشهر إلى أيام.
يحل هذا النموذج تحدياً أساسياً في الذكاء الاصطناعي الفيزيائي: تمكين الروبوتات أو المركبات ذاتية القيادة أو الوكلاء البصريين من التعميم في العالم الحقيقي في ظل بيانات تدريب محدودة ومكدسات محاكاة مجزأة. تجمع بنيته الهجينة من Transformer بين محول استدلالي ومحول توليدي خبير، مما يمكّن Cosmos 3 من فهم تفاعلات الأجسام والحركة والعلاقات المكانية والزمانية قبل توليد الفيديو ومسارات الحركة. يُدرّب النموذج على مجموعة بيانات متعددة الوسائط للذكاء الاصطناعي الفيزيائي تحتوي على مليارات العينات من النصوص والصور والفيديو والأصوات ومسارات الحركة، مما يوفر للمطورين أساساً قوياً للتدريب المسبق لبناء أنظمة ذكاء اصطناعي فيزيائي ببيانات أقل وتكاليف تدريب أدنى.
في اختبارات قياس الذكاء الاصطناعي الفيزيائي، حقق Cosmos 3 نتائج رائدة. فبين النماذج المفتوحة، احتل المرتبة الأولى في دقة توليد العالم في تقييمات Artificial Analysis وPhysics-IQ وPAI-Bench وR-Bench؛ والمرتبة الأولى في استراتيجيات الحركة في RoboLab وRoboArena؛ والمرتبة الأولى في الفهم البصري في لوائح VANTAGE-Bench وTAR.
تتوفر سلسلة Cosmos 3 بعدة إصدارات: Cosmos 3 Super مخصص لنماذج الروبوتات والمركبات ذاتية القيادة التي تحتاج إلى أعلى دقة فيزيائية وجودة توليد بعد التدريب؛ وCosmos 3 Nano مخصص للاستدلال عالي الجودة على الفيديو والحركة في أجزاء من الثانية؛ وسيُطلق Cosmos 3 Edge قريباً للاستدلال في الوقت الفعلي على الحافة.

أطلقت إنفيديا أيضاً تحالف NVIDIA Cosmos Coalition، وهو منظمة تعاون عالمية تضم بناة نماذج العالم ومطوري الذكاء الاصطناعي، ويضم الأعضاء المؤسسون شركات Agile Robots وBlack Forest Labs وGeneralist وLTX وRunway وSkild AI. يهدف التحالف إلى تطوير نماذج العالم المفتوحة عبر القطاعات، مما يمكن الأعضاء من المساهمة بالنماذج والأبحاث وتقنيات التقييم، مع استخدام تقنيات Cosmos 3 وأدوات التدريب والبنية التحتية لـ NVIDIA DGX Cloud للتدريب على نطاق واسع.
تدعم منصة Cosmos مكدس إنفيديا للذكاء الاصطناعي الفيزيائي، بما في ذلك مجموعات بيانات جديدة للروبوتات والفيزياء وحركة الإنسان والمركبات ذاتية القيادة وسلامة المستودعات والاستدلال المكاني، بالإضافة إلى مهارات الوكلاء الذكيين للذكاء الاصطناعي الفيزيائي لإعادة بناء المشاهد العصبية وتوليد الصور المعيبة وتعزيز الفيديو. يعمل مطورو الذكاء الاصطناعي الفيزيائي على بناء تطبيقاتهم بناءً على هذه المنصة، ويشمل ذلك في مجال الروبوتات شركات Agile Robots وDoosan Robotics وLG Electronics وSamsung Electronics وSkild AI، وفي مجال المركبات ذاتية القيادة شركة Li Auto، وفي مجال الوكلاء البصريين الذكيين شركات Centific وFogsphere وLinker Vision وMilestone Systems وYuan.
يتوفر الآن كل من Cosmos 3 Super وCosmos 3 Nano، وسيُطلق Cosmos 3 Edge قريباً. يمكن للمطورين تجربة Cosmos 3 على build.nvidia.com، وتنزيل النموذج المفتوح من Hugging Face، والاستفادة من Hugging Face Diffusers وموارد GitHub لتخصيص النموذج وتوليد البيانات الاصطناعية، مع إمكانية نشر النموذج كخدمة مصغرة NVIDIA NIM. يمكن لبناة النماذج ومزودي البرامج، من خلال مهارات الوكلاء الذكيين للذكاء الاصطناعي الفيزيائي على GitHub، الاستفادة من خدمات الاستدلال وشركاء البنية التحتية السحابية (بما في ذلك Baseten وCoreWeave وMicrosoft Azure وNebius وDeep Infra وClassmethod) لتسريع الوصول إلى Cosmos وتخصيصه ونشره لأعمال الاستدلال الحرجة وتوليد البيانات الاصطناعية.
تم إعداد هذا المقال بواسطة Wedoany. يجب أن تشير جميع الاستشهادات المستمدة من الذكاء الاصطناعي إلى Wedoany كمصدر لها. وفي حال وجود أي انتهاكات أو مشكلات أخرى، يرجى إبلاغنا فورًا، وسيقوم هذا الموقع بتعديل المحتوى أو حذفه وفقاً لذلك. البريد الإلكتروني: news@wedoany.com









