حل مفتوح المصدر من NVIDIA يرفع إنتاجية الضبط الدقيق لنموذج MoE بنسبة تصل إلى 3.7 أضعاف
2026-06-26 13:55
المفضلة

أخبار ar.wedoany.com، أعلنت شركة NVIDIA عن إصدار حل مفتوح المصدر باسم NeMo AutoModel، يحقق زيادة في إنتاجية التدريب بنسبة تتراوح بين 3.4 و3.7 أضعاف أثناء الضبط الدقيق لنماذج الخبراء المختلطة (MoE)، مع تقليل استهلاك ذاكرة GPU بنسبة تتراوح بين 29% و32%.

يتوافق NeMo AutoModel مع واجهة برمجة التطبيقات (API) الخاصة بـ Hugging Face Transformers v5، حيث يمكن للمستخدمين تسريع الضبط الدقيق لنماذج MoE بمجرد إضافة سطر واحد من تعليمات الاستيراد (import). فعلى سبيل المثال، عند استخدام نموذج Qwen3-30B-A3B على عقدة واحدة مزودة بـ 8 وحدات GPU من نوع NVIDIA H100 بسعة 80 جيجابايت، يعمل هذا الحل على رفع الإنتاجية لكل GPU في الثانية (TPS/GPU) من 3075 إلى 11340، أي بزيادة قدرها 3.69 أضعاف.

أصبحت بنية MoE الخيار السائد للنماذج المتطورة، إلا أن المشكلات الهندسية المرتبطة بها، مثل التوازي بين الخبراء، ودمج الاتصالات، وتحسين النواة، تتطلب دعمًا من البنية التحتية المناسبة. يضيف حل NVIDIA ثلاث تقنيات رئيسية فوق Transformers v5، وهي: التوازي بين الخبراء (Expert Parallelism - EP)، وDeepEP، وTransformerEngine.

تقنية التوازي بين الخبراء تعمل على توزيع أوزان الخبراء عبر وحدات GPU متعددة، مما يقلل الضغط على ذاكرة كل وحدة GPU على حدة. ففي حالة استخدام 8 وحدات GPU مع ep_size=8، ينخفض استهلاك الذاكرة الخاص بـ MoE لكل GPU إلى ثمن قيمته الأصلية. بالنسبة لنموذج Qwen3، تعمل هذه التقنية على خفض الذاكرة القصوى من 68.2 جيجابايت إلى 48.1 جيجابايت، أي بنسبة 29%. أما بالنسبة لنموذج Nemotron Nanomo، فتنخفض الذاكرة من 62.1 جيجابايت إلى 42.5 جيجابايت، أي بنسبة 32%. يمكن استخدام الذاكرة المحررة لدعم تدريب دفعات أكبر وتسلسلات أطول.

تحقق تقنية DeepEP دمجًا بين العمليات الحسابية والاتصالات. ففي الوضع التقليدي، توجد تكلفة اتصال بين توزيع الرموز (tokens) وحسابات الخبراء. تعمل DeepEP، من خلال نواة GPU محسّنة، على دمج عمليات توزيع الرموز وتجميعها، مما يسمح بتداخل عملية الاتصال مع حسابات الخبراء.

توفر نواة TransformerEngine تسريعًا للعمليات مثل آلية الانتباه المدمجة، والطبقات الخطية، وRMSNorm، وتعمل في الوقت نفسه على طبقات MoE والطبقات العادية من نوع Transformer.

أظهرت التجارب على نموذجي Qwen3-30B-A3B وNemotron 3 Nano 30B-A3B أنه، مقارنة بـ Transformers v5، يحقق هذا الحل زيادة في إنتاجية التدريب بنسبة تتراوح بين 3.4 و3.7 أضعاف، مع تقليل استهلاك الذاكرة بنسبة تتراوح بين 29% و32%. كما نشرت NVIDIA نتائج الضبط الدقيق الكامل لنموذج Nemotron 3 Ultra 550B A55B على بيئة تضم 16 عقدة H100 بإجمالي 128 وحدة GPU، حيث بلغت قيمة TPS/GPU 815، وTFLOP/s/GPU حوالي 293، وبلغت الذاكرة القصوى 58.2 جيجابايت. وأشارت NVIDIA إلى أن Transformers v5 لا يمكن تشغيله على هذا النطاق بسبب نفاد الذاكرة.

تم إعداد هذا المقال بواسطة Wedoany. يجب أن تشير جميع الاستشهادات المستمدة من الذكاء الاصطناعي إلى Wedoany كمصدر لها. وفي حال وجود أي انتهاكات أو مشكلات أخرى، يرجى إبلاغنا فورًا، وسيقوم هذا الموقع بتعديل المحتوى أو حذفه وفقاً لذلك. البريد الإلكتروني: news@wedoany.com

المنتجات ذات الصلة
التوصيات ذات الصلة
إل جي إلكترونيكس الكورية تتعاون مع إنفيديا لتسريع نشر الذكاء الاصطناعي الفيزيائي
2026-06-26
حصة سامسونج من سوق DRAM العالمي تبلغ 38% في الربع الأول من 2026، وSK هاينكس مع HBM تستحوذان على 58%
2026-06-26
الصين تصدر معيارًا وطنيًا للترابط بين الوكلاء الأذكياء
2026-06-26
وزارة الاتصالات البرازيلية تنشر إشارات الجيل الرابع في أكثر من 110 مناطق ريفية في ولاية بارايبا
2026-06-26
قمة Web Summit Rio في البرازيل: الذكاء الاصطناعي يدخل مرحلة التنفيذ مع التركيز على الوكلاء الأذكياء والحوكمة
2026-06-26
شركة Positivo البرازيلية تطلق حاسوبًا محمولاً من فئة Copilot+ PC موجهًا للشركات
2026-06-26
مشغل الاتصالات الكوري الجنوبي SK Telecom يستثمر 480 مليون دولار في منصة البنية التحتية للذكاء الاصطناعي في أمريكا
2026-06-26
وزارة الاتصالات البرازيلية تطلق شبكة حكومية اتحادية خاصة بتكلفة مليار ريال برازيلي
2026-06-26
هيئة تنظيم الاتصالات الأمريكية (FCC) تشدد قواعد كابلات الاتصالات البحرية
2026-06-26
مبادرة من GSMA تدعو لتخصيص نطاق 6 جيجاهرتز للاتصالات المتنقلة
2026-06-26
آخر الأخبار القصيرة
1
شركة لاسو البرتغالية تسلم مكونات خمس توربينات رياح إلى ماديرا وبورتو سانتو
2
وكالة البيئة البريطانية تُكمل أول ترقية رئيسية لسد ميلفورد
3
شركة مصر للأسمنت تخطط لاستثمار 7-8 ملايين دولار في كل مصنع لإنشاء مشاريع الوقود البديل
4
شركة أنجليان ووتر البريطانية تُكمل مشروع التعقيم بالأشعة فوق البنفسجية والتعقيم النهائي في محطة معالجة المياه
5
شركة Centrica البريطانية تطلق تجربة رائدة للشبكات الصغيرة بالتيار المستمر
6
مشروع نقل الكهرباء "خافدا IV C" في الهند يدمج قدرة 7 جيجاواط في الشبكة الوطنية
7
شركة تابعة لـ MRCB الماليزية تتعاون مع Perintis Akal Sdn Bhd لتطوير مركز بيانات بقدرة 65 ميجاواط بتكلفة 2.1 مليار رينغيت
8
شركة Greenphard اليابانية تحصل على 120 مليون ين لتعزيز محطة الطاقة الافتراضية بالذكاء الاصطناعي
9
مصدر وريبسول تتعاونان في استثمار 849 مليون يورو في محفظة طاقة متجددة بإسبانيا بحلول نهاية 2026
10
GRK تحصل على عقد تطوير طريق وطني 15 في كوتكا بفنلندا بقيمة حوالي 11 مليون يورو