إنفيديا الأمريكية تسرّع نموذج DiffusionGemma بمعدل 4 أضعاف
2026-06-11 10:26
المفضلة

أخبار ar.wedoany.com، أصدرت Google DeepMind نموذجًا تجريبيًا مفتوحًا باسم DiffusionGemma، صُمم خصيصًا لتوليد النصوص فائقة السرعة. وقد قامت NVIDIA بتحسين هذا النموذج ليعمل بشكل أسرع على وحدات معالجة الرسوميات NVIDIA GeForce RTX ومنصة NVIDIA RTX PRO ونظام NVIDIA DGX Spark، ليشمل بيئات متعددة تتراوح من أجهزة الكمبيوتر المحلية إلى السحابة.

على عكس الطريقة التقليدية لتوليد النصوص كلمة بكلمة، يستطيع DiffusionGemma توليد عدة كلمات بشكل متوازٍ لإخراج كتل نصية كاملة. يُبنى هذا النموذج على Gemma 4، وهو نموذج خبراء مختلط يضم 26 مليار معلمة، حيث يُفعّل فقط 3.8 مليار معلمة في كل خطوة، ويدمج رأس الانتشار مع بنية Gemma 4 من Google. من حيث الأداء، تصل سرعة توليد النصوص في DiffusionGemma على الأجهزة المحلية إلى 4 أضعاف مقارنة بالنماذج الانحدارية الذاتية المكافئة. وبصفته نموذجًا مفتوحًا، يتيح DiffusionGemma أوزانه بموجب ترخيص Apache 2.0 المرن، ويمكن تشغيله محليًا بالكامل على RTX وDGX Spark دون الحاجة إلى الاعتماد على السحابة، مع دعم فوري في Hugging Face Transformers وvLLM وUnsloth. بالإضافة إلى ذلك، يمكن للمستخدمين اختبار DiffusionGemma مجانًا عبر واجهة التطبيق المستضافة من NVIDIA على build.nvidia.com.

تعتمد معظم نماذج اللغات الكبيرة (LLM) المستخدمة حاليًا على نطاق واسع على أسلوب التوليد الانحداري الذاتي، أي توليد رمز واحد في كل مرة، حيث يعتمد كل كلمة جديدة على الكلمة السابقة. أما DiffusionGemma، فيعتمد على بنية الخبراء المختلطة Gemma 4 26B، ويولّد النصوص بالطريقة التي تولّد بها نماذج الانتشار الصور: بدءًا من الضوضاء، ثم تنقية الكتلة النصية بأكملها دفعة واحدة. في كل خطوة، يقوم النموذج بإزالة الضوضاء من ما يصل إلى 256 رمزًا بشكل متوازٍ. بالنسبة لمهام المستخدم الواحد الحساسة لزمن الاستجابة، مثل الدردشة التفاعلية أو حلقات الوكلاء الذكيين أو المساعدين على الأجهزة، تتيح هذه الخاصية المتوازية سرعة استجابة تواكب متطلبات التطوير والتكرار.

عند توليد رمز واحد في كل مرة، غالبًا ما تكون نماذج LLM التقليدية محدودة بعرض النطاق الترددي للذاكرة، مما يؤدي إلى عدم استغلال جزء كبير من القدرة الحاسوبية. بينما يعالج DiffusionGemann كتلًا كاملة من الرموز بشكل متوازٍ عبر المحولات (Transformer)، مما يجعل عبء العمل كثيف الحساب مناسبًا تمامًا للاستفادة من مزايا وحدات معالجة الرسوميات من NVIDIA. تُظهر البيانات أن DiffusionGemma يحقق 1000 رمز/ثانية على وحدة معالجة رسوميات واحدة من NVIDIA H100 Tensor Core، و150 رمز/ثانية على NVIDIA DGX Spark، ويحقق أسرع استدلال محلي على NVIDIA DGX Station، وهو أسرع بنحو 4 مرات من النماذج الانحدارية الذاتية المكافئة التي تعمل في نفس سيناريو المستخدم الواحد.

يمتد هذا التفوق في الأداء عبر مجموعة منتجات NVIDIA بأكملها، بما في ذلك الكمبيوتر الفائق للذكاء الاصطناعي المكتبي الشخصي المحلي DGX Spark الذي يعمل بمعالج NVIDIA GB10 Grace Blackwell Superchip ومزود بذاكرة موحدة سعة 128 جيجابايت؛ ومحطة العمل RTX PRO 6000 التي توفر مساحة محلية كافية للمطورين؛ وDGX Station التي توفر سرعة استدلال سريعة تصل إلى 800 رمز/ثانية ومزودة بذاكرة متسقة سعة 748 جيجابايت؛ بالإضافة إلى وحدات معالجة الرسوميات GeForce RTX التي ستدعم قريبًا llama.cpp.

يعد استخدام Hugging Face Transformers أسرع طريقة لتشغيل DiffusionGemma على GeForce RTX 5090 أو DGX Spark. بالنسبة للاستدلال ذي الإنتاجية الأعلى، يوفر vLLM دعمًا فوريًا للخدمة. يمكن للمستخدمين ضبط النموذج بدقة لمهام أو مجالات محددة باستخدام إطاري Unsloth وNVIDIA NeMo. لمزيد من التفاصيل التقنية، يمكن الرجوع إلى مدونة NVIDIA التقنية والإعلان الرسمي من Google DeepMind.

تم إعداد هذا المقال بواسطة Wedoany. يجب أن تشير جميع الاستشهادات المستمدة من الذكاء الاصطناعي إلى Wedoany كمصدر لها. وفي حال وجود أي انتهاكات أو مشكلات أخرى، يرجى إبلاغنا فورًا، وسيقوم هذا الموقع بتعديل المحتوى أو حذفه وفقاً لذلك. البريد الإلكتروني: news@wedoany.com

المنتجات ذات الصلة
التوصيات ذات الصلة
منصة Mymeet.ai الروسية لكفاءة الاجتماعات عبر الإنترنت تفتح بروتوكول MCP لربط الاجتماعات بالوكلاء الذكاء الاصطناعي
2026-06-17
فريق Deckhouse الروسي يُصدر الإصدار 1.18 من Stronghold مع تعزيزات في أمن المفاتيح وقدرات التدقيق
2026-06-17
شركة transcosmos اليابانية تتعاون مع شركة Kyoei لإطلاق منصة SmartOrderLink
2026-06-17
الصين تخطط لاستثمار 2 تريليون يوان في بناء شبكة حوسبة ذكاء اصطناعي وطنية تستهدف إنجازها بحلول عام 2028
2026-06-17
شركة "لونغسي" الصينية تطلق شريحة WM8500 لتحقيق ضغط بنسبة 2:1 لأقراص SSD بسعة 128 جيجابايت
2026-06-17
شركة بول وفوكسكون تنتجان أنظمة الذكاء الاصطناعي في جمهورية التشيك وفرنسا باستخدام منصة NVIDIA Vera Rubin
2026-06-17
فريق صيني يطور نظام "OSCAR" الذكي لتحسين التجميع لتسريع الرقائق المحلية
2026-06-17
توكو وكوبري المكسيكيتان تطلقان حلًا فوريًا لتحصيل المدفوعات عبر نظام SPEI
2026-06-17
شركة DeepSeek الصينية تُكمل أول جولة تمويل خارجي بقيمة تتجاوز 50 مليار يوان، بقيمة سوقية تزيد عن 50 مليار دولار
2026-06-17
شركة ABB السويسرية تتعاون مع سامسونج الكورية لإطلاق حل متكامل لأنظمة المباني الذكية وإنترنت الأشياء المؤسسي
2026-06-17
آخر الأخبار القصيرة
1
شركة إميننت جولد تبدأ حفر 10 آلاف متر في نيفادا اعتبارًا من يوليو
2
فيكتوريا ليك غولد تعزز فريقها لدفع مشروع إمويلو للذهب في تنزانيا
3
شركة Orestone الكندية تنفق 112 ألف دولار كندي على مسح كهرومغناطيسي جوي للذهب والنحاس البورفيري
4
شركة جونو الكندية تطلق أكبر مشروع استكشافي في معسكر "حلقة النار" منذ أكثر من عقد
5
شركة مارتن إنجنيرينغ الأمريكية لمعدات التصنيع تطلق نظامًا ذكيًا للمدافع الهوائية
6
مجموعة دانغوتي تخطط لتوسيع إنتاج الأسمدة في نيجيريا وإثيوبيا بهدف تحقيق صادرات سنوية بقيمة 4 مليارات دولار
7
كوفسترو الألمانية تحصل على منحة بقيمة 7 ملايين يورو لبدء مشروع الإنتاج المستمر للأنيلين الحيوي
8
مصنع إيفونيك في تركيا يحصل على شهادة ISCC Plus ويطلق ULTRASIL eCO
9
شركة نيبون باينت تعلن عن خطة توسع في الهند ببناء ثمانية مصانع جديدة باستثمار 56 مليون يورو
10
مشروع بوتاس "إل سيبو" في الأرجنتين يحصل على تمويل بقيمة 4.07 ملايين دولار من مؤسسة تمويل التنمية الأمريكية (DFC)