جوجل الأمريكية تفتح مصدر نموذج نشر النص DiffusionGemma
2026-06-11 08:52
المفضلة

أخبار ar.wedoany.com، في 10 يونيو، أصدرت شركة جوجل الأمريكية نموذجها التجريبي مفتوح المصدر DiffusionGemma. يعتمد هذا النموذج على بنية نشر النص، وهو متاح بموجب ترخيص Apache 2.0، ويستهدف الباحثين والمطورين لاستكشاف سيناريوهات الاستدلال المحلي السريع، وتوليد النص التفاعلي، والتطبيقات منخفضة التزامن. تصل سرعة توليد النص على وحدات معالجة الرسوميات المخصصة إلى 4 أضعاف سرعة نماذج اللغة الكبيرة التقليدية ذاتية الانحدار.

يختلف المسار التقني لنموذج DiffusionGemma عن نماذج اللغة الكبيرة الشائعة. عادةً ما تولد النماذج ذاتية الانحدار الرموز واحدة تلو الأخرى من اليسار إلى اليمين، وكلما زاد طول النص، زاد وضوح مسار انتظار الخطوة التالية. بينما يحاول DiffusionGemma توليد إطار عمل للنص دفعة واحدة، ثم يقوم بتصحيح المحتوى من خلال تكرارات متعددة. صممته جوجل كنموذج خبير مختلط بإجمالي معلمات يبلغ 26 مليارًا، مع تنشيط حوالي 3.8 مليار معلمة أثناء الاستدلال، ويمكن تكييفه بعد التكميم ليعمل على وحدات معالجة رسوميات استهلاكية متطورة بذاكرة 18 جيجابايت. بالنسبة للمطورين المحليين، هذا يعني أن النموذج لا يقتصر على النشر السحابي واسع النطاق، بل يمكنه أيضًا أداء مهام التحرير السريع، وإكمال الكود، وإعادة ترتيب النص، والتوليد التجريبي على بطاقة رسوميات واحدة عالية الأداء.

تأتي ميزة السرعة لهذا النموذج بشكل أساسي من آلية التوليد المتوازي. يمكن لكل عملية حسابية أمامية في DiffusionGemma توليد 256 رمزًا بالتوازي، مما يسمح للرموز داخل كتلة المخرجات بالتفاعل مع بعضها البعض، والاستمرار في التصحيح في التكرارات اللاحقة. هذا الهيكل مناسب لمهام التحرير المضمن، وملء الفراغات في الكود، وهياكل النص غير الخطية، والأشكال الرياضية، وبعض المهام التي تتطلب قيودًا مشتركة من السياق السابق واللاحق. كشفت جوجل أنه على بطاقة NVIDIA H100 واحدة، يمكن لـ DiffusionGemma تحقيق إخراج يزيد عن 1000 رمز في الثانية؛ وعلى بطاقة NVIDIA GeForce RTX 5090، يمكنه تحقيق إخراج يزيد عن 700 رمز في الثانية.

لكنه ليس بديلاً عن Gemma 4.

تحدد جوجل بوضوح موقع DiffusionGemma: إنه نموذج تجريبي، يعطي الأولوية لسير العمل المحلي الحساس للسرعة والتفاعلي، وجودة المخرجات الإجمالية أقل من Gemma 4 القياسي. بالنسبة للتطبيقات التي تسعى إلى أعلى جودة توليد واستقرار وتسليم على مستوى الإنتاج، لا تزال جوجل توصي باستخدام Gemma 4 القياسي. مزايا DiffusionGemma لا تنطبق أيضًا على جميع بيئات النشر؛ ففي الخدمات السحابية عالية التزامن، يمكن للنماذج ذاتية الانحدار الاستفادة الكاملة من قوة الحوسبة من خلال المعالجة المجمعة، مما قد يقلل من فوائد فك التشفير المتوازي لنشر النص، بل وقد يزيد من تكاليف الخدمة. بعبارة أخرى، إنه أكثر ملاءمة للدفعات المنخفضة إلى المتوسطة، أو المستخدم الفردي المحلي، أو بيئات التطوير التجريبية، بدلاً من استبدال بنيات النماذج السحابية الرئيسية بشكل مباشر.

لا يزال لهذا الإصدار أهمية كبيرة للنظام البيئي لتكنولوجيا المعلومات والاتصالات وتطوير الذكاء الاصطناعي. في الماضي، كانت نماذج الانتشار معروفة للمستخدمين بشكل أكبر في توليد الصور والفيديو، بينما كان توليد النص يهيمن عليه منذ فترة طويلة البنى ذاتية الانحدار. يجمع DiffusionGemma بين مسار نشر النص والنظام البيئي لنماذج Gemma المفتوحة، مما يوفر للمطورين منصة تجريبية أخرى تعطي الأولوية للسرعة. مع تزايد الطلب على الذكاء الاصطناعي المحلي، ومحطات العمل الشخصية، وأجهزة الكمبيوتر الشخصية المزودة بالذكاء الاصطناعي، والأجهزة الطرفية، يحتاج المطورون بشكل متزايد إلى إكمال التوليد السريع والتعديل الفوري ومعالجة المهام الحساسة للخصوصية دون الاعتماد على السحابة البعيدة. كما أن الترخيص مفتوح المصدر يفيد المؤسسات البحثية، وشركات الأدوات، والمطورين لمواصلة التجارب حول بنية النموذج، ومحرك الاستدلال، وخطط التكميم، وطرق الضبط الدقيق.

ستركز تأثيرات سلسلة التوريد على الاستدلال المحلي للذكاء الاصطناعي، ووحدات معالجة الرسوميات الاستهلاكية، وأدوات المطورين، ومنصات خدمات النماذج. يدعم DiffusionGemma بالفعل الحصول على الأوزان عبر Hugging Face، ويمكن استخدامه مع أدوات مثل MLX وvLLM وHugging Face Transformers؛ كما تتعاون جوجل مع NVIDIA لتحسين الأداء عبر حزمة الأجهزة، لتغطي بطاقات الرسوميات الاستهلاكية RTX، وRTX PRO، ومنصات المؤسسات مثل Hopper وBlackwell. تشمل النقاط اللاحقة تأثير الضبط الدقيق للمطورين، وتقدم دعم النظام البيئي مثل llama.cpp، والتجربة الفعلية للنموذج في إكمال الكود والتحرير في الوقت الفعلي، وما إذا كانت بنية نشر النص قادرة على تضييق الفجوة في المخرجات مع النماذج ذاتية الانحدار عالية الجودة. إذا استمر هذا المسار في النضج، فقد تحصل تطبيقات الذكاء الاصطناعي المحلية على استجابة توليد أسرع، وستجلب أيضًا فرعًا تقنيًا جديدًا للنظام البيئي للنماذج المفتوحة.

تم إعداد هذا المقال بواسطة Wedoany. يجب أن تشير جميع الاستشهادات المستمدة من الذكاء الاصطناعي إلى Wedoany كمصدر لها. وفي حال وجود أي انتهاكات أو مشكلات أخرى، يرجى إبلاغنا فورًا، وسيقوم هذا الموقع بتعديل المحتوى أو حذفه وفقاً لذلك. البريد الإلكتروني: news@wedoany.com

المنتجات ذات الصلة