ماسك الأمريكي يعلن بدء الاختبارات الداخلية لنموذج "Grok 4.5" في سبيس إكس وتيسلاالأخبار القصيرة العالمية

ماسك الأمريكي يعلن بدء الاختبارات الداخلية لنموذج "Grok 4.5" في سبيس إكس وتيسلا

2026-06-29 08:56

المفضلة

أخبار ar.wedoany.com، دخل نموذج اللغة الكبير من الجيل الجديد "Grok 4.5"، الذي طورته شركة الذكاء الاصطناعي الأمريكية xAI، مرحلة الاختبارات الداخلية في شركتي سبيس إكس وتيسلا. في 28 يونيو، كشف إيلون ماسك أن "Grok 4.5" مبني على النموذج الأساسي V9 الذي يضم 1.5 تريليون معامل، وتم تضمين بيانات ذات صلة بأداة "Cursor" في التدريب التكميلي. وأظهرت التقييمات الأولية أن أداء النموذج يقترب من أداء النموذج الرائد "Claude Opus" من شركة Anthropic، بل وقد يتجاوزه. لا يزال "Grok 4.5" قيد التحسين المستمر من خلال التعلم المعزز، كما أن معيار الاختبار المصاحب "Grok Build" قيد التطوير أيضًا.

تكمن خصوصية هذه الاختبارات الداخلية في أن بيئة الاختبار تقع مباشرة داخل شركتي سبيس إكس وتيسلا، وكلتاهما مؤسستان هندسيتان عاليتا التعقيد. تشمل سبيس إكس مجالات الصواريخ والأقمار الصناعية وشبكة ستارلينك والهندسة التصنيعية وإدارة المهام الفضائية. بينما تشمل تيسلا تطوير السيارات والإنتاج في المصانع والقيادة الذاتية وأنظمة الطاقة وأعمال الروبوتات. إن وضع النموذج الجديد أولاً في هذه البيئات الهندسية الحقيقية يعني أن xAI لا تختبر فقط أداء النموذج في الأسئلة والأجوبة العامة وتوليد الكود وتقييمات الاستدلال، بل تراقب أيضًا قدرته على معالجة الوثائق الهندسية ومهام البحث والتطوير والعمليات الآلية والتعاون التجاري المعقد.

اعتماد "Grok 4.5" على النموذج الأساسي V9 بـ 1.5 تريليون معامل يشير إلى أن xAI تواصل التقدم على مسار النماذج الأساسية واسعة النطاق. حجم المعاملات بحد ذاته لا يعادل القدرة النهائية، لكن النماذج الأساسية واسعة النطاق توفر سعة أعلى للاستدلال والبرمجة وتكامل المعرفة والتعميم متعدد المهام. تشمل العوامل التي تؤثر حقًا على أداء المنتج أيضًا جودة بيانات التدريب واستراتيجيات ما بعد التدريب وطرق التعلم المعزز والقدرة على استخدام الأدوات والقدرة على معالجة السياق وكفاءة نظام الاستدلال عبر الإنترنت. تأكيد ماسك على أن التعلم المعزز لا يزال يحسن النموذج بشكل ملحوظ يشير إلى أن "Grok 4.5" لم يدخل بعد مرحلة الإصدار النهائي.

إدراج بيانات "Cursor" في التدريب التكميلي هو الجزء الأكثر دلالة صناعية في هذا الخبر. "Cursor" هي إحدى أدوات البرمجة بالذكاء الاصطناعي الأكثر استخدامًا بين المطورين حاليًا. قد تساعد البيانات ذات الصلة النموذج على فهم أفضل لعمليات التطوير الحقيقية وسياق الكود ومسارات التصحيح وطرق التعاون الهندسي. انتقلت المنافسة في مجال النماذج الكبيرة من مرحلة "القدرة على كتابة الكود" إلى مرحلة "القدرة على المشاركة في هندسة البرمجيات". تحتاج نماذج البرمجة المتميزة إلى فهم بنية المشروع وتبعيات الوظائف وملاحظات الاختبار وسجلات الأخطاء ونوايا التعديل متعددة الجولات. إذا خضع "Grok 4.5" لتدريب تكميلي على هذا النوع من البيانات، فقد يعزز ذلك قدرته على توليد الكود ومعالجة المهام الهندسية.

المقارنة مع "Claude Opus" تشير أيضًا إلى أن xAI تضع "Grok 4.5" في مصاف المنافسة على النماذج المتطورة. يُنظر إلى "Claude Opus" منذ فترة طويلة كأحد النماذج القوية في الاستدلال النصي المتقدم وتحليل الكود ومعالجة المهام المعقدة. استخدام ماسك لعبارة "يقترب، بل وقد يتجاوز" لا يزال ضمن نطاق التقييم الداخلي المبكر، ولا يعني أن المعايير العامة المستقلة قد أكدت تفوقه. بالنسبة للمطورين الخارجيين والعملاء من الشركات، فإن القدرة التنافسية الحقيقية لـ "Grok 4.5" تحتاج إلى انتظار نتائج أكثر اكتمالاً من التقييمات العامة وأداء واجهة برمجة التطبيقات (API) والمهام ذات السياق الطويل ومهام البرمجة ومهام العامل الذكي متعدد الجولات.

تطوير معيار الاختبار "Grok Build" يستحق الاهتمام أيضًا. لم تعد النماذج الكبيرة المتطورة تُقيّم فقط من خلال أسئلة الاختبار التقليدية والأسئلة والأجوبة أحادية الجولة. بدأت المزيد من شركات النماذج في بناء معايير داخلية موجهة نحو المهام الحقيقية. إذا كان "Grok Build" موجهًا نحو سيناريوهات بناء البرمجيات أو توليد المنتجات أو التنفيذ الهندسي أو تطوير العوامل الذكية، فقد يصبح أداة مهمة لـ xAI لقياس القدرة العملية للنموذج. إن قدرة النموذج على تفكيك الخطوات بشكل ثابت في المهام المعقدة، واستخدام الأدوات، وكتابة الكود، واكتشاف الأخطاء، والتحسين المستمر، ستحدد ما إذا كان يمكنه الدخول في عمليات الإنتاج المؤسسي.

كشف ماسك أيضًا أن سبيس إكس ستطلق كل شهر من هذا العام نموذجًا جديدًا تم تدريبه بالكامل من الصفر. إذا تحقق هذا الإيقاع، فهذا يعني أن xAI والنظام الهندسي التابع لماسك يحاولان تحقيق وتيرة أعلى من التكرار للنماذج الأساسية. على عكس إجراء تدريب لاحق فقط أو تحديثات إصدار صغيرة، يتطلب تدريب نموذج جديد من الصفر قدرًا هائلاً من القوة الحاسوبية والبيانات وهندسة التدريب ودعم أنظمة التقييم. إطلاق نموذج جديد شهريًا يمثل تحديًا كبيرًا، وسيختبر أيضًا القدرات الهندسية لـ xAI في مجالات مجموعات التدريب وخطوط أنابيب البيانات وهندسة النماذج وعمليات الإصدار.

قد تؤثر الاختبارات الداخلية لـ "Grok 4.5" في سبيس إكس وتيسلا أيضًا على طرق تطبيق الذكاء الاصطناعي داخل منظومة ماسك. يمكن لتيسلا اختبار قدرات النموذج في التصميم الهندسي وتحسين التصنيع وخدمات ما بعد البيع وتطوير البرمجيات الداخلية وأبحاث الروبوتات. يمكن لسبيس إكس استخدام النموذج في وثائق المهام والشبكات الفضائية والمحاكاة الهندسية وتنسيق العمليات المعقدة. إذا كانت نتائج الاختبارات الداخلية مستقرة، فقد يتم دمج "Grok 4.5" بشكل أعمق في أنظمة البحث والتطوير والتشغيل للشركات التابعة لماسك، بدلاً من أن يكون مجرد روبوت محادثة موجه للمستخدمين العاديين.

يعكس هذا أيضًا تحول المنافسة في نماذج الذكاء الاصطناعي المتطورة نحو "قدرات النموذج + السيناريوهات الحقيقية + الحلقة الهندسية المغلقة". تتنافس OpenAI وAnthropic وGoogle وMeta وxAI جميعًا على نموذج أقوى، لكن من يستطيع دمج النموذج في مؤسسات حقيقية وتحقيق زيادة في الإنتاجية، سيكون أكثر قدرة على الحصول على قيمة تجارية طويلة الأجل. اختيار "Grok 4.5" للاختبار الداخلي أولاً في سبيس إكس وتيسلا هو في جوهره وضع النموذج تحت اختبار الضغط في مؤسسات هندسية معقدة، للتحقق من قدرته على دخول سيناريوهات الإنتاج عالية القيمة.

تتركز نقاط المتابعة في ثلاثة جوانب: أولاً، متى سيتم فتح "Grok 4.5" للمستخدمين الخارجيين أو المطورين؟ ثانيًا، هل يمكن لتقييماته العامة أن تدعم الادعاءات المبكرة بـ "الاقتراب من Opus أو تجاوزه"؟ ثالثًا، هل يمكن تحويل نتائج الاختبارات الداخلية في سبيس إكس وتيسلا إلى قدرات ذكاء اصطناعي مؤسسية قابلة لإعادة الاستخدام؟ مع استمرار تقدم التعلم المعزز ومعيار "Grok Build"، سيكون ما إذا كان "Grok 4.5" يمكن أن يتحول من نموذج اختبار داخلي إلى منافس رئيسي في سوق الذكاء الاصطناعي المتطور هو أهم نقطة مراقبة للمرحلة التالية من xAI.

تم إعداد هذا المقال بواسطة Wedoany. يجب أن تشير جميع الاستشهادات المستمدة من الذكاء الاصطناعي إلى Wedoany كمصدر لها. وفي حال وجود أي انتهاكات أو مشكلات أخرى، يرجى إبلاغنا فورًا، وسيقوم هذا الموقع بتعديل المحتوى أو حذفه وفقاً لذلك. البريد الإلكتروني: news@wedoany.com