أخبار ar.wedoany.com، في الأول من يونيو، أطلقت شركة الذكاء الاصطناعي الصينية MiniMax نموذجها العام الجديد MiniMax M3. يعتمد هذا النموذج على بنية الانتباه المتفرق (MiniMax Sparse Attention) التي طورتها الشركة ذاتياً، وتدعم واجهة برمجة التطبيقات (API) نافذة سياق تصل إلى مليون رمز (1M tokens)، مع ضمان توفر 512 ألف رمز على الأقل، وهو موجه بشكل أساسي نحو الوكلاء طويلي المدى، ومهام البرمجة المعقدة، والتطبيقات متعددة الوسائط الأصلية.
يتركز التغيير الجوهري في MiniMax M3 على انتقال قدرة السياق الطويل من "مؤشرات معيارية" إلى "تحمل أعباء المهام الهندسية". بعد دخول تطبيقات النماذج الكبيرة مرحلة الوكيل، لم يعد النموذج بحاجة إلى معالجة أسئلة وأجوبة فردية أو توليد نصوص قصيرة فحسب، بل مهام طويلة المسار تتشابك فيها مستودعات الأكواد، ووثائق المنتجات، وسجلات المهام، وسجلات استدعاء الأدوات، والصور، وبيانات الفيديو. تعني نافذة السياق البالغة مليون رمز أن MiniMax M3 يمكنه الاحتفاظ بمزيد من المعلومات من المراحل العليا والدنيا في مسار مهمة واحدة، مما يقلل من فقدان المعلومات الناتج عن الاقتطاع المتكرر، والتلخيص المتكرر، والاسترجاع الخارجي. بالنسبة لسيناريوهات تطوير البرمجيات، وإعادة إنتاج الأبحاث العلمية، والإجابة على أسئلة قواعد المعرفة المؤسسية، وفهم الفيديو الطويل، وأتمتة المكاتب المعقدة، أصبح السياق الطويل قدرة أساسية حاسمة لاستقرار دخول النموذج في عمليات الإنتاج.
ما يدعم هذه القدرة هو بنية الانتباه المتفرق (MiniMax Sparse Attention) التي طورتها MiniMax ذاتياً. تواجه آلية الانتباه الكامل التقليدية مشكلة الزيادة السريعة في الحساب مع توسع طول السياق. تعمل بنية MSA على تحسين كفاءة الحساب في ظل السياق الطويل من خلال الانتباه المتفرق، مما يمكن MiniMax M3 من الحفاظ على أداء استدلال قابل للاستخدام ضمن نافذة سياق بملايين الرموز. تظهر المعلومات الرسمية أنه في ظل طول سياق يبلغ مليون رمز، تبلغ كمية الحساب لكل رمز في M3 حوالي 1/20 من الجيل السابق من النماذج، وتتجاوز سرعة مرحلة التعبئة المسبقة (pre-filling) 9 أضعاف، وتتجاوز سرعة مرحلة فك التشفير (decoding) 15 ضعفاً. بالنسبة للمطورين والمستخدمين المؤسسيين، تؤثر هذه التغييرات في الكفاءة بشكل مباشر على تكلفة واجهة برمجة التطبيقات (API)، وسرعة الاستجابة، وقدرة التنفيذ المستمر للمهام الطويلة، كما تحدد ما إذا كان MiniMax M3 يمكنه الانتقال من سيناريوهات العرض التوضيحي إلى استدعاءات الأعمال عالية التردد.
يؤكد MiniMax M3 أيضاً على قدرات البرمجة والوكيل. أصبحت مهام هندسة البرمجيات سيناريو رئيسياً للمنافسة في قدرات النماذج الكبيرة، لأن عملية التطوير الحقيقية تتضمن عادةً توضيح المتطلبات، وتعديل الأكواد، وردود فعل الاختبارات، واستدعاء الأدوات، وتكرار الإصدارات، والتعاون متعدد الجولات. كشفت MiniMax أن M3 حقق نتائج عالية في اختبارات مثل SWE-Bench Pro وTerminal-Bench 2.1 وKernelBench Hard وMCP Atlas، وقام بتدريب النموذج على التكيف مع سيناريوهات التعاون المستمر من خلال إطار محاكاة المستخدم. يوضح هذا التوجه أن MiniMax M3 لا يركز فقط على تحسين القدرة على "كتابة جزء من الكود"، بل يحاول تغطية سلسلة التطوير الكاملة بدءاً من تفكيك المهام، والتنفيذ، والتحقق، وصولاً إلى التصحيح المتكرر.
تعد تعددية الوسائط أيضاً إحدى القدرات الرئيسية لـ MiniMax M3. يقوم هذا النموذج بإدخال بيانات الوسائط المختلطة منذ المراحل المبكرة من التدريب، مما يمكن النصوص والصور وبيانات الفيديو من المعالجة بشكل تعاوني ضمن مهمة موحدة. في الحالات الرسمية، تم استخدام MiniMax M3 في مهام طويلة الأمد مثل تجارب إعادة إنتاج الأبحاث، وتحسين عوامل تشغيل CUDA، وأتمتة عمليات تدريب النماذج، مما يعكس القيمة المجمعة للسياق الطويل، وقدرات البرمجة، واستدعاء الأدوات، وفهم الوسائط المتعددة. بالنسبة لتطبيقات الذكاء الاصطناعي في المؤسسات، يعني هذا النوع من القدرات المجمعة أن النموذج يمكنه قراءة المستندات، وفهم الرسوم البيانية، وتحليل السجلات، وتوليد الأكواد، واستدعاء الأدوات في وقت واحد، مما يوسع حدود تطبيقات الوكيل من "القدرات النقطية" إلى "التنفيذ عبر الخطوات".
يعكس إطلاق MiniMax M3 أيضاً أن المنافسة في مجال النماذج الكبيرة في الصين تنتقل من مجرد معايير النموذج، والسعر، وتجربة الحوار العام، إلى قدرات أقرب إلى بيئات الإنتاج مثل السياق الطويل، وتنفيذ الوكيل، وهندسة البرمجيات، ودمج الوسائط المتعددة. مع قيام المؤسسات بدمج النماذج الكبيرة في عمليات البحث والتطوير، والتشغيل، وخدمة العملاء، والمكاتب، وإدارة المعرفة، تحتاج شركات النماذج إلى حل مشاكل الأداء، والتكلفة، وسعة السياق، والاستقرار، ونظام الأدوات في وقت واحد. يُظهر استثمار MiniMax M3 في سياق المليون رمز وبنية MSA أن وكلاء المهام الطويلة أصبحوا محوراً جديداً للمنافسة في التطبيق التجاري للنماذج الكبيرة.
تم إعداد هذا المقال بواسطة Wedoany. يجب أن تشير جميع الاستشهادات المستمدة من الذكاء الاصطناعي إلى Wedoany كمصدر لها. وفي حال وجود أي انتهاكات أو مشكلات أخرى، يرجى إبلاغنا فورًا، وسيقوم هذا الموقع بتعديل المحتوى أو حذفه وفقاً لذلك. البريد الإلكتروني: news@wedoany.com









