أخبار ar.wedoany.com، في 30 يونيو، أعلنت شركة ميتوان رسمياً عن إطلاق الجيل الجديد من نموذجها الضخم LongCat-2.0 الذي يضم تريليونات المعايير، وكشفت عن فتح مصدره للجمهور. يبلغ إجمالي حجم معايير هذا النموذج 1.6 تريليون معيار، بمتوسط معايير نشطة يبلغ حوالي 48 مليار معيار، ونطاق تنشيط ديناميكي يتراوح بين 33 مليار و56 مليار معيار، مع دعم أصلي لسياق فائق الطول يصل إلى 1 مليون رمز. تم تدريب واستنتاج نموذج LongCat-2.0 بالكامل على مجموعة من 50 ألف بطاقة حوسبة محلية، وبلغ حجم بيانات التدريب المسبق أكثر من 30 تريليون رمز، تغطي بيانات متعددة تشمل الصينية والإنجليزية واللغات المتعددة والرموز البرمجية، مما يوفر قدرات نموذجية أساسية موجهة لفهم النصوص الطويلة ومعالجة الرموز والمهام متعددة اللغات والتطبيقات الذكية المعقدة.
يمثل إطلاق LongCat-2.0 امتداداً لقدرات ميتوان في النماذج الضخمة من التطبيقات التجارية إلى فتح مصدر النماذج الأساسية. وتعد مجموعة الحوسبة المحلية المكونة من 50 ألف بطاقة، وإجمالي المعايير البالغ 1.6 تريليون، ونافذة السياق البالغة 1 مليون رمز، من أبرز المعلومات التقنية في هذا الإصدار.
من حيث هيكل النموذج، يعتمد LongCat-2.0 تكويناً يجمع بين إجمالي معايير بمستوى تريليونات ومعايير نشطة بمستوى عشرات المليارات، بمتوسط معايير نشطة يبلغ حوالي 48 مليار معيار، ونطاق تنشيط ديناميكي يتراوح بين 33 مليار و56 مليار معيار. يمكن للمهام المعقدة استدعاء عدد أكبر من المعايير، بينما يمكن للمهام الخفيفة تقليل استهلاك الحوسبة، ويساعد هذا التصميم في التحكم في تكاليف الاستنتاج وتحسين كفاءة استخدام الموارد في سيناريوهات المهام المختلفة. أما قدرة السياق فائق الطول البالغة 1 مليون رمز، فتمكن النموذج من معالجة كميات أكبر من المستندات ومكتبات الرموز ومواد العقود وملفات المشاريع وسجلات المهام المتعددة الجولات دفعة واحدة، مما يقلل من فقدان المعلومات الناتج عن تجزئة المحتوى الطويل.
تعد الحوسبة المحلية معلماً رئيسياً آخر في هذا الإصدار. تم تدريب واستنتاج LongCat-2.0 على مجموعة من 50 ألف بطاقة حوسبة محلية، مما يشير إلى أن البنية التحتية للذكاء الاصطناعي المحلية قد دخلت في مسار تدريب النماذج فائقة الضخامة.
بعد فتح المصدر، سيكون LongCat-2.0 متاحاً للمطورين والشركات والمؤسسات البحثية للاستخدام. تواجه قطاعات مثل التصنيع والتجزئة والخدمات اللوجستية وسلاسل التوريد والخدمات الهندسية كميات كبيرة من المواد النصية الطويلة، بما في ذلك أدلة المعدات والمواصفات الفنية وعقود الشراء وملفات المشاريع وسجلات خدمة العملاء ومستودعات الرموز وقواعد المعرفة المؤسسية. يمكن استخدام نموذج السياق البالغ 1 مليون رمز في الإجابة على أسئلة قواعد المعرفة وتحليل المستندات الطويلة والمساعدة البرمجية وأتمتة العمليات التجارية وتنسيق مهام العوامل الذكية، مما يخفض حاجز بناء النماذج القطاعية والتطبيقات الخاصة للشركات.
يشير إطلاق ميتوان لـ LongCat-2.0 إلى إشارة على استمرار استثمارها في قدرات النماذج الضخمة الأساسية. ستعتمد نتائج التطبيق اللاحقة على أوزان النموذج والتقارير التقنية وشروط الترخيص وتكاليف الاستنتاج ونطاق فتح الأدوات المساعدة.









