اختبار عملي للنماذج متعددة الوسائط المحلية: Step 3.7 Flash يتفوق في السرعة والتكلفة
2026-07-02 14:26
المفضلة

أخبار ar.wedoany.com، في ظل انتقال النماذج متعددة الوسائط من مرحلة العروض التوضيحية إلى النشر الإنتاجي، خضعت ثلاثة نماذج، وهي Step 3.7 Flash وQwen3.6-flash وMiniMax M3، لاختبارات عملية في سيناريوهات التطوير والأعمال. أظهر تقييم مقارن لمهمتين، هما التعرف على المخططات الانسيابية واستخراج بيانات الفواتير، أن جودة الفهم البصري والإخراج المنظم للنماذج الثلاثة كانت مستقرة نسبيًا، مع وجود اختلافات في سرعة الاستجابة واستهلاك الرموز (Tokens).

ركز التقييم على ثلاثة أبعاد: الجودة والسرعة والتكلفة، وتم اختيار نوعين من السيناريوهات الصناعية: الأول هو إعادة بناء منطق الأعمال بناءً على المخطط الانسيابي للنظام أثناء تطوير الوكلاء (Agent)، والثاني هو الاستخراج المنظم لمعلومات الفاتورة الإلكترونية عبر استدعاء واجهة برمجة التطبيقات (API) في نظام الأعمال. أظهرت الاختبارات أن النماذج الثلاثة لم تسجل أي أخطاء جسيمة في التعرف على المهمتين، وأن مخرجاتها كانت ذات قابلية استخدام عالية.

في سيناريو فهم المخطط الانسيابي، كان على النموذج استخراج منطق الأعمال المكون من 10 خطوات بدقة من مخطط انسيابي لتسجيل الدخول والمصادقة في تطبيق WeChat الصغير. تمكن نموذج Step 3.7 Flash من التعرف الكامل على 10 خطوات، وكانت كل خطوة متطابقة تمامًا مع المخطط الأصلي. كما قام نموذج MiniMax M3 بإخراج 10 خطوات مع صحة المنطق. أما نموذج Qwen3.6-flash فقد دمج الخطوتين 3 و4، وأخرج 9 خطوات، لكن المنطق العام كان صحيحًا. مع تكافؤ جودة المخرجات، كان نموذج Step 3.7 Flash الأسرع في الاستجابة والأقل في استهلاك الرموز.

383e7fb0-8f2f-4fc3-81e1-fedf30adb60e.png

في اختبار آخر موجه لأنظمة الأعمال، كان على النموذج إخراج الحقول الرئيسية من فاتورة إلكترونية وفق هيكل JSON محدد مسبقًا. تمكنت النماذج الثلاثة من التعرف بدقة على المعلومات المطلوبة وإخراجها بشكل منظم. استغرق نموذج Step 3.7 Flash 5.6 ثانية لإكمال المهمة، واستهلك 1409 رمزًا (Token)؛ بينما استغرق نموذج MiniMax M3 6.1 ثانية واستهلك 2216 رمزًا؛ واستغرق نموذج Qwen3.6-flash 7.38 ثانية واستهلك 2008 رمزًا. كانت تكلفة الاستخراج المنظم لفاتورة واحدة أقل من 1 سنت صيني.

7c426d93-c9ae-43cc-be6a-cfe369eb38d5.png e128749a-634b-46ea-b46f-0638601bd7ae.png

بدمج نتائج الاختبارين، يتضح أن استقرار جودة الفهم البصري والإخراج المنظم للنماذج الثلاثة يفي بالمتطلبات الأولية للإنتاج، دون تسجيل أي حالات استخراج خاطئ. بالنسبة لسيناريوهات الاستدعاء المتكرر للوكلاء (Agent) أو واجهات برمجة تطبيقات الأعمال، يصبح زمن الاستجابة واستهلاك الرموز مؤشرين رئيسيين للتمييز. في هذه المقارنة، أظهر نموذج Step 3.7 Flash، مع الحفاظ على نفس جودة المخرجات، سرعة استجابة أعلى وتكلفة أقل، مما يجعله أكثر ملاءمة للاختبار في بيئات الإنتاج كأولوية.

f646fa29-a15a-4180-9aaa-d3df1fab0bf7.png
تم تجميع هذه الأخبار القصيرة وإعادة نشرها من للمعلومات من الإنترنت العالمي والشركاء الاستراتيجيين، وهي مخصصة فقط للقراء للتواصل، إذا كان هناك أي انتهاكات أو مشاكل أخرى، فيرجى إبلاغنا في الوقت المناسب، وسنقوم بتعديلها أو حذفها. يُمنع منعًا باتًا إعادة نشر هذه المقالة دون إذن رسمي. البريد الإلكتروني: news@wedoany.com
المنتجات ذات الصلة
التوصيات ذات الصلة
تجاوزت الإيرادات السنوية المتكررة لأعمال "تيانقونغ" للذكاء الاصطناعي التابعة لشركة "كونلون وانوي" الصينية 800 مليون دولار أمريكي
2026-07-02
شركة "زييوان روبوت" الصينية للروبوتات البشرية تؤسس شركة جديدة لمعدات الذكاء الاصطناعي برأسمال 4.5 مليون يوان
2026-07-02
شركة "علي بابا" الصينية تدمج خط إنتاج وكلاءها الذكيين لإطلاق منتج ذكاء اصطناعي جديد لإنتاجية المؤسسات
2026-07-02
شركة HD Hyundai Electric الكورية تحصل على طلبية بقيمة 1.12 تريليون وون لتجهيزات مراكز البيانات
2026-07-02
شركة Patmos الأمريكية تخطط لاستثمار 107 ملايين دولار لتحويل مستودع إلى مركز بيانات في إندبندنس
2026-07-02
مجموعة الأغشية الهندية وشركة كوريتا للمياه تؤسسان مشروعًا مشتركًا لخدمة صناعة أشباه الموصلات
2026-07-02
شركة فانوك اليابانية: جميع منتجاتها البالغ عددها 250 طرازًا من الروبوتات تدعم الذكاء الاصطناعي الفيزيائي
2026-07-02
إيرادات قسم الذكاء الاصطناعي في مايكروسوفت الأمريكية تتجاوز 37 مليار دولار سنويًا بنمو 123%
2026-07-02
فيرتيف تطلق أول قاعدة تصنيع لها في جنوب شرق آسيا بماليزيا لمواكبة الطلب على الذكاء الاصطناعي
2026-07-02
شركة شنايدر إلكتريك تتعاون مع فوكسكون لتعزيز بنية مراكز بيانات الذكاء الاصطناعي
2026-07-02
آخر الأخبار القصيرة
1
شركة "هورش" تحصل على تمويل بقيمة 115 مليون ريال برازيلي لتطوير آلات زراعية
2
تعاون بين "أسياد" العمانية و"سي إم إيه سي جي إم" لتطوير محطة لوجستية في صحار باستثمار 400 مليون دولار
3
وزارة الزراعة الأمريكية تطلق برنامج SPUR بقيمة 500 مليون دولار لدعم معالجي لحوم البقر من صغار ومتوسطي الحجم
4
منطقة بيرم الروسية تحصل على 226 مليون روبل لتعزيز الاستثمار الزراعي
5
من المتوقع الانتهاء من جسم هويس المرحلة الثانية لمحطة لونغتوشان بمقاطعة جيانغشي الصينية بحلول نهاية أغسطس، لترتفع الطاقة السنوية إلى 37 مليون طن
6
شركة Patmos الأمريكية تخطط لاستثمار 107 ملايين دولار لتحويل مستودع إلى مركز بيانات في إندبندنس
7
فتح نافذة تقديم طلبات مدتها 180 يوماً لانضمام البلديات في ولاية ساو باولو إلى التقسيم الإقليمي للصرف الصحي
8
شركة الخطوط الجوية الإسكندنافية تطلب 18 طائرة من طراز A330neo في يونيو
9
شركة "يونيفرسال بيلينغ آند جيوتكنيكال" البريطانية تنجز مشروع شبكة حماية من الصخور المتساقطة بطول 428 مترًا
10
تركيب رادارات أرضية جديدة من نوع SMR في ثلاثة مطارات أمريكية من قبل FAA