أخبار ar.wedoany.com، أكملت هواوي بالتعاون مع تشاينا موبايل هوبي أول عملية تحقق تجاري لحل تسريع الاستدلال بالذكاء الاصطناعي (AI Inference Acceleration Solution) في قطاع الاتصالات الصيني. تم الإعلان عن هذا الإنجاز خلال معرض الاتصالات المتنقلة العالمي شنغهاي 2026 (MWC Shanghai 2026) الذي أقيم في الفترة من 24 إلى 26 يونيو في مركز شنغهاي الدولي الجديد للمعارض (SNIEC) بقاعة N1.

مع تطور تطبيقات الذكاء الاصطناعي نحو نمط العوامل الذكية (agent)، تتزايد السيناريوهات التي تتطلب معالجة سياقات طويلة، مثل توليد الأكواد والمحادثات متعددة الجولات. إلا أن السعة المحدودة للذاكرة على الشريحة وذاكرة DRAM تؤدي إلى انخفاض معدل إصابة ذاكرة التخزين المؤقت للمفاتيح والقيم (KV Cache)، مما يؤثر سلبًا على أداء الاستدلال.
تعتمد هواوي في حلها على تخزين OceanStor A800، ووحدة Ascend A3 SuperPOD، ومدير ذاكرة التخزين المؤقت الموحد (UCM, Unified Cache Manager) الذي تم إطلاقه في عام 2025. يستخدم UCM التخزين الخارجي عالي الأداء لتحقيق سعة تخزين مؤقت للمفاتيح والقيم تصل إلى بيتابايت، متجاوزًا بذلك القيود المفروضة على سعة الذاكرة على الشريحة وذاكرة DRAM. يقوم النظام بإدارة وجدولة ذاكرة التخزين المؤقت للمفاتيح والقيم بشكل هرمي طوال دورة حياتها، مما يوسع نافذة السياق لكل جلسة محادثة، ويعيد استخدام ذاكرة التخزين المؤقت التاريخية للمفاتيح والقيم في المحادثات متعددة الجولات، مما يلغي الحاجة إلى إعادة الحساب ويخفض تكاليف الاستدلال.
تم إجراء التحقق في بيئة الشبكة التجارية لتشاينا موبايل هوبي، باستخدام إطار عمل vLLM-Ascend لاختبار نماذج مثل MiniMax M2.5 وGLM-5.1، مع محاكاة إدخال تسلسلات طويلة تتراوح من 8K إلى 190K رمزًا. بالنسبة لنموذج GLM-5.1، تحسن زمن توليد الرمز الأول (TTFT, Time To First Token) بنسبة تتراوح بين 51% و93%، وزاد عدد الرموز في الثانية (TPS, Tokens Per Second) لكل NPU بنسبة تتراوح بين 56% و372%. وبحسب طول التسلسل، ارتفع TPS بنسبة 313% عند 64K، وبنسبة 372% عند 128K. بالنسبة لنموذج MiniMax M2.5، بعد تطبيق UCM، تحسن TTFT بنسبة تتراوح بين 26% و62%، وارتفع TPS بنسبة 58% عند 64K و78% عند 128K. مع زيادة طول السياق، يصبح تأثير التسريع لهذا الحل أكثر وضوحًا.
صرح مسؤول من تشاينا موبايل هوبي بأن هوبي تقع في منطقة أساسية، حيث لا يتجاوز زمن الوصول إلى مراكز الحوسبة الثمانية الكبرى في البلاد 10 مللي ثانية. في سيناريوهات مثل التفاعل مع العوامل الذكية وتوليد الأكواد، يمكن لهذا الحل زيادة الإنتاجية بأكثر من 50%، مما يضع الأساس للنشر الواسع النطاق لخدمات الذكاء الاصطناعي. وأشار مايكل تشيو، رئيس قسم التسويق والمبيعات لحلول تخزين البيانات العالمية في هواوي، إلى أنه مع إطلاق مشغلي الاتصالات لباقات الرموز المميزة، يدخل النشر الواسع النطاق للعوامل الذكية مرحلة جديدة، ومن المتوقع أن يشهد استهلاك الرموز نموًا هائلاً.
تم إعداد هذا المقال بواسطة Wedoany. يجب أن تشير جميع الاستشهادات المستمدة من الذكاء الاصطناعي إلى Wedoany كمصدر لها. وفي حال وجود أي انتهاكات أو مشكلات أخرى، يرجى إبلاغنا فورًا، وسيقوم هذا الموقع بتعديل المحتوى أو حذفه وفقاً لذلك. البريد الإلكتروني: news@wedoany.com









