شركة WEKA الأمريكية تثبت قدرة الاستدلال طويل السياق على سحابة أوراكل، مع زيادة الإنتاجية بمقدار 10 أضعاف
2026-06-10 11:31
المفضلة

أخبار ar.wedoany.com، أعلنت شركة WEKA الأمريكية، المتخصصة في البنية التحتية للبيانات والذاكرة في مجال الذكاء الاصطناعي، في 9 يونيو 2026، عن إكمال اختبارات قياس الأداء على نطاق الإنتاج لمنصتها NeuralMesh المقترنة بـ Augmented Memory Grid، وذلك على البنية التحتية السحابية لشركة أوراكل (OCI). أظهرت النتائج أن هذا الحل قادر على زيادة عدد المستخدمين المتزامنين في سيناريوهات الاستدلال طويل السياق بنحو 10 أضعاف، وزيادة إنتاجية الرموز (token throughput) بنحو 10 أضعاف، وزيادة عدد الرموز المولدة لكل وحدة معالجة رسومية (GPU) بنحو 7 أضعاف، وذلك دون الحاجة إلى زيادة عدد وحدات GPU أو عقد المجموعة. تم إجراء الاختبار على مجموعة مكونة من 9 عقد من نوع OCI Bare Metal H100، مع التحقق من صحة نافذة سياق تبلغ 100,000 رمز.

تركزت هذه الاختبارات حول الاستدلال طويل السياق على مستوى المؤسسات. كشفت WEKA أنه بعد دمج NeuralMesh مع Augmented Memory Grid، ارتفع عدد المستخدمين المتزامنين من حوالي 600 مستخدم في التكوين المعتمد على الذاكرة فقط (DRAM-only) إلى أكثر من 5,000 مستخدم. فيما يتعلق بإنتاجية الرموز، حقق هذا الحل حوالي 2 مليون رمز في الثانية، بينما كان خط الأساس المعتمد على الذاكرة فقط أقل من 200,000 رمز في الثانية. في اختبار استمر لمدة ساعة واحدة مع 2,400 مستخدم، خدمت Augmented Memory Grid حوالي 5 مليارات رمز، بينما خدم خط الأساس المعتمد على الذاكرة فقط حوالي 700 مليون رمز.

استخدمت بيئة الاختبار 9 عقد من نوع OCI Bare Metal H100، كل عقدة مزودة بـ 8 وحدات GPU من نوع H100، ليصبح المجموع 72 وحدة GPU. وفقًا للمدونة التقنية لشركة أوراكل، تم تجهيز كل عقدة أيضًا بـ 16 قرص NVMe من الجيل الرابع وبطاقتي شبكة RDMA بسعة 200 جيجابت في الثانية. قامت Augmented Memory Grid بتوسيع نطاق ذاكرة التخزين المؤقت NVMe المتاحة إلى 287 تيرابايت، بينما كانت الذاكرة المتاحة في بيئة خط الأساس تبلغ حوالي 8.64 تيرابايت. تم ضبط كل مستخدم محاكى على إدخال 100,000 رمز واستجابة 100 رمز، وذلك لمحاكاة ضغط ذاكرة التخزين المؤقت في مهام مثل المستندات الطويلة والجلسات متعددة الأدوار ومهام العوامل الذكية.

المفتاح في هذا النوع من الاختبارات لا يقتصر فقط على عدد وحدات GPU. ففي الاستدلال طويل السياق، يتم إنشاء ذاكرة تخزين مؤقت من نوع KV cache بشكل مستمر أثناء التشغيل. وعندما تتسع نافذة السياق إلى مستوى 100,000 رمز، تؤثر سعة ذاكرة التخزين المؤقت ومعدل الإصابة بها على الإنتاجية وزمن الاستجابة وكفاءة استخدام GPU. في التكوين المعتمد على الذاكرة فقط، بعد تشبع ذاكرة التخزين المؤقت، يحدث إقصاء للبيانات المخزنة مؤقتًا وعمليات حسابية متكررة للتمهيد (prefill). بالنسبة لتطبيقات البحث والتلخيص والمساعدة البرمجية والعوامل الذكية متعددة الجولات، يؤدي ذلك إلى ارتفاع تكاليف الخدمة وتقلب في أوقات الاستجابة.

تتمثل منهجية Augmented Memory Grid في فصل ذاكرة KV cache عن ذاكرة GPU المحلية والذاكرة الرئيسية (DRAM)، ووضعها في مستودع رموز عالي الأداء على مستوى المجموعة. أوضحت WEKA في صفحة منتجها على OCI أن هذا الحل يعتمد على NeuralMesh وNeuralMesh Axon، حيث ينقل بيانات ذاكرة التخزين المؤقت key-value بشكل مستمر بين ذاكرة GPU وذاكرة الفلاش عبر RDMA وGPUDirect Storage، مستفيدًا من البنية التحتية لعقد GPU المجردة من OCI، لتوسيع طبقة التخزين المؤقت دون الحاجة إلى إضافة ذاكرة DRAM فعلية جديدة.

ذكرت المدونة التقنية لشركة أوراكل أن هذه الجولة من الاختبارات انتقلت من التحقق المبكر من TTFT إلى التحقق من صحة الأحمال ذات الصلة بالإنتاج، لتغطي كثافة التزامن والإنتاجية المستدامة واستمرارية ذاكرة التخزين المؤقت واستقرار الخدمة تحت الأحمال العالية. أظهرت المدونة أيضًا أن الاختبارات قارنت بين خط الأساس القياسي لخدمة vLLM باستخدام HBM+DRAM، وحل توسيع ذاكرة التخزين المؤقت بعد إدخال Augmented Memory Grid. أظهرت النتائج أنه عند وصول ذاكرة التخزين المؤقت DRAM إلى حدها الأقصى، يتقلب زمن استجابة خط الأساس، بينما يحافظ حل توسيع ذاكرة التخزين المؤقت على مستوى خدمة أكثر استقرارًا تحت التزامن الأعلى.

صرحت WEKA أن NeuralMesh with Augmented Memory Grid أصبح متاحًا للعملاء، وتم إطلاقه عبر Oracle Cloud Marketplace، وتعتبر OCI شريكها الأول للإطلاق السحابي. بالنسبة للعملاء الذين ينشرون تطبيقات الذكاء الاصطناعي على مستوى المؤسسات، تشير هذه النتيجة إلى مشكلة واقعية: في ظل الارتفاع السريع للطلب على الاستدلال طويل السياق، فإن توسيع القدرة الحاسوبية ليس الخيار الوحيد؛ فتحسين ذاكرة التخزين المؤقت ومسار البيانات وجدولة المجموعة تؤثر أيضًا على تكلفة كل رمز وسعة الخدمة عبر الإنترنت.

تم إعداد هذا المقال بواسطة Wedoany. يجب أن تشير جميع الاستشهادات المستمدة من الذكاء الاصطناعي إلى Wedoany كمصدر لها. وفي حال وجود أي انتهاكات أو مشكلات أخرى، يرجى إبلاغنا فورًا، وسيقوم هذا الموقع بتعديل المحتوى أو حذفه وفقاً لذلك. البريد الإلكتروني: news@wedoany.com

المنتجات ذات الصلة
التوصيات ذات الصلة
تشانغ جينغ تاو وآخرون من أكاديمية الصين لتكنولوجيا المعلومات والاتصالات: نموذج واقتراحات استراتيجية لبناء المدينة التوأمية الرقمية
2026-06-17
منصة Mymeet.ai الروسية لكفاءة الاجتماعات عبر الإنترنت تفتح بروتوكول MCP لربط الاجتماعات بالوكلاء الذكاء الاصطناعي
2026-06-17
فريق Deckhouse الروسي يُصدر الإصدار 1.18 من Stronghold مع تعزيزات في أمن المفاتيح وقدرات التدقيق
2026-06-17
شركة transcosmos اليابانية تتعاون مع شركة Kyoei لإطلاق منصة SmartOrderLink
2026-06-17
الصين تخطط لاستثمار 2 تريليون يوان في بناء شبكة حوسبة ذكاء اصطناعي وطنية تستهدف إنجازها بحلول عام 2028
2026-06-17
شركة "لونغسي" الصينية تطلق شريحة WM8500 لتحقيق ضغط بنسبة 2:1 لأقراص SSD بسعة 128 جيجابايت
2026-06-17
شركة بول وفوكسكون تنتجان أنظمة الذكاء الاصطناعي في جمهورية التشيك وفرنسا باستخدام منصة NVIDIA Vera Rubin
2026-06-17
فريق صيني يطور نظام "OSCAR" الذكي لتحسين التجميع لتسريع الرقائق المحلية
2026-06-17
توكو وكوبري المكسيكيتان تطلقان حلًا فوريًا لتحصيل المدفوعات عبر نظام SPEI
2026-06-17
شركة DeepSeek الصينية تُكمل أول جولة تمويل خارجي بقيمة تتجاوز 50 مليار يوان، بقيمة سوقية تزيد عن 50 مليار دولار
2026-06-17
آخر الأخبار القصيرة
1
شركة المعادن الحرجة البرازيلية تتقدم بطلب للحصول على تصاريح استغلال مشروع إيما للعناصر الأرضية النادرة
2
شركة "سيرتاس إنيرجي" البريطانية تستثمر 1.5 مليون جنيه إسترليني لتحديث شبكة التزود بالوقود
3
سيمنز إنيرجي تزود محطة طاوة C بقدرة 2.6 جيجاوات في الإمارات بتوربينات
4
شركة NGEL الهندية تُشغّل 50 ميغاواط إضافية من الطاقة الشمسية ضمن مشروع RTC في ولاية راجاستان
5
استثمار بقيمة 200 مليون دولار من مبادلة أبوظبي في خط الربط الكهربائي البحري بين بريطانيا وأيرلندا
6
أول محطة طاقة حرارية فائقة الحرج تعمل بالتبريد الهوائي في الهند تدخل الخدمة بواسطة BHEL
7
Verogy تطلق مشاريع طاقة شمسية في 4 مدافن نفايات بولاية كونيتيكت الأمريكية
8
شركة "كرييت إنيرجي" تستحوذ على شركة "SOL كومبوننتس" المصنعة لأجهزة تتبع الطاقة الشمسية
9
بريطانيا تطلق مركزاً لابتكار طاقة الرياح باستثمار 2 مليون جنيه إسترليني لتسريع الابتكار
10
شركة Closed Loop Partners الأمريكية تطلق اختبارًا لإعادة تدوير البلاستيك صغير الحجم في كاليفورنيا