أخبار ar.wedoany.com، أعلنت شركة سانديسك (Sandisk) عن تقنية الذاكرة الفلاشية عالية النطاق الترددي (High Bandwidth Flash, HBF)، بهدف معالجة اختناق الذاكرة في أعباء عمل استدلال الذكاء الاصطناعي.

يقود الذكاء الاصطناعي تحولاً في بنية ذاكرة مراكز البيانات. ففي الوقت الحالي، أصبح حوالي واحد من كل سبعة مراكز بيانات قادراً على تحمل أعباء عمل الذكاء الاصطناعي، ومن المتوقع أن تصل هذه النسبة إلى ما يقرب من 70% بحلول عام 2030. ينتقل الذكاء الاصطناعي من مراكز البيانات فائقة الاتساع إلى مراكز بيانات المؤسسات والشبكات الطرفية، ومن المتوقع أن تحقق تطبيقات الذكاء الاصطناعي الطرفية إيرادات تقارب 66.5 مليار دولار بحلول نهاية هذا العقد. وتشكل مستودعات المحتوى الضخمة هذه ضغطاً على بنيات التخزين التقليدية، مما يكشف عن نقاط ضعف هيكلية متأصلة.
تواجه ذاكرة DRAM وذاكرة HBM عالية النطاق الترددي المخصصة، المستخدمة على نطاق واسع في مراكز البيانات، صعوبة متزايدة في مواكبة متطلبات نماذج الذكاء الاصطناعي الكبيرة من حيث الكثافة وسعة التخزين وقابلية التوسع. ويعاني مصنعو الحوسبة فائقة الاتساع من الارتفاع المستمر في تكاليف الإنتاج وتعقيد التصميم واستهلاك الطاقة لذاكرة DRAM وHBM. وفي مراكز بيانات المؤسسات وتطبيقات الذكاء الاصطناعي الطرفية، تبرز هذه التحديات بشكل أكبر نظراً لمحدودية المساحة المادية وعدم القدرة على تحمل التكاليف المرتفعة للذاكرة واستهلاكها للطاقة. يختلف استدلال الذكاء الاصطناعي، بصفته عبء العمل المهيمن حالياً، عن تدريب الذكاء الاصطناعي في متطلبات إدارة البيانات، حيث يحتاج إلى تخزين نماذج ذكاء اصطناعي كبيرة ومتنامية. وقد أثبتت حلول الذاكرة المعتمدة على HBM وDRAM عدم كفايتها من حيث قابلية توسيع السعة والتكلفة.
توقف توسع سعة ذاكرة DRAM بشكل شبه كامل، بينما يتزايد الطلب على السعات الأعلى في استدلال الذكاء الاصطناعي. لا تتوافق مزايا زمن الوصول المنخفض والوصول العشوائي لذاكرة DRAM مع طبيعة استدلال الذكاء الاصطناعي، حيث أن أنماط الوصول في الاستدلال حتمية وتتحمل زمن وصول أعلى بفضل تقنيات مثل الجلب المسبق للبيانات. توجد هذه القصور في ظل صناعة DRAM التي تبلغ قيمتها 120 مليار دولار، والتي تواجه إنفاقاً ضخماً من مزودي الخدمات فائقي الاتساع على البنية التحتية للذكاء الاصطناعي (قد يصل إلى 6.7 تريليون دولار بحلول نهاية هذا العقد).
تطرح سانديسك حل HBF كبنية ذاكرة جديدة مصممة خصيصاً لدفع الجيل التالي من حوسبة الذكاء الاصطناعي. يهدف HBF إلى تلبية متطلبات السعة وكفاءة الطاقة والإنتاجية وقابلية التوسع للتطبيقات الحاسوبية المتقدمة والتطبيقات كثيفة البيانات. مقارنة بـ HBM، يوفر HBF سعة وكثافة ذاكرة أعلى، مع نطاق ترددي مماثل، ويتوافق بشكل أكبر مع اتجاهات استدلال الذكاء الاصطناعي. كوسيط تخزين دائم، يحتفظ HBF بالبيانات عند انقطاع التيار الكهربائي، ويتمتع بثبات حراري لتحمل درجات حرارة التشغيل المرتفعة. تستفيد هذه التقنية من تصميم وتصنيع BiCS من سانديسك بالإضافة إلى هندسة الرقائق، حيث تعيد تعريف ذاكرة NAND Flash من خلال تحسين خصائص النطاق الترددي العالي وذاكرة الاستدلال، وتستخدم تقنية ربط مصفوفة الويفر BiCS CMOS (CBA) لتحسين كفاءة الطاقة والنطاق الترددي.
بالمقارنة مع ذاكرة NAND Flash التقليدية، يحقق HBF زمن وصول أقل وإنتاجية قراءة أعلى بشكل ملحوظ من خلال استغلال التوازي، والتحجيم المنطقي المتقدم، وتقنيات التكديس المخصصة. وهذا يسمح لنماذج اللغة الكبيرة بنقل البيانات بسرعات تقترب من سرعة DRAM. في الوقت نفسه، يدعم HBF ذاكرة تخزين مؤقت كبيرة من نوع KV لمعالجة مطالبات المستخدم الطويلة والمعقدة بكفاءة، بالإضافة إلى البيانات الخاصة بالمجال والعملاء، مما يعزز دقة استدلال الذكاء الاصطناعي.
نظراً لأن HBM لا يمكن استخدامها عادةً في البيئات الطرفية والمتنقلة بسبب قيود الكثافة والتكلفة واستهلاك الطاقة، يمكن لـ HBF توفير سعة ذاكرة أكبر للأجهزة الطرفية (مثل الهواتف الذكية) لمعالجة مشاكل استدلال الذكاء الاصطناعي الأكثر تعقيداً. بفضل ذاكرته الدائمة، يدعم HBF استرجاع السياقات القديمة من الاستعلامات السابقة بسلاسة لحل مشاكل جديدة. في مجال الحوسبة على مستوى المؤسسات، بالنسبة للبيئات التي يكون فيها عدد المستخدمين أصغر بكثير من مراكز البيانات فائقة الاتساع، تكون تكلفة مجموعات وحدات معالجة الرسوميات الكبيرة المدعومة بـ HBM باهظة. ومن خلال اعتماد مسرعات تدعم HBF، يمكن للمؤسسات الصغيرة ضبط النماذج المدربة مسبقاً الكبيرة لمجالات محددة.
بالمقارنة مع HBM، يتمتع HBF بميزة واضحة في السعة، مع توفير الإنتاجية العالية المطلوبة لتطبيقات استدلال الذكاء الاصطناعي. كتقنية ذاكرة نظام جديدة وقابلة للتوسع، يساهم HBF في تقليل اختناقات الأداء وتسريع وقت الحصول على الرؤى من تطبيقات الذكاء الاصطناعي في مراكز البيانات الحديثة والشبكات الطرفية.
تم إعداد هذا المقال بواسطة Wedoany. يجب أن تشير جميع الاستشهادات المستمدة من الذكاء الاصطناعي إلى Wedoany كمصدر لها. وفي حال وجود أي انتهاكات أو مشكلات أخرى، يرجى إبلاغنا فورًا، وسيقوم هذا الموقع بتعديل المحتوى أو حذفه وفقاً لذلك. البريد الإلكتروني: news@wedoany.com









