أخبار ar.wedoany.com، تتطور نماذج الذكاء الاصطناعي الكبيرة بوتيرة مذهلة. ولا تستطيع سرعة نمو الذاكرة وعرض النطاق الترددي مواكبة التوسع المتسارع للنماذج. هذه هي مشكلة "جدار الذاكرة" التي طالما أزعجت الصناعة. والأكثر صعوبة هو أن تقنية التغليف ثنائي الأبعاد والنصف (2.5D) السائدة حالياً (مثل CoWoS من TSMC) تعتمد على التوسع في مستوى واحد، مما يحد من موارد التخطيط والتوصيل، ويؤدي إلى كثافة تكامل منخفضة. في سيناريوهات الحوسبة عالية الأداء للذكاء الاصطناعي، لا يمكن تقليص مساحة الرقاقة بشكل أكبر.
عندما يصبح التوسع الأفقي غير قابل للاستمرار، تصبح تقنية التكديس ثلاثي الأبعاد "النمو العمودي" خياراً حتمياً. بالنسبة لرقائق الذكاء الاصطناعي الصينية المحلية، توفر تقنية التكديس ثلاثي الأبعاد، في ظل الواقع الصناعي المتمثل في محدودية طاقة الإنتاج للعمليات المتقدمة وضعف إمدادات ذاكرة HBM عالية الجودة، مساراً ممكناً لـ "استبدال الأداء بالمساحة" والالتفاف حول بعض القيود التقنية.
01 تقنية التغليف: من "التبليط المسطح" إلى "بناء ناطحات السحاب"
في مجال التغليف المتقدم، يحقق التغليف ثنائي الأبعاد والنصف (2.5D) اتصالاً عالي السرعة واتصالات قصيرة المسافة بين الرقائق من خلال دمج عدة قوالب عارية (Bare Die) على طبقة وسيطة من السيليكون. تستخدم الطبقة الوسيطة من السيليكون عادةً تقنية التوصيلات الرأسية عبر السيليكون (TSV) لتحقيق التوصيل الرأسي، وتتميز بخصائص توصيل عالية الكثافة والأداء، مما يمكن أن يحسن بشكل كبير الأداء العام للنظام.
تعمل تقنية التكديس ثلاثي الأبعاد، من خلال تكديس الرقائق أو تكديس الحزم، على سبيل المثال باستخدام تقنية TSV أو الربط المختلط، على زيادة الوظائف، ورفع كثافة التكامل، وخفض تكاليف التغليف، والمساهمة في تحسين سرعة التشغيل بسبب تقصير أطوال التوصيلات. من خلال التكديس ثلاثي الأبعاد، يمكن تكديس الوحدات الوظيفية التي كانت موزعة أصلاً على رقائق مختلفة في التغليف ثنائي الأبعاد والنصف، مثل منطق الحوسبة ومصفوفات التخزين وواجهات الإدخال/الإخراج، فيزيائياً وكهربائياً في البعد الرأسي، متجاوزة بذلك الحدود الفيزيائية للتكامل المسطح.
يستخدم كل من التغليف ثلاثي الأبعاد (3D) والتغليف ثلاثي الأبعاد والنصف (3.5D) تقنية التكديس ثلاثي الأبعاد. تتغلب تقنية التغليف ثلاثي الأبعاد على القيود الفيزيائية للتكامل المسطح التقليدي من خلال تكديس عدة قوالب عارية (Bare Die) عمودياً، والاستعانة بتقنيات التوصيل المتقدمة مثل TSV والنتوءات الدقيقة (Microbumps) لتحقيق الاتصال بين الطبقات. يعمل هذا الهيكل على تقصير مسارات نقل الإلكترونات بشكل كبير، مما يقلل بشكل ملحوظ من زمن الوصول واستهلاك الطاقة، مع تحقيق عرض نطاق ترددي عالٍ جداً للتوصيل وكثافة تغليف عالية. أما التغليف ثلاثي الأبعاد والنصف (3.5D) فيعتمد على التكديس الرأسي ثلاثي الأبعاد، مع إضافة طبقة وسيطة من السيليكون (Interposer) ثنائية الأبعاد والنصف للتوسع الأفقي، مما يشكل هيكلاً مركباً "عمودي + مسطح".
حالياً، تعتمد رقائق الذكاء الاصطناعي المحلية الرئيسية في الصين، مثل تلك من شركات Cambricon و Kunlunxin و BirenTech و Iluvatar CoreX، بشكل أساسي على تقنية التغليف ثنائي الأبعاد والنصف لتوصيل قوالب حوسبة GPU/AI وذاكرة HBM جنباً إلى جنب، باستخدام الطبقة الوسيطة من السيليكون (Interposer) وطبقة إعادة التوصيل (RDL) لبناء شبكات توصيل عالية الكثافة. لكن عرض النطاق الترددي لهذه الحلول التي تعتمد على الذاكرة الخارجية يتراوح عادةً بين 1 و4 تيرابايت/ثانية فقط، وهي مقيدة بالمساحة المسطحة، وقد وصلت كثافة التكامل وعرض النطاق الترددي للتوصيل إلى حدودها الفيزيائية تقريباً.
02 عمالقة دوليون: التكديس ثلاثي الأبعاد وثلاثي الأبعاد والنصف يدخلان مرحلة الإنتاج الضخم
لقد استثمر عمالقة أشباه الموصلات الدوليون بالفعل في تقنيات 3D/3.5D، ودخلت بعض المنتجات مرحلة الإنتاج والتسليم.
في عام 2023، أصدرت AMD مسرع الذكاء الاصطناعي Instinct MI300، وهو منتج رقاقة يستخدم تقنية التغليف ثلاثي الأبعاد والنصف (3.5D) وتم إنتاجه بكميات كبيرة. وصفت AMD تقنيتها بأنها دمج لوحدات معالجة الرسوميات (GPU) ورقائق الإدخال/الإخراج (I/O) المكدسة ثلاثية الأبعاد عبر الربط المختلط، مع دمجها مع التغليف القياسي ثنائي الأبعاد والنصف. يجمع حل التغليف ثلاثي الأبعاد والنصف من AMD بين تقنيتي CoWoS (طبقة وسيطة من السيليكون 2.5D) وSoIC (ربط مختلط 3D) من TSMC، حيث يتم تكديس رقائق GPU/CPU عمودياً فوق رقائق I/O عبر الربط المختلط Cu-Cu، ثم يتم توصيلها جنباً إلى جنب مع ذاكرة HBM3 عبر الطبقة الوسيطة CoWoS.
في ديسمبر 2024، كشفت شركة Broadcom علناً لأول مرة عن منصة التغليف ثلاثية الأبعاد والنصف XDSiP (نظام في حزمة فائق الأبعاد) الأولى من نوعها في الصناعة. تجمع هذه المنصة بين تقنية 2.5D وتكامل 3D-IC باستخدام تقنية الوجه للوجه (F2F). جوهر هذه المنصة هو تقنية التكديس F2F، التي تستخدم الربط النحاسي المختلط بدون نتوءات (HCB) لتوصيل المعادن العلوية للرقائق العلوية والسفلية مباشرة، مما يحقق اتصالاً مباشراً بين الطبقات المعدنية العلوية للرقاقتين. مقارنةً بتقنية الوجه للظهر (F2B) التقليدية، لا تعتمد F2F على TSV، مما يسمح بزيادة عدد اتصالات الإشارة بمقدار 7 مرات، وتقليل استهلاك الطاقة لواجهة ما بين الرقائق بنسبة 90%، وتقليل زمن الوصول بين مكونات الحوسبة والذاكرة والإدخال/الإخراج داخل التكديس ثلاثي الأبعاد. في عام 2026، تم تسليم أول SoC حوسبة مخصصة بتقنية 2 نانومتر يعتمد على XDSiP إلى شركة Fujitsu لاستخدامه في مجموعات الحوسبة الفائقة للذكاء الاصطناعي.
تجمع تقنية التغليف EMIB 3.5D من شركة إنتل بين تقنية EMIB 2.5D (جسر السيليكون المدمج للتوصيل الأفقي) وتقنية Foveros Direct 3D (التكديس الرأسي بالربط المختلط)، مما يدعم التكامل المرن غير المتجانس لأنواع متعددة من الرقائق، ويتوافق مع معيار الصناعة UCIe. تعتبر وحدة المعالجة المركزية (SoC) من سلسلة Intel数据中心 GPU Max، والمبنية باستخدام EMIB 3.5D، أكثر الرقائق غير المتجانسة تعقيداً التي تم إنتاجها بكميات كبيرة على الإطلاق، حيث تحتوي على أكثر من 100 مليار ترانزستور، و47 وحدة نشطة، و5 عقد عمليات تصنيع.
تستخدم تقنية HBC الحديثة من Qualcomm بنية حوسبة مبتكرة قريبة من الذاكرة مخصصة، حيث تدمج الحوسبة مع ذاكرة فائقة السرعة وعالية النطاق عبر حلول قائمة على السيليكون مكدسة ثلاثية الأبعاد، لمعالجة عنق الزجاجة في نقل البيانات أثناء حوسبة الذكاء الاصطناعي. يوفر مسرع AI250، المزود بتقنية HBC من الجيل الأول، معدل عرض نطاق ترددي رائد في الصناعة يبلغ 133 تيرابايت/ثانية على بطاقة واحدة، وهو أعلى بمقدار 18 مرة من عرض النطاق الترددي الفعال للذاكرة مقارنةً بـ AI200 الذي يستخدم LPDDR5X. ويحقق مسرع AI300، المزود بتقنية HBC من الجيل الثاني، قفزة هائلة في الأداء، حيث يزيد عرض النطاق الترددي الفعال للذاكرة بمقدار 54 مرة مقارنةً بـ AI200.
03 شركات تصنيع رقائق الذكاء الاصطناعي الصينية تختار بشكل جماعي التكديس ثلاثي الأبعاد
في مواجهة الريادة الدولية في التكديس ثلاثي الأبعاد والتغليف ثلاثي الأبعاد والنصف، ومحدودية طاقة الإنتاج للعمليات المتقدمة وإمدادات ذاكرة HBM عالية الجودة محلياً في الصين، تستكشف شركات تصنيع رقائق الذكاء الاصطناعي الصينية بنشاط دمج وحدات التخزين والحوسبة عمودياً عبر تقنية التكديس ثلاثي الأبعاد.
تعتمد بنية "زي شيان" (Zixian) من مجموعة "زيغوانغ" (Unisplendour) على ذاكرة DRAM ثلاثية الأبعاد، وتقدم أول حل تكامل غير متجانس ثلاثي الأبعاد والنصف (3.5D) في العالم، حيث يصل عرض النطاق الترددي للتخزين إلى 30 تيرابايت/ثانية. في وضع الحوسبة القريبة من الذاكرة PNM، ينخفض زمن الوصول للوصول إلى الذاكرة بمقدار يصل إلى 1/18، وتظهر المحاكاة أن معدل إنتاج الرموز (Token throughput) تحت نفس القدرة الحاسوبية أعلى بمقدار 1.5 إلى 2 مرة من سلسلة B200 من NVIDIA، ويمكن إنتاجه بكميات كبيرة بالاعتماد على سلسلة التوريد المحلية الصينية.
تستخدم رقاقة الذكاء الاصطناعي من الجيل التالي لشركة "تشينغ وي إنتليجنت" (TsingMicro) تكديساً غير متجانس ثلاثي الأبعاد والنصف (3.5D)، مما يحقق تكديساً عمودياً ثلاثي الأبعاد لقوالب الحوسبة القابلة لإعادة التشكيل وقوالب ذاكرة DRAM. من خلال التكامل الرأسي لـ "قالب حوسبة + قالب تخزين"، وفي ظل ظروف العمليات المتقدمة المحدودة، يتم تحقيق قفزة في الأداء عبر الابتكار المعماري. تعتمد رقاقة إعادة التشكيل ثلاثية الأبعاد من الجيل الثاني بشكل مبتكر على تقنية تكامل الحوسبة والتخزين ثلاثية الأبعاد (3D存算一体) وتقنية تجميع أربع قوالب (Chiplet)، مما يرقى بنمط النقل أحادي المسار ثنائي الأبعاد للرقائق التقليدية إلى هيكل عمودي "4 مسارات حوسبة + 4 طبقات تخزين علوية"، مما يعزز بشكل كبير كفاءة نقل البيانات وكثافة القدرة الحاسوبية، ويشكل ميزة واضحة في الأداء وكفاءة الطاقة والمرونة.
نجحت رقاقة A4E من نوع TokenPU المخصصة لاستدلال النماذج الكبيرة، والتابعة لشركة "سوان مياو تكنولوجي" (SuanMiao Technology)، في التصنيع (Tape-out) رسمياً في 15 يونيو. يمثل هذا الإنجاز تحقيق معالج مخصص للنماذج الكبيرة يعتمد على سلسلة التوريد المحلية الصينية ويستخدم بنية تكديس مختلط ثلاثي الأبعاد. في المنتج الأول A4E، يتم تكديس 8 طبقات من رقائق التخزين عمودياً فوق رقاقة المنطق الحاسوبي، باستخدام تقنيات TSV والنتوءات (bump) لتحقيق توصيلات على مستوى الميكرومتر، مما يقلص مسافة النقل بين الرقائق التقليدية من مستوى المليمتر إلى مستويين أقل من حيث الحجم، مما يوفر عرض نطاق ترددي هائل للوصول إلى الذاكرة يبلغ 16 تيرابايت/ثانية، ويخفف بشكل فعال من مشكلة جوع البيانات.
أعلنت شركة "يونتيان ليفي" (Intellifusion) أن رقاقة الاستدلال التي تعمل على تطويرها ستقدم بنية تخزين مكدسة ثلاثية الأبعاد: وذلك للحصول على عرض نطاق ترددي أعلى وزمن وصول أقل، وكسر "جدار الذاكرة"، وتحسين كفاءة الاستدلال.
أكملت شركة "لينغ تشوان تكنولوجي" (Lingchuan Technology)، المنبثقة عن قسم الحوسبة غير المتجانسة والرقائق في مجموعة "كوايشو" (Kuaishou)، تصنيع رقاقتها من الجيل التالي في أبريل من هذا العام. تستخدم الرقاقة تقنية تكديس ثلاثي الأبعاد محلية صينية، وتقدم لأول مرة بنية حوسبة قريبة من الذاكرة ثلاثية الأبعاد، مع تحسينات خاصة مستهدفة لنقاط الألم الرئيسية في الصناعة مثل التبريد والاتساق والموثوقية. وقد باعت رقاقتها الأولى SL200 ما يقرب من 100 ألف وحدة حتى الآن، وتم نشرها في شركات الإنترنت مثل Kuaishou و Alibaba Cloud و Baidu Cloud و Bilibili، حيث تغطي 99.7% من أعمال تحويل ترميز البث المباشر لـ Kuaishou، وتخدم 700 مليون مستخدم بشكل مستقر.
04 التكديس ثلاثي الأبعاد يحتاج لعبور الفجوة من المختبر إلى الإنتاج الضخم
على الرغم من الآفاق الواسعة للتكديس ثلاثي الأبعاد، إلا أن صعوبة هندسته تفوق بكثير التغليف التقليدي.
أولاً، الإدارة الحرارية والتبريد. في الهياكل المسطحة ثنائية الأبعاد التقليدية، يمكن للحرارة الناتجة عن القالب أن تنتقل مباشرة إلى لوحة توزيع الحرارة والمبرد في الأعلى. لكن في الهياكل ثلاثية الأبعاد، يجب على الحرارة التغلب على عقبات كبيرة، واختراق طبقات متعددة من رقائق السيليكون ومصفوفات TSV والمواد اللاصقة البوليمرية السفلية وواجهات النتوءات الدقيقة عمودياً. بالنسبة لهياكل التكامل ثنائية الأبعاد والنصف، لا تزال أنظمة التبريد الهوائية التقليدية قادرة على العمل عند طاقة إجمالية تبلغ حوالي 300 واط؛ ولكن عندما يتحول النظام إلى التكديس الرأسي الحقيقي ثلاثي الأبعاد، وبمجرد أن تتجاوز الطاقة الإجمالية للحزمة 350 واط، يفشل التبريد القائم على الهواء تماماً، ويصبح من الضروري إدخال أنظمة التبريد السائل ومواد الواجهة الحرارية عالية الأداء.
ثانياً، عملية الربط المختلط ومردود الإنتاج. يتطلب الربط النحاسي المختلط بدون نتوءات (HCB) مسافات توصيل أقل من 10 ميكرومتر أو حتى 1 ميكرومتر، مما يضع متطلبات عالية جداً على استواء السطح (CMP)، ودقة الربط، وتطابق التمدد الحراري. يمكن أن يؤدي الاختلاف في مواد الجسر السيليكوني والركيزة إلى عدم تطابق في التمدد الحراري، مما يسبب إجهاداً ميكانيكياً وشقوقاً؛ عملية التكديس ثلاثي الأبعاد معقدة، ويعتمد تحسين المردود على التحسين المستمر لدقة الربط.
ثالثاً، أدوات التصميم الإلكتروني (EDA) والتنسيق التصميمي. تنمو كمية بيانات التصميم ثلاثي الأبعاد بشكل انفجاري، ويحتاج مهندسو تصميم الدوائر المتكاملة (IC) ومهندسو التغليف إلى تعاون عميق؛ تواجه أدوات EDA الحالية صعوبة في معالجة التحسين متعدد الأبعاد للحرارة والإشارة وسلامة الطاقة في وقت واحد، وهناك حاجة ماسة لتطوير منصات تصميم تعاونية حرارية-كهربائية-ميكانيكية. حالياً، تمتلك شركات EDA العالمية الثلاث الكبرى بعض أدوات الدعم لتصميم رقائق التكديس ثلاثي الأبعاد، لكن على الجانب الآخر، لا تزال أدوات سير العمل الكاملة لتصميم رقائق التكديس ثلاثي الأبعاد في شركات EDA المحلية الصينية قليلة نسبياً. بعض الشركات يمكنها تقديم أدوات نقطية جزئية لمحاكاة رقائق التكديس ثلاثي الأبعاد، ولكن فيما يتعلق بأدوات مثل التخطيط والتوصيل، والتحقق من صحة الرقائق المتعددة، واختبار DFT متعدد القوالب، لا تزال هناك فجوة كبيرة في الصين.
رابعاً، الاختبار والموثوقية. يشكل تعقيد وكثافة تقنية تغليف التكديس ثلاثي الأبعاد للرقائق تحدياً كبيراً للاختبار والموثوقية. من الضروري تطوير طرق ومعدات اختبار جديدة لضمان جودة وموثوقية الحزمة. في الوقت نفسه، من الضروري إجراء تقييم طويل الأمد لموثوقية الحزمة لضمان عملها المستقر في ظل ظروف بيئية مختلفة.
أخيراً، تعقيد التجميع وسلسلة التوريد. يتضمن التجميع الفيزيائي محاذاة دقيقة للقوالب العارية ذات السماكات المختلفة ومعاملات التمدد الحراري المختلفة، مما يتطلب عمليات اعتماد ميكانيكية حرارية مكثفة؛ كمية بيانات التصميم والتحليل تتجاوز بكثير التغليف القياسي. يؤدي هذا أيضاً إلى ارتفاع التكلفة النسبية لتصنيع تقنية تغليف التكديس ثلاثي الأبعاد للرقائق، مما يستلزم التحسين المستمر لعمليات التصنيع وخفض تكاليف التصنيع، للسماح لتقنية تغليف التكديس ثلاثي الأبعاد للرقائق بأن تصبح أكثر انتشاراً في المنتجات الفعلية.
في عصر ما بعد مور، تتناقص الفوائد الحدية لتصغير الترانزستورات، وأصبح التغليف المتقدم مفتاحاً لـ "تجاوز مور". بالنسبة لرقائق الذكاء الاصطناعي الصينية، وفي ظل الواقع الصناعي المتمثل في القيود على استيراد العمليات المتقدمة وذاكرة HBM عالية الجودة، لم يعد مجرد ملاحقة مسار 2.5D+HBM للعمالقة الدوليين كافياً لبناء قدرة تنافسية متميزة. من بنية "زي شيان" من مجموعة "زيغوانغ" إلى التكديس غير المتجانس ثلاثي الأبعاد والنصف من "تشينغ وي إنتليجنت"، تثبت الشركات المصنعة الصينية أنه عندما يصل التوسع المسطح إلى حدوده الفيزيائية، فإن النمو عمودياً وإعادة تعريف طريقة تكامل الرقائق باستخدام البعد الثالث قد يكون بالضبط المفتاح لكسر "جدار الذاكرة" و"جدار المساحة"، وتحقيق التفوق في سباق القدرة الحاسوبية للذكاء الاصطناعي العالمي.









