أخبار ar.wedoany.com، مع حلول عصر "الذكاء الاصطناعي الوكيل" القادر على اتخاذ القرارات والتصرف بشكل مستقل، يتحول مركز ثقل سوق البنية التحتية العالمية للذكاء الاصطناعي بسرعة من التدريب على نطاق واسع إلى مجال الاستدلال اللازم للخدمات الفعلية. في هذه العملية، تتجاوز أهمية كفاءة الطاقة في مراكز البيانات والتكلفة الإجمالية للملكية (TCO) الأداء المطلق للرقاقة الواحدة. لكسر هيمنة شركة نفيديا على السوق، تسارع شركات الأجهزة العالمية وعمالقة التكنولوجيا وشركات الرقائق الكورية المحلية K-AI في تحركاتها.
يؤدي الطلب المتزايد على الحوسبة واحتكار نفيديا لوحدات معالجة الرسوميات (GPU) إلى ضغوط تكلفة على الشركات، مما يدفع عمالقة التكنولوجيا العالمية إلى البدء في تطوير أشباه موصلات ذكاء اصطناعي خاصة بهم محسّنة لمراكز البيانات والخدمات التي يقدمونها. تهدف هذه الشركات إلى بناء بنية تحتية شاملة تشمل الرقائق وهياكل الخوادم والشبكات والبرمجيات، لتعظيم "اقتصاديات الرمز المميز" و"كفاءة الطاقة" في بيئات التشغيل الفعلية. قامت Google Cloud بترقية معالج TPU الخاص بها من الجيل السادس "Trillium"، والذي يتمتع بأداء حوسبة وسعة ذاكرة عالية النطاق الترددي (HBM) محسّنة بشكل كبير عن الجيل السابق، لدعم تدريب واستدلال النموذج الكبير "Gemini"، وتوفيره للعملاء الخارجيين عبر منصة Google Cloud Platform (GCP). أطلقت Microsoft (MS) سلسلة مسرعات الذكاء الاصطناعي المخصصة "Maia" لتحسين القيمة مقابل التكلفة لبنيتها التحتية السحابية Azure، حيث تم تصميم هذه الرقائق بالتعاون مع OpenAI في مجال تصميم الرقائق، بهدف خفض تكاليف تشغيل خدمات Azure OpenAI (مثل ChatGPT). تقدم Meta مسرع التدريب والاستدلال الخاص بها "MTIA"، والذي تم تحسينه لخوارزميات التوصية الإعلانية ومحرك ترتيب التغذية، لمعالجة الحوسبة واسعة النطاق باستهلاك منخفض للطاقة، وقد تم توسيع نطاقه ليشمل استدلال خدمات سلسلة نماذج اللغة الكبيرة مفتوحة المصدر "Llama".
بين عمالقة التكنولوجيا، تتبع AWS استراتيجية مزدوجة المسار، حيث تعمل على توسيع نظام الرقائق الخاص بها من جهة، وتحافظ على التعاون مع نفيديا من جهة أخرى. وصلت أعمال المسرعات في AWS إلى حجم مليارات الدولارات، وأصبحت طبقة أساسية في البنية التحتية، حيث يتم تشغيل أكثر من 50% من الرموز المميزة في خدمة الذكاء الاصطناعي التوليدي المُدارة بالكامل "Amazon Bedrock" على البنية التحتية لرقائقها المسرعة الخاصة "Trainium" و"Inferentia". يوفر إصدار "Trainium2" الذي يضم 16 شريحة ويمكنه معالجة نماذج يصل حجمها إلى تريليون معامل، قيمة أفضل بنسبة 30-40% مقارنة بمثيلات وحدات معالجة الرسوميات العامة، وقد نما إيراده المرتبط بنسبة 150% على أساس ربع سنوي، وحصل على شركاء إنتاج بما في ذلك مجموعة التدريب "Project Rainier" المبنية بالتعاون مع Anthropic، بالإضافة إلى شركات مثل Apple وUber وDatabricks. توفر شريحة الاستدلال المخصصة "Inferentia" إنتاجية تصل إلى 2.3 ضعف وتكاليف استدلال أقل بنسبة تصل إلى 70% مقارنة بالمثيلات الحالية. أطلقت AWS إصدار "Trainium3" المحسّن لأحمال عمل الذكاء الاصطناعي الوكيل وتوليد الفيديو، حيث يوفر أداءً لكل واط يزيد بمقدار يصل إلى 4 أضعاف عن الجيل السابق، وتظهر الاختبارات الأولية أنه يمكن أن يوفر ما يصل إلى 50% من التكاليف مقارنة بتدريب وحدات معالجة الرسوميات العامة. يوفر خادم "EC2 Trn3 UltraServer" الذي يجمع ما يصل إلى 144 شريحة Trainium3 أداء حوسبة يبلغ 362 FP8 PFLOPs وذاكرة HBM3e بسعة 20.7 تيرابايت، وبالاقتران مع شبكة "EC2 UltraCluster 3.0" غير المعوقة القائمة على محول البنية المرنة (EFA)، تعمل مئات الآلاف من الرقائق معًا كمسرع واحد. تعمل ميزة "Neuron Agentic Development" الجديدة التي تم إطلاقها في عام 2026 على تمكين وكلاء ترميز الذكاء الاصطناعي من نقل النماذج الحالية تلقائيًا إلى Trainium وإجراء التحقق من الاتساق العددي، مما يزيل عقبات نقل الأجهزة.
بالإضافة إلى ذلك، يعمل معسكر عمالقة التكنولوجيا على تقليل الاعتماد على منصة "CUDA" من نفيديا من خلال تحالفات البرمجيات مفتوحة المصدر. تروج AWS لمجموعة أدوات "Neuron SDK" مفتوحة المصدر، والتي تم تصميمها بناءً على المعيار المفتوح XLA، وتتكامل مع أطر العمل القياسية في الصناعة مثل PyTorch وJAX وvLLM وHugging Face، مما يمكن المطورين من استخدام هذه المكتبات مع الحد الأدنى من تعديلات الكود. ينتقل سوق المسرعات العالمي من احتكار الأجهزة العامة إلى عصر تنوع البنى، ومن المتوقع أن تشتد المنافسة بين عمالقة التكنولوجيا في مجال الرقائق السيليكونية الخاصة وكفاءة البنية التحتية الشاملة بسبب الزيادة الكبيرة في أحمال عمل الذكاء الاصطناعي الوكيل وتوليد الوسائط عالية السعة.

أشار مهندس الحلول في AWS، لي سو-جي، بخصوص استراتيجية البنية التحتية للذكاء الاصطناعي، إلى أن استثمار AWS في رقائق السيليكون الخاصة بالذكاء الاصطناعي لا يهدف فقط إلى استبدال أجهزة معينة، بل إلى توفير قيمة أفضل وتنوع أوسع من الخيارات للعملاء، مما يخلق دورة إيجابية للحوسبة المتسارعة. فقط من خلال وجود بنى متعددة في السوق يمكن تحقيق خفض الأسعار وتحسين الأداء عبر المنافسة. عند تقييم البنية التحتية للذكاء الاصطناعي، فإن العناصر الأساسية هي النظام المتكامل الذي يضم شريحة المسرع وهيكل الخادم الذي يدعمها والشبكة التي تربط المجموعات واسعة النطاق والبرمجيات والخدمات المُدارة التي تطلق العنان لإمكانات الأجهزة، وهذا هو المفتاح لخفض التكلفة الإجمالية للملكية. في بيئة الجيل التالي من الذكاء الاصطناعي، ستحدد إدارة "اقتصاديات الرمز المميز" و"كفاءة الطاقة" بقاء الأعمال التجارية للشركات. يمكن للذكاء الاصطناعي الوكيل تغيير خصائصه الحاسوبية في أي وقت وفقًا لمتطلبات تخطيط المهام والتنظيم والاستجابة في الوقت الفعلي، وبما أن الطاقة في مراكز البيانات هي مورد محدود، فإن الأداء لكل واط، أي كفاءة الطاقة، سيصبح القدرة التنافسية الأساسية للشركات.









