أخبار ar.wedoany.com، أعلنت مؤخراً شركة GMI Cloud الأمريكية، المتخصصة في البنية التحتية السحابية الأصلية للذكاء الاصطناعي، أن منصتها ستدعم بناء الجيل الجديد من البنية التحتية الموجهة لمصانع الذكاء الاصطناعي الوكيل، وذلك بما يتماشى مع توجهات منصة Vera Rubin التي تطورها شركة NVIDIA خلال فعاليات GTC 2026 في تايبيه. تعمل الشركة حالياً على بناء منصة سحابية تركز على الاستدلال، تهدف إلى تزويد المطورين والشركات بالقدرة على نشر وتوسيع نطاق وتشغيل أعباء عمل الذكاء الاصطناعي على المستوى الإنتاجي.
يشير تركيز GMI Cloud على "مصنع الذكاء الاصطناعي الوكيل" إلى المتطلبات الجديدة التي تفرضها تطبيقات الذكاء الاصطناعي على البنية التحتية الأساسية بعد تطورها من مجرد الإجابة على الأسئلة لمرة واحدة إلى العمل طويل الأمد، والتعاون الذاتي، ومعالجة الوسائط المتعددة. فبينما كانت موارد الذكاء الاصطناعي السحابية التقليدية تركز بشكل أكبر على تدريب النماذج، أو الاستدلال بنموذج واحد، أو استدعاء واجهات برمجة التطبيقات (API)، فإنه عندما تبدأ وكلاء الذكاء الاصطناعي في تنفيذ التخطيط، واستدعاء الأدوات، ومعالجة الصور والفيديو والصوت، والاحتفاظ بذاكرة السياق، والعمل بشكل مستمر، تحتاج المنصة إلى دعم الاستدلال عالي الإنتاجية ومنخفض الكمون، والتوسع الديناميكي، وعزل المستأجرين المتعددين، وإدارة السياق طويل الأمد، وتنسيق سير العمل، وبيئة تنفيذ آمنة في آن واحد. تتضمن مجموعة منصة GMI Cloud بنية تحتية للتدريب والاستدلال والنشر الإنتاجي، وخدمة نماذج الاستدلال منخفضة الكمون Prime Inference، وواجهة برمجة تطبيقات MaaS للنماذج الخاصة ومفتوحة المصدر، ونقاط نهاية مخصصة على مستوى المؤسسات، وطبقة تنسيق وتحسين البنية التحتية لعمليات الذكاء الاصطناعي القابلة للتوسع.
تُعد البنية التحتية لسير العمل الوكيل جزءاً أساسياً من هذا الإعلان. تغطي قدرات المنصة التي طرحتها GMI Cloud أنظمة الذكاء الاصطناعي المستقلة في بيئات معزولة (Sandboxed)، والقائمة على استدعاء الأدوات، وتدعم بيئات النشر متعددة الوسائط الأصلية لتطبيقات الجيل التالي من الذكاء الاصطناعي. بالنسبة للعملاء من الشركات، يمكن استخدام هذه القدرات لبناء وكلاء خدمة عملاء يعملون بشكل مستمر، ووكلاء برمجة، ووكلاء تحليل بيانات، وأنظمة لتوليد المحتوى، ومساعدين لسير العمل الصناعي، وسير عمل لأتمتة الأعمال. مقارنة باستدعاء النماذج العادية، تحتاج أنظمة الذكاء الاصطناعي الوكيل إلى الحفاظ على حالتها لفترات أطول، والوصول إلى الأدوات، وقراءة وكتابة البيانات الخارجية، وجدولة الموارد بين مهام متعددة، وبالتالي فإن استقرار المنصة السحابية الأساسية، وعزلها، والتحكم في تكاليفها سيؤثر بشكل مباشر على جودة النشر الإنتاجي.
كما تم وضع الأمن في صميم البنية التحتية لمصانع الذكاء الاصطناعي. أشارت GMI Cloud إلى أنها تتبنى قدرات الحوسبة السرية من NVIDIA لتوفير بيئة تنفيذ موثوقة لأعباء عمل الجيل الجديد من الذكاء الاصطناعي التي تتطلب حماية خصوصية النماذج والبيانات. مع قيام مصانع الذكاء الاصطناعي بمعالجة البيانات الخاصة بالمؤسسات، والمحتوى الخاضع للتنظيم، وسياق النماذج، وذاكرة الوكلاء، يجب أن تلبي منصة الاستدلال في الوقت نفسه متطلبات الأداء والخصوصية والأمن والامتثال. وتُعتبر منصة Vera Rubin عقدة مهمة في تطور البنية التحتية لمصانع الذكاء الاصطناعي، حيث تم تصميمها حول الجيل التالي من الحوسبة والشبكات والأمن وأنظمة الرفوف (Rack-level) لتلبية احتياجات الذكاء الاصطناعي الوكيل من الاستدلال واسع النطاق والتشغيل المستمر.
يعكس هذا الإعلان تحول المنافسة في مجال البنية التحتية السحابية للذكاء الاصطناعي من "توفير طاقة حوسبة GPU" إلى "دعم الأنظمة الذكية على المستوى الإنتاجي". بعد دخول تطبيقات الذكاء الاصطناعي في العمليات الأساسية للمؤسسات، لا يقتصر اهتمام العملاء على إمكانية استئجار وحدات GPU فحسب، بل يشمل أيضاً زمن استجابة خدمة النماذج، وتكلفة الرموز (Token)، وتوفر المنصة، والعزل الأمني، وتنسيق سير العمل، والنقاط النهائية المخصصة، ونطاق الوصول إلى النماذج، والقدرة على تحمل مهام الوسائط المتعددة. إن اختيار GMI Cloud للتركيز على البنية الأصلية للاستدلال وتحديد موقعها كمصنع للذكاء الاصطناعي الوكيل يشير إلى رغبتها في لعب دور أقرب إلى طبقة التشغيل الإنتاجي في سلسلة البنية التحتية للذكاء الاصطناعي. سيكون المتغير الرئيسي اللاحق هو ما إذا كانت GMI Cloud ستتمكن من دمج النظام البيئي لـ Vera Rubin، وقدرات الحوسبة السرية، ومنصة الاستدلال في منتج قابل للتسليم على نطاق واسع، وجذب المزيد من المطورين والشركات الناشئة وعملاء المؤسسات لنشر وكلاء الذكاء الاصطناعي المعقدين على منصتها السحابية.
تم إعداد هذا المقال بواسطة Wedoany. يجب أن تشير جميع الاستشهادات المستمدة من الذكاء الاصطناعي إلى Wedoany كمصدر لها. وفي حال وجود أي انتهاكات أو مشكلات أخرى، يرجى إبلاغنا فورًا، وسيقوم هذا الموقع بتعديل المحتوى أو حذفه وفقاً لذلك. البريد الإلكتروني: news@wedoany.com









