أخبار ar.wedoany.com، أعلنت شركة Mirantis، المزودة لمنصات البنية التحتية السحابية الأصلية، رسمياً في 14 مايو في كامبل بولاية كاليفورنيا، عن إضافة ثلاث وظائف أساسية لمنصتها للذكاء الاصطناعي k0rdent، وهي: سجل النماذج، وشبكة الاستدلال، وبيئة تشغيل الاستدلال. وتقوم هذه الإضافة، ولأول مرة، بدمج التوزيع الآمن لنماذج الذكاء الاصطناعي، وتنفيذ سياسات الحوكمة، وتوجيه أحمال الاستدلال، والاستخدام عالي الكفاءة لموارد GPU في مستوى تشغيلي موحد يغطي المراحل من التطوير إلى الإنتاج. ويأتي هذا الإطلاق استجابة مباشرة للتحدي المتمثل في التجزؤ الذي يواجهه مشغلو سحابات GPU وفرق منصات الذكاء الاصطناعي في المؤسسات عند نقل أحمال عمل الذكاء الاصطناعي من مرحلة التجارب إلى بيئة الإنتاج.
وقد حدد كيفن كامل، نائب رئيس تطوير المنتجات في Mirantis، جوهر المشكلة في الإعلان الرسمي قائلاً: "مع انتقال المؤسسات بمشاريع الذكاء الاصطناعي من المرحلة التجريبية إلى بيئات الإنتاج، تواجه فرق البنية التحتية بشكل متزايد تحديات تشغيلية وحوكمة تتعلق بتوزيع النماذج، ووضوح رؤية الاستدلال، وفرض الامتثال، وجدوى GPU الاقتصادية. وتضطر المؤسسات ومشغلو GPU إلى تجميع سير عمل هش وأدوات متفرقة لتشغيل الذكاء الاصطناعي." وأكد كذلك على وجود فرق جوهري بين نماذج الذكاء الاصطناعي والحاويات، حيث أن للنماذج متطلبات فريدة تتعلق بالحوكمة والسيادة والامتثال ودورة الحياة، ولا يمكن ببساطة تطبيق نموذج التشغيل المتمحور حول الحاويات الذي ساد في عصر السحابة الأصلية.
تم تحسين سجل نماذج k0rdent AI خصيصاً لسير عمل تخزين وتوزيع نماذج اللغات الكبيرة ومشتقاتها. ويوفر هذا المكون سجلاً أصلياً آمناً ومتوافقاً مع معايير مبادرة الحاويات المفتوحة (OCI)، ويمكنه إدارة نماذج اللغات الكبيرة الأساسية، والإصدارات المعدلة بدقة، والبنى المُكمَّمة، ومنتجات الذكاء الاصطناعي ذات الصلة، عبر بيئات البنية التحتية الموزعة، مما يقلل بشكل مباشر من التعقيد التشغيلي ومخاطر سلسلة التوريد أثناء عملية توزيع نماذج الذكاء الاصطناعي الآمنة. ويتم تضمين إدارة إصدارات النماذج وتتبع المصدر والتحكم في الصلاحيات داخل السجل، مما يمكّن المؤسسات من تطبيق عمليات CI/CD متسقة على نماذج الذكاء الاصطناعي تماماً كما تفعل مع صور الحاويات.
أما شبكة الاستدلال k0rdent AI Inference Mesh فتتولى مسؤولية توجيه وحوكمة أحمال الاستدلال عبر المجموعات العنقودية. ويقوم هذا المكون بالتوجيه الذكي لطلبات الاستدلال، والتحكم في الوصول، وقياس الاستخدام عبر موارد الحوسبة الموحدة، مما يحول منطق البروكسي العكسي، وموازنة الأحمال، وبوابات API التي كانت تُعدّ يدوياً من قبل فرق مختلفة إلى طبقة موحدة قائمة على السياسات. ويمكن للمؤسسات من خلال ذلك تحويل البنية التحتية الخام لوحدات GPU إلى منصة استدلال ذكاء اصطناعي مُحوكمة، مع الحصول في الوقت نفسه على رؤية مركزية لحجم استدعاءات النماذج، وتوزيع زمن الاستجابة، والتكلفة المستهلكة. وبالنسبة للمشغلين الذين يديرون مجموعات GPU متعددة أو يستخدمون مزيجاً من مراكز البيانات الخاصة وحالات GPU السحابية العامة، توفر شبكة الاستدلال نقطة تحكم موحدة عبر البيئات المختلفة.
وتركز بيئة تشغيل الاستدلال k0rdent AI Inference Runtime، التي صدرت بالتزامن مع شبكة الاستدلال، على كفاءة تنفيذ أحمال عمل الاستدلال. وقد صُممت بيئة التشغيل هذه بهدف تعظيم عدد الرموز المُولَّدة في الثانية لكل وحدة GPU، وذلك من خلال تكميم النماذج، وتحسين المعالجة على دفعات، والجدولة الديناميكية للموارد، مما يعزز الاستفادة من البنية التحتية لوحدات GPU. وفي ظل بيئة السوق التي تتسم باستمرار شح المعروض من وحدات GPU وارتفاع تكاليف القدرة الحاسوبية، يمكن أن يترجم التحسن الهامشي في كفاءة الاستدلال مباشرة إلى انخفاض كبير في التكاليف التشغيلية، وهو مطلب ملح بشكل خاص في سوق البنية التحتية للذكاء الاصطناعي الحالي.
ولا تمثل المكونات الثلاثة التي أطلقتها Mirantis منتجات مستقلة، بل هي توسعة لطبقات وظيفية في منصة k0rdent AI. وتتموضع k0rdent نفسها كمنصة لإدارة البنية التحتية السحابية الأصلية لعصر الذكاء الاصطناعي، وتدعم التنسيق الموحد عبر بيئات الأجهزة المجردة، والآلات الافتراضية، والحاويات، كما تتوافق في الطبقة الأساسية مع مسرعات متنوعة مثل NVIDIA GPU و AMD GPU. وتسعى Mirantis من خلال هذه المنصة إلى توسيع نطاق قدراتها في إدارة البنى التحتية على مستوى المؤسسات، والتي راكمتها في مجالي OpenStack و Kubernetes، لتشمل دورة حياة أحمال عمل الذكاء الاصطناعي بأكملها.
يقع المقر الرئيسي لشركة Mirantis في كامبل بولاية كاليفورنيا الأمريكية، وقد تأسست عام 1999، وكانت سابقاً شركة بنية تحتية سحابية اشتهرت بصيانتها طويلة الأمد لمنصة OpenStack، وتحول تركيز أعمالها حالياً إلى توفير حلول البنية التحتية السحابية الأصلية لأحمال عمل AI/ML. وكان الإصدار MOSK 26.1 الذي أطلقته الشركة في أبريل الماضي قد أضاف مساعد ذكاء اصطناعي لمنصة OpenStack، مستخدماً الوثائق التقنية وقاعدة المعرفة لتوفير إرشادات تشغيلية آلية لأحمال العمل عالية الأداء والذكاء الاصطناعي. ويُظهر مسار تحول Mirantis من OpenStack إلى k0rdent AI نية استراتيجية واضحة: الدمج العميق لقدرات إدارة البنية التحتية السحابية التقليدية مع سلسلة أدوات الذكاء الاصطناعي الأصلية، لتثبيت مكانتها في ظل دورة التوسع السريع لسوق البنية التحتية للذكاء الاصطناعي.
يدخل سوق أدوات حوكمة واستدلال الذكاء الاصطناعي مرحلة اندماج متسارعة. فلم تعد المؤسسات تكتفي بالحصول على قدرة GPU الحاسوبية بشكل منعزل، بل تطالب بدعم منصاتي متكامل يغطي كامل السلسلة بدءاً من تخزين النماذج، والتوزيع الآمن، وحوكمة الامتثال، وصولاً إلى نشر الاستدلال وإدارة التكاليف. وتعمل كل من حزمة NVIDIA AI Enterprise، و Vertex AI من جوجل، و SageMaker من AWS على دفع تكامل مماثل على مستويات مختلفة. وتختار Mirantis أن تكون نقطة انطلاقها من طبقة البنية التحتية، ممتدة لأعلى نحو حوكمة النماذج وإدارة الاستدلال، في محاولة لإيجاد موقع متمايز بين مزودي الخدمات السحابية ومنصات الذكاء الاصطناعي. ومع قيام المزيد من المؤسسات بتضمين الذكاء الاصطناعي التوليدي في صميم عملياتها التجارية، ستصبح امتثالية حوكمة النماذج، وقابلية مراقبة مسار الاستدلال، والجدوى الاقتصادية لموارد GPU المؤشرات الأساسية الثلاثة التي تحدد تنافسية المنصات.
تم إعداد هذا المقال بواسطة Wedoany. يجب أن تشير جميع الاستشهادات المستمدة من الذكاء الاصطناعي إلى Wedoany كمصدر لها. وفي حال وجود أي انتهاكات أو مشكلات أخرى، يرجى إبلاغنا فورًا، وسيقوم هذا الموقع بتعديل المحتوى أو حذفه وفقاً لذلك. البريد الإلكتروني: news@wedoany.com










