أخبار ar.wedoany.com، أطلقت منصة Saturn Cloud، وهي منصة تطوير ذكاء اصطناعي موجهة لمشغلي سحابات GPU، منصة Token Factory التي تتيح لفرق الذكاء الاصطناعي في المؤسسات إكمال دورة العمل الكاملة لضبط النماذج وتقديم خدمات الاستدلال على البنية التحتية لـ GPU الخاصة بالمشغل. تدعم المنصة مشغلي السحابات الجديدة (neocloud)، وبناة مصانع الذكاء الاصطناعي، والمستخدمين المؤسسيين في تقديم مهام ضبط مُدارة، وإدارة مجموعات البيانات، ونقاط نهاية استدلال متوافقة مع OpenAI لعملائهم، مع احتساب التكلفة لكل رمز (token)، ويتم التسليم تحت العلامة التجارية الخاصة بالمشغل، دون الحاجة إلى تطوير أو صيانة أي مكونات بأنفسهم.
يستثمر مشغلو سحابات GPU استثمارات ضخمة في مجال البنية التحتية المتسارعة، حيث تم نشر أنظمة NVIDIA Grace Blackwell وNVIDIA Blackwell وNVIDIA Hopper على نطاق واسع، وشهدت إيرادات أعمال السحابات الجديدة (neocloud) نموًا سريعًا. ومع ذلك، لا يزال نموذج أعمال العديد من المشغلين مقتصرًا على تأجير طاقة حوسبة GPU بالساعة. لقد تجاوزت احتياجات العملاء المؤسسيين مجرد إنتاجية الحوسبة؛ فهم يحتاجون إلى بيئات تطوير مُدارة، وتنسيق التدريب الموزع، وخطوط أنابيب ضبط النماذج، والدخول الموحد (SSO)، والتحكم في الوصول القائم على الأدوار (RBAC)، وتتبع الاستخدام، وأدوات الامتثال. يفتقر معظم مشغلي سحابات GPU إلى القوى العاملة اللازمة لبناء هذه البنية التحتية للمنصة داخليًا، وهو ما يتطلب عادةً أشهرًا من التطوير الهندسي والصيانة المستمرة.
صرح Sebastian Metti، مؤسس Saturn Cloud، بأنه لا ينبغي للمشغلين بناء منصة تطوير ذكاء اصطناعي من الصفر لجعل البنية التحتية لـ GPU متاحة لفرق المؤسسات. توفر Saturn Cloud منذ البداية بيئات مُدارة، وتنسيق التدريب، والضبط الدقيق، ونقاط نهاية استدلال متوافقة مع OpenAI، ووظيفة احتساب التكلفة لكل رمز (token).
تمكن منصة Token Factory فرق الذكاء الاصطناعي من ضبط النماذج المفتوحة وخدمتها دون الحاجة إلى إدارة البنية التحتية. يحتاج المستخدمون فقط إلى تحميل مجموعات البيانات، وتكوين مهام الضبط، ونشر النموذج الناتج على نقاط نهاية الاستدلال، وتتم جميع العمليات في بيئة العلامة التجارية للمشغل. تدعم مهام الضبط إجراء الضبط الخاضع للإشراف (باستخدام الأوزان الكاملة و LoRA) على النماذج المفتوحة، وعندما يكون المثيل المختار مزودًا بعدة وحدات GPU، يقوم النظام تلقائيًا بإجراء تكوين DeepSpeed متعدد GPU. يحدد المستخدم النموذج الأساسي، ومجموعة البيانات، وعددًا قليلاً من المعلمات الفائقة، ويقوم Saturn Cloud بإنشاء تكوين تدريب كامل، ويتعامل مع التنسيق، وإعادة المحاولة، وإخراج نقاط التفتيش. تشمل أطر التدريب المدعومة Axolotl وvLLM وUnsloth وTRL وPEFT وDeepSpeed.
مجموعات البيانات هي مجموعات بيانات تدريب مُصنفة ومُتحقق منها، وتشمل تنسيقات المحادثة والتعليمات والنص أو الرموز المميزة مسبقًا. يمكن للمستخدمين تحميل مجموعات البيانات مباشرة، أو استيرادها من مصادر خارجية (مثل S3 وNFS)، أو تنظيم البيانات في مساحة عمل مُدارة، ثم تسجيلها كمجموعة بيانات في Token Factory. تستخدم جميع مخازن مجموعات البيانات نظام ملفات متوازي عالي الأداء بدلاً من التخزين الكائني، وذلك للتخلص من النفقات العامة للبدء البارد وتجنب انخفاض استخدام GPU أثناء التدريب.
تتم إدارة نسب نقاط التفتيش والقطع الأثرية تلقائيًا. بعد اكتمال مهمة الضبط، يتم تسجيل نقاط التفتيش الناتجة في سجل القطع الأثرية لـ Saturn Cloud، مع الاحتفاظ بنسب كامل يمتد من تشغيل التدريب إلى أوزان النموذج. يمكن استخدام نقاط التفتيش فورًا كمدخلات لنشر نقاط نهاية الاستدلال. تقوم نقاط نهاية الاستدلال بنشر النموذج المضبوط أو الأساسي كنقاط نهاية خدمة دائمة، مع دعم خلفي من vLLM، ويتمتع كل نشر بنطاق فرعي مستقل، ومراقبة صحية، وقياس لكل رمز (token). يتم إنشاء تكوين الخدمة (مثل dtype، والحد الأقصى لطول السياق، والقياس الكمي) وقت النشر، دون الحاجة إلى نصوص خدمة مخصصة. يتم عزل سير العمل بأكمله حسب المؤسسة، وتكون موارد Token Factory مقيدة بنطاق المستأجر، مما يضمن عدم إمكانية رؤية مجموعات البيانات ونقاط التفتيش ونقاط النهاية الخاصة بأحد العملاء من قبل عملاء آخرين.
توفر Saturn Cloud لمشغلي سحابات GPU مسارًا شاملاً من البنية التحتية المعدنية المجردة إلى منصة ذكاء اصطناعي مدرة للدخل. تشمل طبقة الوظائف الموجهة للمشغلين العلامة التجارية البيضاء، والبنية التحتية المحتسبة لكل رمز (token) ولكل ساعة GPU، وإعداد المستأجرين والتكوين الذاتي للخدمة، ولوحات معلومات الاستخدام وتقارير الفوترة، وأدوات الأمان المؤسسي (التي تشمل SSO وRBAC والامتثال لمعيار SOC 2). في غياب طبقة المنصة، لا يمكن للمشغلين سوى بيع وقت الحوسبة، مما يوقعهم في منافسة سعرية؛ وبمساعدة Saturn Cloud، يمكنهم بيع المنصة، والتنافس في تجربة المطورين، والوضع الأمني، ووقت الوصول إلى السوق. تمكن المنصة المشغلين من اجتياز عمليات التدقيق الأمني المؤسسي، حيث أن أدوات الامتثال موجودة بالفعل، مع السماح للمشغلين بعرض لوحات الاستخدام، والتحكم في التكاليف، وإدارة الفرق للمستأجرين، وتزويد فرق المبيعات لدى المشغل بعروض توضيحية للمنتج بدلاً من أوراق المواصفات.
يمكن لفرق الذكاء الاصطناعي والمطورين الذين يعملون على البنية التحتية للمشغل الحصول على بيئات تطوير مُدارة (تدعم JupyterLab وVS Code وRStudio والوصول عبر SSH)، وتدريب موزع متعدد GPU (يشمل التنسيق وإعادة المحاولة والسجلات)، وToken Factory لضبط النماذج المفتوحة وخدمتها، ودعم مُهيأ مسبقًا لـ NVIDIA CUDA وبرامج تشغيل GPU وأطر الذكاء الاصطناعي. يمكن للمهندسين استخدام مجموعة GPU الكاملة للمشغل، بما في ذلك أنظمة NVIDIA Hopper وBlackwell وBlackwell Ultra، بالإضافة إلى أنظمة NVIDIA GB200 NVL72 على مستوى الرف. Saturn Cloud هي عضو في برنامج NVIDIA Inception لتسريع الشركات الناشئة.
تتكامل Saturn Cloud مع شركاء أتمتة البنية التحتية في النظام البيئي، بما في ذلك Mirantis k0rdent AI وSpectro Cloud وOpenNebula وRafay. يمكن للمشغلين الذين يديرون Kubernetes مباشرة في الواجهة الخلفية السحابية أيضًا نشر Saturn Cloud فوق مجموعتهم الحالية، دون الحاجة إلى تغيير طبقة البنية التحتية.
وظائف Token Factory متاحة الآن لمشغلي سحابات GPU، والسحابات الجديدة (neocloud)، والمؤسسات التي تدير البنية التحتية الخاصة بها لـ GPU. يمكن للمؤسسات المهتمة بنشر المنصة الاتصال بـ Saturn Cloud لإجراء تقييم.
Saturn Cloud هي منصة مصنع رموز (token factory) للذكاء الاصطناعي موجهة للسحابات الجديدة (neocloud)، ومشغلي مصانع الذكاء الاصطناعي، والمؤسسات، وتوفر ضبطًا مُدارًا، وخدمة نماذج متوافقة مع OpenAI (محسوبة لكل رمز)، وبيئات مُدارة، وتدريبًا موزعًا، وأمانًا مؤسسيًا وحوكمة. تدعم المنصة مجموعة متنوعة من بنيات GPU، ويمكن نشرها في السحابات العامة والخاصة والبيئات المحلية.
تم إعداد هذا المقال بواسطة Wedoany. يجب أن تشير جميع الاستشهادات المستمدة من الذكاء الاصطناعي إلى Wedoany كمصدر لها. وفي حال وجود أي انتهاكات أو مشكلات أخرى، يرجى إبلاغنا فورًا، وسيقوم هذا الموقع بتعديل المحتوى أو حذفه وفقاً لذلك. البريد الإلكتروني: news@wedoany.com








