أخبار ar.wedoany.com، أطلقت شركة الذكاء الاصطناعي Liquid AI، المنبثقة عن معهد ماساتشوستس للتكنولوجيا، مؤخرًا نموذجًا جديدًا باسم LFM2.5-8B-A1B. يبلغ إجمالي عدد معلمات هذا النموذج 8 مليارات، لكنه ينشط فقط 1.5 مليار معلمة في كل عملية استدلال، مما يعني أن القوة الحاسوبية المستخدمة فعليًا لا تتجاوز خمس إجمالي المعلمات. صُمم هذا النموذج خصيصًا لسيناريوهات الحواف مثل الهواتف المحمولة وأجهزة الكمبيوتر الشخصية والروبوتات والخوادم خفيفة الوزن، ولا يشارك في منافسة النماذج الضخمة السحابية.
على مدار العامين الماضيين، اعتمدت الصناعة بشكل عام أساليب مثل التكميم والتقليم والتقطير لتشغيل النماذج الكبيرة على أجهزة إنترنت الأشياء، وذلك بضغط النماذج الكبيرة المصممة أصلاً للسحابة ونشرها على أجهزة الحواف. اتبعت Liquid AI مسارًا تقنيًا مختلفًا، حيث يتمثل نهجها في تغيير "طريقة تغذية" النموذج، مما يجعله يستهلك موارد أقل عند معالجة المهام البسيطة، ولا يستدعي قوة حاسوبية أكبر إلا عند مواجهة المهام المعقدة. على وجه التحديد، ترتبط الطاقة التي يستهلكها النموذج في كل استدلال ارتباطًا مباشرًا بدرجة صعوبة مهمة الإدخال، ويتم تحقيق ذلك من خلال آلية التنشيط المتناثر لنموذج الخبراء المختلط (MoE): فعند مواجهة مهمة إدخال معينة، يقوم النظام فقط بتنبيه وحدات الخبراء الأكثر صلة، بينما تظل الأجزاء المتبقية في حالة سكون.
على جانب الحواف، يتحول القيد الأساسي للذكاء من تكلفة القوة الحاسوبية إلى تكلفة استهلاك الطاقة. إن الطاقة (بالجول) التي تستهلكها رقاقة مدمجة واحدة لإكمال كل استدلال هي محدودة وثابتة. على الرغم من أن طرق التكميم والتقليم والتقطير يمكن أن تقلل من حجم النموذج، إلا أنها لا تغير نمط اجتياز النموذج لجميع المعلمات في كل استدلال، مما يجعل من الصعب استدامتها في ظل قيود البطارية الصارمة. يكمن المسار التقني لشركة Liquid AI في جعل القوة الحاسوبية المستهلكة تتغير ديناميكيًا وفقًا لدرجة صعوبة مهمة الإدخال، أي تحقيق "الحوسبة التكيفية مع المدخلات". ينبع هذا النهج من دراسة دودة Caenorhabditis elegans، التي لا تمتلك سوى 302 خلية عصبية في جسمها بالكامل، لكن ذكاءها يعتمد على التغير الديناميكي في قوة الوصلات المشبكية بين الخلايا العصبية، وليس على تكديس العدد.
يحتفظ نموذج LFM2.5 بالمشغلات الأساسية عالية الكفاءة، بينما يضيف إليها آلية التنشيط المتناثر لـ MoE. يكمن المنطق الأساسي وراء إجمالي 8 مليارات معلمة وتفعيل حوالي 1.5 مليار فقط لكل استدلال في هذا. تطور المسار التقني لشركة Liquid AI من الشبكات الديناميكية الزمنية المستمرة المبكرة إلى بنية التنشيط المتناثر الحالية، ويظل الجوهر المشترك هو جعل كمية الحوسبة تتغير مع المدخلات. بالإضافة إلى ذلك، يركز هذا التيار التقني أيضًا على متانة النموذج بعد النشر. على عكس النماذج الثابتة، تقوم الشبكات العصبية السائلة بالنمذجة من خلال معادلات الزمن المستمر وثوابت زمنية تكيفية، مما يسمح لحالتها الداخلية بأن "تتدفق" وتتكيف في الوقت الفعلي وفقًا لإيقاع إشارة الإدخال. أظهرت عروض توضيحية متعددة من مختبر علوم الكمبيوتر والذكاء الاصطناعي في معهد ماساتشوستس للتكنولوجيا (MIT CSAIL) أن العوامل الذكية التي تقودها هذه الشبكات لا تزال قادرة على التنقل بثبات في البيئات غير المألوفة، والتعامل مع الانجراف البيئي. مقارنة بأساليب الاعتماد على التحديث عن بُعد (OTA) لدفع نماذج جديدة، فإن هذه البنية التي تمتلك متانة أصيلة يمكنها الدفاع ضد الاضطرابات غير المعروفة التي لم تظهر بعد.
في عصر الذكاء على جانب الطرفية، تنتقل القيمة الصناعية من طرفي النموذج والرقاقة إلى طبقة التنسيق بينهما. تم تحسين نموذج LFM الذي أطلقته Liquid AI من حيث التوافق مع الأجهزة منذ بداية تصميم بنيته، وتدعي الشركة رسميًا أنه يمكن تشغيله بسلاسة على وحدات معالجة الرسومات (GPU) أو وحدات المعالجة المركزية (CPU) أو وحدات المعالجة العصبية (NPU)، ليشمل أجهزة غير متجانسة مثل الأجهزة القابلة للارتداء والروبوتات والهواتف المحمولة وأجهزة الكمبيوتر الشخصية والسيارات. أبرمت الشركة شراكة مع AMD في يناير من هذا العام، واستغرقت أسبوعين فقط لتخصيص ونشر نموذج بحجم 2.6 مليار معلمة محليًا على معالج Ryzen AI الخاص بالأخيرة. تكمن القدرة الأساسية وراء هذه الكفاءة في القدرة الهندسية على الاقتراب بسرعة من أفضل مجموعة مشغلات وأقل استخدام للذاكرة في ظل قيود الأجهزة القصوى.
تم إعداد هذا المقال بواسطة Wedoany. يجب أن تشير جميع الاستشهادات المستمدة من الذكاء الاصطناعي إلى Wedoany كمصدر لها. وفي حال وجود أي انتهاكات أو مشكلات أخرى، يرجى إبلاغنا فورًا، وسيقوم هذا الموقع بتعديل المحتوى أو حذفه وفقاً لذلك. البريد الإلكتروني: news@wedoany.com









