أخبار ar.wedoany.com، أطلقت شركة "أنثروبيك" (Anthropic) نموذج "كلود سونيت 5" (Claude Sonnet 5)، الذي يقدم أداءً يقترب من النماذج الرائدة بسعر متوسط، بهدف جذب مطوري المؤسسات المهتمين بالتكلفة. وتسارع الشركة خطاها نحو طرح عام أولي، وسيساعد هذا النموذج في اختبار ما إذا كانت التقييمات المرتفعة في السوق الخاص قادرة على الصمود أمام تدقيق السوق العام. وتصفه "أنثروبيك" بأنه "أكثر نماذج سونيت قدرةً كوكيل حتى الآن"، وسيكون النموذج الافتراضي لمستخدمي الباقات المجانية والمحترفة (Free وPro)، كما يمكن لعملاء باقات ماكس (Max) والفريق (Team) والمؤسسات (Enterprise) استخدامه. ويبلغ سعر الدخول عبر واجهة برمجة التطبيقات (API) مليون رمز (token) للإدخال مقابل 2 دولار، ومليون رمز للإخراج مقابل 10 دولارات، ويستمر هذا السعر حتى 31 أغسطس؛ وبعد ذلك يرتفع إلى 3 دولارات و15 دولارًا على التوالي، وهو ما يظل أقل بكثير من تسعير النموذج الرائد لـ"أنثروبيك" "أوبوس 4.8" (Opus 4.8) البالغ 5 دولارات للإدخال و25 دولارًا للإخراج.
يحقق "سونيت 5" تحسنًا ملحوظًا في كل تقييم كشفت عنه "أنثروبيك" مقارنةً بسابقه "سونيت 4.6" (Sonnet 4.6). ففي اختبار البرمجة الوكيلة المعياري "SWE-bench Pro"، حصل "سونيت 5" على 63.2%، بينما حصل "سونيت 4.6" على 58.1%، مقتربًا من نسبة "أوبوس 4.8" البالغة 69.2%. وفي تقييم البرمجة "Terminal-Bench 2.1"، سجل "سونيت 5" 80.4%، و"سونيت 4.6" 67.0%، و"أوبوس 4.8" 82.7%. وفي مجال الاستدلال متعدد التخصصات، والذي يُقاس بـ"الاختبار النهائي للبشر" (Humanity's Last Exam)، حصل "سونيت 5" على 43.2% دون استخدام أدوات، و57.4% باستخدام الأدوات، وهو ما يعادل تقريبًا نتيجة "أوبوس 4.8" البالغة 57.9%. وفي مهام استخدام الحاسوب التي تم تقييمها عبر "OSWorld-Verified"، وصل "سونيت 5" إلى 81.2%، مرتفعًا من 78.5% سابقًا. وفي اختبار العمل المعرفي المعياري "GDPval-AA v2"، سجل 1,618 نقطة، متجاوزًا "أوبوس 4.8" الذي حصل على 1,615 نقطة و"سونيت 4.6" الذي حصل على 1,395 نقطة.

تُظهر بيانات التقييم هذه أن "سونيت 5" قفز إلى مستوى أداء يتداخل بشكل أساسي مع النموذج الرائد لـ"أنثروبيك"، بتكلفة أقل بنحو 60% لكل رمز (token) وفقًا للتسعير القياسي. ويعكس التركيز على القدرات الوكيلة تحول مركز الثقل في صناعة الذكاء الاصطناعي نحو الأنظمة التي تنفذ سير العمل متعدد الخطوات بشكل مستقل. ويقول سواليه عاصف (Sualeh Asif)، المؤسس المشارك لشركة "كيرسر" (Cursor)، الشريك في الوصول المبكر، إن النموذج يلتزم بالخطة وينفذ تغييرات نظيفة متعددة الخطوات، كما أنه فعال من حيث التكلفة. ويصف دانيال شيبرد (Daniel Shepard)، المهندس الأول في شركة "زابير" (Zapier)، أنه عند اختبار مهمة أتمتة من جزأين، تمكن النموذج من إكمال مهمة كانت ستتوقف "في منتصف الطريق" سابقًا.

يستخدم "سونيت 5" محللاً معجمياً (tokenizer) محدّثاً، مشابهاً للتغييرات التي أدخلها "أوبوس 4.7"، مما يغير طريقة معالجة النموذج للنصوص. قد يُترجم نفس الإدخال إلى ما يقرب من 1.0 إلى 1.35 ضعف عدد الرموز (tokens) اعتمادًا على نوع المحتوى. وتوضح "أنثروبيك" أن تسعير الدخول تمت معايرته لجعل عملية الانتقال "محايدة التكلفة تقريبًا"، لكن على عملاء المؤسسات الذين يشغلون مهامًا عالية الحجم تقييم حالات الاستخدام المحددة بعناية. يُظهر الإفصاح الأمني لـ"أنثروبيك" أن معدلات الهلوسة والتملق في "سونيت 5" أقل من "سونيت 4.6"، كما أنه أفضل في رفض الطلبات الضارة، وأكثر مقاومة لهجمات حقن التعليمات (prompt injection) في البيئات الوكيلة. في عمليات تدقيق السلوك الآلي، سجل "سونيت 5" درجة إجمالية أقل من "سونيت 4.6". ومع ذلك، مقارنةً بـ"أوبوس 4.8" الأكثر قدرة ونموذج "كلود ميثوس بريفيو" (Claude Mythos Preview)، أظهر "سونيت 5" "معدلًا أعلى قليلاً من السلوك غير المتوازن". في تقييم استغلال الثغرات في متصفح "فايرفوكس 147" (Firefox 147)، فشل نموذجا "سونيت" في تطوير استغلال فعال، وحصل كلاهما على 0.0%، لكن نسبة النجاح الجزئي لـ"سونيت 5" بلغت 13.2%، مقارنة بـ8.8% لـ"سونيت 4.6"، وكلاهما لا يزال أقل بكثير من نسبة "أوبوس 4.8" البالغة 68.8% و"ميثوس 5" البالغة 88.4%. وقد فعّلت "أنثروبيك" في "سونيت 5" الحماية الإلكترونية بشكل افتراضي، وهذه الحماية مماثلة لتلك الموجودة في "أوبوس 4.7" و"4.8"، لكنها أقل تقييدًا من "فيبل 5" (Fable 5). وتحصل المؤسسات المنضمة إلى برنامج التحقق الإلكتروني تلقائيًا على نفس الصلاحيات.

يأتي إطلاق "سونيت 5" في وقت حاسم لشركة "أنثروبيك"، حيث قدمت الشركة سرًا نشرة الاكتتاب العام الأولي إلى هيئة الأوراق المالية والبورصات الأمريكية في أوائل يونيو، ووصفتها شبكة CNBC بأنها "الأكثر ترقبًا في تاريخ التكنولوجيا". ووفقًا لصحيفة "الغارديان"، جمعت "أنثروبيك" في فبراير 30 مليار دولار بتقييم 380 مليار دولار، بإيرادات سنوية تبلغ 14 مليار دولار و"تنمو بأكثر من عشرة أضعاف سنويًا خلال السنوات الثلاث الماضية". وفي نهاية مايو، أكملت "أنثروبيك" جولة تمويل من الفئة H بقيمة 65 مليار دولار بقيادة مشتركة من "ألتيمايت كابيتال" (Altimeter Capital) و"سيكويا كابيتال" (Sequoia Capital) وغيرها، بتقييم بعد الاستثمار بلغ 965 مليار دولار، ومعدل إيرادات تشغيلية يتجاوز 47 مليار دولار. ويقول المحلل في "بيتش بوك" (PitchBook)، هاريسون رولفس (Harrison Rolfes)، لشبكة CNBC إن الرقم الرئيسي هو هامش الربح الإجمالي، الذي لم يره المراقبون الخارجيون بعد. في هذا السياق، يهدف "سونيت 5" إلى تعزيز القدرات بسعر تنافسي، لإظهار قدرة الشركة على تقديم منتج جذاب عبر مستويات الأسعار، ودفع التبني الواسع. وأعلن حاكم ولاية كاليفورنيا، جافين نيوسوم (Gavin Newsom)، عن توفير "كلود" لجميع الوكالات الحكومية في الولاية بخصم 50%، مع تقديم تدريب مجاني للقوى العاملة، ووصفت كيت جنسن (Kate Jensen)، مديرة شؤون الأمريكتين في "أنثروبيك"، هذه الخطوة بأنها "لجعل كلود في خدمة الأشخاص الذين يديرون كاليفورنيا".

تتواجد "أنثروبيك" في مجال يزداد ازدحامًا. فشركة "أوبن إيه آي" (OpenAI) (التي جمعت 122 مليار دولار بتقييم 852 مليار دولار في مارس) تسعى أيضًا إلى طرح عام أولي؛ وشركة "سبيس إكس" (SpaceX) التابعة لإيلون ماسك (Elon Musk) بعد اندماجها مع "إكس إيه آي" (xAI) تسعّر طرحها العام الأولي بسهم قدره 135 دولارًا، بتقييم 1.77 تريليون دولار؛ كما تتنافس كل من "جوجل" (Google) و"ميتا" (Meta) والشركات الناشئة الآسيوية في مجال الذكاء الاصطناعي على نفس سوق المؤسسات. ويقول جيل لوريا (Gil Luria)، رئيس قسم أبحاث التكنولوجيا في "دي إيه ديفيدسون" (D.A. Davidson)، لشبكة CNBC، إنه على الرغم من أن "أنثروبيك" "يبدو أنها في موقع الريادة" بين نماذج الذكاء الاصطناعي المتطورة، إلا أن "معظم استخداماتها الحالية هي للتجارب والاختبارات، وقد لا يكون ذلك مستدامًا". يقدم "سونيت 5" أداءً قريبًا من "أوبوس" بسعر "سونيت"، مستهدفًا بشكل مباشر تحويل الاستخدام التجريبي إلى إيرادات إنتاجية. ثلاثة عوامل ستحدد أهميته: موثوقية الوكيل في العالم الحقيقي، واقتصاديات المحلل المعجمي (tokenizer)، وسردية الاكتتاب العام نفسها. عندما يُنشر ملف S-1، سيدقق المستثمرون في أي مستوى من الخدمة يقود الجزء الأكبر من الإيرادات والأرباح الإجمالية. ويشير المحلل في "بيتش بوك"، رولفس، لشبكة CNBC إلى أن نافذة الاكتتاب العام لعام 2026 "إما أن تصبح أهم دورة اكتتاب عام منذ عصر الإنترنت، أو أغلى درس في التاريخ بين السردية والأساسيات في الأسواق العامة".









