أخبار ar.wedoany.com، أطلقت شركة مايكروسوفت خلال مؤتمرها السنوي "بيلد 2026" (Build 2026) عدة نماذج ذكاء اصطناعي مطورة داخلياً، تغطي مجالات الاستدلال، وتوليد الصور، ونسخ الصوت، وتحويل النص إلى كلام. ويمكن للمستخدمين تجربتها مجاناً عبر موقع "بلاي غراوند" (Playground) التابع للشركة. وأظهرت الاختبارات أن أداء هذه النماذج مقبول بشكل عام، لكنها لم تتفوق على المنتجات المنافسة الحالية في مجالاتها.

تعتمد سلسلة نماذج "MAI" (Microsoft AI) على نموذج لغوي كبير (LLM) داخلي، وهي تختلف عن روبوت الدردشة "كوبايلوت" (Copilot) الذي يعمل بتقنية "أوبن إيه آي" (OpenAI). تشمل النماذج المُعلن عنها: نموذج الاستدلال "MAI-Thinking-1"، ونموذج توليد الصور "MAI-Image-2.5" ونسخته السريعة "2.5 Flash"، ونموذج نسخ الصوت "MAI-Transcribe-1.5"، ونموذج تحويل النص إلى كلام "MAI-Voice-2" ونسخته السريعة "2 Flash". وتصف مايكروسوفت هذه النماذج بأنها "تجريبية" وفي مرحلة "معاينة محدودة". ويتوفر نموذج "MAI-Thinking-1" حالياً لمجموعة محددة من المستخدمين فقط كوصول مبكر.
تمت مقارنة نموذج "MAI-Thinking-1"، وهو أول نموذج استدلال لمايكروسوفت، مع نموذج "كلود سونيت" (Claude Sonnet) من شركة "أنثروبيك" (Anthropic) في معالجة الاستفسارات المعقدة. وأظهرت الاختبارات أن نموذج مايكروسوفت لا يستطيع الوصول إلى الإنترنت، ولم يُظهر تحسناً ملحوظاً مقارنة بـ"سونيت" من حيث دقة الإجابات أو جودة الاستجابة أو سرعتها عند الإجابة عن أسئلة تتعلق بآليات لعبة "باث أوف إكسايل 2" (Path of Exile 2) وبناء هيكل قاعدة البيانات.
أظهر نموذج "MAI-Image-2.5" تقدماً ملحوظاً مقارنة بالإصدار الأول من أكتوبر 2025، لكنه لا يزال أقل جودة من نموذج "نانو بانا برو" (Nano Banana Pro) من "جيميناي" (Gemini) من حيث وضوح الصورة ودقة عرض النصوص. ففي الاختبارات، ظهرت تشوهات في النصوص داخل الرسوم الهزلية والمخططات التي أنشأها "MAI-Image-2.5"، بينما لم تظهر هذه المشكلة في نموذج "نانو بانا برو".
سجل نموذج "MAI-Transcribe-1.5" 13 خطأ في اختبارات النسخ، بينما سجل نموذج "جيميناي" 6 أخطاء فقط في نفس السيناريو. وفي اختبار تحليل كلمات أغنية صعبة، أخطأ كلا النموذجين، لكن نموذج "MAI-Transcribe-1.5" قام بقطع النسخ قبل انتهاء الأغنية. ولم تقم شركة "غوغل" (Google) بالترويج لنموذج "جيميناي" كأداة نسخ متخصصة.

يوفر نموذج "MAI-Voice-2" خيارات متعددة للغات والأنماط، لكن في الاختبارات، أدى مزيج جودة الصوت، وأصوات التنفس، والإيقاع، ونبرة الصوت إلى جعل الصوت يبدو غير بشري بشكل واضح، وهو بعيد كل البعد عن مستوى الواقعية الذي توفره تقنيات الصوت مثل "سيسامي" (Sesame). يدعم النموذج حالياً تخصيص الصوت عبر أنماط مختلفة متعددة.

تُظهر الاختبارات الأولية من منظور المستهلك أن التقييم العام لنماذج "MAI" من مايكروسوفت هو "مقبول"، على غرار أداء "كوبايلوت". وتعتمد قدرتها التنافسية بشكل أكبر على مجموعة الوظائف الواسعة والتكامل مع نظام مايكروسوفت البيئي، وليس على التفوق المطلق للنموذج الأساسي نفسه. ومع ذلك، واستناداً إلى سرعة التحسن التي أظهرتها سلسلة نماذج "MAI-Image" خلال الأشهر الماضية، ستواصل مايكروسوفت اختبار هذه النماذج.
تم إعداد هذا المقال بواسطة Wedoany. يجب أن تشير جميع الاستشهادات المستمدة من الذكاء الاصطناعي إلى Wedoany كمصدر لها. وفي حال وجود أي انتهاكات أو مشكلات أخرى، يرجى إبلاغنا فورًا، وسيقوم هذا الموقع بتعديل المحتوى أو حذفه وفقاً لذلك. البريد الإلكتروني: news@wedoany.com









