أخبار ar.wedoany.com، في الفترة من 2 إلى 3 يونيو، أصدرت شركة مايكروسوفت الأمريكية تحديثًا لواجهات برمجة تطبيقات الذكاء الاصطناعي لنظام ويندوز (Windows AI APIs) خلال فعاليات مؤتمر Build 2026، حيث أضافت واجهة برمجة تطبيقات جديدة للتعرف على الصوت تعمل على الأجهزة الطرفية، كما أطلقت نموذجين صغيرين للغة (SLMs) مصممين للتشغيل المحلي، وهما Aion 1.0 Instruct وAion 1.0 Plan. تستهدف هذه الإمكانيات الجديدة بشكل أساسي مطوري نظام ويندوز 11، لتمكين تحويل الصوت إلى نص، ومعالجة النصوص الذكية، وتنفيذ المهام الوكيلة المحلية على أجهزة الكمبيوتر الشخصية.
يعمل هذا التحديث على تعزيز قدرات معالجة اللغة على الأجهزة الطرفية. تدعم واجهة برمجة التطبيقات الجديدة للتعرف على الصوت إنشاء نصوص فورية أو مجمعة من الميكروفون، وتدفقات الصوت، وملفات الصوت، ويمكن استخدامها في إنشاء التسميات التوضيحية، والإملاء الصوتي، وتطبيقات الصوت والفيديو، وأدوات الوصول الشامل. تؤكد مايكروسوفت أن هذه الإمكانية، عند تشغيلها محليًا، يمكنها إنشاء نصوص حتى في حالة عدم وجود اتصال بالإنترنت، مما يقلل الاعتماد على المعالجة السحابية. بالنسبة لبرامج المؤسسات، وأدوات الاجتماعات، وتسجيل البيانات في المواقع الصناعية، والعمليات عن بُعد، وأنظمة التدريب والتعليم، تكمن قيمة التعرف على الصوت على الأجهزة الطرفية في تقليل زمن الاستجابة، وخفض تكاليف الاستدعاء السحابي، مع السماح بمعالجة جزء من بيانات الصوت الحساسة محليًا على الجهاز قدر الإمكان. مع دخول الذكاء الاصطناعي إلى المزيد من الأجهزة الطرفية المكتبية والصناعية، يتحول التعرف على الصوت من وحدة وظيفية منفصلة إلى قدرة أساسية على مستوى نظام التشغيل.
يُصنف نموذج Aion 1.0 Instruct كنموذج لغة صغير موجه لأعباء العمل على الأجهزة الطرفية، ويدعم مهام النصوص الذكية مثل التلخيص، وإعادة الصياغة، وفهم النوايا، والمهام المتعلقة بالوصول الشامل.
أما نموذج Aion 1.0 Plan فهو موجه لسيناريوهات الاستدلال الوكيل المحلي، بحجم 14 مليار معلمة، ويدعم سياقًا يصل طوله إلى 32 ألف رمز، وقدرات استدعاء الأدوات، مما يساعد التطبيقات على فهم نية المستخدم، واستدعاء الأدوات، وإدارة الملفات، وتنسيق الوكلاء الفرعيين. تخطط مايكروسوفت لتشغيل هذا النموذج كجزء من نظام ويندوز على الأجهزة المؤهلة، مما يتيح نقل بعض العمليات الوكيلة من السحابة إلى الأجهزة المحلية. بالنسبة للمطورين، وهذا يعني أن تطبيقات سطح المكتب ستتمكن في المستقبل من استدعاء قدرات فهم النصوص، والتعرف على الصوت، وتنسيق الأدوات مباشرة من طبقة نظام التشغيل، دون الحاجة إلى دمج خدمات نماذج خارجية بشكل منفصل لكل تطبيق. بالنسبة لأقسام تكنولوجيا المعلومات في المؤسسات، تطرح النماذج المحلية أيضًا قضايا حوكمة جديدة، تشمل صلاحيات النموذج، وحدود الوصول إلى الملفات، وتحديد هوية المستخدم، والاحتفاظ بالبيانات، وأداء الجهاز، والتدقيق عبر التطبيقات. يعتمد إمكانية دخول هذه النماذج إلى بيئات المؤسسات على نطاق واسع في المستقبل على مدى التطور المتزامن لقدرات الذكاء الاصطناعي المحلية وآليات الإدارة الأمنية.
أعلنت مايكروسوفت أيضًا أن واجهات برمجة تطبيقات الذكاء الاصطناعي لنظام ويندوز (Windows AI APIs) ستتوسع لتشمل المزيد من أجهزة الكمبيوتر التي تعمل بنظام ويندوز 11، حيث ستدعم بعض الإمكانيات، بالإضافة إلى معالجات NPU، وحدات المعالجة المركزية CPU ووحدات معالجة الرسومات GPU أيضًا. ستكون واجهة برمجة تطبيقات التعرف على الصوت باللغة الإنجليزية في البداية، على أن تتوسع تدريجيًا لتشمل المزيد من الأسواق العالمية. مع دمج النماذج المحلية، والتعرف على الصوت، والقدرات الوكيلة المحلية في النظام البيئي لتطوير ويندوز، تنتقل تقنيات معالجة اللغة من كونها واجهات خدمة سحابية إلى طبقة نظام تشغيل طرفية، لتصبح مكونًا أساسيًا مهمًا لتطوير التطبيقات، والتفاعل الشامل، وسير العمل الذكي في المؤسسات.
تم إعداد هذا المقال بواسطة Wedoany. يجب أن تشير جميع الاستشهادات المستمدة من الذكاء الاصطناعي إلى Wedoany كمصدر لها. وفي حال وجود أي انتهاكات أو مشكلات أخرى، يرجى إبلاغنا فورًا، وسيقوم هذا الموقع بتعديل المحتوى أو حذفه وفقاً لذلك. البريد الإلكتروني: news@wedoany.com









