أخبار ar.wedoany.com، أعلنت مؤخراً شركة Deepgram، المتخصصة في البنية التحتية للذكاء الاصطناعي الصوتي في الوقت الفعلي بالولايات المتحدة، عن إبرام شراكة مع شركة أمن البيانات Fortanix. وتهدف هذه الشراكة إلى الاستفادة من تقنية Fortanix Confidential AI وقدرات الحوسبة السرية من NVIDIA، لتوفير حلول نشر للذكاء الاصطناعي الصوتي يمكن تشغيلها في البيئات المحلية، ومخصصة للقطاعات الخاضعة للرقابة التنظيمية. يستهدف هذا الحل سيناريوهات تشمل الرعاية الصحية والخدمات المالية والحكومة وخدمة العملاء المؤسسية والعمليات الداخلية، مع التركيز على حماية أمان البيانات الصوتية وأوزان النماذج أثناء عملية الاستدلال.
تأخذ هذه الشراكة المنافسة في مجال الذكاء الاصطناعي الصوتي إلى ما هو أبعد من دقة التعرف وزمن الاستجابة المنخفض والقدرات متعددة اللغات، لتصل إلى "إمكانية الدخول إلى بيئات الأعمال شديدة الحساسية". في العديد من القطاعات، تحتوي البيانات الصوتية نفسها على قدر كبير من الخصوصية والأسرار التجارية، مثل حوارات الأطباء والمرضى، وسجلات المعاملات المالية، ومعلومات هوية العملاء، ومحتويات الاجتماعات المؤسسية، وعمليات معالجة التذاكر، وطلبات الخدمة الداخلية. على الرغم من أن حلول التعرف على الصوت أو الوكلاء الصوتيين الذكيين التقليدية القائمة على السحابة تسهل التكامل السريع، إلا أنها غالباً ما تواجه قيوداً فيما يتعلق بإقامة البيانات، والتدقيق الامتثالي، وحماية حقوق الملكية الفكرية للنماذج، والحدود الأمنية الداخلية. تتبنى Deepgram في هذه المرة مسار النشر المحلي، مما يمكّن المؤسسات من تشغيل قدرات التعرف على الكلام، وتوليف الكلام، والتحويل من كلام إلى كلام في بيئاتها الخاصة. من جانبها، توفر Fortanix، من خلال تقنيات الذكاء الاصطناعي السرية وبيئات التنفيذ الموثوقة، حماية عزل للأجهزة للبيانات الصوتية وأوزان النماذج أثناء معالجتها، مما يقلل من مخاطر سرقة النماذج، أو الوصول غير المصرح به إلى البيانات، أو تعريض عملية الاستدلال للبنية التحتية الأساسية.
يعمل الحل في جوهره على وحدات معالجة رسومية تدعم الحوسبة السرية من NVIDIA، حيث تظل البيانات الصوتية وأوزان نماذج الذكاء الاصطناعي مشفرة ومعزولة حتى أثناء مرحلة المعالجة النشطة. تضع Deepgram وFortanix وNVIDIA هذا المزيج كحزمة تقنية مدمجة مسبقاً تستهدف البيئات عالية المتطلبات الأمنية.
أصبح الصوت بوابة جديدة لأنظمة المؤسسات. في الماضي، كانت تسجيلات مراكز الاتصال، ومحاضر الاجتماعات، ومراقبة جودة خدمة العملاء، والنسخ الصوتي مجرد عمليات معالجة لاحقة، حيث كانت المؤسسات تقوم بتحميل الملفات الصوتية إلى مزود الخدمة للحصول على نصوص أو ملخصات أو نتائج تحليلية. مع دخول الوكلاء الصوتيين الذكيين في الوقت الفعلي إلى مجالات مثل خدمة العملاء، والسجلات الطبية، والصيانة الميدانية، ومكاتب خدمة تكنولوجيا المعلومات، وعمليات التدقيق الامتثالي، أصبحت البيانات الصوتية تشارك بشكل مباشر في اتخاذ القرارات التجارية والتنفيذ الآلي. وامتدت المتطلبات الأمنية من "التشفير أثناء التخزين والتشفير أثناء النقل" لتشمل "الحماية أثناء الاستخدام". إن إضافة الحوسبة السرية تحل في الواقع نقطة انقطاع حاسمة في النشر الإنتاجي للذكاء الاصطناعي الصوتي: الحاجة إلى عزل النماذج والبيانات حتى أثناء تنفيذها داخل وحدات معالجة الرسوميات، بحيث لا يتمكن مسؤولو المنصة أو نظام التشغيل الأساسي أو بيئة البنية التحتية من الوصول المباشر إلى البيانات أو أصول النماذج غير المشفرة. بالنسبة للمؤسسات الخاضعة للرقابة التنظيمية، تساعد هذه القدرة على تشغيل تطبيقات الصوت في الوقت الفعلي داخل حدودها الأمنية الخاصة، مع الحفاظ على تجربة تفاعل منخفضة زمن الاستجابة.
توفر Deepgram نفسها قدرات تحويل الكلام إلى نص، وتحويل النص إلى كلام، والتحويل من كلام إلى كلام، وتدعم طرق نشر متعددة تشمل واجهات برمجة التطبيقات السحابية، والاستضافة الذاتية، وواجهات برمجة التطبيقات المحلية. وتذكر الشركة أن أكثر من 200 ألف مطور و1400 مؤسسة تستخدم منصتها حالياً، والتي عالجت أكثر من 50 ألف عام من المحتوى الصوتي وقامت بنسخ أكثر من تريليون كلمة. بعد هذا التعاون مع Fortanix وNVIDIA، يمكن لـ Deepgram دفع قدراتها في الذكاء الاصطناعي الصوتي، التي كانت موجهة أكثر للمطورين والعملاء من نوع المنصات، نحو قطاعات مثل المستشفيات والبنوك وشركات التأمين والقطاع العام ومكاتب الخدمة الداخلية للمؤسسات والعملاء ذوي المتطلبات العالية لسيادة البيانات. يركز دور Fortanix على حماية أمن دورة الحياة الكاملة للبيانات ونماذج الذكاء الاصطناعي والتطبيقات في البيئات المحلية والمتعددة السحابات وعالية الأمان، وخاصة ربط الحوسبة السرية والتحكم في المفاتيح والتنفيذ القائم على الثقة الصفرية وحماية النماذج.
تتمثل المتغيرات اللاحقة في التكلفة الفعلية للتنفيذ على مستوى المؤسسات، وتوفر بيئات الحوسبة السرية لوحدات معالجة الرسوميات، والتكيف مع متطلبات التدقيق الامتثالي، ودرجة قابلية تكرار الوكلاء الصوتيين الذكيين في العمليات القطاعية. إذا تمكن هذا الحل من بناء حالات استخدام مستقرة في القطاعات الخاضعة للرقابة التنظيمية، فإن طريقة نشر الذكاء الاصطناعي الصوتي ستنتقل من "أولوية الاستدعاء السحابي" إلى بنية هجينة تتسم بـ "التشغيل المحلي، وحماية النماذج، وعدم خروج البيانات عن الحدود". بالنسبة لشركات التعرف على الكلام والذكاء الاصطناعي التحادثي، سينصب تركيز المنافسة المستقبلية في الوقت نفسه على أداء النماذج، والوقت الفعلي، والتسليم الخاص، وتكامل الحوسبة السرية، والقدرات الامتثالية القطاعية.
تم إعداد هذا المقال بواسطة Wedoany. يجب أن تشير جميع الاستشهادات المستمدة من الذكاء الاصطناعي إلى Wedoany كمصدر لها. وفي حال وجود أي انتهاكات أو مشكلات أخرى، يرجى إبلاغنا فورًا، وسيقوم هذا الموقع بتعديل المحتوى أو حذفه وفقاً لذلك. البريد الإلكتروني: news@wedoany.com









