أخبار ar.wedoany.com، أبرمت شركة تينسنت كلاود الصينية مؤخرًا شراكة استراتيجية مع شركة Soniox، وهي شركة أمريكية متخصصة في الذكاء الاصطناعي الصوتي ومقرها سان فرانسيسكو، وذلك لدمج تقنية النسخ الصوتي من Soniox في البنية التحتية العالمية لخدمة الاتصالات الصوتية والمرئية الفورية (TRTC) التابعة لشركة تينسنت كلاود. تهدف هذه الشراكة إلى توفير إمكانيات تطوير تطبيقات صوتية فورية متعددة اللغات ومنخفضة زمن الوصول، موجهة لسيناريوهات المؤسسات مثل خدمة العملاء الذكية، والمساعدين الصوتيين، والترجمة الفورية، ونسخ محاضر الاجتماعات.
تتركز هذه الشراكة في المجال المتقاطع بين "معالجة اللغة والاتصالات الفورية"، بهدف أساسي هو خفض حاجز نشر تطبيقات الذكاء الاصطناعي الصوتي عالميًا للمؤسسات. توفر Soniox بشكل أساسي قدرات التعرف على الصوت عالية الدقة ومنخفضة زمن الوصول، وتدعم أكثر من 60 لغة، كما يمكنها معالجة السيناريوهات التي يحدث فيها تبديل بين اللغات المختلفة ضمن الجملة الواحدة. من جانبها، توفر خدمة TRTC من تينسنت كلاود شبكة اتصالات فورية على مستوى المؤسسات، تغطي أكثر من 3200 عقدة عالمية، وتتمتع بقدرات تشمل زمن وصول عالمي أقل من 300 مللي ثانية، وتقليل الضوضاء بالذكاء الاصطناعي، ومقاومة ضعف الشبكة. بعد الدمج بينهما، يمكن للمطورين دمج واجهة النسخ الصوتي من Soniox مباشرة في لوحة تحكم تينسنت كلاود، لاستخدامها في بناء تطبيقات الذكاء الاصطناعي الصوتي عبر الأسواق. بالنسبة لشركات التجارة الإلكترونية عبر الحدود، والتعليم عبر الإنترنت، والاجتماعات عن بُعد، والتعاون المؤسسي، والألعاب الاجتماعية، وخدمة العملاء المالية، وشركات البرمجيات كخدمة (SaaS) العالمية، كانت التطبيقات الصوتية تواجه في السابق ثلاث مشكلات رئيسية: أولاً، التفاوت الكبير في جودة الشبكات بين الدول المختلفة، مما يؤدي إلى تأخير وفقدان الحزم في نقل الصوت الفوري. ثانيًا، الحاجة إلى تكييف نماذج وواجهات مختلفة لكل لغة في التعرف متعدد اللغات، مما يرفع تكاليف التطوير والصيانة. ثالثًا، تتطلب سيناريوهات مثل خدمة العملاء والترجمة وتدوين الملاحظات في الاجتماعات دقة عالية وسرعة استجابة، ويصعب تحقيق تجربة مستقرة بالاعتماد فقط على نموذج التعرف على الصوت أو رابط الاتصال بشكل منفرد. من خلال هذا التعاون، تضع تينسنت كلاود وSoniox شبكة الاتصالات الفورية وتقنية النسخ الصوتي في مسار تسليم واحد، مما يساعد المؤسسات على دمج إدخال الصوت ونقله والتعرف عليه وإخراج النص ومعالجته لاحقًا بالذكاء الاصطناعي في بنية تحتية صوتية فورية أكثر اكتمالاً، بدلاً من الحاجة إلى تجميع خدمات الاتصالات وخدمات التعرف على الصوت ووحدات معالجة اللغات المتعددة بشكل منفصل.
تدعم هذه الشراكة المؤسسات في تطوير تطبيقات صوتية موجهة للسوق الناطقة بالإنجليزية، بالإضافة إلى أسواق متعددة اللغات مثل العربية والهندية والملايوية وغيرها. تشمل مجالات التطبيق خدمة العملاء الذكية، والمساعدين الصوتيين، والترجمة الفورية، ونسخ محاضر الاجتماعات.
يشهد الذكاء الاصطناعي الصوتي للمؤسسات تحولاً من كونه وظيفة منفردة إلى مرحلة النشر الإنتاجي. في الماضي، كان النسخ الصوتي يُستخدم بشكل أكبر في تسجيل الاجتماعات، أو إنشاء الترجمة النصية، أو تدوين مكالمات خدمة العملاء، وكانت طرق المعالجة تعتمد بشكل أساسي على النسخ غير الفوري والتعرف أحادي اللغة. مع انتشار الذكاء الاصطناعي التوليدي، وروبوتات خدمة العملاء الفورية، والتعاون عبر الحدود، والأجهزة الذكية، أصبح الصوت مدخلاً هاماً لتطبيقات المؤسسات. العوامل التي تؤثر حقاً على فعالية التطبيق لا تقتصر على قدرة نموذج التعرف على فهم الجملة فحسب، بل تشمل أيضاً جودة رابط نقل الصوت من المستخدم إلى السحابة، وسرعة إرجاع نتائج التعرف، والاستقرار في بيئات الشبكات الضعيفة، والقدرة على التعرف المستمر في سيناريوهات خلط اللغات المختلفة، بالإضافة إلى إمكانية الاتصال السلس لاحقاً مع النماذج الكبيرة، وقواعد المعرفة، وأنظمة التذاكر، وأنظمة الترجمة. توفر خدمة TRTC من تينسنت كلاود عقداً عالمية وقدرات زمن وصول منخفض في طبقة نقل الصوت والفيديو الفوري، بينما توفر Soniox في طبقة النسخ الصوتي قدرات التعرف متعدد اللغات ومعالجة التبديل داخل الجملة الواحدة. من خلال الجمع بينهما، يمكن للمؤسسات دمج المدخل الصوتي بشكل أسرع في مراكز خدمة العملاء، والاجتماعات عبر الإنترنت، والبث المباشر عبر الحدود، والتدريب عن بُعد، والتطبيقات المحمولة. بالنسبة لقطاع تكنولوجيا المعلومات والاتصالات، يوضح هذا النوع من الشراكات أن منصات الاتصالات الفورية تتطور من مجرد أدوات للمكالمات الصوتية والمرئية لتصبح قنوات أساسية لخدمات الذكاء الاصطناعي الصوتي والترجمة والتعاون والأتمتة. في المستقبل، من يستطيع تنظيم روابط الاتصالات والتعرف على الصوت ومعالجة اللغات المتعددة وتطبيقات الذكاء الاصطناعي في منصة موحدة، سيكون أكثر قدرة على خدمة احتياجات النشر العالمي للمؤسسات وإدارة المستخدمين متعددي اللغات.
تتركز المتغيرات المستقبلية لهذه الشراكة في سرعة اعتماد العملاء من المؤسسات، واستقرار التعرف متعدد اللغات في بيئات الضوضاء الحقيقية، والتكامل البيني مع تطبيقات النماذج الكبيرة، بالإضافة إلى متطلبات الامتثال للبيانات في مختلف الدول والمناطق. مع توجه المزيد من المؤسسات إلى تقديم خدمات العملاء والاجتماعات والتدريب والأنشطة التسويقية في الأسواق العالمية، لن يعد النسخ الصوتي الفوري مجرد وظيفة مساعدة، بل سيصبح قدرة أساسية مهمة للتواصل عبر اللغات والخدمات الآلية والإدارة الذكية. يمثل التعاون بين تينسنت كلاود وSoniox نموذجاً جديداً لمنتج مشترك بين مزود خدمات سحابية صيني وشركة ذكاء اصطناعي صوتي أمريكية في سوق الاتصالات المؤسسية العالمي.
تم إعداد هذا المقال بواسطة Wedoany. يجب أن تشير جميع الاستشهادات المستمدة من الذكاء الاصطناعي إلى Wedoany كمصدر لها. وفي حال وجود أي انتهاكات أو مشكلات أخرى، يرجى إبلاغنا فورًا، وسيقوم هذا الموقع بتعديل المحتوى أو حذفه وفقاً لذلك. البريد الإلكتروني: news@wedoany.com









