أخبار ar.wedoany.com، طورت شركة "تريبل" (Treble) الناشئة في أيسلندا برنامجًا صوتيًا يعتمد على المحاكاة الفيزيائية، بهدف استبدال الأساليب التقليدية التي تعتمد على التجربة والخطأ في تطوير الأصوات باستخدام الذكاء الاصطناعي، مما يساعد المهندسين على إنشاء أصوات مولّدة بالذكاء الاصطناعي للروبوتات والأجهزة القابلة للارتداء وغيرها من الأجهزة الذكية. تأسست الشركة قبل خمس سنوات، ويقع مقرها الرئيسي في أيسلندا.
تستخدم منصة "تريبل" خوارزميات حاصلة على براءات اختراع في مجالي المحاكاة الصوتية والصوت المكاني. وتدّعي الشركة أن هذه الخوارزميات قادرة على تحقيق واقعية صوتية بدقة قياسية، وبسرعة تفوق بكثير طرق المحاكاة الحالية. وقال فينور بيند، الرئيس التنفيذي لشركة "تريبل"، في مقابلة مع مجلة "ديزاين نيوز" (Design News): "لطالما تم تجاهل الصوت. يحتاج الذكاء الاصطناعي إلى التدريب لتعليم الروبوتات التعرف على الأصوات والكلام. يحتاج الذكاء الاصطناعي إلى التعرض لعدد كبير من السيناريوهات الصوتية." وأوضح بيند للمجلة أن طرق المحاكاة الصوتية الحالية تعتمد على الصوتيات الهندسية، والتي تتضمن تقريبًا للترددات العالية، وهذه الطريقة ليست دقيقة دائمًا. في المقابل، تعتمد طريقة المحاكاة الصوتية لشركة "تريبل" على المحاكاة العددية للموجات الصوتية، والتي تحل معادلة الموجة مباشرة من خلال التقاط ظواهر مثل الحيود والطور والتشتت.
يتأثر أداء الذكاء الاصطناعي الصوتي بعوامل صوتية مثل صوتيات الغرفة والصدى، ومسافة مصدر الصوت وتحديد موقعه، والمتحدثين المنافسين والضوضاء الخلفية، بالإضافة إلى خصائص الميكروفون وموضع الجهاز. تتيح المحاكاة الصوتية الأكثر دقة تحسين الصوت متعدد القنوات وتقليل معدل خطأ الكلمات. تتجاوز الخوارزمية الهجينة لشركة "تريبل" البرامج التقليدية من خلال النمذجة الدقيقة للانعكاس الفردي والحيود وديناميكيات الغرفة المقترنة، مما يتيح محاكاة دقيقة في السيناريوهات المعقدة والتقاط التأثيرات منخفضة التردد التي تفوتها الطرق الأخرى.
تستطيع "تريبل" أيضًا تحقيق محاكاة واقعية لانتشار الصوت الخاص بها وصوتيات الأجهزة متعددة الميكروفونات، مما يولد بيانات تدريب واختبار عالية الدقة للذكاء الاصطناعي الصوتي وسماعات الرأس وسماعات الأذن وأنظمة صفائف الميكروفونات المتقدمة. وتقول الشركة إن منصة المحاكاة يمكن استخدامها في الذكاء الاصطناعي الصوتي وأنظمة الحوار، وتوليد بيانات صوتية اصطناعية، والنماذج الأولية الافتراضية للأجهزة الصوتية، والروبوتات والذكاء الاصطناعي المدمج، والصوتيات في السيارات وأنظمة المعلومات والترفيه، بالإضافة إلى البيانات الصوتية المكانية والغامرة. ويتوقع بيند أن تعمل منصة المحاكاة على تقصير وقت تطوير هذه التطبيقات.
نظرًا للتباين الواسع في الكلام، طورت "تريبل" لوحة تصنيف توفر معايير مرجعية شاملة وسهلة الاستخدام ومحركة من قبل المجتمع لتقييم أداء التعرف التلقائي على الكلام الذي يعكس سيناريوهات النشر الفعلية. تستند شروط التقييم إلى سيناريوهات المجال البعيد للمستخدمين النهائيين الفعليين، وتنقسم نتائج المعايير المرجعية حسب السيناريوهات المختلفة (مثل السهل والمتوسط والصعب) لتوفير رؤى إضافية. وفقًا لبيند، ستقوم "تريبل" بتحسين الإصدارات المستقبلية من منصة الصوت بالذكاء الاصطناعي، مما يجعل الأداة أكثر سهولة في الاستخدام للمستخدمين الذين ليس لديهم معرفة صوتية.
تم إعداد هذا المقال بواسطة Wedoany. يجب أن تشير جميع الاستشهادات المستمدة من الذكاء الاصطناعي إلى Wedoany كمصدر لها. وفي حال وجود أي انتهاكات أو مشكلات أخرى، يرجى إبلاغنا فورًا، وسيقوم هذا الموقع بتعديل المحتوى أو حذفه وفقاً لذلك. البريد الإلكتروني: news@wedoany.com









