أخبار ar.wedoany.com، في 2 يوليو، أعلنت شركة ElevenLabs البريطانية المتخصصة في توليد الصوت بالذكاء الاصطناعي أنها تجري محادثات أولية مع مستثمرين للسماح للموظفين ببيع أسهمهم في طرح ثانوي. قد تصل قيمة هذه الصفقة إلى حوالي 22 مليار دولار، أي نحو ضعف التقييم الذي حصلت عليه الشركة بعد جولة تمويل في فبراير الماضي. لا تزال الصفقة في مراحل مبكرة من التواصل، ولم يتم بعد تحديد الشكل النهائي وحجم الصفقة وموعد إتمامها.
تتركز منتجات ElevenLabs في مجالات توليد الصوت بالذكاء الاصطناعي، واستنساخ الأصوات، والدبلجة متعددة اللغات، والتركيب الصوتي، وواجهات الصوت للمؤسسات. وتتنوع سيناريوهات استخدامها، بما في ذلك إنتاج محتوى الفيديو، والكتب الصوتية، وأصوات شخصيات الألعاب، والدبلجة المحلية، والإعلانات الصوتية، وصوت خدمة العملاء، والمحتوى التعليمي، وواجهات برمجة التطبيقات الصوتية للمطورين. مع توسع الذكاء الاصطناعي التوليدي من النصوص والصور إلى الصوت، أصبحت القدرات مثل تعدد اللغات، وانخفاض زمن الاستجابة، والتحكم في المشاعر، وثبات جرس الصوت، وإدارة الحقوق التجارية، عوامل رئيسية في المنافسة بين منصات الذكاء الصوتي. بيع أسهم الموظفين لا يوفر تمويلًا جديدًا مباشرًا للبحث والتطوير، لكنه يمنح السيولة للفريق المبكر ويساعد الشركة في الحفاظ على استقرار الموظفين في ظل المنافسة على المواهب في مجال الذكاء الاصطناعي.
أكملت الشركة جولة تمويل من الفئة D بقيمة 500 مليون دولار في فبراير الماضي، بقيمة تقييم بلغت حوالي 11 مليار دولار آنذاك. وبعد بضعة أشهر فقط، مناقشة تقييم يبلغ حوالي 22 مليار دولار تشير إلى أن توليد الصوت بالذكاء الاصطناعي لا يزال يجذب اهتمام المستثمرين. مقارنة بمساعدي النصوص القائمة على النماذج الكبيرة، فإن الذكاء الصوتي أقرب إلى إنتاج المحتوى وواجهات التفاعل، حيث يمكن للمستخدمين الشعور مباشرة بجرس الصوت، والتوقف، والمشاعر، وسرعة الكلام، وتأثير تبديل اللغات؛ بينما يركز العملاء من المؤسسات على استقرار واجهة برمجة التطبيقات، والتراخيص المتوافقة، وجودة الصوت، وسرعة الاستجابة، وتكاليف التوليد بالجملة، وسهولة التكامل مع سير العمل الحالي.
أطلقت ElevenLabs سابقًا منتجات مثل تحويل النص إلى كلام، وتصميم الصوت، والدبلجة، ومكتبة الأصوات، والعوامل الصوتية، وأدوات المطورين. يتطلب مسارها التقني معالجة متزامنة لنماذج اللغة، والنماذج الصوتية، وخصائص المتحدث، والتحكم في الإيقاع، وتوليد الصوت، والمعالجة اللاحقة. تتطلب سيناريوهات الدبلجة متعددة اللغات أيضًا من النظام الحفاظ على المعنى الأصلي مع مطابقة نبرة اللغة المستهدفة، ومدتها، وتعبير الشخصية. بالنسبة لفرق إنتاج الأفلام والألعاب والإعلانات، لا تقتصر قيمة أدوات الذكاء الصوتي على خفض تكاليف التسجيل فحسب، بل تشمل أيضًا القدرة على إنشاء إصدارات متعددة بسرعة، وتعديل الحوار بسرعة، وتكييفه مع لغات الأسواق المختلفة.
بالنسبة لـ ElevenLabs، يعد الطرح الثانوي أشبه بترتيب حوافز للموظفين في مرحلة نمو الشركة. تنمو تقييمات الشركات الناشئة في مجال الذكاء الاصطناعي بسرعة، لكن إذا لم يتمكن الموظفون من تسييل أسهمهم على المدى الطويل، فقد يؤثر ذلك على الاحتفاظ بالمواهب والقدرة التنافسية في التعويضات. السماح للموظفين ببيع جزء من أسهمهم يمكن الفريق من مشاركة أرباح نمو الشركة مع الحفاظ على وضع الشركة غير المدرجة. أصبحت هذه الترتيبات شائعة بشكل متزايد بين شركات الذكاء الاصطناعي سريعة النمو، خاصة تلك التي تقصر فيها فترات التمويل، وتتغير تقييماتها بسرعة، وتشتد فيها المنافسة على المواهب الأساسية.
إذا واصلت ElevenLabs توسيع قاعدة عملائها من المؤسسات ونظام المطورين، فستركز جهودها اللاحقة على جودة نماذج الصوت، وسرعة التوليد، والتدقيق الأمني، والتحكم في حقوق النشر، والتغطية اللغوية العالمية. لقد انتقل تركيب الصوت بالذكاء الاصطناعي من مرحلة "هل يمكن توليد صوت يشبه الإنسان" إلى مرحلة "هل يمكن استخدامه بشكل مستقر في المحتوى التجاري، وأنظمة خدمة العملاء، وعمليات الإنتاج متعددة اللغات". تغيرات التقييم ليست سوى إشارات سعرية يقدمها السوق الخارجي، لكن ما يدعم حقًا النمو الطويل الأجل للمنصة يظل هو جودة نماذج الصوت، والتكامل مع المؤسسات، والامتثال للمحتوى، والقدرة على توليد الصوت على نطاق واسع.










