أخبار ar.wedoany.com، أعلنت شركة SoundWise.ai مؤخراً عن إطلاق أداة تحويل الصوت إلى نص تعمل بالذكاء الاصطناعي مجاناً إلى الأبد. هذه المنصة التي تعمل عبر المتصفح تحوّل الملفات الصوتية والفيديو إلى نصوص بأكثر من 98 لغة، دون فرض رسوم على المستخدمين الأفراد حسب الدقيقة، ودون حد أقصى للاستخدام الإجمالي.
تعتمد المنصة على بنية محركين مزدوجة، تشمل نموذج تحويل مجاني داخل المتصفح يعمل محلياً على جهاز المستخدم، بالإضافة إلى طبقة تعزيز سحابية اختيارية تُعرف باسم SoundWise Pro. وتوفر هذه الأخيرة دقة تقترب من المستوى البشري، بسرعة تصل إلى 10 أضعاف سرعة التحويل الفوري. ويغطي المحركان معاً نطاقاً واسعاً من سير العمل في تحويل الكلام إلى نص، بدءاً من تدوين ملاحظات البودكاست السريعة وصولاً إلى الاستخدامات المهنية في غرف الأخبار والفصول الدراسية وفرق المحتوى.
صرّح إريك، الرئيس التنفيذي لشركة SoundWise، بأن المحتوى الصوتي والفيديو يجب أن يكون قابلاً للبحث والتحرير والاقتباس والترجمة وإعادة الاستخدام مثل أي مستند آخر. وأوضح أن الفريق قام ببناء SoundWise للتعامل مع المهام التي تلي انتهاء التسجيل، بما في ذلك تحويل المقابلات إلى مقالات، والمحاضرات إلى ملاحظات دراسية، والندوات عبر الإنترنت إلى أصول تسويقية، والمواد الخام إلى نصوص يمكن للفرق استخدامها فعلياً.
توفر الأداة ميزة تحويل محلي غير محدود ومجاني إلى الأبد عبر الذكاء الاصطناعي. يمكن للمستخدمين تحويل الملفات الصوتية والفيديو مباشرة في المتصفح، دون فرض رسوم على كل دقيقة للاستخدام الشخصي المعقول، ودون قيود على إجمالي التحويلات. ونظراً لأن المعالجة تتم محلياً، فإن التسجيلات الحساسة لا تغادر جهاز المستخدم. تقوم خدمة SoundWise Pro بتوجيه الملفات عبر نماذج سحابية محسّنة، ووفقاً لاختبارات داخلية، يمكن تحويل تسجيل مدته ساعة واحدة في حوالي 30 ثانية، أي بسرعة تعادل حوالي 120 ضعف السرعة الفعلية. تعالج المنصة مهام تحويل الكلام إلى نص متعددة اللغات تشمل الإنجليزية والإسبانية والصينية الماندرين والفرنسية والألمانية واليابانية والكورية والعربية والبرتغالية والروسية وأكثر من 88 لغة أخرى. تشمل أنواع الملفات المدعومة MP3 وWAV وFLAC وAAC وM4A وMP4 وMOV وMKV وغيرها من صيغ الوسائط الشائعة. توفر أدوات مراجعة النصوص المدمجة كشفاً تلقائياً للمتحدثين وطوابع زمنية لكل كلمة، ويمكن تصدير النصوص بتنسيق TXT وPDF، على أن يتوفر التصدير بتنسيق DOCX وترجمة SRT قريباً.
توفر SoundWise Free تحويلاً غير محدود من الصوت إلى نص ومن الفيديو إلى نص، دون الحاجة إلى الدفع بالدقيقة أو بطاقة ائتمان أو التسجيل خلف جدار الدفع. تتم معالجة الملفات محلياً بواسطة نموذج الذكاء الاصطناعي داخل المتصفح. وفقاً للاختبارات الداخلية، يبلغ متوسط وقت معالجة تسجيل مدته ساعة واحدة حوالي 10 دقائق، وذلك اعتماداً على أداء الجهاز ودرجة تعقيد الملف. صُممت هذه الطريقة المحلية خصيصاً للطلاب والمبدعين المستقلين والباحثين الأكاديميين والمهتمين بالخصوصية الذين يتعاملون بانتظام مع محتوى مسجل دون الحاجة إلى تخزين سحابي أو معالجة خلفية.
للمستخدمين الذين يحتاجون إلى السرعة والسعة، تنقل SoundWise Pro عملية التحويل إلى وحدات معالجة رسومية سحابية، وتستمر في العمل حتى بعد إغلاق المتصفح. يتم إكمال ملف صوتي مدته ساعة واحدة في حوالي 30 ثانية، وتشمل الخطط تحويلاً سحابياً غير محدود، وتخزيناً سحابياً غير محدود، وتصديراً بتنسيقات متعددة، بالإضافة إلى وصول مبكر إلى ميزات مثل ترجمة SRT وتصدير DOCX القادمة. يبلغ سعر SoundWise Pro 20 دولاراً شهرياً، أو 10 دولارات شهرياً عند الدفع السنوي.
تهدف SoundWise إلى الاندماج في سير العمل الخاص بتحويل المحتوى المنطوق إلى أصول مكتوبة. يمكن لمنشئي المحتوى ومنتجي البودكاست تحويل الفيديو والصوت إلى نصوص فرعية ومقالات مدونة ونشرات إخبارية ومنشورات على وسائل التواصل الاجتماعي في غضون دقائق. يمكن لفرق التسويق والنمو تحويل الندوات عبر الإنترنت والمكالمات البيعية ومقابلات العملاء وحلقات البودكاست إلى قواعد معرفية قابلة للبحث ونصوص قابلة للتحرير. يمكن للمعلمين والطلاب الاعتماد على تحويل المحاضرات إلى أدلة دراسية وبطاقات تعليمية وملاحظات مراجعة من الفصول الدراسية وورش العمل. يمكن للصحفيين والباحثين النوعيين معالجة المقابلات والتسجيلات الميدانية، بما في ذلك تسمية المتحدثين والطوابع الزمنية، دون الحاجة إلى إعادة تشغيل المقطع بأكمله.
تم إعداد هذا المقال بواسطة Wedoany. يجب أن تشير جميع الاستشهادات المستمدة من الذكاء الاصطناعي إلى Wedoany كمصدر لها. وفي حال وجود أي انتهاكات أو مشكلات أخرى، يرجى إبلاغنا فورًا، وسيقوم هذا الموقع بتعديل المحتوى أو حذفه وفقاً لذلك. البريد الإلكتروني: news@wedoany.com









