شركة جيه.دي.دوت كوم الصينية تفتح مصدر إطار عمل JoyAI-Echo لتوليد الفيديو والصوت الطويل
2026-06-04 09:30
المفضلة

أخبار ar.wedoany.com، في الثالث من يونيو، أطلقت شركة جيه.دي.دوت كوم إطار عمل JoyAI-Echo لتوليد الفيديو والصوت الطويل، مع فتح الكود المصدري والأوزان بالكامل. يستهدف هذا الإطار سيناريوهات توليد الفيديو والصوت الطويل، حيث يقدم "مساعد المخرج" الذكي Director Agent، ويجهز بنك ذاكرة صوتي-بصري متعدد الوسائط، يُستخدم للحفاظ المستمر على خصائص المظهر الخارجي للشخصيات ومعلومات نبرة صوت المتحدث واستدعائها أثناء عملية التوليد متعدد اللقطات.

يتناول JoyAI-Echo مشكلة الاستقرار طويلة الأمد في توليد الفيديو الطويل. تمتلك نماذج توليد الفيديو الحالية أداءً قوياً في سيناريوهات المقاطع القصيرة واللقطة الواحدة والشخصية الواحدة، ولكن بمجرد الدخول في سرد متعدد اللقطات، أو ظهور متتابع للشخصيات، أو حوار بين الشخصيات، أو توليد محتوى طويل المدة، تواجه النماذج مشاكل مثل انحراف مظهر الشخصية، وعدم تناسق نبرة الصوت، وانقطاع منطق اللقطات، وبطء سرعة التوليد. يسجل JoyAI-Echo هوية الشخصية وصورتها البصرية وسياق الصوت عبر بنك الذاكرة الصوتي-البصري متعدد الوسائط، مما يسمح للقطات اللاحقة بمواصلة استخدام المعلومات السابقة؛ ويتولى Director Agent وظيفة تفكيك السيناريو والشخصيات واللقطات، مما يمكن المستخدمين من تقديم متطلبات الإبداع والتعديل من خلال اللغة الطبيعية، مما يقلل من تكلفة إعادة تشغيل المحتوى بالكامل بشكل متكرر أثناء عملية توليد الفيديو الطويل.

يظهر مستودع المصدر المفتوح لشركة جيه.دي.دوت كوم أن JoyAI-Echo يدعم توليد الفيديو والصوت متعدد اللقطات على مستوى الدقائق، ويمكنه توليد قصة متماسكة من خلال موجه JSON واحد، ويستخدم خطة تقطير DMD للاستدلال بخطوات قليلة لزيادة سرعة التوليد.

تكمن أهمية هذا الإطار في دفع توليد الفيديو والصوت الطويل من "نتيجة توليد لمرة واحدة" إلى "عملية إبداعية قابلة للتحرير المستمر". في سيناريوهات مثل التصور المسبق للأعمال السينمائية والتلفزيونية، وفيديوهات العلامات التجارية التسويقية، ومحتوى الشخصيات الرقمية، وإنشاء القصص الافتراضية، والمسلسلات القصيرة المباشرة، لا يحتاج المبدعون فقط إلى توليد صورة واحدة، بل يحتاجون إلى الحفاظ على مظهر موحد وصوت موحد وأسلوب سرد موحد للشخصية عبر أجزاء متعددة من القصة. يدمج JoyAI-Echo الصوت والفيديو وذاكرة الشخصية وتخطيط اللقطات والتحرير الحواري في إطار عمل واحد، مما يساعد على خفض الحاجز التقني لإنتاج المحتوى الطويل. بعد فتح الكود المصدري والأوزان بالكامل، يمكن للمطورين أيضًا إجراء تطوير ثانوي وتقييم النماذج وتعديل السيناريوهات الرأسية بناءً على هذا الإطار، مما يزيد من توسيع النظام البيئي لتوليد الفيديو والصوت الطويل محليًا.

تتركز المتغيرات اللاحقة في حالة تكيف مجتمع المصادر المفتوحة، وتكلفة النشر الفعلية، وأداء اتساق الفيديو الطويل، وتجربة التحرير التفاعلية، وسرعة تطبيق السيناريوهات التجارية. مع انتقال توليد الفيديو بالذكاء الاصطناعي من عروض المقاطع القصيرة إلى مراحل إنتاج محتوى أكثر تعقيدًا، ستصبح ذاكرة الشخصية واتساق الصوت واستمرارية اللقطات وقابلية التحرير مؤشرات مهمة للمنافسة بين أطر النماذج. سيوفر فتح مصدر JoyAI-Echo مدخلاً تقنيًا قابلاً لإعادة الإنتاج والتوسع في مجال توليد الفيديو والصوت الطويل.

تم إعداد هذا المقال بواسطة Wedoany. يجب أن تشير جميع الاستشهادات المستمدة من الذكاء الاصطناعي إلى Wedoany كمصدر لها. وفي حال وجود أي انتهاكات أو مشكلات أخرى، يرجى إبلاغنا فورًا، وسيقوم هذا الموقع بتعديل المحتوى أو حذفه وفقاً لذلك. البريد الإلكتروني: news@wedoany.com

المنتجات ذات الصلة
التوصيات ذات الصلة
محطة التجارب متعددة اللغات التابعة لناسا تواصل توسيع قدرات ترحيل البيانات التجارية
2026-06-04
فريق فرنسي يطور محاكيًا جراحيًا للأذن بتقنية الطباعة ثلاثية الأبعاد يُدعى Otosurg
2026-06-04
شركة Edgecore التايوانية تطلق منصة بنية تحتية ذكاء اصطناعي ضوئية بالكامل
2026-06-04
تحالف LoRa الأمريكي ينشر خارطة طريق تقنية لـ LoRaWAN لثلاث سنوات
2026-06-04
شركة GL Communications الأمريكية تطلق حل تسجيل حركة مرور الشبكات بسرعة 400 جيجابت
2026-06-04
لجنة الاتصالات الفيدرالية الأمريكية تطلق أول مزاد للطيف الترددي منذ أربع سنوات
2026-06-04
شركة BDx في إندونيسيا تحصل على التزام بقدرة كهربائية تبلغ 1.2 جيجاواط لمراكز البيانات
2026-06-04
شركة MDaudit الأمريكية تطلق منصة مراقبة الإيرادات المدعومة بالذكاء الاصطناعي، بعوائد تتجاوز 500 مليون دولار للعملاء بحلول عام 2025
2026-06-04
تقنيات الذكاء الاصطناعي والتعلم الآلي الأمريكية تُحدث ثورة في رعاية العمود الفقري
2026-06-04
تقنيات المحاكاة الطبية تدفع نحو توحيد معايير التدريب الطبي وتعزيز سلامة المرضى
2026-06-04
آخر الأخبار القصيرة
1
مراقبة تصدير المعادن في 4 يونيو: أصول الليثيوم والجرافيت والنحاس والذهب والألمنيوم تتسارع نحو مرحلة التطوير الهندسي
2
مراقبة تصدير قطاع النقل والخدمات اللوجستية في 4 يونيو: الشركات الصينية أمام نافذة فرص لتنسيق الممرات وترقية المعدات
3
محطة التجارب متعددة اللغات التابعة لناسا تواصل توسيع قدرات ترحيل البيانات التجارية
4
دراسة كندية: التصوير المقطعي بالإصدار البوزيتروني (PET) يكشف انخفاض كثافة المشابك العصبية بنسبة 16.4% في مرض التصلب المتعدد
5
إضافة قسم جديد للتصوير الطبي في حرم برايتون الصحي بأستراليا
6
تحويل مبنى بمساحة 71 ألف قدم مربع في حديقة ألدرلي بارك إلى مستشفى خاص
7
شركة Flok Health البريطانية تحصل على تمويل بقيمة 12.5 مليون دولار لتوسيع منصة العلاج الطبيعي بالذكاء الاصطناعي
8
جامعة كاليفورنيا في سان دييغو وجامعة أكسفورد تطوران لاصقة فوق صوتية قابلة للارتداء للمراقبة المستمرة للجنين
9
شركة QCS البريطانية تستحوذ على CareBrain لتسريع تحول قطاع الرعاية
10
مركز Angel Eye السنغافوري يُدخل تقنية الذكاء الاصطناعي لفحص شبكية العين لدعم التقييم قبل الجراحي