أخبار ar.wedoany.com، أصدرت جوجل مؤخرًا نموذجين جديدين موجهين للمطورين: Gemini Omni Flash و Nano Banana 2 Lite. يجمع الأول بين الاستدلال متعدد الوسائط وتوليد الفيديو وتحريره بشكل عميق، بينما يركز الثاني على التوليد فائق السرعة للصور.
تم الكشف عن نموذج Gemini Omni Flash في مؤتمر Google I/O 2026، وتتمثل قدرته الأساسية في دمج الاستدلال متعدد الوسائط من Gemini في سير عمل توليد الفيديو وتحريره. النموذج متاح الآن عبر Gemini API و Google AI Studio. تشمل قدراته الرئيسية الأربع: تحرير الفيديو القائم على الحوار، مما يسمح للمستخدمين بتحسين الفيديو باستخدام اللغة الطبيعية؛ والمرجعية متعددة الوسائط، التي يمكنها دمج مدخلات الصور والنصوص والفيديو للحفاظ على اتساق المشهد؛ واستدعاء معرفة Gemini في مجالات مثل التاريخ والأحياء والمنطق السردي لبناء الفيديو؛ ومزامنة النص مع حركة الفيديو من خلال مطالبات بسيطة. من حيث التسعير، تبلغ تكلفة إخراج الفيديو من Omni Flash 0.10 دولارًا أمريكيًا لكل ثانية، وهو ما يعادل تكلفة Veo 3.1 Fast.
في الوقت نفسه، أدرجت جوجل القيود الحالية للنموذج: فهو يدعم حاليًا توليد فيديو لمدة 10 ثوانٍ فقط، ولا يدعم تحميل مرجع صوتي أو توسيع المشهد، ويدعم API فيديو مرجعي بطول أقصى 3 ثوانٍ ولكن النموذج لا يستطيع معالجة هذا النوع من المدخلات بشكل صحيح بعد، كما أن اتساق الشخصيات أثناء انتقالات المشاهد وتحركات الكاميرا لا يزال محدودًا.
النموذج الآخر، Nano Banana 2 Lite، واسمه gemini-3.1-flash-lite-image، تم تحسينه خصيصًا للسيناريوهات الحساسة لزمن الاستجابة. نقطة بيعه الأساسية هي أن زمن استجابة توليد الصور يبلغ حوالي 4 ثوانٍ، أي خمس زمن استجابة Nano Banana 2؛ وتبلغ تكلفة توليد صورة بدقة 1K حوالي 0.034 دولارًا أمريكيًا، أي نصف تكلفة Nano Banana 2 وربع تكلفة Nano Banana Pro. في اختبارات عرض النصوص والمعايير القياسية، يتساوى Nano Banana 2 Lite مع نماذج مثل Grok، وهو مناسب لسيناريوهات مثل التوليد الدفعي لمواد التجارة الإلكترونية وتكرار الإعلانات الإبداعية.

عرضت جوجل سير عمل يربط بين النموذجين: أولاً، استخدام Nano Banana 2 Lite لتوليد الصور بسرعة عالية، ثم إدخال الصور المولدة كمواد مرجعية إلى Gemini Omni Flash لتحويلها إلى فيديو. ولهذا الغرض، طورت جوجل ثلاثة تطبيقات توضيحية: Anywhere، الذي يمكنه دمج صور السيلفي أو الصور المرفوعة في معالم سياحية وتوليد مقاطع فيديو ديناميكية قصيرة؛ و Space Lift، الذي يولد خطط ديكور مختلفة بعد رفع صورة الغرفة ويمكن تحويلها إلى فيديو تجوال مكاني؛ و Omni Product Studio، الذي يولد صورًا سياقية وإعلانات فيديو قصيرة لمنتجات التجارة الإلكترونية.

الرابط المرجعي: https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-omni-flash-nano-banana-2-lite/









