أخبار ar.wedoany.com، أعلنت شركة X Square Robot، المتخصصة في مجال الروبوتات ومقرها شنتشن، عن إطلاق إطار عمل XRZero-G0، وهو إطار عمل مفتوح المصدر للأجهزة والبرمجيات، يُستخدم لجمع بيانات تدريب الروبوتات من المشغلين البشريين، وتوليد الاستراتيجيات، واختبارها على روبوتات فعلية. تم إصدار الكود المصدري بموجب ترخيص MIT، ويتم استضافته على منصة GitHub إلى جانب مجموعة بيانات G0-Dataset.

تعتمد الطرق التقليدية على استخدام روبوتات فعلية لجمع عينات التدريب، مما ينتج عنه كمية محدودة للغاية من بيانات العرض التوضيحي لكل جلسة تشغيل، وهو ما يقيد بشكل مباشر حجم مجموعات البيانات اللازمة لتدريب الذكاء الاصطناعي المُجسَّد. يوفر المُشغِّل البشري مصدر بيانات أقل تكلفة، وقد قامت شركة X Square Robot بدمج هذه الطريقة في نظام متاح للعموم. تُطوِّر الشركة روبوتات لسيناريوهات العمل البدني، حيث كانت هذه الشركات في الماضي تحتاج إلى استثمار قدر كبير من الوقت والمال لتشغيل الروبوتات يدويًا بهدف جمع عينات التدريب.
تستشعر الروبوتات الفعلية البيئة المحيطة من خلال كاميرات متعددة. تلتقط الكاميرات المثبتة على الرأس المشاهد الواسعة النطاق، بينما تسجل الكاميرات المثبتة على المعصم تفاصيل التفاعل بين اليد والأشياء بدقة. تعتمد العديد من أجهزة الجمع التي تعمل بالتشغيل اليدوي على عرض المعصم فقط، مما يؤدي إلى وجود فجوة بين بيانات التدريب وطريقة الإدراك الحسي للروبوت أثناء النشر الفعلي. يستخدم إطار XRZero-G0 كاميرا رأسية وكاميرتين للمعصم لتسجيل سياق المشهد الواسع والعمليات الدقيقة عن قرب بشكل متزامن، ويقوم بتعيين هذه الزوايا إلى تمثيل مشترك يتوافق مع إدراك الروبوت. وبالاقتران مع واجهة الواقع الافتراضي القابلة للارتداء وقابضات التبادل، يمكن لمشغل واحد إنتاج بيانات توضيحية قابلة للتطبيق على هياكل روبوتية مختلفة.
تعاني البيانات الواردة من المشغلين البشريين من مشاكل في الجودة قد تؤثر على قيمتها التدريبية. يُنشئ إطار XRZero-G0 عملية حلقة مغلقة تشمل الجمع والفحص والتدريب والتقييم، وذلك لفرز العينات التي تدخل مرحلة التدريب. على مستوى الرصد، تعمل قيود الاتساق الهندسي متعدد الرؤية على تقليل عدم التطابق بين الصور والحركة؛ وعلى المستوى الحركي، تعمل خوارزمية الحركية العكسية لكامل الجسم مع قيود التصادم وقيود المفاصل على استبعاد المسارات غير الصالحة؛ وعلى مستوى الاستراتيجية، يُعد إعادة التشغيل والتنفيذ على الروبوت الفعلي بمثابة التحقق النهائي. وفقًا لتقارير شركة X Square Robot، في ظل الإعدادات الخاضعة للرقابة، يبلغ إنتاج البيانات الفعالة لهذا النظام حوالي 85%.
أشارت الشركة إلى أن البيانات المأخوذة بدون روبوت والبيانات المأخوذة من روبوت فعلي يمكن أن تعمل بشكل تآزري. من خلال دمج حوالي 10 مقاطع توضيحية تم جمعها بواسطة البشر مع مقطع واحد تم تسجيله بواسطة روبوت فعلي، تم الوصول في مهام الاختبار إلى أداء مماثل لمجموعة التدريب المكونة بالكامل من بيانات الروبوت الفعلي. توفر البيانات التي جمعها البشر تغطية واسعة للسلوك، بينما تُستخدم كمية صغيرة من بيانات الروبوت الفعلي لتثبيت المعلمات الفيزيائية مثل تأخير المحرك والاحتكاك. في ظل ظروف الاختبار، أدت هذه النسبة إلى تقليل الحاجة إلى بيانات الروبوت الفعلي بما يصل إلى 20 مرة.
تحتوي مجموعة بيانات G0-Dataset على أكثر من 2000 ساعة من العروض التوضيحية المُتحقق منها، وتغطي أنماط الرؤية واللمس والسمع، وتشمل 3000 مهمة تشغيلية مختلفة، مع توزيع يتبع خاصية الذيل الطويل. بلغت السرعة القصوى لجمع البيانات بواسطة المشغل 93.2 مقطعًا في الساعة. تدعم مجموعة البيانات التدريب المسبق على نطاق واسع وأبحاث النقل عبر الهياكل الروبوتية المختلفة. صرحت شركة X Square Robot بأن الاستراتيجيات المُدرَّبة بناءً على هذا الإطار يمكنها التعميم على بيئات الجمع ذات أوضاع الروبوت المختلفة وارتفاعات الطاولات وزوايا الرؤية، كما تُظهر قدرة على النقل بدون عينات (zero-shot) إلى منصات روبوتية غير موجودة في مجموعة التدريب، مما يمكنها من تنفيذ المهام دون الحاجة إلى ضبط دقيق للمنصة الجديدة.
تم إعداد هذا المقال بواسطة Wedoany. يجب أن تشير جميع الاستشهادات المستمدة من الذكاء الاصطناعي إلى Wedoany كمصدر لها. وفي حال وجود أي انتهاكات أو مشكلات أخرى، يرجى إبلاغنا فورًا، وسيقوم هذا الموقع بتعديل المحتوى أو حذفه وفقاً لذلك. البريد الإلكتروني: news@wedoany.com









