للمساعدة في تمكين الآلات من امتلاك القدرة البصرية اللازمة لفهم العالم، طوّر باحثون مجموعة بيانات تدريبية جديدة تُدعى RoboSpatial، تهدف إلى تحسين قدرات الروبوتات على الإدراك المكاني. في دراسة جديدة، تفوقت الروبوتات التي تم تدريبها باستخدام مجموعة بيانات RoboSpatial على الروبوتات المدربة باستخدام النماذج الأساسية (baseline models) في أداء المهام نفسها، حيث أظهرت فهماً معقداً للعلاقات المكانية وتلاعب الأجسام المادية.

إن الإدراك البصري البشري هو الذي يشكل طريقة تفاعلنا مع البيئة المحيطة، بينما كانت الروبوتات تعاني سابقاً من نقص البيانات اللازمة لتحقيق فهم مكاني معقد، مما جعل تطوير هذه المهارات يحقق نتائج محدودة. أشار لوك سونغ (Luke Song)، الطالب في مرحلة الدكتوراه بكلية الهندسة في Ohio State University، إلى أن الفهم العميق للمكان ضروري للتفاعل البديهي، وأن عدم حل تحديات التفكير المكاني سيُعيق قدرة أنظمة الذكاء الاصطناعي المستقبلية على فهم التعليمات المعقدة والعمل في بيئات ديناميكية. وقال: «لكي نمتلك نماذج أساسية عامة حقاً، يجب أن تفهم الروبوتات العالم ثلاثي الأبعاد المحيط بها، فالفهم المكاني يُعدّ من أهم القدرات التي يجب أن يمتلكها الروبوت».
تحتوي مجموعة بيانات RoboSpatial على أكثر من مليون صورة حقيقية للبيئات الداخلية وسطح المكتب، وآلاف عمليات المسح ثلاثي الأبعاد عالية الدقة، وثلاثة ملايين تسمية (label) غنية بالمعلومات المكانية المتعلقة بالروبوتات. من خلال هذه الموارد، يقترن إطار العمل بين الصور ثنائية الأبعاد من منظور الذات (egocentric) وصور المسح ثلاثي الأبعاد الكاملة للمشهد نفسه، مما يمكّن النموذج من تعلم تحديد موقع الأجسام بدقة سواء باستخدام الصور المسطحة أو الهندسة ثلاثية الأبعاد. وبالمقارنة مع مجموعات البيانات التدريبية الحالية، تتيح RoboSpatial اختبار قدرات التفكير المكاني بشكل صارم في مهام روبوتية حقيقية، حيث يتم أولاً عرض إعادة ترتيب الأجسام، ثم اختبار قدرة النموذج على التعميم في سيناريوهات تفكير مكاني جديدة.
قام الفريق باختبار النظام على ذراع روبوت Kinova Jaco، الذي يُستخدم كذراع مساعدة للأشخاص ذوي الإعاقة للتفاعل مع بيئتهم المحيطة. خلال التدريب، تمكن الروبوت من الإجابة بشكل صحيح على أسئلة مكانية مغلقة بسيطة مثل: «هل يمكن وضع الكرسي أمام الطاولة؟» أو «هل الكوب على يسار اللابتوب؟». أشار لوك سونغ إلى أن هذه النتائج تعني أنه من خلال تحسين قدرات الروبوت على إدراك وتنظيم البيئة المكانية، يمكننا الحصول على أنظمة ذكاء اصطناعي أكثر أماناً وموثوقية. ورغم أن تدريب الذكاء الاصطناعي لا يزال يواجه العديد من الألغاز غير المحلولة، فإن RoboSpatial تمتلك القدرة على أن تصبح أساساً لتطبيقات أوسع في مجال الروبوتات، وقد تُولّد تقدماً تكنولوجياً مكانياً أكثر إثارة في المستقبل.













