يتنقل الروبوت في مساحة مكتبية باستخدام Google Gemini

وجدت شركة جوجل طريقة جديدة لإظهار ما يمكن أن يفعله نموذج Gemini AI الخاص بها، بمساعدة الروبوت.

كان هذا روبوتًا من قسم الروبوتات الجميع في Google، والذي تم إغلاقه العام الماضي. ولكن من الواضح أن الروبوتات لا تزال موجودة، لذا وضعت جوجل ربطة عنق صفراء على أحدهم ثم استخدمت جيميني لتعليم الروبوت كيفية الاستجابة للأوامر والتنقل في مساحة مكتب DeepMind.

ولتحقيق ذلك، تستخدم جوجل نماذج لغة الرؤية (VLMs) التي يتم تدريبها على الصور ومقاطع الفيديو مع النص، مما يسمح لها بالإجابة على الأسئلة وتنفيذ المهام التي تتطلب الإدراك.

على سبيل المثال، في أحد مقاطع الفيديو، يطلب أحد موظفي Google من الروبوت أن يأخذه إلى مكان ما لرسم الأشياء. يقول الروبوت أنه يحتاج إلى دقيقة للتفكير، ثم يأخذ الموظف إلى السبورة البيضاء. وفي مقطع فيديو آخر، يُطلب من الروبوت اتباع التوجيهات الموجودة على السبورة البيضاء، حيث تظهر الخريطة الاتجاهات للوصول إلى ما يسمى بالمنطقة الزرقاء. يتبع الروبوت التوجيهات إلى منطقة اختبار الروبوتات ثم يعلن: “لقد اتبعت التوجيهات الموجودة على السبورة البيضاء بنجاح”.

اضغط على زر التشغيل لرؤية الروبوت وهو يعمل، ثم أخبرنا برأيك في التعليقات!