جوجل: برنامج Gemini AI يجعل الروبوتات الخاصة بنا أكثر ذكاءً
وتقوم جوجل بتدريب روبوتات Gemini AI الخاصة بها لتحسين قدراتها على التنقل وإكمال المهام، وقد أوضح فريق الروبوتات DeepMind في ورقة بحثية جديدة كيف أن استخدام نافذة السياق الطويلة في Gemini 1.5 Pro، والتي تحد من مقدار المعلومات التي يمكن لنموذج الذكاء الاصطناعي معالجتها، يسمح للمستخدمين بالتفاعل بسهولة أكبر مع روبوتات RT-2 باستخدام تعليمات اللغة الطبيعية.
وتعمل هذه التقنية من خلال القيام بجولة فيديو في منطقة محددة، مثل منزل أو مساحة مكتب، ويستخدم الباحثون برنامج Gemini 1.5 Pro لجعل الروبوت “يشاهد” الفيديو للتعرف على البيئة.
ويستطيع الروبوت بعد ذلك تنفيذ الأوامر بناء على ما لاحظه باستخدام مخرجات لفظية أو بصرية، مثل توجيه المستخدمين إلى منفذ طاقة بعد إظهار هاتف له وسؤاله، “أين يمكنني شحنه؟”
وتقول شركة DeepMind إن روبوتها الذي يعمل بمحرك Gemini حقق معدل نجاح بنسبة 90% في أكثر من 50 تعليمات للمستخدم في منطقة تشغيل تزيد مساحتها عن 9000 قدم مربع.
كما وجد الباحثون “أدلة أولية” على أن برنامج Gemini 1.5 Pro مكّن الروبوتات من التخطيط لكيفية تنفيذ التعليمات بما يتجاوز مجرد التوجيه. على سبيل المثال، عندما سأل مستخدم لديه الكثير من علب الكوكاكولا على مكتبه الروبوت عما إذا كان مشروبه المفضل متاحًا، قال الفريق إن برنامج Gemini “كان يعلم أن الروبوت يجب أن يتوجه إلى الثلاجة، ويتحقق من وجود علب الكوكاكولا، ثم يبلغ المستخدم بالنتيجة”. وتقول شركة DeepMind إنها تخطط للتحقيق في هذه النتائج بشكل أكبر.
كما أن عروض الفيديو التوضيحية التي تقدمها شركة جوجل مثيرة للإعجاب، على الرغم من أن المقاطع الواضحة بعد أن يستجيب الروبوت لكل طلب تكذب حقيقة أن الأمر يستغرق ما بين 10 إلى 30 ثانية لمعالجة هذه التعليمات. ووفقًا لورقة البحث، فقد يستغرق الأمر بعض الوقت قبل أن نشارك منازلنا مع روبوتات رسم الخرائط البيئية الأكثر تقدمًا، ولكن على الأقل قد تكون هذه الروبوتات قادرة على العثور على مفاتيحنا أو محافظنا المفقودة.
للمزيد : تابعنا هنا ، وللتواصل الاجتماعي تابعنا علي فيسبوك وتويتر .
مصدر المعلومات والصور: youm7