Google DeepMind به طور پیوسته در حال پیشرفت در زمینه هوش مصنوعی بوده و بهروزرسانیهای منظمی را برای مدلهای Gemini، Imagen، Veo، Gemma و AlphaFold ارائه میدهد. امروز، تیم Google DeepMind با دو مدل جدید مبتنی بر Gemini 2.0 وارد صنعت رباتیک شد: Gemini Robotics و Gemini Robotics-ER.
معرفی Gemini Robotics: مدلی پیشرفته برای کنترل رباتها
Gemini Robotics یک مدل پیشرفته “بینایی-زبان-عمل” (VLA) است که بر پایه Gemini 2.0 ساخته شده. تفاوت مهم این مدل، اضافه شدن “اعمال فیزیکی” به عنوان یک روش خروجی جدید برای کنترل رباتها است. گوگل ادعا میکند که این مدل جدید میتواند موقعیتهایی را که قبلاً در طول آموزش ندیده است، درک کند.
عملکرد برتر Gemini Robotics در مقایسه با سایر مدلها
در مقایسه با سایر مدلهای پیشرفته “بینایی-زبان-عمل”، Gemini Robotics در یک معیار جامع تعمیمپذیری، دو برابر بهتر عمل میکند. از آنجایی که Gemini Robotics بر روی مدل Gemini 2.0 ساخته شده، از قابلیتهای درک زبان طبیعی در زبانهای مختلف برخوردار است. بنابراین، میتواند دستورات افراد را به شکل بسیار بهتری درک کند.
مهارت و دقت Gemini Robotics در انجام وظایف پیچیده
از نظر مهارت، گوگل ادعا میکند که Gemini Robotics میتواند وظایف بسیار پیچیده و چند مرحلهای را که نیاز به دستکاری دقیق دارند، انجام دهد. به عنوان مثال، این مدل میتواند تا کردن اوریگامی یا قرار دادن یک خوراکی در کیسه زیپدار را انجام دهد.
معرفی Gemini Robotics-ER: تمرکز بر استدلال فضایی و سهولت استفاده برای متخصصان رباتیک
Gemini Robotics-ER یک مدل پیشرفته “بینایی-زبان” است که بر استدلال فضایی تمرکز دارد و به متخصصان رباتیک اجازه میدهد تا آن را با کنترلکنندههای سطح پایین موجود خود متصل کنند. با استفاده از این مدل، متخصصان رباتیک تمام مراحل کنترل ربات، شامل درک محیط، تخمین وضعیت، درک فضایی، برنامهریزی و تولید کد را به صورت آماده در اختیار خواهند داشت.
همکاریهای Google DeepMind برای توسعه رباتهای انساننما
گوگل در حال همکاری با Apptronik برای ساخت رباتهای انساننما بر اساس مدلهای Gemini 2.0 است. گوگل همچنین با آزمایشکنندگان منتخب و معتبر، از جمله Agile Robots، Agility Robotics، Boston Dynamics و Enchanted Tools، بر روی آینده Gemini Robotics-ER کار میکند.
چشمانداز آینده: ادغام یکپارچه رباتها در زندگی روزمره
Google DeepMind با قادر ساختن رباتها به درک و اجرای وظایف پیچیده با دقت و سازگاری بیشتر، راه را برای آیندهای هموار میکند که در آن رباتها میتوانند به طور یکپارچه در جنبههای مختلف زندگی ما ادغام شوند.
source