Google DeepMind به طور پیوسته در حال پیشرفت در زمینه هوش مصنوعی بوده و به‌روزرسانی‌های منظمی را برای مدل‌های Gemini، Imagen، Veo، Gemma و AlphaFold ارائه می‌دهد. امروز، تیم Google DeepMind با دو مدل جدید مبتنی بر Gemini 2.0 وارد صنعت رباتیک شد: Gemini Robotics و Gemini Robotics-ER.

 

هوش مصنوعی Gemini وارد دنیای ربات‌ها شد

 

معرفی Gemini Robotics: مدلی پیشرفته برای کنترل ربات‌ها

Gemini Robotics یک مدل پیشرفته “بینایی-زبان-عمل” (VLA) است که بر پایه Gemini 2.0 ساخته شده. تفاوت مهم این مدل، اضافه شدن “اعمال فیزیکی” به عنوان یک روش خروجی جدید برای کنترل ربات‌ها است. گوگل ادعا می‌کند که این مدل جدید می‌تواند موقعیت‌هایی را که قبلاً در طول آموزش ندیده است، درک کند.

 

عملکرد برتر Gemini Robotics در مقایسه با سایر مدل‌ها

در مقایسه با سایر مدل‌های پیشرفته “بینایی-زبان-عمل”، Gemini Robotics در یک معیار جامع تعمیم‌پذیری، دو برابر بهتر عمل می‌کند. از آنجایی که Gemini Robotics بر روی مدل Gemini 2.0 ساخته شده، از قابلیت‌های درک زبان طبیعی در زبان‌های مختلف برخوردار است. بنابراین، می‌تواند دستورات افراد را به شکل بسیار بهتری درک کند.

 

مهارت و دقت Gemini Robotics در انجام وظایف پیچیده

از نظر مهارت، گوگل ادعا می‌کند که Gemini Robotics می‌تواند وظایف بسیار پیچیده و چند مرحله‌ای را که نیاز به دستکاری دقیق دارند، انجام دهد. به عنوان مثال، این مدل می‌تواند تا کردن اوریگامی یا قرار دادن یک خوراکی در کیسه زیپ‌دار را انجام دهد.

 

معرفی Gemini Robotics-ER: تمرکز بر استدلال فضایی و سهولت استفاده برای متخصصان رباتیک

Gemini Robotics-ER یک مدل پیشرفته “بینایی-زبان” است که بر استدلال فضایی تمرکز دارد و به متخصصان رباتیک اجازه می‌دهد تا آن را با کنترل‌کننده‌های سطح پایین موجود خود متصل کنند. با استفاده از این مدل، متخصصان رباتیک تمام مراحل کنترل ربات، شامل درک محیط، تخمین وضعیت، درک فضایی، برنامه‌ریزی و تولید کد را به صورت آماده در اختیار خواهند داشت.

 

همکاری‌های Google DeepMind برای توسعه ربات‌های انسان‌نما

گوگل در حال همکاری با Apptronik برای ساخت ربات‌های انسان‌نما بر اساس مدل‌های Gemini 2.0 است. گوگل همچنین با آزمایش‌کنندگان منتخب و معتبر، از جمله Agile Robots، Agility Robotics، Boston Dynamics و Enchanted Tools، بر روی آینده Gemini Robotics-ER کار می‌کند.

 

چشم‌انداز آینده: ادغام یکپارچه ربات‌ها در زندگی روزمره

Google DeepMind با قادر ساختن ربات‌ها به درک و اجرای وظایف پیچیده با دقت و سازگاری بیشتر، راه را برای آینده‌ای هموار می‌کند که در آن ربات‌ها می‌توانند به طور یکپارچه در جنبه‌های مختلف زندگی ما ادغام شوند.

source

توسط wikiche.com