در ماه سپتامبر، شرکت OpenAI از سری جدید مدل‌های زبانی بزرگ خود به نام سری o1 رونمایی کرد که برای اختصاص زمان بیشتری به تفکر پیش از پاسخ طراحی شده‌اند. این مدل‌ها برای انجام وظایف پیچیده در زمینه استدلال بسیار مناسب هستند و در حوزه‌های علمی، کدنویسی و ریاضی عملکرد بهتری دارند.

 

گوگل از مدل استدلالی جدید Gemini 2.0 رونمایی کرد

 

امروز، شرکت گوگل اولین مدل بزرگ زبانی خود با تمرکز بر استدلال را با نام Gemini 2.0 Flash Thinking معرفی کرد. این مدل آزمایشی جدید تحت عنوان gemini-2.0-flash-thinking-exp-1219 در دسترس توسعه‌ دهندگان در پلتفرم Google AI Studio قرار گرفته است. گوگل ادعا می‌کند که این مدل جدید برای درک چندحالتی (multimodal)، استدلال و کدنویسی بسیار مناسب است.

گوگل اشاره کرد که با افزایش زمان محاسبه در هنگام استنتاج (inference)، به نتایج امیدوارکننده‌ای دست یافته است. با این حال، این شرکت هیچ معیاری برای پشتیبانی از این ادعا ارائه نکرد. اما بر اساس داده‌های Chatbot Arena، مدل Gemini-2.0-Flash-Thinking اکنون در تمامی دسته‌ بندی‌ها رتبه اول را دارد.

 

پیشرفت از Gemini-2.0-Flash:

  1. رتبه کلی: از #3 به #1
  2. کنترل سبک (Style Control): از #4 به #1
  3. ریاضی: از #2 به #1
  4. نگارش خلاقانه: از #2 به #1
  5. پرسش‌های سخت: همچنان #1

 

موارد استفاده مدل Gemini 2.0 Flash Thinking

گوگل در پورتال توسعه‌ دهندگان خود این موارد استفاده را برای مدل جدید ذکر کرده است:

  1. تحلیل و استدلال در مسائل بسیار پیچیده
  2. نمایش فرآیند فکری مدل
  3. حل مسائل دشوار کدنویسی و ریاضی

این مدل جدید از طول زمینه‌ای بیش از 128 هزار توکن پشتیبانی می‌کند و دارای برش دانش تا آگوست 2024 است. توسعه‌ دهندگان می‌توانند از طریق Gemini API در Google AI Studio و Vertex AI به این مدل استدلالی جدید دسترسی پیدا کنند.

 

اوایل این هفته، OpenAI اعلام کرد که مدل استدلالی o1 آن برای توسعه‌ دهندگان با سطح دسترسی 5 در API منتشر شده است. این مدل بروز شده o1 نتایج پیشرفته‌ای را در چندین معیار محبوب هوش مصنوعی ارائه می‌دهد. توسعه‌ دهندگان می‌توانند از این مدل برای ساخت اپلیکیشن‌های هوشمند جهت بهبود پشتیبانی مشتری، بهینه‌ سازی تصمیم‌ گیری‌های زنجیره تأمین و پیش‌بینی روندهای مالی استفاده کنند.

با این مدل‌های زبانی جدید با تمرکز بر استدلال، توسعه‌ دهندگان ابزارهای قدرتمندتری برای ایجاد اپلیکیشن‌های نوآورانه هوش مصنوعی در صنایع مختلف در اختیار دارند.

source

توسط wikiche.com