در کنفرانس Google I/O 2025، گوگل امروز چندین به‌روزرسانی برای مدل‌های سری Gemini 2.5 را اعلام کرد. مهم‌ترین نکته، معرفی حالت Deep Think برای Gemini 2.5 Pro بود که طبق گزارش‌ها، در آزمون‌های معتبر هوش مصنوعی، حتی از جدیدترین مدل‌های o3 و o4 شرکت OpenAI هم بهتر عمل کرده است.

گوگل هیچ به‌روزرسانی جدیدی برای مدل Gemini 2.5 Pro اعلام نکرد، چون این مدل همین اوایل ماه جاری یک به‌روزرسانی مهم دریافت کرده بود. با این حال، حالت جدید استدلال تقویت‌شده با نام Deep Think قرار است توانایی‌های مدل 2.5 Pro را به سطح بالاتری برساند. Deep Think از تکنیک‌های پژوهشی جدیدی استفاده می‌کند تا قبل از ارائه پاسخ، فرضیات مختلف را بررسی کند.

 

گوگل با حالت Deep Think در Gemini 2.5 Pro رکورد OpenAI را شکست؛ پیشرفت چشمگیر هوش مصنوعی در Google I/O 2025

 

گوگل سه معیار (بنچمارک) زیر را برای Deep Think در مدل 2.5 Pro اعلام کرد:

  • کسب امتیاز ۴۹.۴ درصد در آزمون ریاضی USAMO سال ۲۰۲۵.
  • کسب امتیاز ۸۰.۴ درصد در بنچمارک برنامه‌نویسی سطح مسابقه LiveCodeBench.
  • کسب امتیاز ۸۴ درصد در بنچمارک استدلال چندرسانه‌ای MMMU.

تمام این نتایج، رکورد جدید محسوب می‌شوند و حتی از جدیدترین مدل‌های o3 و o4 شرکت OpenAI نیز بهتر هستند. مدل 2.5 Pro Deep Think فعلاً از طریق Gemini API فقط برای تست‌کنندگان مورد اعتماد قابل دسترسی خواهد بود.

گوگل همچنین جدیدترین به‌روزرسانی مدل Gemini 2.5 Flash را معرفی کرد که یک مدل کم‌هزینه محسوب می‌شود. این مدل جدید در همه بنچمارک‌ها نسبت به نسخه قبلی عملکرد بهتری دارد و اکنون برای پیش‌نمایش در Google AI Studio برای توسعه‌دهندگان، در Vertex AI برای شرکت‌ها و در اپلیکیشن Gemini در دسترس است. نسخه نهایی و تولیدی Gemini 2.5 Flash در ماه ژوئن منتشر خواهد شد.

 

همزمان با به‌روزرسانی مدل‌ها، گوگل بهبودهای زیر را برای تجربه توسعه‌دهندگان Gemini اعلام کرد:

  • پیش‌نمایش جدید Live API با پشتیبانی از چند گوینده، امکان تبدیل متن به گفتار با دو صدا از طریق خروجی صوتی بومی و امکانات بیشتر.
  • پشتیبانی SDK بومی برای تعاریف Model Context Protocol (MCP) در Gemini API برای ادغام ساده‌تر با ابزارهای متن‌باز.
  • مدل Gemini 2.5 Pro با قابلیت بودجه‌بندی تفکر (thinking budgets) طی هفته‌های آینده برای استفاده عمومی و پایدار در دسترس خواهد بود.
  • قابلیت‌های پردازش رایانه‌ای پروژه Mariner به Gemini API و Vertex AI اضافه می‌شود.
  • مدل‌های 2.5 Pro و Flash اکنون شامل خلاصه‌سازی فکر (thought summaries) در Gemini API و Vertex AI خواهند بود.

source

توسط wikiche.com