مدل ارتقایافته هوش مصنوعی Gemini 2.5 Pro گوگل منتشر شد

گوگل روز پنج‌شنبه از عرضه نسخه ارتقایافته هوش مصنوعی Gemini 2.5 Pro خود خبر داد. این نسخه جدید که ادامه‌دهنده نسخه معرفی‌شده در رویداد Google I/O 2025 در ماه گذشته است، اکنون با بهبودهای قابل‌توجه در عملکرد، خلاقیت و کارایی در اختیار توسعه‌دهندگان قرار می‌گیرد.

مدل ارتقایافته هوش مصنوعی Gemini 2.5 Pro

Gemini 2.5 Pro در جدیدترین ارزیابی‌ها موفق به کسب ۲۴ امتیاز Elo بیشتر در LMArena شده و امتیاز ۱۴۷۰ را به ثبت رسانده است که همچنان جایگاه نخست جدول را برای آن حفظ می‌کند. همچنین در WebDevArena با افزایش ۳۵ امتیاز Elo به عدد ۱۴۴۳ رسیده و در این بخش نیز صدرنشین است.

این مدل در بنچمارک‌های کدنویسی مانند Aider Polyglot پیشتاز بوده و در آزمون‌هایی نظیر GPQA و Humanity’s Last Exam (HLE) که ریاضیات، علوم، استدلال و دانش عمومی را می‌سنجند، عملکرد بسیار خوبی داشته است.

به‌گفته تولسی دوشی، مدیر ارشد محصول گوگل، این به‌روزرسانی نتیجه بازخورد کاربران است و بهبودهایی در خلاقیت و فرمت‌دهی پاسخ‌ها اعمال شده است. وی همچنین به معرفی قابلیت جدید thinking budgets اشاره کرد که به توسعه‌دهندگان امکان می‌دهد به‌طور بهتری هزینه و تأخیر پاسخ‌ها را مدیریت کنند.

مدل ارتقایافته هوش مصنوعی Gemini 2.5 Pro

عملکرد فنی، مقایسه و قیمت‌گذاری

مدل جدید Gemini 2.5 Pro در میان مدل‌های برتر هوش مصنوعی جهان قرار گرفته و از رقبایی چون OpenAI o3 و Grok 3 Beta ،Claude Opus 4 ،o4-mini و DeepSeek R1 پیشی گرفته است.

امتیازهای کلیدی این مدل عبارتند از:

LMArena: امتیاز ۱۴۷۰ (+۲۴ Elo)
WebDevArena: امتیاز ۱۴۴۳ (+۳۵ Elo)
GPQA (علوم): امتیاز ۸۶.۴٪
AIME 2025 (ریاضیات): امتیاز ۸۸.۰٪
LiveCodeBench (تولید کد): امتیاز ۶۹.۰٪
Aider Polyglot (ویرایش کد): امتیاز ۸۲.۲٪
SWE-bench (کدنویسی عامل‌محور): امتیاز ۵۹.۶٪ (تک‌عاملی)، ۶۷.۲٪ (چندعاملی)
HLE (استدلال/دانش): امتیاز ۲۱.۶٪
SimpleQA (حقایق): امتیاز ۵۴.۰٪
FACTS Grounding: امتیاز ۸۷.۸٪
MMMU (استدلال بصری): امتیاز ۸۲.۰٪
Vibe-Eval (تصویر): امتیاز ۶۷.۲٪
VideoMMMU (ویدیو): امتیاز ۸۳.۶٪
MRCR v2 (متن‌های طولانی): امتیاز ۵۸.۰٪ در ۱۲۸K ،۱۶.۴٪ در ۱M
Global MMLU (چندزبانه): امتیاز ۸۹.۲٪

از نظر هزینه‌های استفاده نیز Gemini 2.5 Pro رقابتی ظاهر شده است

۱.۲۵ دلار به‌ازای هر میلیون توکن ورودی
۱۰ دلار به‌ازای هر میلیون توکن خروجی
هزینه‌های کشینگ (Caching) بین ۰.۵۰ تا ۲ دلار برای ورودی و ۱ تا ۱۵ دلار برای خروجی متغیر است.

در مقایسه:

OpenAI o3: هزینه ۱۰ دلار ورودی / ۴۰ دلار خروجی
Claude Opus 4: هزینه ۱۵ دلار ورودی / ۷۵ دلار خروجی
DeepSeek R1: هزینه ۰.۵۵ دلار ورودی / ۲.۱۹ دلار خروجی (هزینه کمتر اما عملکرد ضعیف‌تر)

دسترسی و عرضه رسمی

گوگل اعلام کرده که نسخه پایدار و عمومی Gemini 2.5 Pro طی چند هفته آینده برای کاربردهای در مقیاس سازمانی در دسترس قرار خواهد گرفت.

درحال‌حاضر، توسعه‌دهندگان می‌توانند از طریق Gemini API در Google AI Studio و Vertex AI به نسخه پیش‌نمایش این مدل دسترسی پیدا کنند. همچنین، اپلیکیشن Gemini از ۵ ژوئن ۲۰۲۵ شروع به عرضه این نسخه در سطح جهانی کرده است.

سخن پایانی

با بهبود چشمگیر عملکرد در طیف وسیعی از بنچمارک‌ها و ارائه قیمت‌گذاری رقابتی، نسخه جدید Gemini 2.5 Pro نشان می‌دهد که گوگل قصد دارد جایگاه خود در رقابت هوش مصنوعی را بیش‌ازپیش تثبیت کند. درحالی‌که رقبا هنوز با مدل‌های پرهزینه‌تر یا عملکرد پایین‌تر مواجه‌اند، Gemini 2.5 Pro انتخابی قدرتمند برای توسعه‌دهندگان و سازمان‌های بزرگ به‌شمار می‌رود. با عرضه رسمی این نسخه طی هفته‌های آینده، باید دید این روند چگونه در بازار هوش مصنوعی مولد تأثیرگذار خواهد بود.

دیدگاه شما پیرامون هوش مصنوعی ارتقایافته Gemini 2.5 Pro چیست؟

source

توسطwikiche.com