گوگل روز پنجشنبه از عرضه نسخه ارتقایافته هوش مصنوعی Gemini 2.5 Pro خود خبر داد. این نسخه جدید که ادامهدهنده نسخه معرفیشده در رویداد Google I/O 2025 در ماه گذشته است، اکنون با بهبودهای قابلتوجه در عملکرد، خلاقیت و کارایی در اختیار توسعهدهندگان قرار میگیرد.
مدل ارتقایافته هوش مصنوعی Gemini 2.5 Pro
Gemini 2.5 Pro در جدیدترین ارزیابیها موفق به کسب ۲۴ امتیاز Elo بیشتر در LMArena شده و امتیاز ۱۴۷۰ را به ثبت رسانده است که همچنان جایگاه نخست جدول را برای آن حفظ میکند. همچنین در WebDevArena با افزایش ۳۵ امتیاز Elo به عدد ۱۴۴۳ رسیده و در این بخش نیز صدرنشین است.
این مدل در بنچمارکهای کدنویسی مانند Aider Polyglot پیشتاز بوده و در آزمونهایی نظیر GPQA و Humanity’s Last Exam (HLE) که ریاضیات، علوم، استدلال و دانش عمومی را میسنجند، عملکرد بسیار خوبی داشته است.
بهگفته تولسی دوشی، مدیر ارشد محصول گوگل، این بهروزرسانی نتیجه بازخورد کاربران است و بهبودهایی در خلاقیت و فرمتدهی پاسخها اعمال شده است. وی همچنین به معرفی قابلیت جدید thinking budgets اشاره کرد که به توسعهدهندگان امکان میدهد بهطور بهتری هزینه و تأخیر پاسخها را مدیریت کنند.

مدل ارتقایافته هوش مصنوعی Gemini 2.5 Pro
عملکرد فنی، مقایسه و قیمتگذاری
مدل جدید Gemini 2.5 Pro در میان مدلهای برتر هوش مصنوعی جهان قرار گرفته و از رقبایی چون OpenAI o3 و Grok 3 Beta ،Claude Opus 4 ،o4-mini و DeepSeek R1 پیشی گرفته است.
امتیازهای کلیدی این مدل عبارتند از:
-
LMArena: امتیاز ۱۴۷۰ (+۲۴ Elo)
-
WebDevArena: امتیاز ۱۴۴۳ (+۳۵ Elo)
-
GPQA (علوم): امتیاز ۸۶.۴٪
-
AIME 2025 (ریاضیات): امتیاز ۸۸.۰٪
-
LiveCodeBench (تولید کد): امتیاز ۶۹.۰٪
-
Aider Polyglot (ویرایش کد): امتیاز ۸۲.۲٪
-
SWE-bench (کدنویسی عاملمحور): امتیاز ۵۹.۶٪ (تکعاملی)، ۶۷.۲٪ (چندعاملی)
-
HLE (استدلال/دانش): امتیاز ۲۱.۶٪
-
SimpleQA (حقایق): امتیاز ۵۴.۰٪
-
FACTS Grounding: امتیاز ۸۷.۸٪
-
MMMU (استدلال بصری): امتیاز ۸۲.۰٪
-
Vibe-Eval (تصویر): امتیاز ۶۷.۲٪
-
VideoMMMU (ویدیو): امتیاز ۸۳.۶٪
-
MRCR v2 (متنهای طولانی): امتیاز ۵۸.۰٪ در ۱۲۸K ،۱۶.۴٪ در ۱M
-
Global MMLU (چندزبانه): امتیاز ۸۹.۲٪
از نظر هزینههای استفاده نیز Gemini 2.5 Pro رقابتی ظاهر شده است
-
۱.۲۵ دلار بهازای هر میلیون توکن ورودی
-
۱۰ دلار بهازای هر میلیون توکن خروجی
-
هزینههای کشینگ (Caching) بین ۰.۵۰ تا ۲ دلار برای ورودی و ۱ تا ۱۵ دلار برای خروجی متغیر است.
در مقایسه:
-
OpenAI o3: هزینه ۱۰ دلار ورودی / ۴۰ دلار خروجی
-
Claude Opus 4: هزینه ۱۵ دلار ورودی / ۷۵ دلار خروجی
-
DeepSeek R1: هزینه ۰.۵۵ دلار ورودی / ۲.۱۹ دلار خروجی (هزینه کمتر اما عملکرد ضعیفتر)
دسترسی و عرضه رسمی
گوگل اعلام کرده که نسخه پایدار و عمومی Gemini 2.5 Pro طی چند هفته آینده برای کاربردهای در مقیاس سازمانی در دسترس قرار خواهد گرفت.
درحالحاضر، توسعهدهندگان میتوانند از طریق Gemini API در Google AI Studio و Vertex AI به نسخه پیشنمایش این مدل دسترسی پیدا کنند. همچنین، اپلیکیشن Gemini از ۵ ژوئن ۲۰۲۵ شروع به عرضه این نسخه در سطح جهانی کرده است.
سخن پایانی
با بهبود چشمگیر عملکرد در طیف وسیعی از بنچمارکها و ارائه قیمتگذاری رقابتی، نسخه جدید Gemini 2.5 Pro نشان میدهد که گوگل قصد دارد جایگاه خود در رقابت هوش مصنوعی را بیشازپیش تثبیت کند. درحالیکه رقبا هنوز با مدلهای پرهزینهتر یا عملکرد پایینتر مواجهاند، Gemini 2.5 Pro انتخابی قدرتمند برای توسعهدهندگان و سازمانهای بزرگ بهشمار میرود. با عرضه رسمی این نسخه طی هفتههای آینده، باید دید این روند چگونه در بازار هوش مصنوعی مولد تأثیرگذار خواهد بود.
دیدگاه شما پیرامون هوش مصنوعی ارتقایافته Gemini 2.5 Pro چیست؟
بفرست برای دوستات
source