واحد خبر mobile.ir : کمپانی گوگل به تازگی Gemini 2.0 را به عنوان «توانمندترین» مجموعه مدل هوش مصنوعی خود برای استفاده عمومی ارائه کرده است. البته دسترسی به این مجموعه در ماه دسامبر، برای توسعه‌دهندگان و آزمایش‌کنندگان مورد اعتماد کمپانی فراهم شده بود و برخی ویژگی‌های آن نیز در محصولات گوگل قابل استفاده بود، اما اینک نسخه عمومی به طور رسمی به بازار آمده است. این مجموعه تازه از مدل‌های پیشرفته، نمونه‌هایی همچون 2.0Flash به منظور «بهینه‌سازی کارهای پرتکرار پرحجم با بسامد بالا»،2.0Pro Experimental برای کدنویسی و 2.0Flash-Lite را در بر می‌گیرد که شرکت سازنده از این آخری به عنوان «مقرون به صرفه‌ترین مدلی که تاکنون ارائه شده» یاد می‌کند.

انتشار پی‌درپی نسخه‌های جدید مدل‌های هوش مصنوعی بخشی از استراتژی گسترده‌ گوگل برای سرمایه‌گذاری هنگفت روی agents یا عامل‌های هوش مصنوعی است؛ چراکه نبرد تجاری میان غول‌های فناوری و استارت‌آپ‌های این حوزه به اوج خود رسیده است. چنان‌که متا، آمازون، مایکروسافت، OpenAI و Anthropic نیز هوش مصنوعی عاملی (agentic AI) و توسعه هرچه بیشتر آن را در دستورکار قرار داده‌اند. این نوع مدل‌های عاملی می‌توانند وظایف پیچیده چندمرحله‌ای را از طرف کاربر انجام دهند، بدون این‌که کاربر ناچار باشد تک‌تک مراحل آن را خود پشت سر بگذارد.

بنا بر گزارش‌ها، Gemini 2.0 Flash به ازای هر یک میلیون توکن برای ورودی‌های متن، تصویر و ویدئو با هزینه 10 سنت در اختیار توسعه‌دهندگان قرار می‌گیرد، در حالی که Flash-Lite یعنی نسخه مقرون به‌صرفه‌تر، برای همین میزان ورودی مستلزم پرداخت 0.75 سنت هزینه به ازای هر توکن است. گفتنی است که توکن به هر یک از واحد داده‌ای گفته می‌شود که مورد پردازش مدل قرار می‌گیرد.

در همین راستا، گوگل دسترسی به قدرتمندترین مدل هوش مصنوعی خود، یعنی نمونه آزمایشیGemini 2.0 Pro را نیز ارائه کرده است. در این مدل پنجره ورودی دو میلیون توکنی افزوده شده که بزرگ‌ترین پنجره هوش مصنوعی گوگل به شمار می‌رود و قادر است ورودی‌های متنی بسیار بزرگ را مدیریت کند. در واقع Gemini برای رسیدگی به فرمان‌های پیچیده در این قبیل ورودی‌ها طراحی شده است. علاوه بر این، Gemini 2.0 Pro می‌تواند در وب نیز جست‌وجو کرده و هنگام کدنویسی اپ‌ها، آن‌ها را به اجرا هم درآورد.

گوگل پیش از این و طی پستی در وبلاگ رسمی خود در ماه دسامبر اعلام کرده بود: «در طول سال گذشته، ما روی توسعه مدل‌های عاملی سرمایه‌گذاری کرده‌ایم. به این معنا که [مدل‌های جدید] می‌توانند درباره دنیای اطراف شما درک بیشتری داشته باشند، گام‌های متعددی را از پیش مورد بررسی قرار دهند و از طرف و تحت نظارت شما دست به اقدام بزنند.» این شرکت در ادامه ضمن اشاره به پیشرفت‌های تازه Gemini 2.0 در زمینه قابلیت‌های چندحالتی (multimodal) مانند خروجی صدا و تصویر و کاربرد ابزار به صورت محلی، افزوده بود که این مجموعه از مدل‌ها تحقق چشم‌اندازها را برای عرضه یک دستیار فراگیر بیش از پیش قابل دسترسی کرده‌اند.

Anthropic، استارت‌آپ هوش مصنوعی تحت حمایت آمازون که توسط مدیران پژوهشی سابق OpenAI تأسیس شده است، رقیبی کلیدی برای گوگل در زمینه توسعه هوش مصنوعی عاملی به شمار می‌رود. این شرکت در ماه اکتبر از توانایی عوامل هوش مصنوعی خود برای استفاده از رایانه‌ها همچون یک انسان و انجام وظایف پیچیده خبر داده بود. به گفته مدیران این استارت‌آپ، قابلیت استفاده از رایانه در محصولات Anthropic این امکان را فراهم می‌سازد که عامل هوش مصنوعی آن‌چه را روی صفحه رایانه نمایش داده شده تفسیر و دکمه‌ها را انتخاب کند. همچنین توانایی وارد کردن متن، مرور وب‌سایت‌ها و اجرای taskها از طریق نرم‌افزارهای مختلف و مرور اینترنت به صورت آنی از دیگر قابلیت‌های این agent به‌شمار می‌رود.

OpenAI هم اخیراً ویژگی مشابهی با نام Operator را ارائه کرده است که وظایفی مانند برنامه‌ریزی تعطیلات، پر کردن فرم‌ها، رزرو رستوران و سفارش خواروبار را به طور خودکار انجام می‌دهد. این استارت‌آپ تحت حمایت مایکروسافت، از عامل هوش مصنوعی Operator به عنوان «عاملی که قادر است به وب رفته و taskهای مورد نظر شما را انجام دهد» یاد کرده است.

همچنینOpenAI به تازگی Deep Research را معرفی کرده است که به عامل هوش مصنوعی اجازه می‌دهد گزارش‌های تحقیقاتی پیچیده‌ای را جمع‌آوری و سؤالات و موضوعات انتخابی کاربر را تجزیه و تحلیل کند. این در حالی است که گوگل نیز در ماه دسامبر ابزار مشابهی با همین نام یعنی Deep Research را به عنوان «دستیار پژوهشی [برای] بررسی موضوعات پیچیده و تدوین گزارش‌ها از طرف کاربر» را به نمایش گذاشته بود.

Gemini 2.0 Pro در حال حاضر برای همه کاربران Google Gemini Advanced و همچنین توسعه‌دهندگانی که از Google AI Studio و Vertex AI استفاده می‌کنند با پرداخت هزینه اشتراک 19.99 دلار در ماه در دسترس است. همچنین اپلیکیشن این مدل هوش مصنوعی به صورت پیش‌فرض روی گوشی‌ Pixel 9 Pro نصب شده است و علاوه بر آن علاقمندان می‌توانند اپلیکیشن Gemini را روی اسمارت‌فون خود نصب کنند.

source

توسط wikiche.com