پس از گوگل، شرکت Anthropic نیز پیشرفته‌ترین مدل هوش مصنوعی خود را معرفی کرد. مدل Claude Opus 4.5 اکنون در اپلیکیشن‌ها، API و تمامی پلتفرم‌های ابری معتبر در دسترس قرار دارد. قیمت‌گذاری این مدل از ۵ دلار برای ورودی و ۲۵ دلار برای خروجی به ازای هر یک میلیون توکن آغاز می‌شود.


عملکرد بی‌رقیب در مهندسی نرم‌افزار

آنتروپیک در بلاگ رسمی خود اعلام کرده که Opus 4.5 بهترین عملکرد را در ارزیابی‌های واقعی کدنویسی ارائه داده است. در تست SWE-bench Verified، این مدل از تمام سیستم‌های پیشرفته رقیب – از جمله Gemini 3 Pro گوگل – بهتر ظاهر شده و توانسته پیچیده‌ترین باگ‌های چندسیستمی را با دقت بیشتری حل کند.

گزارش‌ها نشان می‌دهد Opus 4.5 در چالش‌هایی موفق بوده که حتی مدل‌های قبلی آنتروپیک مانند Sonnet 4.5 قادر به انجام کامل آن‌ها نبودند.


بهترین نتیجه ثبت‌شده در آزمون داخلی آنتروپیک

این شرکت همچنین اعلام کرد که Claude Opus 4.5 بالاترین امتیاز تاریخ را در آزمون مهندسی داخلی آنتروپیک کسب کرده است؛ آن هم در بازه زمانی دو ساعت. این امتیاز حتی از تمامی نامزدهای انسانی که تاکنون ارزیابی شده‌اند بالاتر بوده است.

از سوی دیگر، آزمایش‌کنندگان به توانایی این مدل در استدلال عاملی (agentic reasoning) اشاره کرده‌اند؛ قابلیتی که باعث می‌شود Opus 4.5 در مسیرهای چندمرحله‌ای راه‌حل‌های خلاقانه پیدا کند.


هماهنگی و امنیت بیشتر در برابر حملات

به گفته آنتروپیک، Claude Opus 4.5 هماهنگ‌ترین و امن‌ترین مدل این شرکت تاکنون است. این مدل در برابر حملات پیچیده تزریق درخواست (prompt injection) مقاومت بیشتری نشان داده و نسبت به دیگر مدل‌های پیشرفته عملکرد قابل‌اطمینان‌تری دارد.


ارتقای پلتفرم توسعه‌دهندگان Claude

هم‌زمان با رونمایی Opus 4.5، آنتروپیک مجموعه‌ای از ارتقاها را برای پلتفرم توسعه‌دهندگان خود معرفی کرد:

  • ابزار جدید “effort” برای کنترل عمق استدلال

  • بهبودهای گسترده در Claude Code

  • پشتیبانی بهتر در نسخه دسکتاپ

  • مدیریت بهینه متن‌های طولانی در اپ، افزونه کروم و افزونه اکسل

  • افزایش سقف مصرف برای کاربران Max و Team Premium

آنتروپیک در توضیحات خود نوشته است:

«در کنار Opus، به‌روزرسانی‌های مهمی برای پلتفرم توسعه‌دهندگان، Claude Code و اپلیکیشن‌های مصرفی اضافه شده است. ابزارهای تازه برای اجرای ایجنت‌های طولانی‌مدت و روش‌های جدید استفاده از کلود در اکسل، کروم و دسکتاپ ارائه می‌شود.»


این معرفی نشان می‌دهد رقابت میان مدل‌های پیشرفته هوش مصنوعی در حوزه مهندسی نرم‌افزار و عملکرد ایجنت‌ها وارد مرحله جدیدی شده است؛ جایی که آنتروپیک تلاش دارد جایگاهی فراتر از رقبای بزرگی مثل گوگل و OpenAI به دست آورد.

source

توسط wikiche.com