شرکت دیپ‌سیک درحال آماده‌سازی برای رونمایی از نسل جدید مدل هوش مصنوعی خود با نام DeepSeek R2 است. این مدل پیشرفته قرار است در بازه زمانی ۲۴ تا ۸ شهریور ۱۴۰۴ عرضه شود، تنها چند روز پس از انتشار رسمی ChatGPT 5.

تحول بزرگ مدل هوش مصنوعی DeepSeek R2 با معماری Mixture of Experts

مدل DeepSeek R2 قرار است جهشی قابل‌توجه در معماری مدل‌های زبانی ایجاد کند. این مدل از ساختار Mixture of Experts (MoE) پیشرفته‌تری بهره خواهد برد و به شبکه گیتینگ هوشمندتر برای مدیریت بهتر بارهای سنگین استنتاج مجهز می‌شود.

بر اساس گزارش منابع آگاه از روند توسعه این مدل، تعداد پارامترهای DeepSeek R2 به ۱.۲ تریلیون خواهد رسید، تقریباً دو برابر مدل قبلی DeepSeek R1 که دارای ۶۷۱ میلیارد پارامتر بود. البته این میزان هنوز کمتر از مدل‌های ChatGPT 4/5 با بیش از ۱.۸ تریلیون پارامتر است.

حرکت به‌سمت استقلال هوش مصنوعی در چین

یکی از جنبه‌های مهم DeepSeek R2، تربیت کامل مدل روی تراشه‌های Ascend 910B هواوی است. این اقدام استراتژیک با هدف کاهش وابستگی به سخت‌افزارهای ساخت ایالات متحده انجام شده و در مسیر خودکفایی چین در حوزه هوش مصنوعی معنا دارد.

خوشه محاسباتی هواوی با توان پردازشی ۵۱۲ پتافلاپس FP16 و بهره‌وری ۸۲ درصدی، به‌گفته تحلیل‌گران، حدود ۹۱ درصد از قدرت خوشه‌های مبتنی‌بر Nvidia A100 را ارائه می‌دهد. علاوه‌براین، هزینه آموزش DeepSeek-R2 حدود ۹۷ درصد کمتر از GPT-4 گزارش شده و این به‌لطف استفاده از سخت‌افزار بومی و تکنیک‌های بهینه‌سازی نرم‌افزاری است.

مدل هوش مصنوعی DeepSeek R2

مدل هوش مصنوعی DeepSeek R2

آغاز رقابت قیمتی با OpenAI و Anthropic

تحلیل‌گران پیش‌بینی می‌کنند که DeepSeek با هدف رقابت جدی در قیمت‌گذاری API وارد میدان خواهد شد. این اقدام می‌تواند ساختار بازار خدمات هوش مصنوعی را که اکنون تحت سلطه شرکت‌هایی چون OpenAI و Anthropic است، دچار دگرگونی کند.

در پی این اخبار، سهام شرکت‌های فناوری چینی با جهش همراه بوده است. برای مثال، ارزش سهام شرکت سازنده تراشه Cambricon حدود ۲۰ درصد رشد کرده و ارزش بازار آن به بیش از ۳۵۵ میلیارد یوان (حدود ۴۹.۷ میلیارد دلار) رسیده است.

سخن پایانی

عرضه DeepSeek R2 همراه با معرفی چارچوب استنتاج جدید هواوی با نام Unified Cache Manager (UCM)، نشانه‌ای واضح از تحول در چشم‌انداز هوش مصنوعی چین است. هواوی در آزمایش‌های انجام‌شده با شرکت UnionPay توانسته تا ۹۰ درصد کاهش تأخیر و ۲۲ برابر افزایش بازدهی در عملکرد مدل‌ها ایجاد کند. قرار است این ابزار در شهریور ۱۴۰۴ به‌صورت متن‌باز منتشر شود. این اقدامات، نشان‌دهنده حرکتی بلندپروازانه برای ساخت زیرساختی کاملاً مستقل از فناوری غربی در حوزه هوش مصنوعی هستند، حرکتی که آینده رقابت جهانی در این حوزه را بازتعریف خواهد کرد.

دیدگاه شما درباره مدل هوش مصنوعی DeepSeek R2 چیست؟

source

توسط wikiche.com