شرکت دیپسیک درحال آمادهسازی برای رونمایی از نسل جدید مدل هوش مصنوعی خود با نام DeepSeek R2 است. این مدل پیشرفته قرار است در بازه زمانی ۲۴ تا ۸ شهریور ۱۴۰۴ عرضه شود، تنها چند روز پس از انتشار رسمی ChatGPT 5.
تحول بزرگ مدل هوش مصنوعی DeepSeek R2 با معماری Mixture of Experts
مدل DeepSeek R2 قرار است جهشی قابلتوجه در معماری مدلهای زبانی ایجاد کند. این مدل از ساختار Mixture of Experts (MoE) پیشرفتهتری بهره خواهد برد و به شبکه گیتینگ هوشمندتر برای مدیریت بهتر بارهای سنگین استنتاج مجهز میشود.
بر اساس گزارش منابع آگاه از روند توسعه این مدل، تعداد پارامترهای DeepSeek R2 به ۱.۲ تریلیون خواهد رسید، تقریباً دو برابر مدل قبلی DeepSeek R1 که دارای ۶۷۱ میلیارد پارامتر بود. البته این میزان هنوز کمتر از مدلهای ChatGPT 4/5 با بیش از ۱.۸ تریلیون پارامتر است.
حرکت بهسمت استقلال هوش مصنوعی در چین
یکی از جنبههای مهم DeepSeek R2، تربیت کامل مدل روی تراشههای Ascend 910B هواوی است. این اقدام استراتژیک با هدف کاهش وابستگی به سختافزارهای ساخت ایالات متحده انجام شده و در مسیر خودکفایی چین در حوزه هوش مصنوعی معنا دارد.
خوشه محاسباتی هواوی با توان پردازشی ۵۱۲ پتافلاپس FP16 و بهرهوری ۸۲ درصدی، بهگفته تحلیلگران، حدود ۹۱ درصد از قدرت خوشههای مبتنیبر Nvidia A100 را ارائه میدهد. علاوهبراین، هزینه آموزش DeepSeek-R2 حدود ۹۷ درصد کمتر از GPT-4 گزارش شده و این بهلطف استفاده از سختافزار بومی و تکنیکهای بهینهسازی نرمافزاری است.

مدل هوش مصنوعی DeepSeek R2
آغاز رقابت قیمتی با OpenAI و Anthropic
تحلیلگران پیشبینی میکنند که DeepSeek با هدف رقابت جدی در قیمتگذاری API وارد میدان خواهد شد. این اقدام میتواند ساختار بازار خدمات هوش مصنوعی را که اکنون تحت سلطه شرکتهایی چون OpenAI و Anthropic است، دچار دگرگونی کند.
در پی این اخبار، سهام شرکتهای فناوری چینی با جهش همراه بوده است. برای مثال، ارزش سهام شرکت سازنده تراشه Cambricon حدود ۲۰ درصد رشد کرده و ارزش بازار آن به بیش از ۳۵۵ میلیارد یوان (حدود ۴۹.۷ میلیارد دلار) رسیده است.
سخن پایانی
عرضه DeepSeek R2 همراه با معرفی چارچوب استنتاج جدید هواوی با نام Unified Cache Manager (UCM)، نشانهای واضح از تحول در چشمانداز هوش مصنوعی چین است. هواوی در آزمایشهای انجامشده با شرکت UnionPay توانسته تا ۹۰ درصد کاهش تأخیر و ۲۲ برابر افزایش بازدهی در عملکرد مدلها ایجاد کند. قرار است این ابزار در شهریور ۱۴۰۴ بهصورت متنباز منتشر شود. این اقدامات، نشاندهنده حرکتی بلندپروازانه برای ساخت زیرساختی کاملاً مستقل از فناوری غربی در حوزه هوش مصنوعی هستند، حرکتی که آینده رقابت جهانی در این حوزه را بازتعریف خواهد کرد.
دیدگاه شما درباره مدل هوش مصنوعی DeepSeek R2 چیست؟
بفرست برای دوستات
source