هواوی به‌طور رسمی از چارچوب جدید استنتاج هوش مصنوعی با نام Unified Cache Manager (UCM) رونمایی کرده است. این اتفاق درحالی رخ می‌دهد که مدت‌هاست گزارش‌هایی درباره تلاش هواوی برای کاهش وابستگی به حافظه‌های پرسرعت HBM منتشر شده است.

فناوری جدید هوش مصنوعی UCM هواوی

چارچوب UCM به‌عنوان راهکاری نرم‌افزاری برای افزایش سرعت اجرای مدل‌های هوش مصنوعی حجیم طراحی شده و با مدیریت پیشرفته داده‌های KV Cache در سطوح مختلف حافظه، باعث بهبود چشمگیر در بهره‌وری سیستم و کاهش تأخیر (Latency) می‌شود.

UCM بر پایه یک هدف ساده اما مؤثر طراحی شده: اجرای سریع‌تر مدل‌های هوش مصنوعی بدون نیاز به سخت‌افزار گران‌قیمت. این چارچوب با استفاده از یک ساختار سلسله‌مراتبی، داده‌های حافظه کش را میان HBM، رم استاندارد (DRAM) و حتی درایو SSD توزیع می‌کند. این توزیع بر اساس نیاز لحظه‌ای به سرعت و تأخیر صورت می‌گیرد.

هواوی این فناوری را در کاربردهای واقعی در شرکت China UnionPay آزمایش کرده است؛ از جمله در تحلیل صدای مشتری، برنامه‌ریزی بازاریابی و دستیارهای اداری. نتایج نشان می‌دهد که با استفاده از UCM، زمان پاسخ‌گویی تا ۹۰ درصد کاهش یافته و توان عملیاتی تا ۲۲ برابر افزایش یافته است. این عملکرد ثابت می‌کند که بهینه‌سازی نرم‌افزاری می‌تواند محدودیت‌های سخت‌افزاری را جبران کند.

پاسخ نرم‌افزاری به محدودیت‌های سخت‌افزاری چین

حافظه‌های HBM برای اجرای مدل‌های سنگین هوش مصنوعی ضروری هستند، اما چین با محدودیت‌های شدید صادرات از سوی آمریکا و متحدانش روبه‌روست. دسترسی به نسخه‌های پیشرفته HBM3 و HBM4 به‌شدت برای شرکت‌های چینی محدود شده و این شرایط، تولید داخلی را به چالش کشیده است.

UCM در چنین فضایی، به‌عنوان راهکاری بومی و نرم‌افزاری معرفی شده که می‌تواند نیاز به حافظه‌های گران‌قیمت را تا حدی کاهش دهد. این چارچوب امکان اجرای مدل‌ها در مقیاس وسیع با استفاده از رم و ذخیره‌سازهای معمولی را فراهم می‌کند؛ مزیتی قابل‌توجه برای مراکز داده و زیرساخت‌های بومی در شرایط تحریم.

فناوری جدید هوش مصنوعی UCM هواوی

فناوری جدید هوش مصنوعی UCM هواوی

نقشه راه متن‌باز و گسترش اکوسیستم

هواوی اعلام کرده که قصد دارد UCM را در شهریور ۱۴۰۴ به‌صورت متن‌باز منتشر کند. این نسخه نخستین‌بار از طریق پلتفرم MindSpore در اختیار توسعه‌دهندگان قرار می‌گیرد. سپس این چارچوب به موتورهای استنتاج دیگر و شرکای اکوسیستم مانند تولیدکنندگان ذخیره‌ساز که با معماری “Share Everything” هواوی هماهنگ هستند، نیز ارائه خواهد شد.

این رویکرد با استراتژی کلی هواوی در توسعه سخت‌افزارهای Ascend هماهنگ است. پیش‌تر نیز هواوی چارچوب CANN را به‌عنوان جایگزینی برای CUDA انویدیا برای توسعه روی تراشه‌های Ascend معرفی کرده بود.

سخن پایانی

UCM تنها یک ابزار جدید نیست، بلکه بخشی از استراتژی بزرگ‌تر چین برای کاهش وابستگی به فناوری‌های غربی در حوزه‌ی هوش مصنوعی است. با وجود ادامه تنش‌ها میان آمریکا و چین بر سر نیمه‌رساناها، هواوی با معرفی راهکارهای نرم‌افزاری مانند UCM تلاش می‌کند زیرساخت‌های هوش مصنوعی بومی و مقاوم به تحریم ایجاد کند. با توجه به اهمیت پهنای باند حافظه در رقابت هوش مصنوعی، نوآوری‌هایی از این جنس می‌توانند نقش تعیین‌کننده‌ای در نحوه پیاده‌سازی مدل‌های عظیم در چین ایفا کنند.

source

توسط wikiche.com