اوراکل ادعا کرده است که بزرگترین ابرکامپیوتر هوش مصنوعی در فضای ابری را با نام OCI Zettascale10 معرفی کرده است. این شرکت ادعا میکند که این سیستم میتواند به اوج عملکرد ۱۶ زتافلاپس دست یابد و از حدود ۸۰۰ هزار پردازنده گرافیکی انویدیا در مراکز داده مختلف استفاده میکند. این توان خروجی در صورت تقسیم معادل حدود ۲۰ پتافلاپس برای هر پردازنده گرافیکی است که تقریباً با تراشه Grace Blackwell GB300 Ultra مطابقت دارد.
به گزارش بخش صنایع زیرساختی رسانه اخبار تکنولوژی تکنا، این پلتفرم به عنوان زیرساخت اساسی برای خوشه Stargate شرکت OpenAI در ابیلین تگزاس عمل میکند. این مجموعه برای مدیریت برخی از سنگینترین بارهای کاری هوش مصنوعی نوظهور در تحقیقات و مصارف تجاری ساخته شده است. پیتر هوشله از OpenAI اشاره کرد که طراحی سفارشی و بسیار مقیاسپذیر RoCE عملکرد سراسری پارچه (fabric) را در مقیاس گیگاواتی به حداکثر میرساند در حالی که بیشتر توان را بر روی محاسبات متمرکز نگه میدارد.
در هسته سیستم Zettascale10 شبکه Oracle Acceleron RoCE قرار دارد که برای افزایش مقیاسپذیری و قابلیت اطمینان در عملیاتهای سنگین هوش مصنوعی طراحی شده است. این معماری از کارتهای رابط شبکه به عنوان سوئیچهای کوچک استفاده میکند. این کارتها پردازندههای گرافیکی را در چندین صفحه شبکه ایزوله به هم متصل میکنند. هدف این طراحی کاهش تاخیر بین پردازندههای گرافیکی است.
این ساختار همچنین اجازه میدهد تا در صورت خرابی یک مسیر شبکه کارها به اجرا ادامه دهند. ایان باک از انویدیا بیان کرد که OCI Zettascale10 با بهرهگیری از زیرساخت کامل هوش مصنوعی انویدیا پارچه محاسباتی لازم را برای پیشبرد تحقیقات پیشرفته هوش مصنوعی فراهم میکند. این سیستم به سازمانها در سراسر جهان کمک میکند تا از مرحله آزمایش به هوش مصنوعی صنعتیشده حرکت کنند.
اوراکل ادعا میکند این ساختار میتواند با سادهسازی لایهها در شبکه هزینهها را کاهش دهد و همزمان عملکرد ثابتی را در تمام گرهها حفظ کند. این سیستم همچنین از فناوریهای نوری خطی قابل اتصال و گیرنده بهره میبرد تا مصرف انرژی و نیاز به خنککننده را بدون کاهش پهنای باند کاهش دهد.
اگرچه ارقام اوراکل چشمگیر هستند اما این شرکت هیچ تأییدیه مستقلی برای ادعای ۱۶ زتافلاپس خود ارائه نکرده است. معیارهای عملکرد ابری بسته به نحوه محاسبه توان عملیاتی میتواند متفاوت باشد. ممکن است مقایسه اوراکل به جای نرخهای پایدار بر اوجهای نظری تکیه داشته باشد.
با توجه به اینکه مجموع تبلیغ شده سیستم برابر با مجموع ۸۰۰ هزار پردازنده گرافیکی پیشرفته است بازدهی در دنیای واقعی میتواند به شدت به طراحی شبکه و بهینهسازی نرمافزار بستگی داشته باشد. تحلیلگران احتمالاً منتظر خواهند ماند تا ببینند آیا این پیکربندی عملکردی قابل مقایسه با خوشههای هوش مصنوعی پیشرو که قبلاً توسط سایر ارائهدهندگان بزرگ ابری اجرا شدهاند ارائه میدهد یا خیر.
سیستم Zettascale10 اوراکل را در کنار سایر بازیگران اصلی قرار میدهد که برای ارائه زیرساختهای پشتیبان بهترین پردازندههای گرافیکی و ابزارهای هوش مصنوعی رقابت میکنند. این شرکت میگوید مشتریان میتوانند مدلهای بزرگ را در محیط ابری توزیعشده اوراکل آموزش داده و مستقر کنند. این فرآیند توسط تدابیر حاکمیت داده پشتیبانی میشود.
اوراکل همچنین میگوید Zettascale10 از طریق نگهداری مستقل در سطح صفحه انعطافپذیری عملیاتی ارائه میدهد که امکان بهروزرسانی با کمترین زمان توقف را فراهم میکند. ماهش تیاگاراجان از اوراکل توضیح داد که این شرکت معماری شبکه Oracle Acceleron RoCE خود را با زیرساخت هوش مصنوعی نسل بعدی انویدیا ترکیب میکند تا ظرفیت هوش مصنوعی چند گیگاواتی را در مقیاسی بینظیر ارائه دهد.
به گفته او مشتریان میتوانند بزرگترین مدلهای هوش مصنوعی خود را با قدرت کمتر ساخته، آموزش داده و به تولید برسانند. آنها همچنین آزادی عمل در سراسر ابر توزیعشده اوراکل با حاکمیت قوی داده و هوش مصنوعی خواهند داشت. با این حال ناظران اشاره میکنند که سایر ارائهدهندگان نیز در حال ساخت خوشههای پردازنده گرافیکی مقیاس بزرگ و سیستمهای ذخیرهسازی ابری پیشرفته خود هستند که میتواند برتری اوراکل را کاهش دهد.
این سیستم سال آینده عرضه خواهد شد و تنها در آن زمان مشخص خواهد شد که آیا این معماری میتواند تقاضا برای محاسبات هوش مصنوعی مقیاسپذیر، کارآمد و قابل اعتماد را برآورده کند یا خیر.
source