اوراکل ادعا کرده است که بزرگترین ابرکامپیوتر هوش مصنوعی در فضای ابری را با نام OCI Zettascale10 معرفی کرده است. این شرکت ادعا می‌کند که این سیستم می‌تواند به اوج عملکرد ۱۶ زتافلاپس دست یابد و از حدود ۸۰۰ هزار پردازنده گرافیکی انویدیا در مراکز داده مختلف استفاده می‌کند. این توان خروجی در صورت تقسیم معادل حدود ۲۰ پتافلاپس برای هر پردازنده گرافیکی است که تقریباً با تراشه Grace Blackwell GB300 Ultra مطابقت دارد.

به گزارش بخش صنایع زیرساختی رسانه اخبار تکنولوژی تکنا، این پلتفرم به عنوان زیرساخت اساسی برای خوشه Stargate شرکت OpenAI در ابیلین تگزاس عمل می‌کند. این مجموعه برای مدیریت برخی از سنگین‌ترین بارهای کاری هوش مصنوعی نوظهور در تحقیقات و مصارف تجاری ساخته شده است. پیتر هوشله از OpenAI اشاره کرد که طراحی سفارشی و بسیار مقیاس‌پذیر RoCE عملکرد سراسری پارچه (fabric) را در مقیاس گیگاواتی به حداکثر می‌رساند در حالی که بیشتر توان را بر روی محاسبات متمرکز نگه می‌دارد.

در هسته سیستم Zettascale10 شبکه Oracle Acceleron RoCE قرار دارد که برای افزایش مقیاس‌پذیری و قابلیت اطمینان در عملیات‌های سنگین هوش مصنوعی طراحی شده است. این معماری از کارت‌های رابط شبکه به عنوان سوئیچ‌های کوچک استفاده می‌کند. این کارت‌ها پردازنده‌های گرافیکی را در چندین صفحه شبکه ایزوله به هم متصل می‌کنند. هدف این طراحی کاهش تاخیر بین پردازنده‌های گرافیکی است.

این ساختار همچنین اجازه می‌دهد تا در صورت خرابی یک مسیر شبکه کارها به اجرا ادامه دهند. ایان باک از انویدیا بیان کرد که OCI Zettascale10 با بهره‌گیری از زیرساخت کامل هوش مصنوعی انویدیا پارچه محاسباتی لازم را برای پیشبرد تحقیقات پیشرفته هوش مصنوعی فراهم می‌کند. این سیستم به سازمان‌ها در سراسر جهان کمک می‌کند تا از مرحله آزمایش به هوش مصنوعی صنعتی‌شده حرکت کنند.

اوراکل ادعا می‌کند این ساختار می‌تواند با ساده‌سازی لایه‌ها در شبکه هزینه‌ها را کاهش دهد و همزمان عملکرد ثابتی را در تمام گره‌ها حفظ کند. این سیستم همچنین از فناوری‌های نوری خطی قابل اتصال و گیرنده بهره می‌برد تا مصرف انرژی و نیاز به خنک‌کننده را بدون کاهش پهنای باند کاهش دهد.

اگرچه ارقام اوراکل چشمگیر هستند اما این شرکت هیچ تأییدیه مستقلی برای ادعای ۱۶ زتافلاپس خود ارائه نکرده است. معیارهای عملکرد ابری بسته به نحوه محاسبه توان عملیاتی می‌تواند متفاوت باشد. ممکن است مقایسه اوراکل به جای نرخ‌های پایدار بر اوج‌های نظری تکیه داشته باشد.

با توجه به اینکه مجموع تبلیغ شده سیستم برابر با مجموع ۸۰۰ هزار پردازنده گرافیکی پیشرفته است بازدهی در دنیای واقعی می‌تواند به شدت به طراحی شبکه و بهینه‌سازی نرم‌افزار بستگی داشته باشد. تحلیلگران احتمالاً منتظر خواهند ماند تا ببینند آیا این پیکربندی عملکردی قابل مقایسه با خوشه‌های هوش مصنوعی پیشرو که قبلاً توسط سایر ارائه‌دهندگان بزرگ ابری اجرا شده‌اند ارائه می‌دهد یا خیر.

سیستم Zettascale10 اوراکل را در کنار سایر بازیگران اصلی قرار می‌دهد که برای ارائه زیرساخت‌های پشتیبان بهترین پردازنده‌های گرافیکی و ابزارهای هوش مصنوعی رقابت می‌کنند. این شرکت می‌گوید مشتریان می‌توانند مدل‌های بزرگ را در محیط ابری توزیع‌شده اوراکل آموزش داده و مستقر کنند. این فرآیند توسط تدابیر حاکمیت داده پشتیبانی می‌شود.

اوراکل همچنین می‌گوید Zettascale10 از طریق نگهداری مستقل در سطح صفحه انعطاف‌پذیری عملیاتی ارائه می‌دهد که امکان به‌روزرسانی با کمترین زمان توقف را فراهم می‌کند. ماهش تیاگاراجان از اوراکل توضیح داد که این شرکت معماری شبکه Oracle Acceleron RoCE خود را با زیرساخت هوش مصنوعی نسل بعدی انویدیا ترکیب می‌کند تا ظرفیت هوش مصنوعی چند گیگاواتی را در مقیاسی بی‌نظیر ارائه دهد.

به گفته او مشتریان می‌توانند بزرگترین مدل‌های هوش مصنوعی خود را با قدرت کمتر ساخته، آموزش داده و به تولید برسانند. آنها همچنین آزادی عمل در سراسر ابر توزیع‌شده اوراکل با حاکمیت قوی داده و هوش مصنوعی خواهند داشت. با این حال ناظران اشاره می‌کنند که سایر ارائه‌دهندگان نیز در حال ساخت خوشه‌های پردازنده گرافیکی مقیاس بزرگ و سیستم‌های ذخیره‌سازی ابری پیشرفته خود هستند که می‌تواند برتری اوراکل را کاهش دهد.

این سیستم سال آینده عرضه خواهد شد و تنها در آن زمان مشخص خواهد شد که آیا این معماری می‌تواند تقاضا برای محاسبات هوش مصنوعی مقیاس‌پذیر، کارآمد و قابل اعتماد را برآورده کند یا خیر.

source

توسط wikiche.com