سوپرتراشه NVIDIA Grace CPU: طراحی شده برای پاسخگویی به نیازهای با عملکرد و کارایی بالا در مراکز داده هوش مصنوعی امروزی
سوپرتراشه NVIDIA Grace CPU برای نوع جدیدی از مراکز داده طراحی شده است—مراکز دادهای که حجمهای زیادی از داده را پردازش کرده و به تولید هوش با حداکثر کارایی انرژی میپردازند. این مراکز داده بارهای کاری متنوعی از جمله هوش مصنوعی، تحلیل دادهها، برنامههای ابری با مقیاس بزرگ، و محاسبات با کارایی بالا (HPC) را اجرا میکنند. برای پاسخگویی به نیازهای چالشبرانگیز مراکز داده، Grace عملکرد به ازای هر وات را ۲ برابر، چگالی بستهبندی را ۲ برابر، و بالاترین پهنای باند حافظه را نسبت به سرورهای پیشرو امروز ارائه میدهد.
سیپییو Grace شامل ۷۲ هسته ARM Neoverse V2 با عملکرد بالا و کارایی انرژی است که با استفاده از ساختار NVIDIA Scalable Coherency Fabric (SCF) به یکدیگر متصل شدهاند و ۳.۲ ترابایت بر ثانیه پهنای باند تقسیم را ارائه میدهند—دو برابر CPUs سنتی—تا حداکثر عملکرد را به همراه سازگاری کامل با اکوسیستم ARM فراهم کند. Grace همچنین اولین سیپییو مرکز داده است که از حافظه LPDDR5X با سرعت بالا در کلاس سرور استفاده میکند که یک زیرسیستم حافظه وسیع دارد و پهنای باندی تا ۵۰۰ گیگابایت بر ثانیه را با یک پنجم قدرت حافظه DDR سنتی و در هزینه مشابه ارائه میدهد.
معرفی پردازنده NVIDIA Grace CPU
سوپرچیپ پردازنده Grace سوپرچیپ پردازنده Grace از دو چیپ پردازنده Grace تشکیل شده است که بهصورت متوازن بر روی NVLink™ چیپ به چیپ (C2C) متصل هستند و سرعت آن ۹۰۰ گیگابایت در ثانیه است. این سوپرچیپ شامل ۱۴۴ هسته Neoverse V2 در یک ماژول است و حافظه LPDDR5X سرور کلاسی دارد که تا ۱ ترابایت در ثانیه پهنای باند حافظه ارائه میدهد. سوپرچیپ Grace قلب یک سرور دو سوکت در یک ماژول جمع و جور است که ۲ برابر عملکرد مشابه با قدرت پردازندههای سرور سنتی با حافظه DDR5 را ارائه میدهد.
پردازنده NVIDIA Grace C1 پردازنده NVIDIA Grace C1 یک پلتفرم سرور با عملکرد بالا و یک سوکت است که برای پلتفرمهای مقیاسپذیر و لبه (edge) بهینه شده است، از جمله ابر رایانشهای مقیاسپذیر، CDN، ذخیرهسازی، تلکام و دیگر پلتفرمهای لبه با عملکرد بالا که از نظر عملکرد یا پهنای باند به هیچ وجه مصالحه نمیکند. این پلتفرم عملکرد بالای x86 را ارائه میدهد و از ۱۴۰ وات تا ۲۵۰ وات برای پردازنده Grace و حافظه LPDDR5X قابل پیکربندی است، در حالی که مشابه آن در پلتفرمهای x86 بیش از ۴۰۰ وات است. ساختار قابل مقیاسپذیری که بهوسیله NVIDIA طراحی شده، به پردازنده Grace این امکان را میدهد که ۲ برابر کارایی انرژی نسبت به پلتفرمهای x86 پیشرو ارائه دهد.
دو برابر کردن خروجی مرکز داده یا کاهش مصرف انرژی به نصف با پردازنده Grace
پردازنده NVIDIA Grace با بهینهسازیهای پیشرفته خود، امکان ارائه عملکردی فراتر از پردازندههای سنتی x86 را فراهم میکند. این پردازنده بهویژه برای مراکز داده طراحی شده و بهخوبی قادر است تا در پردازشهای پیچیده و بزرگ، از کارایی بالایی برخوردار باشد. در زیر به برخی از قابلیتها و مقایسههای عملکردی آن اشاره میشود:
- تحلیل گراف: Grace CPU تا ۳ برابر بیشتر از پردازندههای x86 در تحلیل گرافها عملکرد دارد. این مزیت به دلیل طراحی خاص و توانایی پردازش سریع دادههای پیچیده در گرافها است.
- تحلیل داده: در زمینه تحلیل داده، Grace CPU عملکردی ۲ برابری نسبت به پردازندههای x86 ارائه میدهد. این امر به سازمانها کمک میکند تا در زمان کمتری به بینشهای عمیقتری دست یابند.
- پیشبینی آب و هوا: این پردازنده همچنین میتواند پیشبینیهای مربوط به وضعیت آب و هوا را ۲ برابر سریعتر از پردازندههای x86 انجام دهد، که این امر میتواند به تصمیمگیریهای بهتر در زمینههای مختلف کمک کند.
- میکروسرویسها: در زمینه میکروسرویسها، Grace CPU عملکردی ۱.۶ برابری نسبت به پردازندههای x86 دارد. این موضوع نشاندهنده این است که Grace میتواند به طور موثری منابع را در بارهای کاری توزیع کند و به بهبود کارایی کمک کند.
با این ویژگیها، Grace CPU نهتنها به افزایش عملکرد در مراکز داده کمک میکند، بلکه امکان کاهش مصرف انرژی را نیز فراهم میآورد، که این امر به کاهش هزینهها و بهبود پایداری محیط زیست میانجامد.
تحلیل گراف
پردازنده NVIDIA Grace CPU Superchip با استفاده از هستههای Arm Neoverse V2 و یک ساختار مقیاسپذیر NVIDIA Coherency، عملکرد فوقالعاده سریعی را برای بارهای کاری مانند جستجوی اول عمق (Breadth First Search) در تحلیل گراف ارائه میدهد. این معماری بهویژه برای کارهایی که نیاز به ارتباط و هماهنگی بین هستهها دارند، بهینهسازی شده است. NVIDIA Grace بیش از ۲ برابر عملکرد بیشتری در سطح سرور نسبت به سیستمهای پیشرو x86 دارد و همچنین ۳ برابر کارایی انرژی بهتری ارائه میدهد.
تحلیل داده
با رشد روزافزون دادهها، کسبوکارها نیاز دارند تا حداکثر بهرهوری را از دادههای خود کسب کنند تا در رقابت باقی بمانند. مجموعه تست HiBench، خوشهبندی K-means را برای کشف دانش و استخراج دادهها ارزیابی میکند و از حافظه با پهنای باند بالا و مصرف انرژی پایین در پردازنده NVIDIA Grace CPU بهره میبرد. پردازنده Grace بیش از ۲ برابر انرژی کارآمدتر از پردازندههای پیشرو x86 موجود در بازار امروز است. این مزایا به کسبوکارها کمک میکند تا نه تنها عملکرد بالاتری را تجربه کنند، بلکه در عین حال مصرف انرژی کمتری داشته باشند، که برای محیطهای پردازش دادههای کلان و تحلیلهای پیچیده بسیار حیاتی است.
مدلهای پیشبینی آبوهوا
مدلهای پیشبینی آبوهوا یکی از موارد استفاده مهم برای پردازشهای با عملکرد بالا (HPC) هستند و درک و پاسخ به تغییر الگوهای آبوهوایی ناشی از تغییرات اقلیمی را حیاتی میسازند. حافظه LPDDR5X با پهنای باند بالا و کارایی انرژی عالی در پردازنده Grace میتواند تا ۵۰۰ گیگابایت بر ثانیه پهنای باند ارائه دهد و تنها در حدود ۱۶ وات مصرف انرژی کند. این قابلیت به پردازنده Grace اجازه میدهد که تقریباً ۲ برابر کار بیشتری را در همان محدوده قدرت نسبت به راهحلهای موجود x86 انجام دهد.
میکروسرویسها
میکروسرویسها مجموعهای از خدمات کوچک و مستقل هستند که به مراکز داده اجازه میدهند بهراحتی مقیاسپذیری را برای پاسخگویی به تقاضا افزایش دهند. آنها همچنین انعطافپذیری را برای مدیریت خدمات فردی بدون تأثیر بر کل برنامه فراهم میکنند. Google Protobufs سرعت سیستم در سریالسازی و تجزیهوتحلیل دادههای مورد نیاز برای تبادل داده بین سیستمها را اندازهگیری میکند که برای اجرای میکروسرویسها ضروری است. کارایی بالای پردازنده NVIDIA Grace و کارایی انرژی آن، عملکرد برتری را برای به حداکثر رساندن توان عملیاتی مرکز داده ارائه میدهد.
ویژگی ها و مشخصات فنی پردازنده NVIDIA Grace CPU Superchip
هستههای Arm Neoverse V2
در قلب پردازنده Grace، هستههای پردازنده Arm Neoverse V2 قرار دارند که بهعنوان قویترین هستههای دیتاسنتر Arm در بازار امروز شناخته میشوند. هستههای Neoverse V2 بهگونهای بهینهسازی شدهاند که عملکرد برتری را در هر هسته ارائه دهند و در عین حال کارایی فوقالعادهای نسبت به پردازندههای سنتی داشته باشند. پردازنده Grace شامل ۷۲ هسته است و وقتی با حافظه LPDDR5X و ساختار NVIDIA Scaled Coherency ترکیب میشود، میتواند دو برابر عملکرد مشابهی را در همان محدوده قدرت نسبت به پردازندههای x86 پیشرفته ارائه دهد.
ساختار NVIDIA Scalable Coherency
ساختار NVIDIA Scalable Coherency Fabric (SCF) یک ساختار شبکهای و کش توزیعشده است که توسط NVIDIA طراحی شده تا چالشهای مقیاسدهی هستهها و پهنای باند را بهصورت کارآمد از نظر انرژی و فضا برطرف کند. SCF بیش از ۳.۲ ترابایت بر ثانیه پهنای باند کل بایسکشن ارائه میدهد که دو برابر پردازندههای سنتی است و به حفظ جریان داده بین هستههای CPU، حافظه و ورودی/خروجی سیستم کمک میکند. SCF گلوگاهها را در برنامههای سنگین دادهای مانند تحلیل گراف کاهش میدهد، جایی که NVIDIA Grace تا ۲ برابر عملکرد پردازندههای x86 پیشرفته را ارائه میدهد.
حافظه LPDDR5X
NVIDIA Grace اولین پردازنده سرور است که از حافظه LPDDR5X با قابلیت اطمینان کلاس سرور از طریق مکانیزمهایی مانند کد تصحیح خطا (ECC) استفاده میکند. حافظه LPDDR5X در NVIDIA Grace تعادل بین هزینه، قدرت، پهنای باند و ظرفیت را برقرار میکند و میتواند تا ۵۰۰ گیگابایت بر ثانیه پهنای باند را تنها در حدود ۱۶ وات ارائه دهد که تقریباً یک پنجم انرژی حافظههای DDR5 متعارف است.
تکسوکت و دو سوکت
پرتفوی پردازنده NVIDIA Grace شامل سوپرچیپ Grace است که قلب یک سرور دو سوکت را با ۱۴۴ هسته Neoverse V2 و تا ۹۶۰ گیگابایت حافظه LPDDR5X در یک ماژول جمعوجور و فشرده تأمین میکند که تنها به ۵۰۰ وات برای پردازنده و حافظه نیاز دارد. برای فراهم آوردن انعطافپذیری بیشتر، پردازنده Grace C1 عملکرد شگفتانگیزی را با ۷۲ هسته Neoverse V2 در یک پیکربندی تک سوکت که توسط یک ساختار سریع NVIDIA Scalable Coherency متصل شده است، ارائه میدهد. این پیکربندی برای استفاده در فضای ابری، ذخیرهسازی، لبه و تلکو بهینهسازی شده و میتواند تا ۲ برابر عملکرد در هر وات نسبت به سرورهای x86 متعارف ارائه دهد.