قدرت بخشیدن به محاسبات عصر جدید با NVIDIA GB200 NVL72 پیام بگذارید

باز کردن قفل مدلهای تریلیون پارامتری بلادرنگ

پلتفرم سرور گرافیکی انودیا GB200 NVL72 به گونه ای طراحی شده که تعداد ۳۶ عدد CPU Grace و ۷۲ عدد GPU Blackwell را در مقیاس رک به هم متصل می کند. GB200 NVL72 یک راه حل در مقیاس رک با خنک کننده مایع است و دارای یک دامنه NVLink با ۷۲ عدد GPU است که به عنوان یک واحد پردازش گرافیکی عظیم عمل می کند و عملیات استنتاج LLM با تریلیون پارامتر در زمان واقعی را ۳۰ برابر سریعتر ارائه می دهد. سوپرتراشه GB200 Grace Blackwell یکی از اجزای کلیدی NVIDIA GB200 NVL72 است که دو پردازنده گرافیکی NVIDIA Blackwell Tensor Core با کارایی بالا و یک CPU NVIDIA Grace را با استفاده از اتصال NVIDIA NVLink-C2C به دو پردازنده گرافیکی بلک ول GPU Blackwell متصل می کند.

سوپرشارژ هوش مصنوعی نسل بعدی و محاسبات تسریع‌شده با NVIDIA GB200 NVL72:

تصویر زیر مربوط به آزمایش و مقایسه NVIDIA HGX™ H100 مقیاس‌پذیر بر روی InfiniBand (IB) با GB200 NVL72 در حوزه های کار مختلف است که نتایج آن را در تصویر می بینید:

استنتاج LLM و بهره‌وری انرژی: زمان تأخیر کلی (TTL) = ۵۰ میلی‌ثانیه (ms) در زمان واقعی، زمان تأخیر اولین توکن (FTL) = ۵ ثانیه، با ورودی ۳۲,۷۶۸ و خروجی ۱,۰۲۴، مقایسه NVIDIA HGX™ H100 مقیاس‌پذیر بر روی InfiniBand (IB) با GB200 NVL72. آموزش ۱.۸T MOE با ۴۰۹۶ پردازنده HGX H100 مقیاس‌پذیر بر روی IB در مقایسه با ۴۵۶ پردازنده GB200 NVL72 مقیاس‌پذیر بر روی IB. اندازه کلاستر: ۳۲,۷۶۸ | بار کاری اتصال و تجمیع پایگاه داده با فشرده‌سازی Snappy / Deflate که از پرس و جو TPC-H Q4 مشتق شده است. پیاده‌سازی‌های سفارشی پرس و جو برای x86، یک پردازنده گرافیکی H100 و یک پردازنده گرافیکی از GB200 NVL72 در مقابل Intel Xeon 8480+.

Supercharging Next-Generation AI and Accelerated Computing

استنتاج LLM در زمان واقعی

GB200 NVL72 قابلیت‌های پیشرفته و یک موتور ترنسفورمر نسل دوم را معرفی می‌کند که امکان پردازش FP4 AI را فراهم می‌آورد و در کنار NVLink نسل پنجم NVIDIA، عملکرد استنتاج LLM در زمان واقعی را برای مدل‌های زبانی با تریلیون پارامتر ۳۰ برابر سریع‌تر می‌کند. این پیشرفت با استفاده از نسل جدید هسته‌های تنسور ممکن شده است که فرمت‌های میکروسکال جدیدی را معرفی می‌کند و دقت بالا و توان عملیاتی بیشتری را فراهم می‌آورد. علاوه بر این، GB200 NVL72 از NVLink و سیستم خنک‌کننده مایع برای ایجاد یک رک ۷۲ پردازنده گرافیکی بزرگ و یکپارچه استفاده می‌کند که می‌تواند بر موانع ارتباطی غلبه کند.

آموزش مقیاس عظیم

GB200 NVL72 شامل یک موتور ترنسفورمر نسل دوم سریع‌تر است که از دقت FP8 بهره می‌برد و امکان آموزش سریع‌تر ۴ برابری برای مدل‌های زبانی بزرگ در مقیاس را فراهم می‌کند. این پیشرفت با NVLink نسل پنجم تکمیل شده است که ۱.۸ ترابایت در ثانیه (TB/s) اتصال بین پردازنده‌های گرافیکی، شبکه InfiniBand و نرم‌افزار NVIDIA Magnum IO™ را ارائه می‌دهد.

Real-Time LLM Inference & Massive-Scale Training

زیرساخت با بهره‌وری انرژی

رک‌های GB200 NVL72 با خنک‌سازی مایع، ردپای کربن و مصرف انرژی یک مرکز داده را کاهش می‌دهند. خنک‌سازی مایع، چگالی محاسبات را افزایش می‌دهد، فضای کف مورد استفاده را کاهش می‌دهد و ارتباطات GPU با پهنای باند بالا و تأخیر کم با معماری‌های دامنه بزرگ NVLink را تسهیل می‌کند. در مقایسه با زیرساخت خنک‌سازی هوایی NVIDIA H100، GB200 با همان توان، ۲۵ برابر عملکرد بیشتری ارائه می‌دهد و مصرف آب را کاهش می‌دهد.

پردازش داده

پایگاه‌های داده نقش حیاتی در مدیریت، پردازش و تحلیل حجم‌های بزرگ داده برای سازمان‌ها دارند. GB200 از عملکرد بالای حافظه، NVLink-C2C و موتورهای decompress اختصاصی در معماری NVIDIA Blackwell بهره‌برداری می‌کند تا بهبود عملکرد کلیدی در استعلام‌های پایگاه داده را به میزان ۱۸ برابر در مقایسه با CPU فراهم کرده و TCO (هزینه کل مالکیت) بهتری به میزان ۵ برابر ارائه دهد.

Energy-Efficient Infrastructure & Data Processing

مشخصات فنی و ویژگی‌های پیشرفته تکنولوژیکی انودیا NVIDIA GB200 NVL72

  • معماری بلک‌ول

    معماری NVIDIA Blackwell پیشرفت‌های چشمگیری را در زمینه محاسبات تسریع شده ارائه می‌دهد و دوره جدیدی از محاسبات را با عملکرد، کارایی و مقیاس بی‌نظیر به حرکت درمی‌آورد.

  • پردازنده NVIDIA Grace CPU

    پردازنده NVIDIA Grace CPU یک پردازنده پیشرفته است که برای مراکز داده مدرن که در حال اجرای برنامه‌های هوش مصنوعی، ابر و محاسبات با کارایی بالا هستند، طراحی شده است. این پردازنده عملکرد و پهنای باند حافظه فوق‌العاده‌ای را با ۲ برابر کارایی انرژی نسبت به پردازنده‌های سرور پیشرو امروزی ارائه می‌دهد.

  • نسل پنجم NVIDIA NVLink

    برای آزادسازی پتانسیل کامل محاسبات اگزاسکیل و مدل‌های هوش مصنوعی با تریلیون پارامتر، نیاز به ارتباط سریع و بدون وقفه بین هر GPU در یک خوشه سرور است. نسل پنجم NVLink یک ارتباط مقیاس‌پذیر است که عملکرد شتاب‌یافته‌ای را برای مدل‌های هوش مصنوعی با تریلیون و چند تریلیون پارامتر فراهم می‌آورد.

  • شبکه NVIDIA

    شبکه مرکز داده نقش حیاتی در پیشبرد پیشرفت‌های هوش مصنوعی و عملکرد آن دارد و به‌عنوان زیرساخت اصلی برای آموزش مدل‌های توزیع‌شده هوش مصنوعی و عملکرد هوش مصنوعی تولیدی عمل می‌کند. فناوری‌های NVIDIA Quantum-X800 InfiniBand، NVIDIA Spectrum™-X800 Ethernet و NVIDIA BlueField®-۳ DPUها به مقیاس‌پذیری مؤثر در میان صدها و هزاران GPU بلک‌ول کمک می‌کنند تا عملکرد بهینه‌ای برای برنامه‌ها فراهم شود.

مشخصات فنی و ویژگی های اصلی انودیا NVIDIA Grace Blackwell GB20


منبع: بلاگ انودیا – NVIDIA GB200 NVL72

دیدگاهتان را بنویسید

سبد خرید

close