انویدیا SXM سوکت با پهنای باند بالا برای دیتاسنترها
SXM (ماژول PCI Express سرور) یک راهحل سوکت با پهنای باند بالا برای اتصال شتابدهندههای محاسباتی انویدیا به سیستم است. هر نسل از انویدیا تسلا از مدلهای P100 به بعد، سری کامپیوترهای DGX و بردهای HGX دارای نوع سوکت SXM هستند که پهنای باند بالا، تأمین انرژی و ویژگیهای بیشتر را برای کارتهای GPU دوتایی سازگار فراهم میکند. انویدیا این ترکیبها را به عنوان یک محصول برای کاربران نهایی در مدلهای مختلف سیستمهای DGX عرضه میکند. نسلهای فعلی سوکتها عبارتند از: SXM برای پردازندههای گرافیکی مبتنی بر (Pascal) پاسکال ، SXM2 و SXM3 برای پردازندههای گرافیکی مبتنی بر (Volta) ولتا، SXM4 برای پردازندههای گرافیکی مبتنی بر (Ampere) آمپر، SXM5 برای پردازندههای گرافیکی مبتنی بر (Hopper) هوپر و SXM6 برای پردازندههای گرافیکی مبتنی بر (Blackwell) بلکول. این سوکتها برای مدلهای خاصی از این شتابدهندهها استفاده میشوند و عملکرد بهتری در مقایسه با کارتهای معادل PCIe ارائه میدهند. سیستم DGX-1 اولین سیستمی بود که با سوکتهای SXM-2 مجهز شد و بهاینترتیب اولین سیستمی بود که ماژولهای SXM سازگار با پردازندههای گرافیکی P100 را حمل کرد و بعدها مشخص شد که امکان ارتقاء به ماژولهای SXM2 با پردازندههای V100 نیز وجود دارد.

بردهای SXM معمولاً با چهار یا هشت شکاف GPU ساخته میشوند، اگرچه برخی راهحلها مانند Nvidia DGX-2 چندین برد را برای ارائه عملکرد بالا به هم متصل میکنند. در حالی که راهحلهای شخص ثالث برای بردهای SXM وجود دارد، بیشتر سیستمهای یکپارچهسازی مانند Supermicro از بردهای از پیش ساختهشده Nvidia HGX استفاده میکنند که در پیکربندیهای چهار یا هشت سوکت عرضه میشوند. این راهحل بهطور قابلتوجهی هزینه و سختی ساخت سرورهای مبتنی بر GPU SXM را کاهش میدهد و سازگاری و قابلیت اطمینان را در تمام بردهای نسل یکسان تضمین میکند.
ماژولهای SXM بر روی بردهای HGX، بهویژه نسلهای اخیر، ممکن است دارای سوئیچهای NVLink باشند تا ارتباط سریعتر بین GPUها را ممکن کنند. این امر همچنین گلوگاههایی را که معمولاً توسط محدودیتهای CPU و PCIe ایجاد میشوند، کاهش میدهد. پردازندههای گرافیکی در کارتهای دوتایی از NVLink بهعنوان پروتکل اصلی ارتباطی خود استفاده میکنند. بهعنوان مثال، یک پردازنده گرافیکی مبتنی بر Hopper H100 SXM5 میتواند تا ۹۰۰ گیگابایت بر ثانیه پهنای باند از طریق ۱۸ کانال NVLink 4 استفاده کند که هرکدام ۵۰ گیگابایت بر ثانیه پهنای باند را ارائه میدهند؛ در مقابل، PCIe 5.0 میتواند تا ۶۴ گیگابایت بر ثانیه پهنای باند را در یک شکاف x16 مدیریت کند. این پهنای باند بالا همچنین به این معناست که پردازندههای گرافیکی میتوانند از طریق باس NVLink حافظه خود را به اشتراک بگذارند، که به یک برد HGX این امکان را میدهد که به سیستم میزبان بهعنوان یک پردازنده گرافیکی بزرگ و واحد ظاهر شود.
تأمین انرژی نیز توسط سوکت SXM انجام میشود که نیازی به کابلهای برق خارجی، مانند آنچه در کارتهای معادل PCIe لازم است، ندارد. این ویژگی، همراه با نصب افقی، اجازه میدهد تا مکانیزمهای خنککننده بهطور مؤثرتری عمل کنند و در نتیجه، پردازندههای گرافیکی مبتنی بر SXM بتوانند با TDP (توان طراحی حرارتی) بسیار بالاتری عمل کنند. بهعنوان مثال، Hopper H100 میتواند تا ۷۰۰ وات فقط از سوکت SXM مصرف کند. نبود کابلها همچنین مونتاژ و تعمیر سیستمهای بزرگ را آسانتر میکند و تعداد نقاط احتمالی خرابی را کاهش میدهد.
برد ارزیابی Nvidia Tegra برای کاربردهای خودرویی، Drive PX2، دو سوکت MXM (ماژول PCI Express موبایل) در دو طرف کارت داشت. این طراحی دوگانه MXM میتواند پیشساز اجرای سوکت SXM در Nvidia Tesla در نظر گرفته شود.