در این مقاله به بررسی NVLINK می پردازیم و موارد زیر را به صورت جداگانه بررسی خواهیم کرد:
NVLINK چیست؟
NVIDIA® NVLink یک اتصال پرسرعت GPU به GPU است که به GPUها اجازه میدهد مستقیماً با یکدیگر بدون تکیه بر گذرگاه PCI Express که کندتر است، ارتباط برقرار کنند. این پروتکل ارتباطی مبتنی بر پل سیمی برای اولین بار توسط NVIDIA در مارس ۲۰۱۴ معرفی شد و از یک اتصال سیگنالینگ پرسرعت اختصاصی (NVHS) استفاده می کند. در سطح پایه، NVLink انویدیا امکان ادغام منابع از چندین پردازنده گرافیکی را فراهم میکند، به گونهای که به شخص اجازه میدهد به حافظه و هستههای CUDA دسترسی داشته باشد که انگار یک کارت واحد هستند. به عنوان مثال هوش مصنوعی، برای برنامه های کاربردی علمی و رندر می تواند از این فضای آدرس افزایش یافته بهره مند شود.
کمی تاریخ…
NVLink تکامل یافته فناوری NVIDIA SLI (Scalable Link Interconnect) است که در سال ۲۰۰۴ معرفی شد. SLI امکان اتصال دو، سه یا چهار کارت گرافیک NVIDIA GeForce را برای به اشتراک گذاشتن حجم کاری، هنگام رندر گرافیکی کامپیوتری سه بعدی (معمولاً در بازی)، فراهم می کرد. برای پیکربندی SLI، چندین کارت گرافیک نصب شده در رایانه شخصی باید با یک رابط به نام SLI Bridge به یکدیگر متصل می شدند. علاوه بر این، مادربرد رایانه شخصی شما باید توسط NVIDIA تأیید شده باشد تا اطمینان حاصل شود که همه چیز در خارج کیس به درستی در حال پردازش است.
اتصال گرافیکی پرسرعت NVIDIA NVLink
NVIDIA® NVLink اولین اتصال GPU پرسرعت جهان است که جایگزین بسیار سریعتری برای سیستمهایی با چند GPU نسبت به راهحل سنتی مبتنی بر PCIe ارائه میکند. اتصال دو کارت گرافیک NVIDIA با NVLink، مقیاسگذاری حافظه و عملکرد را برای برآورده کردن نیازهای بزرگترین حجم کاری محاسبات بصری شما ممکن میسازد. با پشتیبانی NVLink در نرم افزار NVIDIA RTX Virtual Workstation (RTX vWS) و NVIDIA Virtual Compute Server، سخت ترین حجم های کاری را در یک محیط مجازی سازی شده به صورت ایمن اجرا کنید.
تکنولوژی SLI :
تصویر بالا لوگوی NVIDIA SLI Ready که روی جعبه مادربردهایی وجود داشت که از این فناوری پشتیبانی میکردند است. در SLI، کارتهای گرافیکی در پیکربندی master-slave کار میکردند، به همه کارتها حجم کاری برابر داده میشد، اما خروجی هر کارت به کارت اصلی ارسال میشد تا در نهایت به صفحه نمایش برای خروجی بصری ارسال شود.
دو حالت اصلی SLI عبارتند از : رندر فریم تقسیم شده (SFR) و رندر فریم جایگزین (AFR). با SFR، کارت “master” فقط قسمت بالای قاب را رندر می کند، “slave” قسمت پایین قاب را رندر می کند و پس از اتمام، به “master” که قبل از نمایش روی نمایشگر، هر دو تکه از فریم را با هم ترکیب می کند، و آن را روی مانیتور نمایش می دهد. با AFR، هر کارت گرافیک روی فریمهای مختلفی کار میکرد، به عنوان مثال کارت اول فریمهای فرد را ارائه میکرد، و کارت دوم فریمهای زوج را ارائه میداد، سپس به کارت «مستر» فرستاده میشد و خروجی میگرفت. SLI تا ۱.9x عملکرد تک کارت را در پیکربندی GPU دوگانه ارائه می داد، با این حال همه عناوین بازی قادر به بهره مندی از این فناوری نبودند، بنابراین عملکرد مقیاس بندی همیشه کارآمد نبود.
در نتیجه، فناوری SLI کامل نبود و افزایش عملکرد اغلب بسیار کمتر از ۱.9x بود، گاهی اوقات باعث ایجاد مصنوعات بصری روی خروجی میشد. این نیاز به توسعه دهندگان داشت که زمان و تلاش بیشتری را برای بهینه سازی بازی ها برای پشتیبانی از چند GPU بگذارند، بنابراین آنها شروع به دور شدن از آن کردند و در عوض بازی ها را برای یک GPU واحد بهینه کردند. در سپتامبر سال گذشته (۲۰۲۰)، همراه با راهاندازی پردازندههای گرافیکی سری جدید GeForce RTX™ ۳۰۰۰ شرکت NVIDIA پایان تکنولوژی SLI را اعلام کرد، بنابراین سازندگان مادربرد و توسعهدهندگان بازی ممکن است دیگر از آن پشتیبانی نکنند.
NVLINK در مقابل SLI – تفاوت در چیست؟
موضوع اصلی و ایجاد کننده تمایز این دو تکنولوژی، سرعت است – SLI پهنای باند 1GB/s را با استفاده از پل استاندارد و 2GB/s با استفاده از پل با پهنای باند بالا ارائه می دهد. برای مقایسه، نسل سوم NVLink کل پهنای باند 600GB/s را ارائه می دهد که تقریباً ۳۰۰ تا ۶۰۰ برابر SLI و ۱۰ برابر بیشتر از PCIe نسل آخر یعنی PCIe 4.0 !!. برخلاف SLI، پهنای باند NVLink دو جهته است به این معنی که از روش master-slave استفاده نمی کند، در عوض GPU ها را در یک شبکه مش بندی با چندین لینک و کارایی بالاتر به هم متصل می کند و به هر GPU روی آن مش، اجازه می دهد تا با یکدیگر ارتباط برقرار کرده و منابع را جمع آوری کنند.
از NVIDIA NVLINK برای طراحی گرافیکی، CAD/CAM/CAE , Simulation , ML , AI , مجازی سازی و … استفاده می شود. NVLink SLI-ready برای کارتهای گیمینگ و NVIDIA NVLINK در کارت گرافیک های حرفه ای مورد استفاده قرار می گیرد.
تصویر بالا: پل NVLink نسل سوم (در سمت راست) و پل NVLink نسل دوم (در سمت چپ)
مانند پل SLI پلهای NVLink نیز از رابط فیزیکی برای پردازنده های گرافیکی استفاده می کند که در قالب کارت استاندارد PCIe FHFL قرار دارند و به فرد اجازه می دهد بسته به مدل، دو یا سه GPU را به یکدیگر متصل کند. با این حال، در برخی از راهحلهای متراکمتر و حجم بزرگ تر از تعداد بیشتر کارت گرافیک، که از فرم فاکتور SXM4 استفاده میکنند، NVLink روی برد چند GPU مانند پلتفرم NVIDIA HGX تعبیه شده که آخرین ابررایانه DGX A100 8-GPU آنها را تامین میکند.
تصویر بالا: : NVLink برای A100 PCIe (در سمت چپ) در مقابل نمودار توپولوژی NVLink برای پردازندههای گرافیکی A100 SXM4 در (سمت راست) می باشد.
تصویر بالا: برد گرافیکی NVIDIA HGX با ۸ عدد گرافیک DGX™ A100 (سمت راست) و یک سرور/ورک استیشن دیگر با ۲ کارت گرافیک A100 PCIe (سمت چپ).
اولین نسل NVIDIA NVLink در سال ۲۰۱۴ همراه با معماری پاسکال معرفی شد که سپس با معماری Volta به نسل دوم تبدیل شد. اخیرا، با راه اندازی معماری جدید آمپر Ampere از شرکت NVIDIA نسل سوم اتصال GPU به GPU را معرفی کرده است که در GPU های حرفه ای سری A مانند A100، RTX A6000 و A40 و همچنین GeForce RTX 3090 استفاده می شود.
مهندسان در آزمایشگاه بوستون وقت خود را صرف آزمایش یک جفت پردازنده گرافیکی NVIDIA A100 PCIe 4.0 کردند که از ۳ پل فیزیکی NVLink (که برای بهترین عملکرد پل زدن و توپولوژی پل متعادل لازم است) استفاده کرده و آنها را با سایر GPU های تولید شده با معماری Ampere مانند RTX A6000 و GeForce RTX 3090 مقایسه کردند(کارت گرافیک سری ۳۰ مدل RTX 3090 فقط از یک پل NVLink پشتیبانی می کند).
توپولوژی پل زدن A100 NVLink (منبع : خلاصه محصول شتاب دهنده پردازنده گرافیکی NVIDIA A100 40GB PCIe)
تصویر بالا: ۴ عدد پردازنده گرافیکی A100 PCIe، متصل با ۳ پل NVLink به صورت جفت، نصب شده در ایستگاه کاری (در آزمایشگاه شرکت بوستون). این چیدمان برای پل های NVLink توسط شرکت انویدیا توصیه شده که در بالا لینک فایل و عکس مور نظر ارایه شده. به عنوان معیار، تست پهنای باند Peer-To-Peer از جعبه ابزار CUDA 11 استفاده شده تا تست برای همه نوع از کارت های انویدیا قابل قبول باشد.
همانطور که انتظار می رفت، A100 به لطف ۳ پل NVLink و سریع ترین حافظه HBM2e بهترین نتایج را نشان داد، پس از آن GeForce RTX 3090 که از حافظه GDDR6X استفاده می کند، سپس RTX A6000 با حافظه GDDR6. البته این تست سرعت مربوط به استفاده از حافظه و نوع آن است نه برتری کاربری یا توصیه کارتهای گرافیک برای استفاده در نوع کاربری محاسباتی، گرافیکی، گیم یا هر گزینه کاربری دیگر.
برنامه های کاربردی NVLink و نتیجه گیری
NVLink یک فناوری عالی است، با این حال، نقل قول معروف جنسن هوانگ “این فقط کار می کند” به طور کامل در اینجا صدق نمی کند. توسعه دهندگان نرم افزار باید پشتیبانی از نسل جدید NVLink را در برنامه های خود پیاده سازی کنند تا از مزایای کامل آن استفاده کنند. برخی از موتور رندرها، برنامه های کاربردی علمی و هوش مصنوعی از NVLINK پشتیبانی می کنند، که چند نمونه از این موارد عبارتند از:
- AutoDesk Arnold
- V-Ray
- AMBER
- Ansys Fluent
- Lattice QCD
(موارد بسیار بیشتری وجود دارد و همیشه موارد جدیدی اضافه می شود.)
اطلاعات استفاده شده از آزمایشگاه شرکت بوستون (امریکا) مرکز تحقیق و توسعه و آزمایش در محل است که در آن محصولات جدید را توسعه می دهند و آخرین فناوری ها را ارزیابی می کنند. فناوریهای جدید و بهبودیافته همیشه در حال ظهور هستند و این میتواند برای مشتریانی که پروژههای آیندهشان را برنامهریزی میکنند، وضعیت دلهرهآوری باشد. تصمیم گیری درست در مورد خرید سخت افزار جدید پیشنهاد دشواری است، حتی دشوارتر نیز می شود، زمانی که مشتریان قادر به آزمایش و درک سخت افزار قبل از خرید نباشند. تمام فناوری و محصولات ذکر شده برای شرکت NVIDIA در این وبلاگ، مانند DGX A100، NVLINK، A100 PCIe، RTX A6000 در حال حاضر برای آزمایش در دسترس هستند!
سایت دکمه ها از سال ۲۰۰۵ فناوری های پیشرفته را ارائه می دهد. ما راه حل برای ایستگاه های کاری زیادی را ارائه می دهیم که از فناوری NVIDIA NVLink پشتیبانی می کنند و می توانند به طور خاص برای نیازهای شما طراحی شوند.
اگر مایل به کسب اطلاعات بیشتر هستید، می توانید با یکی از اعضای تیم فروش و مشاوره دکمه ها تماس بگیرید.
منبع مقاله: (بلاگ شرکت بوستون)
تصاویر: از بخش های متفاوت محصولات و تکنولوژی های شرکت NVidia و آزمایشگاه بوستون.
عکس بالا: نمودار توپولوژی NVSwitch اتصال دو GPU را برای سادگی نشان می دهد. هشت یا ۱۶ پردازنده گرافیکی از طریق NVSwitch همه به همه به همین روش متصل می شوند.
عالی بود. ممنون
سپاس از وقتی که گذاشتید برای مطالعه این مطلب.
👍👍❤️عالی بود
سپاس فراوان مهرداد جان.
برای دوستانی که مهرداد رو نمی شناسند باید بگم مهرداد از علاقمندان به تکنولوژی های پردازش کامپیوتری و از دوستان بنده است که اگر قبول کنند، پدر ایشون استاد بنده بوده. نظر لطفی که مهرداد در حوزه های گیمینگ و تکنولوژی های پیشگام داشته، همیشه چراغ من برای ادامه راه بوده.
سپاس از توجه شما به مقاله بالا جناب میعادی.
اما اگر این مقاله نظر شما رو جلب کرده، برای هر متخصصی ضروری، آخه بین این تعداد تکنولوژی ارتباط بین قطعات، این گزینه از تاثیرگذارترین و پیشگام ترین در حوضه حجم پردازش ها، در ابعادی است که کمتر بشر امروز با اون در ارتباط بوده و این راه حل جالب توجه مخاطبان هوش مصنوعی (AI) ، یادگیری ماشین (ML)، مجازی سازی (Visualization) و شبیه سازی (Simulation) ، همون گلوگاهی هستش که برای پهنای باند در این نوع پردازش و انواع پردازش هایی که در آینده به اون برخورد می کنیم، نیاز داریم.