تاثیر پهنای باند PCI-e بر عملکرد پردازش کارت گرافیک GPU برای تولید محتوا
در بدترین حالت، محدود کردن پهنای باند PCI-e موجود به GPU اولیه میتواند عملکرد برنامههای تولید محتوا را تا ۵۸ درصد برای گردشهای کاری خاص در هنگام مقایسه PCI-e 4.0 x16 با PCI-e 3.0 x4 و توجه کنید، در سایز x4 یعنی یک چهارم سایز x16 در حالت فیزیکی،می تواند کاهش دهد. با این حال، اکثر برنامه های آزمایش شده، از جمله Unreal Engine، Stable Diffusion و Blender، کاهش عملکرد کمی یا بدون کاهش را نشان دادند.
در موقعیتهای رایجتر کاهش پهنای باند PCI-e به PCI-e 4.0 x8 از PCI-e 4.0 x16، تغییر کمی در عملکرد ایجاد محتوا وجود داشت: تنها یک کاهش متوسط در امتیازات ۳ درصدی برای ویرایش ویدیو و گرافیکهای حرکتی وجود داشت. در شرایط شدیدتر (مانند اجرا در PCI-e 4.0 x4 / PCI-e 3.0 x8)، این به کاهش متوسط عملکرد ۱۰٪ تغییر کرد. در نهایت، در بدترین حالت مطلق (PCI-e 3.0 x4)، امتیازات ویرایش ویدیو و گرافیک حرکتی به طور میانگین ۷۵% عملکرد پایه داشتند، با هر دو جلوههای GPU و رسانه H.264 کاهش عملکرد قابلتوجهی را نشان میدهند.
به طور کلی، تا زمانی که بتوانید GPU خود را در PCI-e 4.0 x8 یا بالاتر (یا PCI-e 3.0 x16 اگر مادربرد قدیمیتری دارید) اجرا کنید، میتوانید عملکرد تقریباً کاملی را برای گردشهای کاری ایجاد محتوا انتظار داشته باشید. از آنجایی که شرایطی وجود دارد که در آن یک سیستم مدرن در هر چیزی کمتر از این کار کند بسیار غیر معمول است، ما عمدتاً توصیه میکنیم نگران پهنای باند PCI-e برای این نوع گردش کار نباشید.
معرفی
PCI Express (PCI-e) فناوری است که بسیاری از دستگاههای کامپیوتری داخلی را به مادربرد متصل میکند – از جمله کارتهای ویدئویی، درایوهای NVMe و کارتهای شبکه. در طول سالها، ما شاهد چندین تجدید نظر در این فناوری بودهایم، اما رایجترین آنها در حال حاضر PCI-e 3.0، ۴.۰، ۵.۰ هستند. PCI-e 3.0 عمدتاً به دستگاههای قدیمیتر منتقل میشود، زیرا تمام مادربردها و کارتهای گرافیک نسل فعلی حداقل از PCI-e 4.0 پشتیبانی میکنند و جدیدترین مادربردهای Z790 و X670 از PCI-e 5.0 حداقل در یک اسلات با اندازه کامل پشتیبانی میکنند. اگرچه هنوز شاهد کارت گرافیک مصرف کننده در PCI-e 5.0 نیستیم.
هر نسخه PCI Express ویژگی های جدیدی را معرفی می کند، اما تفاوت اصلی در سرعت انتقال داده است. یک اتصال PCI-e شامل تعدادی خط (معمولاً بین ۴ تا ۱۶ برای اکثر اسلات های توسعه) است که بسته به نسخه PCI-e حداکثر نرخ انتقال را دارند. هر نسخه از نسخه ۳.۰ سرعت انتقال نسخه قبلی را برای نرخ هر خط 32GT/s در PCI-e 5.0 دو برابر کرده است. پهنای باند کل یک اسلات توسعه هم به تعداد خطوط و هم به نسخه PCI-e بستگی دارد، به طوری که یک اتصال PCI-e 5.0 با (هشت خط x8) دارای پهنای باند یکسان (۳۱.۵ گیگابایت بر ثانیه) با اتصال PCI-e 4.0 با (شانزده خط x16) است.
در حال حاضر، بسیاری از مادربردهای دسکتاپ دارای پشتیبانی محدود کارت افزودنی هستند، در عوض خطوط PCI-e موجود خود را به ویژگی هایی مانند اتصالات M.2، پورت های USB اضافی و اتصالات اترنت پرسرعت اختصاص می دهند. این بدان معناست که آنها ممکن است فقط سه اسلات PCI-e داشته باشند و معمولاً دو مورد از آنها پهنای باند مشترک دارند: دو اسلات با هم یک اتصال PCI-e 5.0 x16 یا دو اتصال PCI-e 5.0 x8 را ایجاد می کنند. اسلات سوم معمولاً یک اتصال PCI-e 4.0 x4 (یا حتی فقط x2!) است.
این محدودیت در پشتیبانی کارت افزودنی به این معنی است که کاربرانی که یک کارت گرافیک قدرتمند و کارتهای شبکه اضافی، کارتهای Raid یا کارتهای ضبط میخواهند، باید پهنای باند کارت گرافیک خود را به حداقل x8 کاهش دهند. و در تنظیمات چند gpu، یکی از کارتها احتمالاً با سرعت پایین x4 اجرا میشود. اما سوال اینجاست: وقتی کارتهای ویدئویی به طور چشمگیری محدود به پهنای باند میشوند، چقدر عملکرد از دست میرود؟
Test Platform
CPUs: Intel Core i9 13900K 16-core |
CPU Cooler: Noctua NH-U12A |
Motherboard: ASUS ProArt Z690-Creator WiFi |
RAM: 2x DDR5-4800 32GB (64GB total) |
GPUs: NVIDIA GeForce RTX 4080 16GB Studio Driver 536.67AMD Radeon RX 7900 XTX 24GB Adrenaline 23.7.2 |
PSU: Super Flower LEADEX Platinum 1600W |
Storage: Samsung 980 Pro 2TB |
OS: Windows 11 Pro 64-bit (22621) |
Benchmark Software
DaVinci Resolve 18.5 PugetBench for DaVinci Resolve 0.93.2 |
Premiere Pro 23.5.0 PugetBench for Premiere Pro 0.98.0 |
After Effects 23.5 PugetBench for After Effects 0.96.0 |
Unreal Engine 5.2 |
Blender 3.6.0 |
Automatic 1111 Version: 1.5.1, xformers: 0.0.17 Checkpoint: v1-5-pruned-emaonly |
SHARK Version: 20230701_796 Checkpoint: stabilityai/stable-diffusion-2-1-base |
برای ارزیابی تاثیر پهنای باند PCI-e، از یکی از سریعترین پلتفرمهای دسکتاپ خود استفاده کردیم: Intel i9 13900K. اگرچه پلتفرم ایستگاه کاری مانند Threadripper Pro ممکن است پتانسیل گلوگاه های CPU را در برخی از گردش های کاری کاهش داده باشد، این بردها دارای خطوط PCI-e کافی برای اختصاص ۱۶ عدد کامل به هر اسلات PCI-e هستند. بنابراین تصمیم گرفتیم از پلتفرمی استفاده کنیم که در آن اشتراکگذاری خط PCI-e پهنای باند را برای کارتهای افزودنی کاهش میدهد تا تأثیر دنیای واقعی را بر انواع سیستمهایی که میفروشیم ببینیم. پردازندههای گرافیکی که ما با آنها آزمایش میکنیم، مدلهای مصرفکننده رده بالایی از NVIDIA و AMD، GeForce RTX 4080 و Radeon RX 7900 XTX هستند، تا ببینیم در صورت محدودیت پهنای باند، تفاوتی بین تولیدکنندگان وجود دارد یا خیر.
ما از مجموعه آزمایشی گستردهای استفاده میکنیم که شامل اکثر دستهبندیهای معیارهایی است که در حال حاضر برای بررسی GPU با آنها آزمایش میکنیم. اینها بر تولید محتوا متمرکز هستند و شامل معیارهای ما برای After Effects، DaVinci Resolve و Premiere Pro، علاوه بر این معیارهای در حال توسعه برای Unreal Engine 5.2 است. ما همچنین در حال آزمایش رندر آفلاین GPU با Blender 3.6 و عملکرد Stable Diffusion با SHARK و Automatic1111 هستیم.
برای ارزیابی تاثیر پهنای باند PCI-e، از یکی از سریعترین پلتفرمهای دسکتاپ خود استفاده کردیم: Intel i9 13900K. اگرچه پلتفرم ایستگاه کاری مانند Threadripper Pro ممکن است پتانسیل گلوگاه های CPU را در برخی از گردش های کاری کاهش داده باشد، این بردها دارای خطوط PCI-e کافی برای اختصاص ۱۶ عدد کامل به هر اسلات PCI-e هستند. بنابراین تصمیم گرفتیم از پلتفرمی استفاده کنیم که در آن اشتراکگذاری خط PCI-e پهنای باند را برای کارتهای افزودنی کاهش میدهد تا تأثیر دنیای واقعی را بر انواع سیستمهایی که میفروشیم ببینیم. پردازندههای گرافیکی که ما با آنها آزمایش میکنیم، مدلهای مصرفکننده رده بالایی از NVIDIA و AMD، GeForce RTX 4080 و Radeon RX 7900 XTX هستند، تا ببینیم در صورت محدودیت پهنای باند، تفاوتی بین تولیدکنندگان وجود دارد یا خیر.
ما از مجموعه آزمایشی گستردهای استفاده میکنیم که شامل اکثر دستهبندیهای معیارهایی است که در حال حاضر برای بررسی GPU با آنها آزمایش میکنیم. اینها بر تولید محتوا متمرکز هستند و شامل معیارهای ما برای After Effects، DaVinci Resolve و Premiere Pro، علاوه بر این معیارهای در حال توسعه برای Unreal Engine 5.2 است. ما همچنین در حال آزمایش رندر آفلاین GPU با Blender 3.6 و عملکرد Stable Diffusion با SHARK و Automatic1111 هستیم.
ویراش ویدیو (Video Editing) : تاثیر پهنای باند PCIe در نرم افزار DaVinci Resolve Studio
با شروع DaVinci Resolve، می بینیم که کاهش پهنای باند PCI-e به GPU تأثیر کوچک اما قابل توجهی بر عملکرد کلی دارد. به طور کلی، حداکثر کاهش عملکرد ۲۲٪ برای NVIDIA و ۱۵٪ برای AMD وجود دارد. این تفاوت نسبتاً قابل توجهی است، اما گروه بندی واضحی از امتیازات در انتهای بالاتر پهنای باند PCI-e نیز وجود دارد.
در PCI-e 4.0 x16 و x8، و PCI-e 3.0 x16، تفاوت کمی در عملکرد وجود دارد به جز در آزمایشهای GPU Effects، که در آن نصف کردن پهنای باند به PCI-e 4.0 x8 / PCI-e 3.0 x16 منجر به ۵٪ امتیازات پایینتر شد. کارت NVIDIA همچنین کاهش ۹ درصدی را در نتایج رسانه RED/RAW نشان داد. این بدان معناست که به اشتراک گذاری پهنای باند برای یک کارت افزودنی در مادربرد نسل ۴ تنها در صورتی که از رسانه RAW استفاده می کنید، بر عملکرد شما تأثیر منفی می گذارد.
اگر اشتراکگذاری منابع در یک اتصال قدیمیتر PCI-e 3.0 اتفاق بیفتد، داستان تا حدودی تغییر میکند، زیرا کاهش پهنای باند به PCI-e 3.0 x8 / PCI-e 4.0 x4 باعث کاهش بیشتر ۱۰% و ۶% برای NVIDIA و AMD میشود. هر سه دسته امتیاز عملکرد قابل توجهی را نشان دادند، به ویژه برای رسانه های RAW و جلوه های GPU.
در نهایت، زمانی که پهنای باند GPU به PCI-e 3.0 x4 محدود شود، شاهد کاهش امتیاز ۲۲ و ۱۵ درصدی فوقالذکر هستیم. اگرچه همه دستهها در این پیکربندی ضعیف عمل میکنند، اما بیشترین ضربه را برای رسانههای H.264/HEVC مشاهده میکنیم که با آخرین نصف شدن پهنای باند به شدت کاهش مییابد. این جالب است زیرا در این مورد از عملکرد خام GPU استفاده نمی شود، بلکه از رمزگشا/رمزگذار سخت افزار NVDEC/NVENC استفاده می شود.
به طور کلی، تفاوت بین x8 و x16 نباید برای اکثر کاربران DaVinci Resolve مطرح شود. رایجترین گردش کار برای کسانی است که با رسانههای RAW کار میکنند، که برای نظارت دقیق ویدیویی به کارتهای افزودنی مانند BlackMagic Decklink نیز نیاز دارند. با این حال، برای آن نوع گردش کار، ما معمولاً به کاربران توصیه میکنیم به گزینه AMD Threadripper PRO که دارای خطوط PCI-e زیادی برای کار با چندین کارت است ارتقا دهید.
ویراش ویدیو (Video Editing) : تاثیر پهنای باند PCIe در نرم افزار Adobe Premiere Pro
با ادامه روند بنچمارک از DaVinci Resolve، نرم افزار Adobe Premiere Pro با کاهش پهنای باند PCI-e به GPU، تفاوت حتی بزرگتری را در عملکرد نشان می دهد. از نظر عملکرد کلی، هر دو AMD و NVIDIA در بدترین حالت کاهش ۳۵ درصدی بین PCI-e 4.0 x16 و PCI-e 3.0 x4 نشان دادند، اگرچه AMD کمی کمتر از NVIDIA تحت تأثیر قرار گرفت.
هنگام اجرای کاهش خط معمولی PCI-e 4.0 x8 (یا PCI-e 3.0×۱۶)، هر دو سازنده افت عملکرد متوسط ۴٪ داشتند. بیشترین تأثیر بر روی تستهای H.264/HEVC (6%) و کمترین آن در تستهای RED/RAW (3%) بود. به طور کلی، اجرای GPU در نیم پهنای باند تأثیر کمی بر عملکرد دنیای واقعی در Premiere Pro خواهد داشت.
مرحله بعدی پایین تر، در PCI-e 4.0 x4 (PCI-e 3.0 x8)، تفاوت قابل توجه ۱۷ درصدی را از پهنای باند کامل نشان می دهد. اجرای GPU شما در این پیکربندی کمتر از حد ایده آل است، به طوری که همه نمرات حداقل ۹ درصد کاهش عملکرد را مشاهده می کنند و رسانه H.264 به ویژه تحت تأثیر قرار می گیرد.
هنگام کار در Premiere Pro، به خصوص با کدک های H.264/HEVC، کاهش بیش از حد پهنای باند PCI-e می تواند عملکرد شما را بسیار تحت تاثیر قرار دهد. اگرچه وضعیت تا حد رایج کاهش به PCI-e 4.0 x8 کاهش زیادی را متحمل نمی شود، اما از هر چیزی کمتر از آن باید اجتناب شود.
تصاویر متحرک (Motion Graphics/VFX) : تاثیر پهنای باند PCIe در نرم افزار After Effects
افترافکت معمولاً معیاری نیست که ما هنگام بررسی عملکرد GPU اجرا می کنیم، زیرا معمولاً به یک GPU قدرتمند نیاز ندارد. به شرطی که VRAM کافی برای پروژه خود داشته باشید، پردازندههای گرافیکی میانرده برای اکثر گردشهای کاری بیش از اندازه کافی هستند. با این وجود، تصمیم گرفتیم با After Effects آزمایش کنیم تا ببینیم آیا محدود کردن پهنای باند GPU PCI-e بر عملکرد، تأثیر منفی میگذارد یا خیر.
با شروع اولین کاهش پهنای باند ما از PCI-e 4.0 x16 به PCI-e 4.0 x8 / PCI-e 3.0 x16، عملاً هیچ تأثیری در عملکرد خارج از حاشیه خطا برای امتیاز کلی مشاهده نمیکنیم. با این حال، کاهش عملکرد حدود ۱۰٪ در امتیاز GPU Effects برای هر دو کارت وجود دارد.
کاهش اتصال PCI-e حتی بیشتر به PCI-e 4.0 x4 / PCI-e 3.0 x8 کاهش عملکرد کلی ۷٪ را نشان می دهد که قابل توجه است اما احتمالاً برای بسیاری از کاربران قابل قبول است، با توجه به اینکه After Effects بیشتر به CPU متصل است تا GPU. اگر جلوههای GPU بخش بزرگی از گردش کار شما باشد، امتیاز GPU کاهش امتیاز بسیار قابلتوجهی ۳۳ درصدی را مشاهده میکند.
در کمترین پهنای باند آزمایش شده PCI-e 3.0 x4، در نهایت امتیاز کلی بیشتر از ۱۰% زیر امتیاز PCI-e 4.0 x16 را مشاهده می کنیم. در این مرحله، حتی امتیازهای پیشنمایش و رندر RAM (نشان داده نشده) با کاهش عملکرد مواجه میشوند، و جلوههای GPU در مقایسه با اجرای با پهنای باند کامل، تنها با ۴۵ درصد عملکرد مشکل دارند.
بسیار نادر است که یک GPU با سرعت PCI-e 3.0 x4 اجرا شود، بنابراین در اکثر مواقع، سرعت و پهنای باند PCI-e نباید برای کاربران After Effects نگران کننده باشد.
توسعه دهندگان بازی/تولید مجازی (Game Dev/Virtual Production) : تاثیر پهنای باند PCIe در نرم افزار Unreal Engine 5.2
بخش real-time renderer که ما در آزمایش خود وارد کردیم با نرم افزار یا موتور رندر Unreal Engine 5.2 است که در صنایع مختلف از جمله بازی سازی، تولید مجازی(سینمایی/ویدیویی) و تجسم معماری استفاده می شود. همانطور که انتظار دارید، کاهش پهنای باند PCI-e بر میانگین فریم در ثانیه برای پردازندههای گرافیکی NVIDIA و AMD تأثیر منفی میگذارد. با این حال، این اثر برای پردازنده گرافیکی NVIDIA بسیار بارزتر است، با ۸٪ اختلاف کل بین PCI-e 3.0 x4 و PCI-e 4.0 x16 در مقایسه با تفاوت ۲٪ برای GPU AMD. هنگامی که به امتیازات فرعی نگاه می کنیم، همچنین می بینیم که این اثر برای عملکرد رندر شطرنجی بسیار بارزتر است، با ۱۱٪ و ۵٪ عملکرد کمتر به ترتیب برای RTX 4080 و RX 7900 XTX.
اگرچه افت متوسط FPS به میزان ۱۱ درصد قابل توجه است، اما بیشتر این افت برای AMD و NVIDIA تنها زمانی رخ می دهد که در کمترین پهنای باندی که آزمایش کرده ایم اجرا شود: PCI-e 3.0 x4. عملکرد در پهنای باند معادل PCI-e 3.0 ×۸ بسیار کمتر تحت تأثیر قرار می گیرد. برای اکثر کاربران، حتی زمانی که روی یک مادربرد قدیمی با اشتراکگذاری خط PCI-e کار میکنند، این یک کاهش بزرگ برای عملکرد نخواهد بود.
به عبارت دیگر، درست مانند After Effects، پهنای باند PCI-e احتمالاً برای اکثر توسعه دهندگان و کاربران Unreal Engine نگرانی قابل توجهی نیست.
رندر کارت گرافیک (GPU Rendering) : تاثیر پهنای باند PCIe در نرم افزار Blender
با رفتن به تست رندر آفلاین GPU با Blender، هیچ تاثیری بر عملکرد ناشی از تغییرات پهنای باند PCI-e نمی بینیم. اکثر رندرهای آفلاین با بارگذاری صحنه در VRAM شروع میکنند، بنابراین این تنها تأثیر اتصال PCI-e است – مگر اینکه سیستم VRAM کافی برای بارگیری صحنه نداشته باشد و باید حافظه سیستم را خاموش کند. با این حال، این عملکرد بیشتر از آنچه که میتواند ناشی از پهنای باند محدود PCI-e باشد، ایجاد میکند، که اغلب منجر به بارگذاری نشدن صحنه یا خرابی در طول رندر میشود.
با توجه به اینکه رندر GPU مانند Blender یکی از محتمل ترین پیکربندی ها برای پیکربندی چندین GPU است (و در نتیجه یکی از محتمل ترین پیکربندی ها برای داشتن مقداری یا همه با پهنای باند کاهش یافته است)، خوب است ببینیم که نباید به دلیل کاهش پهنای باند، هیچ اثر نامطلوبی وجود داشته باشد.
انتشار پایدار (Stable Diffusion) : تاثیر پهنای باند PCIe در نرم افزارهای (SHARK ,Automatic 1111)
برای آزمایش انتشار پایدار، از دو مورد از سه پیادهسازی مورد بحث در مقاله روششناسی انتشار پایدار استفاده کردیم، یک محاسبه میانگین هندسی روی هر یک از نتایج آنها انجام دادیم و سپس بالاترین نتیجه را بین سه پیادهسازی برای هر ترکیب پهنای باند-سختافزار گرفتیم. نمایش بر روی نمودار برای AMD، هر نتیجه نشان داده شده از اجرای SHARK است، در حالی که برای NVIDIA، همه آنها از پیاده سازی Automatic 1111 استفاده می کنند.
نتایج مربوط به انتشار پایدار همه در حاشیه خطای این آزمون هستند. با این حال، مانند بلندر، سرعت اتصال PCI-e می تواند مدت زمان بارگذاری مدل در VRAM را تغییر دهد، که در معیار عملکردی مانند این نشان داده نمی شود. به همین دلیل، توصیه می کنیم در صورت امکان از کاهش پهنای باند خودداری کنید، اما احتمالاً تأثیر زیادی روی چیزها نخواهد داشت.
تأثیر عملکرد کلی سرعت PCI-e
برای ارائه برخی زمینهها برای تأثیرات کلی عملکرد، امتیازها را به حداکثر پهنای باند PCI-e پشتیبانیشده از GPUهای آزمایششدهمان عادی کردیم: PCI-e 4.0 x16. سپس یک میانگین هندسی وزنی از نمرات نرمال شده در بین دسته ها را محاسبه کردیم – اینها اساساً می توانند نسبت های درصد عملکرد در نظر گرفته شوند:
به طور کلی، ما میتوانیم روندهای کلی را از نتایج خاص برنامه خود ببینیم. در ویرایش ویدیو/موشن گرافیک (Premiere Pro، DaVinci Resolve و After Effects)، عملکرد نسبتاً ثابتی کاهش می یابد زیرا پهنای باند موجود PCI-e را کاهش می دهیم، با PCI-e 3.0 x4 که حدود ۷۵ درصد از خط پایه نرمال شده را به دست می آورد. رندر – بلادرنگ با Unreal Engine و آفلاین با Blender – و Stable Diffusion نسبتاً بیتأثیر بودند.
نکته مهمی که میخواهیم به آن اشاره کنیم این است که با یک مادربرد مدرن و GPU با استفاده از PCI-e 4.0، به طور متوسط تنها ۱٪ کاهش عملکرد از x16 به x8 وجود دارد، همانطور که در صورت استفاده از یک پلتفرم مصرفی با چندین دستگاه PCI-e مادربردهای قدیمیتر که به PCI-e 3.0 محدود میشوند، تأثیر بیشتری خواهند داشت، اما حتی در آن زمان تنها حدود ۴-۶٪ است.
تنها زمانی که به افراط و تفریط رفته و تعداد خطوط را به x4 کاهش دهید، عملکرد بهویژه در جریانهای کاری مانند ویرایش ویدیو و VFX ضربه جدی میگیرد.
با محدود کردن پهنای باند به کارتهای ویدئویی، چقدر عملکرد تولید محتوا را قربانی میکنید؟
اغلب در مادربردهای مصرف کننده داشتن چندین کارت افزودنی چالش برانگیز است و در عین حال اطمینان حاصل می شود که همه آنها به حداکثر تعداد خطوط PCI-e که می توانند استفاده کنند دسترسی دارند. به همین دلیل، کارتهای ویدئویی اغلب با تعداد خط یا نسل PCI-e کمتری کار میکنند. خوشبختانه، رایج ترین کاهش – از PCI-e 4.0 x16 به PCI-e 4.0 x8 – تأثیر نسبتا کمی بر عملکرد در برنامه های ایجاد محتوا دارد.
ویرایش ویدیو با Premiere Pro و DaVinci Resolve حساس ترین برنامه هایی هستند که ما روی پهنای باند PCI-e آزمایش کردیم. اجرا در PCI-e 4.0 x16، PCI-e 4.0 x8 یا PCI-e 3.0 x16 باید تأثیر ناچیزی بر گردش کار شما داشته باشد. این معمولاً هنگام نصب یک کارت افزودنی مانند کارت ضبط یا کارت شبکه در کنار GPU در مادربردهای نسل فعلی یا هنگام استفاده از ترکیب CPU/مادربرد قدیمی (نسل دهم اینتل یا Ryzen 2000) رخ می دهد. نصب کارت افزودنی روی این مادربردهای قدیمی و کاهش پهنای باند GPU به PCI-e 3.0 x8 توصیه نمی شود، زیرا می تواند عملکرد را از ۱۰ به ۳۰ درصد کاهش دهد.
After Effects به طور مشابه با محدود کردن پهنای باند PCI-e به GPU، اما به میزان کمتر، تحت تأثیر قرار گرفت. به طور معمول، After Effects دارای گلوگاه CPU است، اما گردشهای کاری با جلوههای GPU سنگین، حتی در PCI-e 4.0 x8/PCI-e 3.0 x16، تأثیرات ۱۰ درصدی را خواهند دید. در غیر این صورت، کاهش خطوط PCI-e موجود تا PCI-e 3.0 x4 کمترین تأثیر را خواهد داشت، که معمولاً فقط در تنظیمات چند GPU در مادربردهای مصرفکننده اتفاق میافتد.
در مقابل، عملکرد رندر به طور قابل توجهی تحت تأثیر پهنای باند PCI-e نیست. Blender کاملاً تحت تأثیر قرار نگرفت، در حالی که Unreal Engine یک تفاوت جزئی کمتر از ۱۰٪ در PCI-e 3.0 x4 مشاهده کرد، در حالی که همه تنظیمات دیگر کمتر از ۵٪ بودند. استفاده از چندین پردازنده گرافیکی یا کارت های افزودنی در یک سیستم برای این گردش کارها نباید باعث مشکلات عملکرد شود.
در نهایت، Stable Diffusion تحت تأثیر تعداد یا نسل خطوط PCI-e موجود برای GPU قرار نگرفت. همه نتایج ما در حاشیه خطا بود. تنها منطقه ای که انتظار داریم تفاوتی وجود داشته باشد مربوط به زمان بارگذاری مدل است.
هنگامی که ما سیستمهایی را که میفروشیم پیکربندی میکنیم، بین نیاز به حداکثر کارایی از اجزا و تمایل به کارتهای اضافی لازم برای انجام کار مشتریانمان تعادل برقرار میکنیم. اغلب، این به معنای کاهش GPU اولیه به PCI-e 4.0 x8 است که پهنای باند PCI-e را به نصف کاهش می دهد. با این حال، همانطور که در این مقاله نشان دادیم، این کاهش عمده در پهنای باند اغلب تأثیر حداقلی بر عملکرد دنیای واقعی دارد. خارج از چند موقعیت غیر معمول، این آزمایش تأیید می کند که تا زمانی که یک مادربرد مدرن دارید که از PCI-e 4.0 پشتیبانی می کند، اجرای GPU با سرعت x8 مشکلی ندارد.
آیا به دنبال یک ایستگاه کاری برای هر یک از برنامه هایی که آزمایش کردیم هستید؟ برای مشاهده ایستگاه های کاری پیشنهادی ما برای بسته های نرم افزاری مختلف می توانید از صفحه راه حل های ما دیدن کنید. اگر گردش کار منحصر به فردی دارید، صفحه پیکربندی سفارشی ما به شما امکان می دهد سخت افزار مورد نیاز خود را جمع آوری کنید. و اگر در هر نقطه ای می خواهید مطمئن شوید که پیکربندی کاملی را برای نیازهای خود دریافت می کنید – یا مطمئن نیستید از کجا شروع کنید – مشاوران فناوری ما برای کمک در دسترس هستند.
این مطلب ترجمه مقاله (Impact of GPU PCI-e Bandwidth on Content Creation Performance) از بخش مقالات سخت افزاری شرکت Puget Systems بود.