همه چیز درباره‌ی PCI Express 3.0 و 2.0، چه تفاوتی در سرعت کارت گرافیک ایجاد می‌شود؟ (بخش سوم)

امروزه اسلات PCIe به شکل‌های مختلف روی مادربوردها دیده می‌شود و بسیار پرکاربرد است. اسلات‌های PCIe و کارت‌های جانبی می‌بایست به درستی انتخاب و نصب شوند. در بخش اول به مقایسه PCIe با PCI و AGP می‌پردازیم. بخش دوم به بررسی دقیق پی‌سی‌آی اکسپرس اختصاص دارد و در بخش سوم به بررسی تأثیر اسلات پی‌سی‌آی اکسپرس در عملکرد کارت گرافیک و سرعت اجرای بازی‌ها می‌پردازیم.

{autotoc}

توجه شما را به بخش‌های دیگر این مطلب جلب می‌نماییم:

آمار و ارقام نسخه‌ی 3.0 و مقایسه با PCI Express 2.0

در بخش‌های قبلی به معرفی PCI Express و بررسی پهنای باند نسخه‌های گوناگون و اسلات‌های مختلف پرداختیم. در این بخش می‌خواهیم تفاوت عملکرد کارت گرافیک‌های رده اول امروزی را مورد بررسی قرار دهیم و ببینیم اگر کارت گرافیکی با واسط PCI Express Gen 3.0 را در نسخه‌ی دوم اسلات PCIe قرار دهیم، چه اتفاقی می‌افتد و چند درصد از توان واقعی کارت گرافیک هدر می‌رود. این سوالی است که اکثر کاربرانی که مادربوردهای قدیمی‌تر دارند و می‌خواهند برای اجرای بازی‌های امروزی، بدون ارتقای پردازنده، مادربورد و رم، به نتیجه‌ی مطلوب برسند، پیش می‌آید.

در ابتدا تکرار می‌کنیم که پهنای باند اسلات 16 مسیره‌ی PCIe 3.0 حدود 16 گیگابایت بر ثانیه است که نسبت به رکورد 8 گیگابایت بر ثانیه‌ای نسخه‌ی دوم، دو برابر بیشتر است. به بیان دیگر اگر PCIe 3.0 را به صورت 8 مسیره استفاده کنیم، پهنای باند برابر با PCIe 2.0 در حالت 16 مسیره خواهد بود. به جدول زیر توجه کنید:

پهنای باند اسلات PCI در حالت x16 و x8
نسخه

پهنای باند x8

(گیگابایت در ثانیه)

پهنای باند x16

(گیگابایت در ثانیه)

PCIe 1.x24
PCIe 2.x48
PCIe 3.x7.8715.75
PCIe 4.x15.7731.51

نکته‌ی بسیار مهمی که بعداً مفصلاً در مقاله‌ی دیگری به آن می‌پردازیم این است که اسلات واقعاً به صورت x16 فعالیت کند و نه به شکل x8 و پایین‌تر. محدودیت مادربورد، چیپ‌ست و پردازنده ممکن است به کاهش تعداد مسیرها بیانجامد، اما در بررسی ما، تنها یک کارت گرافیک برای آزمودن کاهش عملکرد مورد استفاده قرار می‌گیرد.

سخت‌‌افزار و نرم‌افزار برای شروع بنچ‌مارک‌ها

سراغ سخت‌افزار تست زومیت می‌رویم که مشخصاتی به شرح زیر دارد:

مشخصات نرم‌افزاری و سخت‌افزاری سیستم تست

سیستم عاملویندوز 8.1 ویرایش 64 بیتی
درایور کارت گرافیک کاتالیست 14.4
مادربورد و چیپ‌ستZ97: گیگابایت Z97X-UD7 TH LGA1150 - گارانتی آواژنگ
کارت گرافیکگیگابایت R9 290X WindForce 3X OC - گارانتی آواژنگ
پردازندههسول Core i5-4570: سرعت کلاک 3.6 گیگاهرتز
رمای‌دیتا XPG Gaming V2، سرعت 2400 مگاهرتز و تایمینگ CL11 -گارانتی آونگ
فضای ذخیره‌سازیدیسک حالت جامد ای‌دیتا SX900 128 GB - گارانتی آونگ
پاورگرین 1275 وات، 80 پلاس پلاتینیوم
مانیتورال‌جی 1080p W2261vp

تغییر لینک PCI Express در بایوس مادربورد انجام می‌شود و با توجه به اینکه R9 290x در حال حاضر یکی از سریع‌ترین کارت‌ گرافیک‌های تک‌هسته‌ای بازار است، تأثیر PCI Express 30 و پهنای باند دو برابری آن، بیش از مدل‌های معمولی خواهد بود.

عکس کارت گرافیک گیگابایت R9 290X

بنچ‌مارک با Crysis 3

کرایسیس 3 نمایشی از قدرت موتور گرافیکی CryEngine 3 است.

crysis3-root-smallفقط بخش دوم تست که قسمتی از مرحله‌ی Root of All Evil را برای تست اجرا می‌کنیم. در این صحنه نورپردازی ذرات، سایه‌ها، تسلیشن گیاهان و پردازش فیزیک حرکات، همگی دست به دست هم داده‌اند تا کارت گرافیک‌ها را به زانو درآورند.

آنتی‌الیاسینگ به صورت MSAA 4X و تنظیمات در بالاترین حالت ممکن هستند

با تغییر Gen 3 به Gen 2 سرعت اجرای بازی کمی تغییر می‌کند.

جالب است که نسخه‌ی سوم نه تنها سرعت را افزایش نداده بلکه حدود 2 درصد کاهش هم ایجاد کرده است!

بنچ‌مارک با 3DMark 2013

به جای گرفتن بنچ‌مارک تک‌تک بازی‌های سنگین امروزی، به 3DMark سری می‌زنیم تا یک بررسی کلی داشته باشیم. البته مجموعه‌ی 3DMark تست‌های متنوعی را در خود جای داده ولیکن با توجه به سنگین بودن بازی‌های نسل جدید، فقط آزمون Firestrike Extreme را به عنوان ملاک ارزیابی در نظر گرفته‌ایم.

نتیجه با استفاده از Gen 2.0 و Gen 3.0 به ترتیب زیر است. با PCI Express 2.0:

3dmark-gen3-small

با PCI Express 3.0:

3dmark-gen2-small

و اما مقایسه‌ی کلی تمام بخش‌های 3DMark 2013 به صورت زیر خواهد بود:

سخت‌افزار و نرم‌افزار برای دومین آزمون

موضوع به مادربورد باکیفیت گیگابایت مربوط نمی‌شود. سخت‌افزارهای دیگر هم ممکن است همین نتیجه را تأیید کنند. بنابراین با یک سیستم دیگر بررسی می‌کنیم.

سخت‌افزار و نرم‌افزار استفاده شده در این آزمون به شرح زیر است:

مشخصات نرم‌افزاری و سخت‌افزاری دومین سیستم تست
سیستم عاملویندوز 8.1 پرو، ویرایش 64 بیتی
درایور کارت گرافیکجیفورس 337.88 (نسخه نهایی)
مادربوردZ87: ایسوس Z87 ماکسیموس 6 هیرو
کارت گرافیکایسوس GTX 770 DirectCU II
پردازندههسول Core i5 4670K اورکلاک شده به 4.2 گیگاهرتز
فضای ذخیره‌سازیدیسک حالت جامد کینگستون، HyperX 3K 240 GB
مانیتورایسوس ML229 IPS
پاورتاپ‌پاور Twister ADJ، مدل 1100 وات

بنچ‌مارک در Crysis 3

در دو حالت اصلی، از تنظیمات پیشرفته‌ی PCIe برای کاهش مصرف انرژی استفاده شده است، این دو حالت با عنوان Optimized در تمامی نمودارها تمیز داده می‌شوند:

چرا ممکن است سرعت کاهش یابد؟

قبل از هر چیز به تنظیمات مادربورد رجوع کرده و صحت تنظیمات را بررسی می‌کنیم. گیگابایت و چیپ‌ست Z97 تضمین‌کننده‌ی کیفیت سخت‌افزار و نرم‌افزار (بایوس) هستند اما به هر حال سازندگان بزرگ هم برای بهترین مادربوردهای خود، بسته‌های بروزرسانی نرم‌افزاری که شامل درایورها و بایوس است، عرضه می‌کنند. لذا ممکن است مشکل به مادربورد و بایوس مربوط شود.

پس از چک کردن تنظیمات، با اجرای Furmark به بررسی سرعت لینک PCI Express پرداختیم.

در بخش قبلی این مقاله سرعت نسخه‌ی سوم و دوم به ترتیب 8 و 5 گیگاهرتز یا GT/s ذکر شده بود. بنابراین هنگام اجرای Furmark انتظار داریم لینک ارتباطی PCIe 3.0 در یک ثانیه 8 میلیارد عمل انتقال داده انجام دهد. در حالتی که در بایوس نسخه‌ی دوم PCIe را انتخاب کرده باشیم هم به سرعت 5 گیگاهرتزی امیدوار هستیم.

بررسی سرعت لینک PCIe

نتیجه را با هم ببینیم، توجه کنید که از HWiNFO برای بررسی سرعت لینک PCIe استفاده شده است. برای بزرگ‌نمایی عکس‌های کوچک روی آن کلیک کنید:

gen-2-optimized-small

gen-3-optimized-small

نکته‌ی جالب توجه، حالت بی‌کار سیستم است که سرعت لینک به صورت خودکار به 2.5 گیگاهرتز که همان سرعت نسخه‌ی اول PCI Express است، تقلیل می‌یابد تا مصرف انرژی بهینه شود.

همین نکته ما را به پاسخ نزدیک می‌کند. چرایی کمتر بودن سرعت اجرای بازی‌های سنگین به فعال یا غیرفعال بودن تنظیمات مربوط به کاهش مصرف انرژی مرتبط می‌شود. بنابراین توان مصرفی و سرعت اجرا را به صورت دقیق‌تر بررسی می‌کنیم.

بررسی توان مصرفی مجموعه‌ی سخت‌افزار و R9 290X

سراغ سیستم بنچ‌مارک زومیت می‌رویم و توان مصرف مجموعه‌ی سخت‌افزار را بررسی می‌کنیم.

در بهینه‌سازی PCI Express آنچه مهم است، افزایش بازدهی است. منظور از بازدهی این است که به ازای هر وات مصرف انرژی، چه سرعتی حاصل می‌شود. بنابراین بازدهی را با تقسیم سرعت اجرا بر توان مصرفی محاسبه می‌کنیم. نتیجه‌ی مشخص می‌کند که برای رندر شدن یک فریم تصویر به طور متوسط چند ژول انرژی لازم است.

توان مصرفی مجموعه‌ سخت‌افزار:

در دو تصویر زیر توان VDDC کارت گرافیک را مشاهده می‌کنید. نکته‌ی جالب توجه در این دو تصویر این است که با استفاده از PCI Express 3.0 نه تنها توان مصرفی حدود 17 وات کاهش یافته بلکه ولتاژ هسته و بالطبع فرکانس کاری آن هم کاهش یافته است.

r9-290x-furmark-gen2-s

r9-290x-furmark-gen3-s

بنابراین توان، سرعت هسته و سرعت اجرای متوسط به صورت زیر است:

جالب این است که با وجود کاهش سرعت هسته حین اجرای Furmark، سرعت متوسط اجرای این آزمون ثابت باقی مانده است. موضوع این است که Furmark تنها به عنوان بنچ‌مارکی جهت تعیین میزان مصرف انرژی کاربرد دارد و با فشار آوردن روی تمام بخش‌های کارت گرافیک، توان مصرفی را به حداکثر می‌رساند. اما در بازی‌های سنگین امروزی، تمام بخش‌های کارت گرافیک به صورت کامل فعالیت نمی‌کنند.

نتیجه‌ی محاسبه‌ی بازدهی را باهم ببینیم:

بررسی توان مصرفی کارت گرافیک GTX 770

 

توان مصرفی کارت گرافیک به صورت درصدی از TDP در نرم‌افزار GPU-Z ارایه شده و نمودار بعدی، نشان‌دهنده‌ آن است:

جالب توجه‌ترین موضوعی که از بررسی دو نمودار فوق به آن می‌رسیم، بیشتر شدن سرعت اجرا همگام با افزایش توان مصرفی است. با توجه به اینکه PCI Express 3.0 و 2.0 از نظر تأمین پهنای باند مورد نیاز، با مشکل خاصی روبرو نیستند، منطقی است که با مصرف انرژی بیشتر، سرعت اجرا در حد بسیار کمی افزایش داشته باشد.

نکته‌ی جالب دیگر، پیشرفت نسخه‌ی سوم از نظر بهینه‌سازی مصرف انرژی است. از بررسی نمودار آخر به این مهم می‌رسیم که Gen 3.0 در حالت عادی بیشتر از Gen 2.0 بهینه شده، انرژی مصرف می‌کند ولیکن با فعال کردن تنظیمات بهینه‌سازی مصرف انرژی در Gen 3.0، توان مصرفی آن  کمتر از حالت بهینه‌ی نسخه‌ی دوم می‌شود.

نگاهی به دیگر بررسی‌ها و بازی‌ها

Crysis 3 را انتخاب کردیم و آن را در کنار 3DMark Fire Strike Extreme قرار دادیم به این علت که هر دو از سنگین‌ترین آزمون‌های سخت‌افزاری هستند و علاوه بر پردازنده‌ی گرافیکی، پردازنده‌ی اصلی را هم به خوبی درگیر می‌کنند. ممکن است برخی بازی‌ها از نسخه‌ی سوم PCI Express استفاده‌ی لازم را ببرند و افزایش سرعت چند درصدی را شاهد باشیم.

نتیجه‌ی آزمون hardware canucks که با کارت گرافیک دو هسته‌ای و قدرتمند GTX 690 انجام شده، تفاوت بسیار کم سرعت را در بیشتر بازی‌ها نشان می‌دهد:

gtx-690-pcie-compare

بررسی pugetsystems با موتور گرافیکی Unigine Heaven 4.0 که از جذاب‌ترین موتورهای گرافیکی حال حاضر است هم نشان از برتری نامحسوس PCIe 2.0 دارد و جالب است که در پلتفرم اکستریم X79، کاهش تعداد مسیرها از 16 عدد به 8 عدد، افزایش سرعت را به همراه داشته است:

pic disp

نتیجه‌گیری

پاسخ این سوال که آیا PCI Express 3.0 در افزایش سرعت اجرای بازی‌های فعلی، اثری دارد یا نه و اگر اثر دارد، چند درصد سرعت اجرای بازی را افزایش می‌دهد به طور خلاصه این است:

نسخه سوم PCI Express در حال حاضر ممکن است سرعت اجرای برخی بازی‌ها را کم و برخی را بیشتر کند اما تفاوت زیر 3 درصد است. بازدهی نسخه‌ی سوم در حد کمی بالاتر از نسخه‌ی دوم است

لذا به راحتی می‌توان با مادربوردها و پردازنده‌های رده متوسط که شاید 3 سال از کارکردشان گذشته است هم به اجرای روان بازی‌های سنگین پرداخت. آنچه نیاز است، یک کارت گرافیک رده اول است و اینکه واسط آن PCI Express 3.0 باشد اما مادربورد چنین اسلاتی را نداشته باشد، موضوع مهمی نیست و نهایتاً 3 درصد روی سرعت اجرای بازی موثر است. گاهاً موضوع برعکس هم می‌شود و در عمل سرعت نسخه‌ی دوم بالاتر به دست می‌آید که با مصرف توان بیشتر ممکن شده است.

بد نیست موضوع کارایی و بازدهی دو کارت گرافیک GTX 770 OC و R9 290X OC در بازی Crysis 3 را یکبار دیگر مرور کنیم:

در پایان باید ذکر کنیم که اگر مادربورد حرفه‌ای با تنظیمات کامل و پیشرفته دارید، در منوهای بایوس به دنبال گزینه‌ی انتخاب نسخه‌ی PCIe باشید. مثلاً در ماکسیموس هیرو 6 ایسوس مسیر زیر تنظیمات لازم را در اختیار کاربر می‌گذارد:

bios 27

اگر مادربورد شما از چیپ‌ست‌های رده اول برخوردار است ولی چنین گزینه‌ای را در بایوس پیدا نمی‌کنید، بهتر است به جست‌وجو در اینترنت پرداخته و پاسخ سوالات خود را پیدا کنید.

از سراسر وب

  دیدگاه
کاراکتر باقی مانده

بیشتر بخوانید