جزئیات جدیدی از کارت های گرافیکی RTX و پردازنده ‌های امپر انویدیا منتشر شد

یک‌شنبه 16 شهریور 1399 - 15:45

مطالعه 19 دقیقه

اخبار و اطلاعات جدیدی از پردازنده‌های گرافیکی انویدیا امپر به‌همراه قدرت و کارایی کارت‌های گرافیکی RTX 3070 و RTX 3080 و RTX 3090 منتشر شده است.

تبلیغات

انویدیا اطلاعات تکمیلی جدیدی را درباره‌ی کارت‌های گرافیکی RTX 30 خود دراختیار رسانه‌ها گذاشت. اطلاعات جدید، جزئیاتی از عملکرد و بهره‌وری پردازنده‌های امپر (Ampere) موجود در کارت‌های مذکور را هم دراختیار مخاطبان قرار می‌دهد. اطلاعات تکمیلی، بخشی از برنامه‌ی بررسی عمیق محصولات انویدیا هستند که پردازنده‌های گرافیکی گیمینگ امپر مدل‌های GA 102 و GA 104 را مورد بررسی قرار می‌دهند. پردازنده‌های مذکور، به‌زودی و در قالب کارت‌های گرافیکی جدید دراختیار مصرف‌کننده‌ها قرار می‌گیرند.

همان‌طور که گفته شد، اطلاعات جدید انویدیا پیرامون محصولات جدید، علاوه بر اشاره‌ی مجدد به برخی از جزئیات RTX 30، بیشتر روی توانایی‌ها و جزئیات پردازنده‌ی گرافیکی امپر متمرکز می‌شود. انویدیا جلسه‌ی پرسش و پاسخی هم در ردیت برگزار کرد که اطلاعاتی جزئی در آن دراختیار مخاطبان قرار گرفت. اطلاعات جلسه‌ی مذکور بیشتر حول طراحی SM برای پردازنده‌های گرافیکی امپر تمرکز داشت. ابتدا، نگاهی به پردازنده‌های گرافیکی داریم که در دل کارت‌های RTX 30 قرار گرفته‌اند.

کپی لینک

پردازنده‌ی گرافیکی پرچم‌دار GA102 (مخصوص RTX 3080 و RTX 3090)

پردازنده‌ گرافیمی GA102 به‌عنوان محصول پرچم‌دار انویدیا در خانواده‌ی گیمینگ جدید شناخته می‌شود که در قالبی با ابعاد ۶۲۸ میلی‌متر مربع ساخته می‌شود. در مجموع، ۲۸ میلیارد ترانزیستور در این تراشه استفاده شده است. انویدیا می‌گوید تراشه‌ی GA102 شامل ۶ واحد GPC (مخفف Graphics Processing Clusters) می‌شود و همچنین ۶ واحد TPC‌ (مخفف Texture Processing Clusters) در آن وجود دارد. تراشه‌ی GA102 در RTX 3090 از ۴۱ واحد TPC یا ۸۲ واحد SM استفاده می‌کند، درحالی‌که در RTX 3080 این اعداد به ۳۴ واحد TPC یا ۶۸ واحد SM می‌رسند. هر واحد SM در پردازنده‌های گرافیکی اتمپر شامل ۱۲۸ هسته‌ی CUDA می‌شود که دارای ساختار بازطراحی‌شده هستند و در ادامه، جزئیات آن‌ها را شرح می‌دهیم. پردازنده‌ی GA102 در RTX 3080 دارای ۱۰،۴۹۶ هسته است، درحالی‌که در RTX 3080 شاهد ۸،۷۰۴ هسته هستیم.

پردازنده‌ی گرافیکی GA102 ازلحاظ چگالی، دوبرابر پردازنده‌ی تورینگ TU102 است و در هر میلی‌متر مربع، ۴۴/۵۶ میلیون ترانزیستور دارد. در مدل قبلی، در هر میلی‌متری مربع، ۲۴/۶۷ میلیون ترانزیستور وجود داشت. دلیل اصلی افزایش چگالی را می‌توان بهره‌برداری از روش تولید هشت نانومتری سامسونگ در پردازنده‌های جدید دانست.

هر واحد SM در پردازنده‌ی گرافیکی جدید شامل چهار هسته‌‌ی تنسور و یک هسته‌ی RT می‌شود. پردازنده‌ی گرافیکی GA102 از یک حافظه‌ی کش L2 مشترک بهره می‌برد. RTX 3090 دارای ۶ و RTX 3080 دارای پنج مگابایت حافظه‌ی کش است. دیاگرام بلوکی اختصای پردازنده‌ی گرافیکی که ازسوی انویدیا دراختیار رسانه‌ها قرار گرفت، مجموع ۱۰ کنترلر ۳۲ بیتی حافظه را در RTX 3080 نشان می‌دهد که باس ۳۲۰ بیتی را به‌هرماه دارد. کارت گرافیک RTX 3090 دارای ۱۲ کنترلر ۳۲ بیتی حافظه خواهد بود که رابط باس ۳۸۴ بیتی را به‌همراه می‌آورد.

کپی لینک

پردازنده‌ی گرافیکی GA104 (مخصوص RTX 3070)

در دل کارت گرافیک انویدیا RTX 3070، پردازنده‌ی گرافیکی GA104 قرار دارد. این تراشه، یکی از چندین پردازنده‌ی گرافیکی امپر محسوب می‌شود که در دسته‌ی گیمینگ به بازار خواهد آمد. GA104 دومین تراشه‌ی سریع امپر در خانواده‌ی جدید محسوب می‌شود که آن هم با روش تولید هشت نانومتری سامسونگ ساخته شده است. پردازنده‌ی گرافیکی مذکور، ابعاد ۳۵۹/۲ میلی‌متر مربعی داشته و ۱۷/۴ میلیارد ترانزیستور در آن قرار دارد. تعداد ترانزیستورهای GA104 حدود ۹۳ درصد تعداد ترانزیستور GA102 می‌شود. فراموش نکنید که GA104 ابعادی نصف GA102 دارد و درنتیجه چگالی بسیار بالایی را در آن شاهد هستیم.

کارت گرافیک Nvidia GeForce RTX 3090 و 3080 و 3070 کنار هم

انویدیا در RTX 3070 از ۴۶ واحد SM استفاده می‌کند که در مجموع، ۵،۸۸۸ هسته‌ی CUDA را دراختیار کاربر می‌گذارد. کارت گرافیکی RTX 3070 علاوه بر هسته‌های CUDA مجهز به نسل دوم هسته‌های رهگیری پرتو یا همان RT نیز می‌شود. همچنین نسل جدید هسته‌های تنسور و SM کاملا جدید برای استریم چندگانه‌ی داده در واحدها در کارت جدید استفاده می‌شوند. پردازنده‌ی گرافیکی GA104 شامل ۱۸۴ هسته‌ی تنسور و ۴۶ هسته‌ی RT می‌شود. البته احتمال زیادی وجود دارد که GA104 با پیکربندی ۶،۱۴۴ هسته‌ای عرضه شود که شاید در یک محصول آتی شاهد آن باشیم. پردازنده‌ی GA104 از چهار مگابایت حافظه‌ی کش L2 اشتراکی بهره می‌برد و در مجموع، هشت کنترلر حافظه‌ی ۳۲ بیتی در آن دیده می‌شود. درنتیجه رابط باس این کارت گرافیک، ۲۵۶ بیتی است.

کپی لینک

مشخصات فنی کارت‌های گرافیک RTX 30 مجهز به پردازنده‌های انویدیا امپر

نام کارت گرافیک	انویدیا GeForce RTX 3070	انویدیا GeForce RTX 3080	انویدیا GeForce RTX 3090
نام پردازنده گرافیکی	Ampere GA104-300	Ampere GA102-200	Ampere GA102-300
روش تولید	هشت نانومتری سامسونگ	هشت نانومتری سامسونگ	هشت نانومتری سامسونگ
ابعاد قالب	۳۹۵/۲ میلی‌متر مربع	۶۲۸/۴ میلی‌متر مربع	۶۲۸/۴ میلی‌متر مربع
تعداد ترانزیستور	۱۷/۴ میلیارد	۲۸ میلیارد	۲۸ میلیارد
تعداد هسته‌های CUDA	۵،۸۸۸	۸،۷۰۴	۱۰،۴۹۶
TMU/ROP	نامشخص	نامشخص	نامشخص
هسته‌های Tensor/RT	184/46	272/68	328/82
کلاک پایه	۱۵۰۰ مگاهرتز	۱۴۴۰ مگاهرتز	۱۴۰۰ مگاهرتز
کلاک تقویت‌شده	۱۷۳۰ مگاهرتز	۱۷۱۰ مگاهرتز	۱۷۰۰ مگاهرتز
قدرت پردازشی FP32	۲۰ ترافلاپس	۳۰ ترافلاپس	۳۶ ترافلاپس
ترافلاپس RT	۴۰ ترافلاپس	۵۸ ترافلاپس	۶۹ ترافلاپس
TOPs هسته‌های تنسور	۱۶۳	۲۳۸	۲۸۵
ظرفیت حافظه	۸ یا ۱۶ گیگابایت GDDR6	۱۰ یا ۲۰ گیگابایت GDDR6X	۲۴ گیگابایت GDDR6X
باس حافظه	۲۵۶ بیت	۳۲۰ بیت	۳۸۴ بیت
سرعت حافظه	۱۴ گیگابیت‌برثانیه	۱۹ گیگابیت‌برثانیه	۱۹/۵ گیگابیت‌برثانیه
پهنای باند	۴۴۸ گیگابیت‌برثانیه	۷۶۰ گیگابیت‌برثانیه	۹۳۶ گیگابیت‌برثانیه
توان طراحی گرمایی	۲۲۰ وات	۳۲۰ وات	۳۵۰ وات
قیمت	۴۹۹ دلار	۶۹۹ دلار	۱۴۹۹ دلار
تاریخ عرضه	اکتبر ۲۰۲۰	۱۷ سپتامبر ۲۰۲۰	۲۴ سپتامبر ۲۰۲۰

کپی لینک

طراحی پردازنده‌ی جریان یا SM در انویدیا امپر

کارت‌های گرافیکی RTX 30 انویدیا مجهز به پردازنده‌های امپر، با طراحی کاملا جدیدی در بخش SM همراه هستند. در ادامه، جزئیات کاملی از طراحی جدید SM در معماری امپر می‌خوانید.

تونی تاماسی از تیم انویدیا می‌گوید یکی از اهداف مهم طراحی در SM در کارت‌های گرافیکی RTX 30 با پردازنده‌ی امپر، رسیدن به دوبرابر جریان عملیایتی FP32 نسبت به معماری تورینگ بوده است. واحد SM در پردازنده‌های امپر برای رسیدن به این هدف از طراحی مسیر داده‌ای جدید برای فرایندهای عملیاتی FP32 و INT32 بهره می‌برند. هر مسیر داده در هر جهت، شامل ۱۶ هسته‌ی FP32 CUDA می‌شود که توانایی اجرای ۱۶ عملیات FP32 را در هر چرخه‌ی کلاک دارند. مسیر داده‌ای دیگر شامل ۱۶ هسته‌ی FP32 و ۱۶ هسته‌ی INT32 می‌شود. درنتیجه‌ی این طراحی جدید، هریک از بخش‌های Ampere SM در هر کلاک توانایی اجرای ۳۲ عملیات FP32 یا ۱۶ عملیات FP32 به‌همراه ۱۶ عملیات INT32 را دارد. همه‌ی چهار بخش SM در ترکیب با یکدیگر می‌توانند ۱۲۸ عملیات FP32 را در یک کلاک انجام دهند که دوبرابر نرخ FP32 در واحد‌های SM معماری تورینگ می‌شود. همچنین آن‌ها می‌توانند در هر کلاک، ۶۴ عملیات FP32 و ۶۴ عملیات INT32 انجام دهند.

طراحی جدید واحد SM در کارت‌های جدید RTX 30 کی از عوامنل اصلی افزایش سرعت آن‌ها است

دوبرابر کردن سرعت پردازش برای FP32، قدرت و عملکرد را برای تعدادی از فرایندها و الگوریتم‌های مرسوم گرافیکی بهبود می‌بخشد. فرایندهای سایه‌زنی مدرن عموما ترکیبی از دستورالعمل‌های FP32 حسابی مانند FFMA و FADD و FMUL دارند که با دستورالعمل‌های ساده‌تر همچون جمع اعداد صحیح برای پیدا و دریافت کردن داده، مقایسه‌های ممیز شناور، پردازش‌های حداقل/حداکثر و موارد دیگر می‌شود. بهبود عملکرد بسته به سطح سایه‌زنی یا اپلیکیشن در پردازش‌ها متفاوت خواهد بود که به مجموعه‌ای از دستورالعمل‌ها وابسته می‌شود. سایه‌زن‌های حذف نویز در رهگیری پرتو مثال‌های خوبی هستند که احتمالا از دوبرابر شدن جریان‌های داده‌ای در FP32 سود می‌برند.

دوبرابر کردن جریان خروجی محاسبه در پردازنده، نیازمند دوبرابر کردن مسیرهای داده‌ای بود که از آن‌ها پشتیبانی می‌کردند. به‌همین دلیل در Ampere SM شاهد دوبرابر شدن حافظه‌ی اشتراکی و عملکرد کش L1 در SM هستیم. در SM امپر شاهد ۱۲۸ بایت در هر کلاک هستیم که در تورینگ، ۶۴ بایت در هر کلاک بود. انویدیا، پهنای باند L1 برای GeForce RTX 3080 را ۲۱۹ گیگابایت‌برثانیه اعلام می‌کند که در مقایسه با ۱۱۶ گیگابایت‌برثانیه در GeForce RTX 2080 Super یک بهبود قابل‌توجه محسوب می‌شود.

تاماسی در ادامه‌ی صحبت‌هایش می‌گوید امپر هم مانند نسل‌های قبلی پردازنده‌های انویدیا، مجهز به GPC، TPC، SM و ROP است که درکنار کنترلرهای حافظه عمل می‌کنند. واحد GPC را می‌توان یک بلوک سخت‌افزاری سطح بالا با سلطه‌ی بیشتر دانست. تمامی واحدهای پردازشی گرافیکی کلیدی در داخل GPC قرار می‌گیرند. هر GPC شامل یک موتور اختصاصی Raster می‌شود که در طراحی جدید، دو پارتیشن ROP هم در آن قرار گرفته‌اند. هر پارتیشن، شامل هشت واحد ROP (مخفف Raster Operators) می‌شود. اضافه شدن ROP را می‌توان قابلیت جدید پردازنده‌های گرافیکی مبتنی بر معماری امپر در دسته‌ی GA10x دانست. تاماسی در پایان صحبت‌هایش می‌گوید که به‌زودی جزئیات بیشتر را در سند فنی انویدیا امپر منتشر خواهند کرد.

با نگاهی دقیق‌تر به واحد SM در امپر، متوجه وجود ۱۲۸ واحد FP32 در هر بلوک می‌شویم. یکی از دو مسیر داده‌ای FP32 می‌تواند به‌صورت هم‌زمان فرایندهای عملیاتی INT32 را هم انجام دهد. هزینه‌های تنسور شامل چهار واحد می‌شوند. چهار واحد بافت و یک هسته‌ی RT هم در هر SM دیده می‌شود.

یادگیری عمیق انویدیا امپر / Nvidia Ampere

هسته تنسور نسل سوم انویدیا امپر / Nvidia Ampere

رهگیری پرتو انویدیا امپر / Nvidia Ampere

بهبود رهگیری پرتو انویدیا امپر / Nvidia Ampere

بهبود موشن بلور در انویدیا امپر / Nvidia Ampere

معرفی موشن بلور در انویدیا امپر / Nvidia Ampere

رندر صحنه موشن بلور انویدیا امپر / Nvidia Ampere

شتاب‌دهی سخت افزاری انویدیا امپر / Nvidia Ampere

هسته های اختصاصی RT در انویدیا امپر / Nvidia Ampere

RT حرفه ای در انویدیا امپر / Nvidia Ampere

بهبود عمیق عملکرد در انویدیا امپر / Nvidia Ampere

مشخصات ذخیره سازی انویدیا امپر / Nvidia Ampere

خواندن داده فشرده نشده در انویدیا امپر / Nvidia Ampere

IO قدیمی برای بازی ها اشکال ایجاد می کرد

خواندن داده های فشرده در معماری قدیمی گرافیکی

دموی سرعت بارگذاری انویدیا امپر / Nvidia Ampere

انویدیا برای هسته‌های نسل سومی تنسور، از همان معماری Smarsity استفاده می‌کند که در خانواده‌ی محصولات Ampere HPC هم استفاده شده بود. امپر از چهار هسته‌ی تنسور در هر SM بهره می‌برد که کمتر از هشت هسته‌ی موجود در هر SM در تورینگ است. ازطرفی آن‌ها نه‌تنها از طراحی نسل سوم بهره می‌برند، بلکه جریان‌های SM بزرگ‌تری هم دارند که موجب افزایش تعداد می‌شود. پردازنده‌های گرافیکی امپر توانایی اجرای ۱۲۸ فرایند عملیاتی FP16 FMA را در هر هسته‌ی تنسور دارند که از کل هسته‌های INT16 بهره می‌برد و با به‌کار گرفتن معماری Sparsity تا ۲۵۶ افزایش پیدا می‌کند. مجموع فرایندهای عملیاتی FP16 FMA به ۵۱۲ می‌رسد و با به‌کارگیری معماری مذکور، می‌توان آن را به ۱۰۲۴ رساند. اعداد مذکور، نشان‌دهنده‌ی بهبود دوبرابری نسبت به پردازنده‌های گرافیکی تورینگ هستند که به‌لطف طراحی به‌روز تنسور ممکن می‌شود.

فرایندهای بهبود بالا برای هسته‌های رهگیری پرتو هم رخ می‌دهد که در نسل دوم، دوبرابر تداخل پرتو را نسبت به معماری تورینگ در پی دارند. بیشتر بودن تعداد واحدهای SM همچنین باعث افزایش تعداد هسته‌های RT هم می‌شود که عملکرد کلی و شتاب‌دهی رهگیری پرتو را به‌میزان قابل‌توجهی در امپر افزایش می‌دهد.

کپی لینک

حافظه‌ی GDDR6X، تکامل بعدی در دنیای گرافیک

حافظه‌های Micron GDDR6X دستاوردهای مهمی در کارت‌های گرافیکی جدید دارند. این حافظه‌ها سریع‌تر هستند و درکنار دوبرابر کردن نرخ داده‌ی I/O، برای اولین‌بار از سیگنال‌دهی PAM4 چندسطحی در قالب‌های حافظه بهره می‌برند. حافظه‌های مذکور در کلاس محصولات انویدیا RTX 3090 به پهنای باند تا یک ترابایت می‌رسند که برای اجرای بازی‌های حرفه‌ای نسل بعد در رزولوشن 8K عالی خواهند بود.

کپی لینک

مشخصات و قابلیت‌های GDDR6X SGRAM جدید

نرخ داده‌ی SGRAM در حافظه‌های جدید نسبت به نسل قبلی دوبرابر می‌شود که در هر تراکنش، توان کمتری هم مصرف می‌کنند و از مرز یک ترابایت‌برثانیه در پهنای باند حافظه‌ی سیستمی فراتر می‌روند.
این حافظه‌ها، اولین دستگاه‌های حافظه‌ای اختصاصی گرافیک محسوب می‌شوند کع از سیگنال‌دهی رمزنگاری شده‌ی PAM4 بین پردازنده و DRAM بهره می‌برند. در سیستم جدید، از چهار سطح ولتاژ برای رمزنگاری و جابه‌جایی دو بیت از داده در هر کلاک رابط استفاده می‌شود.
حافظه‌های جدید را می‌توان در سرعت‌های بسیار بالا با پایداری مناسب طراحی کرد و به کار انداخت. امکان تولید انبوه آن‌ها نیز اکنون فراهم شده است.

همان‌طور که گفته شد، GDDR6X از سیگنال‌دهی چندسطحی PAM4 جدید استفاده کرده که سرعت انتقال داده را بسیار سریع‌تر می‌کند. همچنین نرخ I/O نیز بهبود پیدا می‌کند و ظرفیت هر قالب حافظه در آن از ۶۴ به ۸۴ گیگابیت‌برثانیه می‌رسد. قالب‌‌های حافظه‌ی Micron GDDR6x همچنین تنها DRAMهای مخصوص گرافیک هستند که می‌توان با وجود بهره‌گیری از PAM4 آن‌ها را به‌صورت انبوه تولید کرد.

نکته‌ی جذاب درباره‌ی حافظه‌های GDDR6X اینکه می‌توان سرعت آن‌ها را تا ۲۱ گیگابیت‌برثانیه افزایش داد. البته در RTX 3090 شاهد حداکثر سرعت ۱۹/۵ گیگابیت‌برثانیه در آن‌ها هستیم. ظاهرا تولیدکننده‌ها می‌توانند قالب‌هایی با ظرفیت بیشتر را هم از مایکرون خریداری کنند. مایکرون همچنین تأیید می‌کند که برنامه‌هایی برای افزایش سرعت حافظه‌ها تا بیش از ۲۱ گیگابیت‌برثانیه در سال ۲۰۲۱ داد، اما هنوز مشخص نیست که چه کارت‌هایی از این حافظه‌ها بهره خواهند برد.

حافظه‌های مایکرون GDDR6X نه‌تنها سرعت بیشتر، بلکه پهنای باند بیشتری را هم با ۱۵ درصد توان مصرفی کمتر نسبت به نسل قبل ارائه می‌کنند.

کپی لینک

مشخصات حافظه‌های GDDR6X در مقایسه با نسل‌های قبل

نام حافظه	GDDR5	GDDR5X	GDDR6	GDDR6X
چگالی	از ۵۱۲ مگابایت تا هشت گیگابایت	هشت گیگابایت	هشت گیگابایت و ۱۶ گیگابایت	هشت گیگابایت و ۱۶ گیگابایت
VDD و VDDQ	۱/۵ یا ۱/۳۵ ولت	۱/۳۵ ولت	۱/۳۵ یا ۱/۲۵ ولت	۱/۳۵ یا ۱/۲۵ ولت
VPP	نامشخص	۱/۸ ولت	۱/۸ ولت	۱/۸ ولت
نرخ داده	تا هشت‌ گیگابیت‌برثانیه	تا ۱۲ گیگابیت‌برثانیه	تا ۱۶ گیگابیت‌برثانیه	۱۹ و ۲۱ و بیشتر از ۲۱ گیگابیت‌برثانیه
تعداد کانال	۱	۱	۲	۲
Access granularity	۳۲ بایت	۶۴ بایت - ۲ عدد ۳۲ بایتی در حالت pseuso 32B	دو کانال ۳۲ بایتی	دو کانال ۳۲ بایتی
Burst length	۸	۱۶ یا ۸	۱۶	۸ در حالت PAM4 و ۱۶ در حالت RDQS
سیگنال‌دهی	POD15/POD135	POD135	POD135/POD125	PAM4 POD135/POD125
پکیج	BGA-170 14x12x0.8mm ball pitch	BGA-190 14x12x0.65mm ball pitch	BGA-180 14x12x0.75mm ball pitch	BGA-180 14x12x0.75mm ball pitch
عرض I/O	x32/x16	x32/x16	دو کانال x16/x8	دو کانال x16/x8
تعداد سیگنال	61 - 40 DQ, DBI, EDC - 15 CA - 6 CK, WCK	61 - 40 DQ, DBI, EDC - 15 CA - 6 CK, WCK	70 یا 74 - 40 DQ, DBI, EDC - 24 CA - 6 or 10 CK, WCK	70 یا 74 - 40 DQ, DBI, EDC - 24 CA - 6 or 10 CK, WCK
PLL, DCC	PLL	PLL	PLL,DCC	DCC
CRC	CRC-8	CRC-8	دو عدد CRC-8	دو عدد CRC-8
VREFD	در هر دو بایت، داخلی یا خارجی	داخلی در هر بایت	داخلی در هر پین	داخلی در هر پین، سه گیرنده‌ی زیرمجموعه در هر پین
Equalization	نامشخص	RX/TX	RX/TX	RX/TX
VREFC	خارجی	خارجی یا داخلی	خارجی یا داخلی	خارجی یا داخلی
خود نوسازی یا SRF	بله، SRF موقتی کنترل‌شده	بله، SRF موقتی کنترل‌شده و SRF هایبرنیت	بله، SRF موقتی کنترل‌شده و SRF هایبرنیت VDDQ-off	بله، SRF موقتی کنترل‌شده و SRF هایبرنیت VDDQ-off
اسکن	SEN	IEEE 1149.1 JTAG	IEEE 1149.1 JTAG	IEEE 1149.1 JTAG

کپی لینک

طراحی سیستم خنک‌کننده در GeForce RTX 30

مقاله‌های مرتبط:

پردازنده ‌های انویدیا GeForce RTX 30 تا سال ۲۰۲۱ با کمبود عرضه مواجه هستند

پردازنده‌‌ های گرافیکی انویدیا GeForce RTX 30 چه رهاوردهایی برای گیمرهای PC دارند؟

انویدیا یکی از بهترین طراحی‌های سیستم گرمایی Founders Edition را در کارت‌های گرافیکی RTX 30 پیاده‌سازی کرده است. تیم سبز می‌گوید عملکرد بهتر و سریع‌تر کارت‌های گرافیکی جدید، نیازمند راهکارهای خنک‌کننده‌ی بهتر بود و به همین دلیل، آن‌ها راهکاری مخصوص را برای نسل بعدی کارت‌های گرافیکی خود به‌کار گرفته‌اند. این راهکارهای جدید، پردازنده‌ی گرافیکی را در دمای پایین نگه می‌دارند و با پیاده‌سازی فناوری‌های متعدد موجود و تعدادی فناوری جدید، جلوی افزایش بیش‌ازحد صدای عملیاتی را هم می‌گیرند.

سیستم خنک‌کننده‌ی جدید فاندرز ادیشن از یک هیت‌سینک مخصوص با آلیاژ آلومینیم استفاده می‌‌کند که با بهره‌مندی از محفظه‌ی بخار و فن‌های مبتنی بر فناوری محوری دوسویه، عملکردی عالی دارد. هیت‌سینک خنک‌کننده از یک پوشش نانوکربن بهره می‌برد که قطعا در کنترل کردن دما موفق خواهد بود.

طراحی سیستم خنک‌کننده‌ی جدید در RTX 30 بسیار منحصربه‌فرد به‌نظر می‌رسد. این اولین طراحی در نوع خود محسوب می‌شود که آخرین بار نمونه‌ای مشابه با آن را در GTX 780 با هیت‌سینکی بزرگ دیده بودیم.

در طراحی سیستم خنک‌کننده‌ی جدید، موقعیت‌های خاصی برای قرارگیری فن دیده می‌شود که یکی در جلو و دیگری در پشت کارت قرار می‌گیرد. این پیکربندی کشش و مکش که با ترکیب فن دوگانه ایجاد می‌شود، گرما را با عملکردی ساده‌تر و بهینه‌تر از خروجی بخار کارت گرافیک استخراج می‌کند. البته کمی هوا به داخل کیس انتقال داده می‌شود که باتوجه‌به قدرت و کیفیت بالای سیستم‌های خنک‌کننده‌ی کنونی و بهره‌مندی از خنک‌کننده‌های مایع، مشکل زیادی ایجاد نخواهد کرد.

سیستم خنک کننده RTX 30 در مقایسه با RTX 2080

انویدیا تأکید می‌کند که طراحی جدید فاندرز ادیشن صدای کمتری نسبت به خنک‌کننده‌های سنتی دومحوره دارد و همچنین عملکردی دوبرابر بهتر از آن‌ها را ارائه می‌کند. تغییر در طراحی مصرف توان و خصوصا NVLink نقش مهمی در بهبود عملکرد سیستم خنک‌کننده داشته است. تغییرات جدید، جریان بهتر هوا را در از میان بزرگ‌ترین مجموعه‌ی فین طراحی‌شده تا به امروز، آسان‌تر می‌کند. منافذ براکتی بزرگ‌تر در ساختار خنک‌کننده در ترکیب با فین‌های خاص، جریان بزرگ‌تری از هوا را ممکن می‌کنند. از هر جهت که نگاه کنید، طراحی فاندرز ادیشن با تمرکز بر افزایش جریان هوا انجام شده است. به حداقل رساندن دما و رسیدن به بالاترین سطح عملکرد با کمترین صدا، همگی در طراحی جدید لحاظ شده‌اند.

بهبود عملکرد در توان مصرفی خنک کننده RTX 30

کارت گرافیک RTX 3080 در مبحث صدای خنک‌کننده و عملکرد، در حداکثر دمای ۷۸ درجه‌ی سانتی‌گراد عمل می‌کند. کارت گرافیک مذکور برای رسیدن به حداکثر باید به توان ۳۲۰ وات برسد که در آن حالت، خروجی صدای ۳۰ دسی‌بل خواهد داشت. در مقام مقایسه، کارت گرافیک تورینگ فاندر ادیشن حداکثر دمای ۸۱ درجه‌ی سانتی‌گراد داشت و حداکثر صدای آن نیز با توان ۲۴۰ وات، ۳۲ دسی‌بل گزارش می‌شد (کارت گرافیک RTX 2080 Super).

بهبود ۱/۹ برابری عملکرد در توان مصرفی خنک کننده RTX 30

در آزمایش‌های اختصاصی تیم سبز، RTX 3080 فرکانس میانگین ۱۹۲۰ مگاهرتز را با توان مصرفی ۳۱۰ وات ثبت می‌کند که حداکثر دمای آن را به ۷۶ درجه می‌رساند. انویدیا در همین مقایسه، فاکتور ۱/۹ برابر را مطرح کرده و ادعا می‌کند که RTX 3080 با صدا و دمای کمتر امکان ارائه‌ی خروجی ۱۰۰ فریم‌برثانیه را دارد که در مقایسه با ۶۰ فریم‌برثانیه‌ی نسل قبلی، یک پیشرفت محسوب می‌شود.

کپی لینک

طراحی برد PCB و توان RTX 3080 و RTX 3090

یکی از تغییرهای عمده‌ای که در کارت گرافیک RTX 3090 Founders Edition دیده می‌شود، در طراحی PCB نهفته است. کارت‌های گرافیکی RTX 3080 و RTX 3090 با پکیجینگ منحصربه‌فرد و کامپکت PCB طراحی و ساخته می‌شوند که قبلا در فضای مصرف‌کننده در هیچ‌جا دیده نشده بود. ازطرفی کامپکت بودن طراحی بدین معنی نیست که کارت‌ها توان مصرفی زیای ندارند. انویدیا در همین کارت‌های کامپکت مجموعه‌ای با توان طراحی بسیار بالا قرار داده است.

برد PCB در کارت‌های جدید انویدیا شامل ۲۰ بخش مصرف‌کننده‌ی توان می‌شود که طراحی خاص و حرفه‌ای آن را در مقایسه با کارت‌های RTX 20 پرچم‌دار نشان می‌دهد. پردازنده‌ی گرافیکی توان مورد نیاز خود را از ۱۸ فاز دریافت می‌کند و توان حافظه نیز از دو فاز دیگر تأمین می‌شود. انویدیا می‌گوید این نوع از PCB یک محصول عالی برای اورکلاک محسوب می‌شود که کاربران با استفاده از آن، به توان‌های بسیار بالاتری خواهند رسید. البته PCB در نسخه‌ی فاندرز ادیشن با نسخه‌‌ی عادی تفاوت دارد و در نسخه‌های مرسوم، از همان طراحی چهارگوش استفاده می‌شود.

کارت‌های گرافیکی RTX 30 مدل فاندرز ادیشن علاوه بر طراحی جدید، از کانکتورهای برق ۱۲ پینی Micro-Fit 3.0 بهره می‌برند. این کانکتورها نیازی به ارتقا منبع تغذیه ایجاد نمی‌کنند چون با رابط‌های 2x8pin به 1x12pin عرضه می‌شوند و می‌توان بدون مشکل تأمین توان، از آن‌ها بهره برد.

جانمایی کانکتورهای ۱۲ پینی روی PCB در کارت‌های جدید انویدیا یک نوآوری دیگر را از تیم سبز نشان می‌دهد. پین‌ها به‌صورت عمودی جانمایی شده‌اند و باتوجه‌به طراحی PCB، می‌توان دلیل استفاده از طراحی ۱۲ پینی را به‌جای طراحی استاندارد هشت پینی استاندارد متوجه شد. در PCB فضای محدودی برای انجام فرایندهای این‌چنینی وجود دارد و باید از ورودی توان کوچک‌تر استفاده می‌شد.

کپی لینک

عملکرد، زمان عرضه و قیمت RTX 30

انویدیا در اطلاعات تکمیلی خود جزئیاتی از اعداد و ارقام توان در کارت‌های گرافیکی جدید منتشر کرد. در نمودارهای زیر، توان و عملکرد کارت‌های RTX 3070 و RTX 3080 و RTX 3090 v را مشاهده می‌کنید.

انویدیا هنوز هیچ آمار و ارقام دقیقی درباره‌ی کارت‌های جدید سری RTX 30 منتشر نکرده است، اما باتوجه‌به همین رونمایی کلی هم می‌توان پیش‌بینی کرد که RTX 3070 عملکردی بالاتر از RTX 2080 Ti دارد و RTX 3080 بسیار بهتر از RTX 2080 Ti خواهد بود. کارت گرافیک پرچم‌دار RTX 3090 هم که سرعتی تقریبا ۵۰ درصد بهتر از RTX 2080 Ti دارد و بهبودی عالی را در مجموعه‌ی خانواده‌ی جدید نشان می‌دهد.

کارت گرافیک Nvidia GeForce RTX 3090 از نمای بالا

درواقع انویدیا پیش‌نمایشی کلی را از عملکرد و قدرت کارت‌های جدید به نمایش گذاشت. آن‌ها پیش‌نمایشی از Doom Eternal را با RTX 3080 نمایش دادند که بسیار بهتر از RTX 2080 Ti ظاهر شد و همچنین توانایی عالی کارت در اجرای بازی‌های 4K هم به نمایش گذاشته شد. در اکثر بازی‌‌های AAA، کارت‌های جدید انویدیا توانایی رسیدن به حداکثر نرخ فریم ۶۰ فریم‌برثانیه را دارند.

درنهایت نوبت به اطلاعات قیمت و زمان عرضه‌ی کارت‌های جدید انویدیا می‌رسد. تیم سبز می‌گوید RTX 3080 اول از همه و در تاریخ ۱۷ سپتامبر به بازار عرضه می‌شود. پس از آن نوبت RTX 3090 خواهد بود که ۲۴ سپتامبر به بازار می‌آید و درنهایت RTX 3070 در ماه اکتبر به مصرف‌کننده‌ها عرضه می‌شود. ازلحاظ قیمت نیز کارت‌ها به‌ترتیب ۱،۴۹۹ و ۶۹۹ و ۴۹۹ دلار قیمت خواهند داشت. به‌زودی نسخه‌های سفارشی و پرمیوم نیز با قیمت‌های متنوع معرفی می‌شوند.

مقاله رو دوست داشتی؟

نظرت چیه؟

مهدی زارع سریزدی

پردازنده‌ی گرافیکی پرچم‌دار GA102 (مخصوص RTX 3080 و RTX 3090)

پردازنده‌ی گرافیکی GA104 (مخصوص RTX 3070)

مشخصات فنی کارت‌های گرافیک RTX 30 مجهز به پردازنده‌های انویدیا امپر

طراحی پردازنده‌ی جریان یا SM در انویدیا امپر

حافظه‌ی GDDR6X، تکامل بعدی در دنیای گرافیک

مشخصات و قابلیت‌های GDDR6X SGRAM جدید

مشخصات حافظه‌های GDDR6X در مقایسه با نسل‌های قبل

طراحی سیستم خنک‌کننده در GeForce RTX 30

طراحی برد PCB و توان RTX 3080 و RTX 3090

عملکرد، زمان عرضه و قیمت RTX 30

نظرات