جزئیات جدیدی از کارت های گرافیکی RTX و پردازنده ‌های امپر انویدیا منتشر شد

جزئیات جدیدی از کارت های گرافیکی RTX و پردازنده ‌های امپر انویدیا منتشر شد

اخبار و اطلاعات جدیدی از پردازنده‌های گرافیکی انویدیا امپر به‌همراه قدرت و کارایی کارت‌های گرافیکی RTX 3070 و RTX 3080 و RTX 3090 منتشر شده است.

انویدیا اطلاعات تکمیلی جدیدی را درباره‌ی کارت‌های گرافیکی RTX 30 خود دراختیار رسانه‌ها گذاشت. اطلاعات جدید، جزئیاتی از عملکرد و بهره‌وری پردازنده‌های امپر (Ampere) موجود در کارت‌های مذکور را هم دراختیار مخاطبان قرار می‌دهد. اطلاعات تکمیلی، بخشی از برنامه‌ی بررسی عمیق محصولات انویدیا هستند که پردازنده‌های گرافیکی گیمینگ امپر مدل‌های GA 102 و GA 104 را مورد بررسی قرار می‌دهند. پردازنده‌های مذکور، به‌زودی و در قالب کارت‌های گرافیکی جدید دراختیار مصرف‌کننده‌ها قرار می‌گیرند.

همان‌طور که گفته شد، اطلاعات جدید انویدیا پیرامون محصولات جدید، علاوه بر اشاره‌ی مجدد به برخی از جزئیات RTX 30، بیشتر روی توانایی‌ها و جزئیات پردازنده‌ی گرافیکی امپر متمرکز می‌شود. انویدیا جلسه‌ی پرسش و پاسخی هم در ردیت برگزار کرد که اطلاعاتی جزئی در آن دراختیار مخاطبان قرار گرفت. اطلاعات جلسه‌ی مذکور بیشتر حول طراحی SM برای پردازنده‌های گرافیکی امپر تمرکز داشت. ابتدا، نگاهی به پردازنده‌های گرافیکی داریم که در دل کارت‌های RTX 30 قرار گرفته‌اند.

پردازنده‌ی گرافیکی پرچم‌دار GA102 (مخصوص RTX 3080 و RTX 3090)

پردازنده‌ گرافیمی GA102 به‌عنوان محصول پرچم‌دار انویدیا در خانواده‌ی گیمینگ جدید شناخته می‌شود که در قالبی با ابعاد ۶۲۸ میلی‌متر مربع ساخته می‌شود. در مجموع، ۲۸ میلیارد ترانزیستور در این تراشه استفاده شده است. انویدیا می‌گوید تراشه‌ی GA102 شامل ۶ واحد GPC (مخفف Graphics Processing Clusters) می‌شود و همچنین ۶ واحد TPC‌ (مخفف Texture Processing Clusters) در آن وجود دارد. تراشه‌ی GA102 در RTX 3090 از ۴۱ واحد TPC یا ۸۲ واحد SM استفاده می‌کند، درحالی‌که در RTX 3080 این اعداد به ۳۴ واحد TPC یا ۶۸ واحد SM می‌رسند. هر واحد SM در پردازنده‌های گرافیکی اتمپر شامل ۱۲۸ هسته‌ی CUDA می‌شود که دارای ساختار بازطراحی‌شده هستند و در ادامه، جزئیات آن‌ها را شرح می‌دهیم. پردازنده‌ی GA102 در RTX 3080 دارای ۱۰،۴۹۶ هسته است، درحالی‌که در RTX 3080 شاهد ۸،۷۰۴ هسته هستیم.

پردازنده‌ی گرافیکی GA102 ازلحاظ چگالی، دوبرابر پردازنده‌ی تورینگ TU102 است و در هر میلی‌متر مربع، ۴۴/۵۶ میلیون ترانزیستور دارد. در مدل قبلی، در هر میلی‌متری مربع، ۲۴/۶۷ میلیون ترانزیستور وجود داشت. دلیل اصلی افزایش چگالی را می‌توان بهره‌برداری از روش تولید هشت نانومتری سامسونگ در پردازنده‌های جدید دانست.

مشخصات جزئی RTX 3080

هر واحد SM در پردازنده‌ی گرافیکی جدید شامل چهار هسته‌‌ی تنسور و یک هسته‌ی RT می‌شود. پردازنده‌ی گرافیکی GA102 از یک حافظه‌ی کش L2 مشترک بهره می‌برد. RTX 3090 دارای ۶ و RTX 3080 دارای پنج مگابایت حافظه‌ی کش است. دیاگرام بلوکی اختصای پردازنده‌ی گرافیکی که ازسوی انویدیا دراختیار رسانه‌ها قرار گرفت، مجموع ۱۰ کنترلر ۳۲ بیتی حافظه را در RTX 3080 نشان می‌دهد که باس ۳۲۰ بیتی را به‌هرماه دارد. کارت گرافیک RTX 3090 دارای ۱۲ کنترلر ۳۲ بیتی حافظه خواهد بود که رابط باس ۳۸۴ بیتی را به‌همراه می‌آورد.

پردازنده‌ی گرافیکی GA104 (مخصوص RTX 3070)

در دل کارت گرافیک انویدیا RTX 3070، پردازنده‌ی گرافیکی GA104 قرار دارد. این تراشه، یکی از چندین پردازنده‌ی گرافیکی امپر محسوب می‌شود که در دسته‌ی گیمینگ به بازار خواهد آمد. GA104 دومین تراشه‌ی سریع امپر در خانواده‌ی جدید محسوب می‌شود که آن هم با روش تولید هشت نانومتری سامسونگ ساخته شده است. پردازنده‌ی گرافیکی مذکور، ابعاد ۳۵۹/۲ میلی‌متر مربعی داشته و ۱۷/۴ میلیارد ترانزیستور در آن قرار دارد. تعداد ترانزیستورهای GA104 حدود ۹۳ درصد تعداد ترانزیستور GA102 می‌شود. فراموش نکنید که GA104 ابعادی نصف GA102 دارد و درنتیجه چگالی بسیار بالایی را در آن شاهد هستیم.

انویدیا در RTX 3070 از ۴۶ واحد SM استفاده می‌کند که در مجموع، ۵،۸۸۸ هسته‌ی CUDA را دراختیار کاربر می‌گذارد. کارت گرافیکی RTX 3070 علاوه بر هسته‌های CUDA مجهز به نسل دوم هسته‌های رهگیری پرتو یا همان RT نیز می‌شود. همچنین نسل جدید هسته‌های تنسور و SM کاملا جدید برای استریم چندگانه‌ی داده در واحدها در کارت جدید استفاده می‌شوند. پردازنده‌ی گرافیکی GA104 شامل ۱۸۴ هسته‌ی تنسور و ۴۶ هسته‌ی RT می‌شود. البته احتمال زیادی وجود دارد که GA104 با پیکربندی ۶،۱۴۴ هسته‌ای عرضه شود که شاید در یک محصول آتی شاهد آن باشیم. پردازنده‌ی GA104 از چهار مگابایت حافظه‌ی کش L2 اشتراکی بهره می‌برد و در مجموع، هشت کنترلر حافظه‌ی ۳۲ بیتی در آن دیده می‌شود. درنتیجه رابط باس این کارت گرافیک، ۲۵۶ بیتی است.

مشخصات فنی کارت‌های گرافیک RTX 30 مجهز به پردازنده‌های انویدیا امپر

نام کارت گرافیکانویدیا GeForce RTX 3070انویدیا GeForce RTX 3080انویدیا GeForce RTX 3090
نام پردازنده گرافیکیAmpere GA104-300Ampere GA102-200Ampere GA102-300
روش تولیدهشت نانومتری سامسونگهشت نانومتری سامسونگهشت نانومتری سامسونگ
ابعاد قالب۳۹۵/۲ میلی‌متر مربع۶۲۸/۴ میلی‌متر مربع۶۲۸/۴ میلی‌متر مربع
تعداد ترانزیستور۱۷/۴ میلیارد۲۸ میلیارد۲۸ میلیارد
تعداد هسته‌های CUDA۵،۸۸۸۸،۷۰۴۱۰،۴۹۶
TMU/ROPنامشخصنامشخصنامشخص
هسته‌های Tensor/RT184/46272/68328/82
کلاک پایه۱۵۰۰ مگاهرتز۱۴۴۰ مگاهرتز۱۴۰۰ مگاهرتز
کلاک تقویت‌شده۱۷۳۰ مگاهرتز۱۷۱۰ مگاهرتز۱۷۰۰ مگاهرتز
قدرت پردازشی FP32۲۰ ترافلاپس۳۰ ترافلاپس۳۶ ترافلاپس
ترافلاپس RT۴۰ ترافلاپس۵۸ ترافلاپس۶۹ ترافلاپس
TOPs هسته‌های تنسور۱۶۳۲۳۸۲۸۵
ظرفیت حافظه۸ یا ۱۶ گیگابایت GDDR6۱۰ یا ۲۰ گیگابایت GDDR6X۲۴ گیگابایت GDDR6X
باس حافظه۲۵۶ بیت۳۲۰ بیت۳۸۴ بیت
سرعت حافظه۱۴ گیگابیت‌برثانیه۱۹ گیگابیت‌برثانیه۱۹/۵ گیگابیت‌برثانیه
پهنای باند۴۴۸ گیگابیت‌برثانیه۷۶۰ گیگابیت‌برثانیه۹۳۶ گیگابیت‌برثانیه
توان طراحی گرمایی۲۲۰ وات۳۲۰ وات۳۵۰ وات
قیمت۴۹۹ دلار۶۹۹ دلار۱۴۹۹ دلار
تاریخ عرضهاکتبر ۲۰۲۰۱۷ سپتامبر ۲۰۲۰۲۴ سپتامبر ۲۰۲۰

طراحی پردازنده‌ی جریان یا SM در انویدیا امپر

کارت‌های گرافیکی RTX 30 انویدیا مجهز به پردازنده‌های امپر، با طراحی کاملا جدیدی در بخش SM همراه هستند. در ادامه، جزئیات کاملی از طراحی جدید SM در معماری امپر می‌خوانید.

طراحی پردازنده‌ی جریان یا SM در انویدیا امپر

تونی تاماسی از تیم انویدیا می‌گوید یکی از اهداف مهم طراحی در SM در کارت‌های گرافیکی RTX 30 با پردازنده‌ی امپر، رسیدن به دوبرابر جریان عملیایتی FP32 نسبت به معماری تورینگ بوده است. واحد SM در پردازنده‌های امپر برای رسیدن به این هدف از طراحی مسیر داده‌ای جدید برای فرایندهای عملیاتی FP32 و INT32 بهره می‌برند. هر مسیر داده در هر جهت، شامل ۱۶ هسته‌ی FP32 CUDA می‌شود که توانایی اجرای ۱۶ عملیات FP32 را در هر چرخه‌ی کلاک دارند. مسیر داده‌ای دیگر شامل ۱۶ هسته‌ی FP32 و ۱۶ هسته‌ی INT32 می‌شود. درنتیجه‌ی این طراحی جدید، هریک از بخش‌های Ampere SM در هر کلاک توانایی اجرای ۳۲ عملیات FP32 یا ۱۶ عملیات FP32 به‌همراه ۱۶ عملیات INT32 را دارد. همه‌ی چهار بخش SM در ترکیب با یکدیگر می‌توانند ۱۲۸ عملیات FP32 را در یک کلاک انجام دهند که دوبرابر نرخ FP32 در واحد‌های SM معماری تورینگ می‌شود. همچنین آن‌ها می‌توانند در هر کلاک، ۶۴ عملیات FP32 و ۶۴ عملیات INT32 انجام دهند.

طراحی جدید واحد SM در کارت‌های جدید RTX 30 کی از عوامنل اصلی افزایش سرعت آن‌ها است

دوبرابر کردن سرعت پردازش برای FP32، قدرت و عملکرد را برای تعدادی از فرایندها و الگوریتم‌های مرسوم گرافیکی بهبود می‌بخشد. فرایندهای سایه‌زنی مدرن عموما ترکیبی از دستورالعمل‌های FP32 حسابی مانند FFMA و FADD و FMUL دارند که با دستورالعمل‌های ساده‌تر همچون جمع اعداد صحیح برای پیدا و دریافت کردن داده، مقایسه‌های ممیز شناور، پردازش‌های حداقل/حداکثر و موارد دیگر می‌شود. بهبود عملکرد بسته به سطح سایه‌زنی یا اپلیکیشن در پردازش‌ها متفاوت خواهد بود که به مجموعه‌ای از دستورالعمل‌ها وابسته می‌شود. سایه‌زن‌های حذف نویز در رهگیری پرتو مثال‌های خوبی هستند که احتمالا از دوبرابر شدن جریان‌های داده‌ای در FP32 سود می‌برند.

دوبرابر کردن جریان خروجی محاسبه در پردازنده، نیازمند دوبرابر کردن مسیرهای داده‌ای بود که از آن‌ها پشتیبانی می‌کردند. به‌همین دلیل در Ampere SM شاهد دوبرابر شدن حافظه‌ی اشتراکی و عملکرد کش L1 در SM هستیم. در SM امپر شاهد ۱۲۸ بایت در هر کلاک هستیم که در تورینگ، ۶۴ بایت در هر کلاک بود. انویدیا، پهنای باند L1 برای GeForce RTX 3080 را ۲۱۹ گیگابایت‌برثانیه اعلام می‌کند که در مقایسه با ۱۱۶ گیگابایت‌برثانیه در GeForce RTX 2080 Super یک بهبود قابل‌توجه محسوب می‌شود.

تاماسی در ادامه‌ی صحبت‌هایش می‌گوید امپر هم مانند نسل‌های قبلی پردازنده‌های انویدیا، مجهز به GPC، TPC، SM و ROP است که درکنار کنترلرهای حافظه عمل می‌کنند. واحد GPC را می‌توان یک بلوک سخت‌افزاری سطح بالا با سلطه‌ی بیشتر دانست. تمامی واحدهای پردازشی گرافیکی کلیدی در داخل GPC قرار می‌گیرند. هر GPC شامل یک موتور اختصاصی Raster می‌شود که در طراحی جدید، دو پارتیشن ROP هم در آن قرار گرفته‌اند. هر پارتیشن، شامل هشت واحد ROP (مخفف Raster Operators) می‌شود. اضافه شدن ROP را می‌توان قابلیت جدید پردازنده‌های گرافیکی مبتنی بر معماری امپر در دسته‌ی GA10x دانست. تاماسی در پایان صحبت‌هایش می‌گوید که به‌زودی جزئیات بیشتر را در سند فنی انویدیا امپر منتشر خواهند کرد.

با نگاهی دقیق‌تر به واحد SM در امپر، متوجه وجود ۱۲۸ واحد FP32 در هر بلوک می‌شویم. یکی از دو مسیر داده‌ای FP32 می‌تواند به‌صورت هم‌زمان فرایندهای عملیاتی INT32 را هم انجام دهد. هزینه‌های تنسور شامل چهار واحد می‌شوند. چهار واحد بافت و یک هسته‌ی RT هم در هر SM دیده می‌شود.

انویدیا برای هسته‌های نسل سومی تنسور، از همان معماری Smarsity استفاده می‌کند که در خانواده‌ی محصولات Ampere HPC هم استفاده شده بود. امپر از چهار هسته‌ی تنسور در هر SM بهره می‌برد که کمتر از هشت هسته‌ی موجود در هر SM در تورینگ است. ازطرفی آن‌ها نه‌تنها از طراحی نسل سوم بهره می‌برند، بلکه جریان‌های SM بزرگ‌تری هم دارند که موجب افزایش تعداد می‌شود. پردازنده‌های گرافیکی امپر توانایی اجرای ۱۲۸ فرایند عملیاتی FP16 FMA را در هر هسته‌ی تنسور دارند که از کل هسته‌های INT16 بهره می‌برد و با به‌کار گرفتن معماری Sparsity تا ۲۵۶ افزایش پیدا می‌کند. مجموع فرایندهای عملیاتی FP16 FMA به ۵۱۲ می‌رسد و با به‌کارگیری معماری مذکور، می‌توان آن را به ۱۰۲۴ رساند. اعداد مذکور، نشان‌دهنده‌ی بهبود دوبرابری نسبت به پردازنده‌های گرافیکی تورینگ هستند که به‌لطف طراحی به‌روز تنسور ممکن می‌شود.

فرایندهای بهبود بالا برای هسته‌های رهگیری پرتو هم رخ می‌دهد که در نسل دوم، دوبرابر تداخل پرتو را نسبت به معماری تورینگ در پی دارند. بیشتر بودن تعداد واحدهای SM همچنین باعث افزایش تعداد هسته‌های RT هم می‌شود که عملکرد کلی و شتاب‌دهی رهگیری پرتو را به‌میزان قابل‌توجهی در امپر افزایش می‌دهد. 

حافظه‌ی GDDR6X، تکامل بعدی در دنیای گرافیک

حافظه‌های Micron GDDR6X دستاوردهای مهمی در کارت‌های گرافیکی جدید دارند. این حافظه‌ها سریع‌تر هستند و درکنار دوبرابر کردن نرخ داده‌ی I/O، برای اولین‌بار از سیگنال‌دهی PAM4 چندسطحی در قالب‌های حافظه بهره می‌برند. حافظه‌های مذکور در کلاس محصولات انویدیا RTX 3090 به پهنای باند تا یک ترابایت می‌رسند که برای اجرای بازی‌های حرفه‌ای نسل بعد در رزولوشن 8K عالی خواهند بود.

 حافظه گرافیکی GDDR6X

مشخصات و قابلیت‌های GDDR6X SGRAM جدید

  • نرخ داده‌ی SGRAM در حافظه‌های جدید نسبت به نسل قبلی دوبرابر می‌شود که در هر تراکنش، توان کمتری هم مصرف می‌کنند و از مرز یک ترابایت‌برثانیه در پهنای باند حافظه‌ی سیستمی فراتر می‌روند.
  • این حافظه‌ها، اولین دستگاه‌های حافظه‌ای اختصاصی گرافیک محسوب می‌شوند کع از سیگنال‌دهی رمزنگاری شده‌ی PAM4 بین پردازنده و DRAM بهره می‌برند. در سیستم جدید، از چهار سطح ولتاژ برای رمزنگاری و جابه‌جایی دو بیت از داده در هر کلاک رابط استفاده می‌شود.
  • حافظه‌های جدید را می‌توان در سرعت‌های بسیار بالا با پایداری مناسب طراحی کرد و به کار انداخت. امکان تولید انبوه آن‌ها نیز اکنون فراهم شده است.

همان‌طور که گفته شد، GDDR6X از سیگنال‌دهی چندسطحی PAM4 جدید استفاده کرده که سرعت انتقال داده را بسیار سریع‌تر می‌کند. همچنین نرخ I/O نیز بهبود پیدا می‌کند و ظرفیت هر قالب حافظه در آن از ۶۴ به ۸۴ گیگابیت‌برثانیه می‌رسد. قالب‌‌های حافظه‌ی Micron GDDR6x همچنین تنها DRAMهای مخصوص گرافیک هستند که می‌توان با وجود بهره‌گیری از PAM4 آن‌ها را به‌صورت انبوه تولید کرد.

قالب حافظه micron gddr6x

نکته‌ی جذاب درباره‌ی حافظه‌های GDDR6X اینکه می‌توان سرعت آن‌ها را تا ۲۱ گیگابیت‌برثانیه افزایش داد. البته در RTX 3090 شاهد حداکثر سرعت ۱۹/۵ گیگابیت‌برثانیه در آن‌ها هستیم. ظاهرا تولیدکننده‌ها می‌توانند قالب‌هایی با ظرفیت بیشتر را هم از مایکرون خریداری کنند. مایکرون همچنین تأیید می‌کند که برنامه‌هایی برای افزایش سرعت حافظه‌ها تا بیش از ۲۱ گیگابیت‌برثانیه در سال ۲۰۲۱ داد، اما هنوز مشخص نیست که چه کارت‌هایی از این حافظه‌ها بهره خواهند برد.

حافظه‌های مایکرون GDDR6X نه‌تنها سرعت بیشتر، بلکه پهنای باند بیشتری را هم با ۱۵ درصد توان مصرفی کمتر نسبت به نسل قبل ارائه می‌کنند.

مشخصات حافظه‌های GDDR6X در مقایسه با نسل‌های قبل

نام حافظهGDDR5GDDR5XGDDR6GDDR6X
 چگالیاز ۵۱۲ مگابایت تا هشت گیگابایتهشت گیگابایتهشت گیگابایت و ۱۶ گیگابایتهشت گیگابایت و ۱۶ گیگابایت
VDD و VDDQ۱/۵ یا ۱/۳۵ ولت۱/۳۵ ولت۱/۳۵ یا ۱/۲۵ ولت۱/۳۵ یا ۱/۲۵ ولت
VPPنامشخص۱/۸ ولت۱/۸ ولت۱/۸ ولت
نرخ دادهتا هشت‌ گیگابیت‌برثانیهتا ۱۲ گیگابیت‌برثانیهتا ۱۶ گیگابیت‌برثانیه۱۹ و ۲۱ و بیشتر از ۲۱ گیگابیت‌برثانیه
تعداد کانال۱۱۲۲
Access granularity۳۲ بایت۶۴ بایت - ۲ عدد ۳۲ بایتی در حالت pseuso 32Bدو کانال ۳۲ بایتیدو کانال ۳۲ بایتی
Burst length۸۱۶ یا ۸۱۶۸ در حالت PAM4 و ۱۶ در حالت RDQS
سیگنال‌دهیPOD15/POD135POD135POD135/POD125PAM4 POD135/POD125
پکیجBGA-170
14x12x0.8mm ball pitch
BGA-190

14x12x0.65mm ball pitch

BGA-180

14x12x0.75mm ball pitch

BGA-180

14x12x0.75mm ball pitch

عرض I/Ox32/x16x32/x16دو کانال x16/x8دو کانال x16/x8
تعداد سیگنال61

- 40 DQ, DBI, EDC

- 15 CA

- 6 CK, WCK

61

- 40 DQ, DBI, EDC

- 15 CA

- 6 CK, WCK

70 یا 74

- 40 DQ, DBI, EDC

- 24 CA

- 6 or 10 CK, WCK

70 یا 74

- 40 DQ, DBI, EDC

- 24 CA

- 6 or 10 CK, WCK

PLL, DCCPLLPLLPLL,DCCDCC
CRCCRC-8CRC-8دو عدد CRC-8دو عدد CRC-8
VREFDدر هر دو بایت، داخلی یا خارجیداخلی در هر بایتداخلی در هر پینداخلی در هر پین، سه گیرنده‌ی زیرمجموعه در هر پین
EqualizationنامشخصRX/TXRX/TXRX/TX
VREFCخارجیخارجی یا داخلیخارجی یا داخلیخارجی یا داخلی
خود نوسازی یا SRFبله، SRF موقتی کنترل‌شدهبله، SRF موقتی کنترل‌شده و SRF هایبرنیت

بله، SRF موقتی کنترل‌شده و SRF هایبرنیت

VDDQ-off

بله، SRF موقتی کنترل‌شده و SRF هایبرنیت

VDDQ-off

اسکنSENIEEE 1149.1 JTAG

IEEE 1149.1 JTAG

IEEE 1149.1 JTAG

طراحی سیستم خنک‌کننده در GeForce RTX 30

انویدیا یکی از بهترین طراحی‌های سیستم گرمایی Founders Edition را در کارت‌های گرافیکی RTX 30 پیاده‌سازی کرده است. تیم سبز می‌گوید عملکرد بهتر و سریع‌تر کارت‌های گرافیکی جدید، نیازمند راهکارهای خنک‌کننده‌ی بهتر بود و به همین دلیل، آن‌ها راهکاری مخصوص را برای نسل بعدی کارت‌های گرافیکی خود به‌کار گرفته‌اند. این راهکارهای جدید، پردازنده‌ی گرافیکی را در دمای پایین نگه می‌دارند و با پیاده‌سازی فناوری‌های متعدد موجود و تعدادی فناوری جدید، جلوی افزایش بیش‌ازحد صدای عملیاتی را هم می‌گیرند.

سیستم خنک‌کننده‌ی جدید فاندرز ادیشن از یک هیت‌سینک مخصوص با آلیاژ آلومینیم استفاده می‌‌کند که با بهره‌مندی از محفظه‌ی بخار و فن‌های مبتنی بر فناوری محوری دوسویه، عملکردی عالی دارد. هیت‌سینک خنک‌کننده از یک پوشش نانوکربن بهره می‌برد که قطعا در کنترل کردن دما موفق خواهد بود.

سیستم خنک کننده در RTX 30

طراحی سیستم خنک‌کننده‌ی جدید در RTX 30 بسیار منحصربه‌فرد به‌نظر می‌رسد. این اولین طراحی در نوع خود محسوب می‌شود که آخرین بار نمونه‌ای مشابه با آن را در GTX 780 با هیت‌سینکی بزرگ دیده بودیم.

در طراحی سیستم خنک‌کننده‌ی جدید، موقعیت‌های خاصی برای قرارگیری فن دیده می‌شود که یکی در جلو و دیگری در پشت کارت قرار می‌گیرد. این پیکربندی کشش و مکش که با ترکیب فن دوگانه ایجاد می‌شود، گرما را با عملکردی ساده‌تر و بهینه‌تر از خروجی بخار کارت گرافیک استخراج می‌کند. البته کمی هوا به داخل کیس انتقال داده می‌شود که باتوجه‌به قدرت و کیفیت بالای سیستم‌های خنک‌کننده‌ی کنونی و بهره‌مندی از خنک‌کننده‌های مایع، مشکل زیادی ایجاد نخواهد کرد.

انویدیا تأکید می‌کند که طراحی جدید فاندرز ادیشن صدای کمتری نسبت به خنک‌کننده‌های سنتی دومحوره دارد و همچنین عملکردی دوبرابر بهتر از آن‌ها را ارائه می‌کند. تغییر در طراحی مصرف توان و خصوصا NVLink نقش مهمی در بهبود عملکرد سیستم خنک‌کننده داشته است. تغییرات جدید، جریان بهتر هوا را در از میان بزرگ‌ترین مجموعه‌ی فین طراحی‌شده تا به امروز، آسان‌تر می‌کند. منافذ براکتی بزرگ‌تر در ساختار خنک‌کننده در ترکیب با فین‌های خاص، جریان بزرگ‌تری از هوا را ممکن می‌کنند. از هر جهت که نگاه کنید، طراحی فاندرز ادیشن با تمرکز بر افزایش جریان هوا انجام شده است. به حداقل رساندن دما و رسیدن به بالاترین سطح عملکرد با کمترین صدا، همگی در طراحی جدید لحاظ شده‌اند.

بهبود عملکرد در توان مصرفی خنک کننده RTX 30

کارت گرافیک RTX 3080 در مبحث صدای خنک‌کننده و عملکرد، در حداکثر دمای ۷۸ درجه‌ی سانتی‌گراد عمل می‌کند. کارت گرافیک مذکور برای رسیدن به حداکثر باید به توان ۳۲۰ وات برسد که در آن حالت، خروجی صدای ۳۰ دسی‌بل خواهد داشت. در مقام مقایسه، کارت گرافیک تورینگ فاندر ادیشن حداکثر دمای ۸۱ درجه‌ی سانتی‌گراد داشت و حداکثر صدای آن نیز با توان ۲۴۰ وات، ۳۲ دسی‌بل گزارش می‌شد (کارت گرافیک RTX 2080 Super).

بهبود ۱/۹ برابری عملکرد در توان مصرفی خنک کننده RTX 30

در آزمایش‌های اختصاصی تیم سبز،  RTX 3080 فرکانس میانگین ۱۹۲۰ مگاهرتز را با توان مصرفی ۳۱۰ وات ثبت می‌کند که حداکثر دمای آن را به ۷۶ درجه می‌رساند. انویدیا در همین مقایسه، فاکتور ۱/۹ برابر را مطرح کرده و ادعا می‌کند که RTX 3080 با صدا و دمای کمتر امکان ارائه‌ی خروجی ۱۰۰ فریم‌برثانیه را دارد که در مقایسه با ۶۰ فریم‌برثانیه‌ی نسل قبلی، یک پیشرفت محسوب می‌شود.

طراحی برد PCB و توان RTX 3080 و RTX 3090

یکی از تغییرهای عمده‌ای که در کارت گرافیک RTX 3090 Founders Edition دیده می‌شود، در طراحی PCB نهفته است. کارت‌های گرافیکی RTX 3080 و RTX 3090 با پکیجینگ منحصربه‌فرد و کامپکت PCB طراحی و ساخته می‌شوند که قبلا در فضای مصرف‌کننده در هیچ‌جا دیده نشده بود. ازطرفی کامپکت بودن طراحی بدین معنی نیست که کارت‌ها توان مصرفی زیای ندارند. انویدیا در همین کارت‌های کامپکت مجموعه‌ای با توان طراحی بسیار بالا قرار داده است.

طراحی PCB در RTX 30

برد PCB در کارت‌های جدید انویدیا شامل ۲۰ بخش مصرف‌کننده‌ی توان می‌شود که طراحی خاص و حرفه‌ای آن را در مقایسه با کارت‌های RTX 20 پرچم‌دار نشان می‌دهد. پردازنده‌ی گرافیکی توان مورد نیاز خود را از ۱۸ فاز دریافت می‌کند و توان حافظه نیز از دو فاز دیگر تأمین می‌شود. انویدیا می‌گوید این نوع از PCB یک محصول عالی برای اورکلاک محسوب می‌شود که کاربران با استفاده از آن، به توان‌های بسیار بالاتری خواهند رسید. البته PCB در نسخه‌ی فاندرز ادیشن با نسخه‌‌ی عادی تفاوت دارد و در نسخه‌های مرسوم، از همان طراحی چهارگوش استفاده می‌شود.

طراحی جدید PCB در RTX 30

کارت‌های گرافیکی RTX 30 مدل فاندرز ادیشن علاوه بر طراحی جدید، از کانکتورهای برق ۱۲ پینی Micro-Fit 3.0 بهره می‌برند. این کانکتورها نیازی به ارتقا منبع تغذیه ایجاد نمی‌کنند چون با رابط‌های 2x8pin به 1x12pin عرضه می‌شوند و می‌توان بدون مشکل تأمین توان، از آن‌ها بهره برد.

جانمایی کانکتورهای ۱۲ پینی روی PCB در کارت‌های جدید انویدیا یک نوآوری دیگر را از تیم سبز نشان می‌دهد. پین‌ها به‌صورت عمودی جانمایی شده‌اند و باتوجه‌به طراحی PCB، می‌توان دلیل استفاده از طراحی ۱۲ پینی را به‌جای طراحی استاندارد هشت پینی استاندارد متوجه شد. در PCB فضای محدودی برای انجام فرایندهای این‌چنینی وجود دارد و باید از ورودی توان کوچک‌تر استفاده می‌شد.

عملکرد، زمان عرضه و قیمت RTX 30

انویدیا در اطلاعات تکمیلی خود جزئیاتی از اعداد و ارقام توان در کارت‌های گرافیکی جدید منتشر کرد. در نمودارهای زیر، توان و عملکرد کارت‌های RTX 3070 و RTX 3080 و RTX 3090 v را مشاهده می‌کنید.

قدرت و عملکرد RTX 30

انویدیا هنوز هیچ آمار و ارقام دقیقی درباره‌ی کارت‌های جدید سری RTX 30 منتشر نکرده است، اما باتوجه‌به همین رونمایی کلی هم می‌توان پیش‌بینی کرد که RTX 3070 عملکردی بالاتر از RTX 2080 Ti دارد و RTX 3080 بسیار بهتر از RTX 2080 Ti خواهد بود. کارت گرافیک پرچم‌دار RTX 3090 هم که سرعتی تقریبا ۵۰ درصد بهتر از RTX 2080 Ti دارد و بهبودی عالی را در مجموعه‌ی خانواده‌ی جدید نشان می‌دهد.

درواقع انویدیا پیش‌نمایشی کلی را از عملکرد و قدرت کارت‌های جدید به نمایش گذاشت. آن‌ها پیش‌نمایشی از Doom Eternal را با RTX 3080 نمایش دادند که بسیار بهتر از RTX 2080 Ti ظاهر شد و همچنین توانایی عالی کارت در اجرای بازی‌های 4K هم به نمایش گذاشته شد. در اکثر بازی‌‌های AAA، کارت‌های جدید انویدیا توانایی رسیدن به حداکثر نرخ فریم ۶۰ فریم‌برثانیه را دارند.

درنهایت نوبت به اطلاعات قیمت و زمان عرضه‌ی کارت‌های جدید انویدیا می‌رسد. تیم سبز می‌گوید RTX 3080 اول از همه و در تاریخ ۱۷ سپتامبر به بازار عرضه می‌شود. پس از آن نوبت RTX 3090 خواهد بود که ۲۴ سپتامبر به بازار می‌آید و درنهایت RTX 3070 در ماه اکتبر به مصرف‌کننده‌ها عرضه می‌شود. ازلحاظ قیمت نیز کارت‌ها به‌ترتیب ۱،۴۹۹ و ۶۹۹ و ۴۹۹ دلار قیمت خواهند داشت. به‌زودی نسخه‌های سفارشی و پرمیوم نیز با قیمت‌های متنوع معرفی می‌شوند.

منبع wccftech

از سراسر وب

  دیدگاه
کاراکتر باقی مانده

بیشتر بخوانید