موشکافی معماری AMD در ایکس باکس سری ایکس مایکروسافت

سه‌شنبه ۴ شهریور ۱۳۹۹ - ۲۱:۳۰
مطالعه 7 دقیقه
APUهای کنسولی نسل بعدی AMD به‌تدریج از خفا خارج می‌شوند. در این مطلب،اطلاعات جدید از کنسول نسل بعدی مایکروسافت را به‌طور اجمالی بررسی می‌کنیم.
تبلیغات

در رویداد سالانه‌ی Hot Chips 2020، مایکروسافت جزئیات بیشتری از قسمت‌های داخلی معماری سیستم کنسول بازی ایکس‌باکس سری ایکس را ارائه کرد. بخش زیادی از اطلاعات مطرح‌شده در ارائه‌ی منتشرشده پیش از این رخداد دربرگیرنده‌ی جزئیاتی بود که قبلا هم از آن باخبر بودیم؛ اما با در دست داشتن اسلایدهای جدید، به اطلاعات جالبی نیز دسترسی پیدا کردیم که دیاگرامی از هسته‌ی پردازنده را نیز شامل می‌شود. اجازه دهید مختصر و مفید به برخی از عناوین برجسته‌ی آن اشاره می‌کنیم.

دیاگرام هسته در تراشه مرکزی ایکس باکس سری ایکس به همراه مشخصات کلیدی

درحالی‌که می‌دانستیم ایکس‌ باکس سری ایکس براساس پردازنده‌ی Zen 2 و واحد گرافیکی با ۵۲ واحد پردازشی ۸ هسته و ۱۶ رشته‌ی پردازشی خواهد داشت، این اولین‌باری است که تصویر کاملی از هسته را مشاهده می‌کنیم. جای تعجبی نیست که قسمت مربوط به GPU بسیار بزرگ باشد. تراشه‌ی کامل ابعادی با ۳۶۰/۴ میلی‌مترمربع مساحت دارد که ۱۵/۳ میلیارد ترانزیستور را در خود جای داده است. تحلیلی سریع روی تصویر مشخص می‌کند که GPU حدود نیمی از هسته (دقیق‌تر ۴۷/۵ درصد) را دربر گرفته است.

بلاک دیاگرام سیستم روی چیپ یا همان SOC در ایکس باکس سری ایکس

باتوجه‌به تمام بخش‌های تعبیه‌شده در این سیلیکون، اندازه‌ی هسته درواقع کاملا مدیریت شده است. در نظر بگیرید که پردازنده‌های مرکزی Ryzen برمبنای Zen 2 با طراحی دو کلاستری Chiplet، افزون‌بر ۷۴ میلی‌مترمربع مساحت دارند (با چهار برابر حافظه‌ی کش سطح سوم یا L3 بیشتر درمقایسه‌با APUی به‌کار‌رفته در ایکس ‌باکس سری ایکس) و بعد GPU را شامل می‌شود که امکانات و هسته‌های سایه‌زن بیشتری از Navi 10 (تراشه‌ی گرافیکی RX 5700XT) دارد که آن هم ۲۵۱ میلی‌مترمربع است؛ یعنی مجموعا ۳۲۵ میلی‌مترمربع بدون درنظرگرفتن هسته‌های بهبودیافته‌ی معماری Navi 2x و ۱۲ واحد پردازشی اضافه‌ی دیگر درمقایسه‌با RX 5700XT. همچنین، ابعاد این تراشه بیش از دو برابر بزرگ‌تر از APUی دیگر AMD با اسم رمز Renior است که ۱۵۶ میلی‌مترمربع مساحت دارد.

با نگاه نزدیک‌تر به تصویر هسته، به‌نظر می‌آید که تراشه‌ی کامل حداکثر ۵۶ واحد پردازشی (Compute Unit) در قسمت مربوط به GPU داشته باشد. این امر بدان‌دلیل است که با وجود این هسته‌ی نسبتا بزرگ، بازده تولید تراشه‌های سالم را می‌توان با درنظرگرفتن واحدهای اضافه بسیار افزایش داد. به‌بیان دیگر، تراشه‌هایی که تا سقف ۴ واحد از ۵۶ واحد پردازشی گرافیکی آن‌ها هم بعد از فرایند‌ی لیتوگرافی معیوب تشخیص داده شده و استفاده‌کردنی نباشند، بازهم به‌عنوان تراشه‌ی سری ایکس کاربردی خواهند بود. اگر شمارش ما از روی تصویر درست باشد، برآورد می‌شود که AMD و مایکروسافت فقط ۴ واحد از کلاسترهای پردازشی دوگانه را غیرفعال کرده‌اند و البته تمام ۸ هسته‌ی کلاسترهای پردازنده باید برای به‌دست‌آوردن تراشه‌ی استفاده‌کردنی سالم باشند.

توضیحاتی در رابطه با قانون مور و چگونگی حل مشکلات در رابطه با آن در سری ایکس

همچنین، این ارائه زمانی را به معرفی کاهش سختی در مقیاس‌پذیری تراشه دربرابر قانون‌ مور اختصاص می‌دهد. اندازه‌ی تراشه‌ی XBOX Series X در رده‌ی سخت‌افزار کنسول قبلی است (۳۷۵ میلی‌مترمربع برای ایکس ‌باکس وان در سال ۲۰۱۳ و ۳۶۷ میلی‌مترمربع برای ایکس ‌باکس وان ایکس در سال ۲۰۱۷) و تعداد ترانزیستورها بیش از دو برابر درمقایسه‌با XBOX One X افزایش یافته است (۶.۶ میلیارد دربرابر ۱۵.۴ میلیارد)؛ اما درعین‌حال هزینه‌ی تولید هسته هم بیشتر شده است. مایکروسافت مشخص نکرده چقدر بیشتر است؛ ولی نماد $ را برای هزینه‌ی ایکس‌باکس وان و نماد +$ را برای ایکس‌باکس وان ایکس و ++$ را برای ایکس‌باکس وان سری ایکس فهرست کرده است. همان‌گونه که در جای دیگری هم اشاره کردیم، درحالی‌که لیتوگرافی ۷ نانومتری شرکت TSMC قدرتش را به‌رخ می‌کشد، هزینه‌ی تمام‌شده برای هر ویفر به میزان درخورملاحظه‌ای بالاتر از فرایند‌ی ۱۲ نانومتری است.

توضیحاتی در رابطه با معماری velocity در ذخیره ساز کنسول سری ایکس

به‌علاوه، مایکروسافت جزئیات بیشتری از معماری Velocity و اهدافش ارائه کرده است. معماری Velocity به‌جای افزایش حافظه‌ی سیستم، از حافظه‌ی ارزان‌قیمت‌تر SSD استفاده می‌کند. در گذشته، قیمت حافظه‌های DRAM هر سال ۳۰ درصد کاسته شده است؛ اما برای هشت‌و‌نیم سال گذشته هرسال فقط ۵ درصد کاهش یافته است. درمقابل، قیمت حافظه‌های Flash در مدت مشابه ۲۳ درصد در هر سال افت کرده است.

ازآنجاکه SSDها بسیار سریع‌تر از پلاترهای چرخان استفاده‌شده در هارددیسک‌ها در کنسول‌های قبلی هستند، مزیت بزرگی در زمان‌های بارگذاری بازی‌ها دارند. در ترکیب با تکنیک sampler feedback streaming، سخت‌افزار می‌تواند حافظه‌ی فلش را برای افزایش‌ بهره‌وری کلی به‌کار گیرد، بدون اینکه به افزایش تصاعدی در میزان حافظه‌ی رم نیاز باشد.

مقایسه دو تصویر با استفاده از ری تریسینگ و بدون آن در بازی ماینکرافت
مقایسه دو تصویر با استفاده از ری تریسینگ و بدون آن در بازی ماینکرافت
توضیح واحدهای محاسباتی بکار رفته در CU های دوگانه‌ی مایکروسافت
تشریح سرعت شتابدهی ری تریسنگ در سخت افزار ایکس باکس سری ایکس
توضیحاتی در مورد شتاب‌دهی یادگیری ماشینی در بازی‌ها و پشتیبانی از HDR

یکی از جنبه‌های جدید جالب در کنسول‌های نسل بعدی پشتیبانی از تکنیک رهگیری پرتو (Ray Tracing) است. تاکنون، می‌دانستیم که هر دو کنسول ایکس‌باکس سری ایکس و پلی ‌استیشن 5 از رهگیری پرتو سخت‌افزاری پشتیبانی خواهند کرد؛ اما تا پیش‌از‌این نشانه‌ی روشنی دراختیار نداشتیم از اینکه چه سطحی از بهره‌وری را باید انتظار داشته باشیم. به‌نظر می‌رسد که مایکروسافت اهمیت استفاده از رهگیری پرتو در بازی‌ها را کم‌رنگ جلوه می‌دهد یا حداقل برداشت ما این‌گونه است. درست مانند آنچه کارت‌های سری RTX انویدیا انجام داده‌اند، مایکروسافت نیز در اینجا روی رویکرد رندر ترکیبی تأکید می‌کند و گوشزد می‌کند که جایگزین کاملی برای روش‌های رندر سنی نیست.

تا آنجا که در مبحث بهره‌وری رهگیری پرتو اشاره می‌شود، مایکروسافت فقط به سقف بهره‌وری محاسبه‌ی ۳۸۰ گیگا یا میلیارد پرتوجعبه در ثانیه و ۹۵ میلیارد پرتومثلث در ثانیه اکتفا می‌کند (مفهوم جعبه و مثلث را در الگوریتم BVH و RT در مقاله‌ی بررسی معماری تورینگ در کارت‌های گرافیک RTX 2080 ،RTX 2070 و RTX 2080 Ti انویدیا قبلا شرح داده بودیم). این محاسبات چگونه با سخت‌افزار سری RTX 20 انویدیا مقایسه‌شدنی خواهد بود، درحالی‌که ادعا شده RTX 2080 Ti می‌تواند ۱۱ میلیارد پرتو در ثانیه پردازش کند؟ واقعا نمی‌دانیم؛ چراکه انویدیا سقف بهره‌وری را عنوان نکرده و مایکروسافت هم از بهره‌وری معمول حرفی نزده است.

اسلاید متذکر می‌شود که جزء کوچکی از ابعاد تراشه برای شتاب ۳ تا ۱۰ برابری در شیوه‌ی رهگیری پرتو اختصاص داده شده است که به‌نظر می‌رسد تقریبا مشابه‌ سخت‌افزار انویدیا باشد. در بازی‌هایی که رهگیری پرتو را با رندر سنتی ترکیب می‌کنند، اجرای بازی با قابلیت Ray Tracing فعال‌شده روی RTX 2060 انویدیا، اغلب دو یا سه برابر سریع‌تر از نسل قبلی GTX 1080 Ti خواهد بود.

مقاله‌های مرتبط:

    هنوز جزئیات قطعی از این موضوع دراختیار نداریم که ایکس‌باکس سری ایکس از سخت‌افزار اضافی مرتبط به یادگیری ماشینی مانند هسته‌های Tensor انویدیا استفاده‌شده برای DLSS 2.0 برخوردار باشد. البته اسلایدها صریحا به شتاب‌دهی یادگیری ماشینی اشاره می‌کنند و به عبارت ML inference acceleration (مترادف با شتاب‌دهی استنباط یادگیری ماشینی) برای ۳ تا ۱۰ برابر سرعت بیشتر و بخش کوچکی از هسته هم اشاره شده است. باوجوداین، این امر می‌تواند با اجرای محاسبات FP16 یا INT8 روی کلاسترهای معمولی CU نیز انجام شود.

    اسلاید مربوط به فرمت‌های تصویری، خروجی کنسول و مشخصات ذخیره‌ساز

    درنهایت باید اشاره کنیم ایکس‌باکس سری ایکس از خروجی HDMI 2.1 پشتیبانی خواهد کرد که امکان خروجی با دقت 4K و ۱۲۰ هرتز یا حتی 8K و ۶۰ هرتز را فراهم می‌کند. آنچه انتظار نداشتیم، این است که خروجی DisplayPort در اینجا وجود ندارد؛ اما اگر قصد داشتید که کنسول را به نمایشگر مخصوص بازی برای پی‌سی وصل کنید، این مورد می‌تواند قابلیت‌ها را محدود کند.

    همچنین، رمزگذار / رمزگشای ویدئو از پشتیبانی از رمزگشایی 4K و 8K AVC و HEVC/ VP9 با پشتیبانی از رمزگذاری AVC (فرمت H.264) و HEVC (فرمت H.265) بهره می‌برد. این کار باعث بهبود قابلیت‌های استریم برای هر کاربری خواهد شد که می‌خواهد آخرین دستاوردهای خود در بازی را پخش کند.

    درادامه، اسلاید مشخصات پردازنده‌ی مرکزی و واحد گرافیکی و حافظه در کنسول ایکس‌باکس سری ایکس را مشاهده می‌کنید:

    مشخصات پردازنده یا CPU، واحد گرافیکی و حافظه یا DRAM در سری ایکس

    شما قابلیت‌ها و اطلاعات جدید معرفی‌شده از کنسول نسل بعدی مایکروسافت را چگونه ارزیابی می‌کنید؟ دیدگاه‌های خود را با ما در میان بگذارید.

    تبلیغات
    داغ‌ترین مطالب روز

    نظرات

    تبلیغات