انویدیا با معرفی Pascal و NVLink و حافظه‌ی سه بعدی، نقشه راه کارت گرافیک‌های خود را بروز کرد

در GTC 2014، مدیر عامل کمپانی Nvidia روی صحنه آمده و از نسل‌های بعدی پردازنده‌های گرافیکی صحبت کرده است. Pascal و Volta نام دو نسل بعدی است و قرار است تکنولوژی جدیدی به نام NVLink برای ارتباط با سیستم مورد استفاده قرار بگیرد. حافظه‌های سه بعدی هم مطرح شده‌اند. در ادامه‌ی مطلب ببینیم انویدیا برای نقشه راه خود چه برنامه‌هایی در نظر گرفته و با توجه به برد کوچکی که در دست Jen-Hsun Huang، روی صحنه آمده، قرار است چه تغییری در طراحی کارت گرافیک‌ها اتفاق بیافتد؟

امسال در نشست سالانه‌ی تکنولوژی‌های کارت گرافیک، انویدیا مثل همیشه به معرفی نقشه راه خود و نمایشی از روند صعودی پیشرفت معماری‌های خود پرداخت. در GTC 2013 انویدیا از معماری Volta صحبت کرد. همان‌طور که می‌دانید معماری فعلی کارت گرافیک‌های سری 700 انویدیا، Kepler نام دارد. کمی پیش‌تر با معرفی دو کارت گرافیک رده متوسط و پایین GTX 750 و GTX 750 Ti شاهد رونمایی از اولین تراشه‌های مبتنی بر معماری Maxwell بودیم که در زومیت به بررسی عمیق آن پرداختیم.

کپلر و مکسول هر دو از دانشمندان بزرگ بودند و معماری بعدی که ولتا نام دارد هم نام یکی دیگر از دانشمندان است که شاید در علم فیزیک و واحد اختلاف پتانسیل الکتریکی یعنی ولت، نامش را شنیده باشید.

فعلاً در مورد زمان‌بندی برای رونمایی از محصولات مبتنی بر ولتا خبری منتشر نشده ولیکن برای مکسول برنامه‌ریزی روشن شده است.

مکسول و ولتا، دو معماری بعدی انویدیا

طبق نمودار زیر هر یک از معماری‌ها با یک شاخص معرفی شده‌اند، کپلر که معماری فعلی است، قابلیت موازی‌سازی پویای امور محوله را دارد. مکسول هم با این ویژگی معرفی شده: حافظه‌ی مجازی یکپارچه. برنامه‌ی انویدیا هم این است که مکسول را تا اواخر سال 2014 کامل‌تر روانه‌ی بازار کند.

nvidia-2014-roadmap-1

در مورد ولتا ویژگی اساسی حافظه‌ی DRAM داخلی است، منظور از داخلی این است که حافظه با استفاده از فناوری TSV یا Through Silicon Via روی قالب تراشه‌ی پردازنده‌ی گرافیکی شکل بگیرد.

وقتی مکسول و ولتا در عمل با مشکل مواجه می‌شوند، پاسکال ظهور می‌کند

اما انویدیا در عمل ویژگی مکسول را به سرانجام نرسانده و قرار است آن را بعدها در معماری‌های بعدی کامل کند. فعلاً تنها اتفاقی که در عمل شاهد هستیم، پشتیبانی از حافظه‌ی مجازی یکپارچه به صورت نرم‌افزاری است که در CUDA 6 عملی شده است. علاوه بر این انویدیا هنوز در مورد نسل دوم مکسول‌ها صحبتی نکرده و مشخص نیست که کارت گرافیک‌های مکسولی رده اول، تا چه حد قدرتمند و سریع خواهند بود.

در نمودار زیر می‌بینیم که در نقشه راه جدید انویدیا، ویژگی اساسی مکسول پشتیبانی از DX 12 ذکر شده است.

nvidia-2014-roadmap-2

مکسول با معرفی کارت گرافیک GTX 750 شروع کرده و قرار است در سال 2014 تدریجاً سایر مدل‌ها معرفی شوند. اما آنچه باعث نا امیدی است، فقدان قابلیت‌های جدیدی است که به قابلیت‌های خانواده‌ی موفق کپلر (سری 700) و نسل اول مکسولی‌ها اضافه شود.

تغییر دیگر در نقشه راه به ولتا مربوط می‌شود، خبری از نام آن نیست! هنوز مشخص نشده که چرا ولتا در این نقشه راه دیده نمی‌شود اما آنچه قطعی به نظر می‌رسد، عرضه شدن آن دیرتر از زمان‌بندی‌هایی است که قبلاً اعلام شده بود. ویژگی اساسی ولتا هم زیر نام معماری Pascal ذکر شده که خود عجیب به نظر می‌رسد.

فعلاً برنامه‌ی انویدیا عرضه‌ی پاسکال در سال 2016 به بعد است، پاسکال دو ویژگی اساسی که قبلاً برای مکسول و ولتا ذکر شده بود را جذب کرده و یک معماری جدید و بسیار جالب به نظر می‌رسد.

پاسکال در نگاه اول

انویدیا برای بهبود عملکرد تراشه‌های گرافیکی خود، تصمیم گرفته که با استفاده از TSV، حافظه‌های DRAM را روی تراشه‌ها اضافه کند. خبر جدید در این رابطه این است که انویدیا طبق یکی از استانداردهای معرفی شده توسط JEDEC به نام HBM استفاده می‌کند. HBM مخفف High Bandwidth Memory به معنی حافظه‌هایی با پهنای باند بالاست. در نمونه‌ای که انویدیا تولید کرده هم تمام حافظه‌ی کارت گرافیک پاسکالی به صورت مجتمع بوده و هیچ حافظه‌ی دیگری روی کارت گرافیک وجود ندارد.

nvidia-2014-roadmap-3

قبلاً در معرفی ولتا از پهنای باند 1 ترابایت در ثانیه صحبت شده بود ولیکن در مورد پاسکال هیچ عدد خاصی ذکر نشده است.

یک مشکل جدی در رابطه با این حافظه‌ها، هزینه‌ی تولید است، باید صبر کرد و دید که در قبال پهنای باند بالاتر، چه هزینه‌ای متوجه مشتریان انویدیا خواهد بود.

nvidia-2014-roadmap-4

NVLink چیست؟ چه اثری روی پهنای باند و رابطه‌ی بین پردازنده‌ی اصلی و گرافیکی دارد؟

انویدیا در نشست اخیر در مورد حافظه‌ی مجازی یکپارچه اطلاعات جدیدی منتشر نکرده است اما یک ویژگی جالب‌تر به نام NVLink را معرفی کرده است.

برای ارتباط بین پردازنده‌ی اصلی و گرافیکی از باسی به نام PCI Express استفاده می‌شود که در مادربوردهای جدید با نسخه‌ی سوم آن روبرو هستیم. این واسط ارتباطی به ازای هر Lane پهنای باندی معادل 985 مگابایت در ثانیه دارد. توجه کنید که منظور از Lane یک مسیر دو جهته برای دریافت و ارسال سیگنال به صورت تفاضلی است. لذا در مورد مادربوردهای متداول امروزی، اگر تعداد مسیرها 16 عدد باشد و یا به اصطلاح بازاری، پهنای شکاف PCI Express، به صورت x16 نوشته شود، پهنای باند این اسلات مادربورد، 16 ضرب در 0.985 گیگابایت یا حدود 16 گیگابایت در ثانیه خواهد بود.

کارت گرافیک‌های مدرن امروزی پهنای باند حافظه‌ای به مراتب بالاتر از محدودیت‌های موجود مثل ارقام بالاتر از 250 گیگابایت در ثانیه دارند. البته این رقم پهنای باند حافظه‌ی روی کارت گرافیک است و قرار نیست واسط ارتباطی PCI-Express هم به همین اندازه سرعت داشته باشد. ولیکن 16 گیگابایت بر ثانیه و حتی 31.5 گیگابایت در ثانیه‌ای که با معرفی نسل چهارم واسط PCIe حاصل شده، به نظر کافی نیستند.

NVLink برای حل همین مشکل معرفی شده و قرار است یک جایگزین خوب برای PCIe باشد. ساختار NVLink به شدت شبیه PCIe است و حتی درست مثل آن پروگرم می‌شود. اما تفاوت اصلی آن طراحی برای ارتباط بهتر نقطه به نقطه است. NVLink هم سیگنال را به شکل تفاضلی منتقل می‌کند و کوچک‌ترین واحد ارتباطی در آن بلوک نام دارد. یک بلوک یا Block، شامل 8 مسیر یا همان‌طور که قبلاً توضیح داده شد، 8 لِین است. هر مسیر پهنای باندی معادل 20 گیگابیت در ثانیه دارد، لذا اگر پهنای واسط ارتباطی به اندازه‌ی 8 مسیر باشد، پهنای باند حاصل شده، 20 گیگابایت در ثانیه (160 گیگابیت در ثانیه) خواهد بود. توجه کنید که در PCIe 3.0 هر مسیر حدود 8 گیگابیت در ثانیه سرعت داشت. یعنی سرعت حدود 2.5 برابر بیشتر است.

nvidia-2014-roadmap-5

برای ارتباط بهتر می‌توان چند بلوک را با هم ترکیب کرد تا رابطه‌ی بین دو ابزار خاص سریع‌تر شود، امکان دیگر رابطه با ابزارهای اضافی دیگر است. به بیان دیگر برای ارتباط ابزارها با هم، نیازی به ارتباط با ریشه‌ی شکاف‌ها و استفاده از یک سوییچ مجزا نیست. به استفاده از ریشه‌ی مرکبی که در پردازنده‌ی اصلی گنجانده شده هم نیازی نیست، به همین علت است که می‌گوییم NVLink یک واسط با طراحی کاملاً نقطه به نقطه است و ابزارهای متصل و به عبارتی پردازنده‌های گرافیکی مستقیماً با هم در ارتباط خواهند بود.

اما به شباهت NVLink با Hypertransport کمپانی رقیب یعنی AMD و همچنین ارتباط داخلی Quick Path Interconnect اینتل توجه کنید، همگی به این ویژگی NUMA اشاره دارد که نیازی نیست تمام پردازنده‌ها با هم در ارتباط باشند. NUMA یا دسترسی غیریکنواخت به حافظه، روشی است که در آن یک پردازنده دسترسی بهتری به حافظه‌ی اختصاصی خود دارد.

کارت گرافیک‌های آینده، عمود بر مادربورد نخواهند بود؟

NVLink پهنای باند بالایی دارد و انویدیا برای ایجاد چنین سرعت فوق‌العاده‌ای نمی‌تواند از PCI و PCIe استفاده کند. طول واسط ارتباطی باید کوتاه‌تر باشد. بنابراین انویدیا تصمیم گرفته به جای استفاده از اسلات‌های شبیه PCIe روش دیگری اتخاذ کند.

انویدیا نام کانکتور جدید را درست شبیه اتصال دو برد مدار چاپی (یا PCB) در نظر گرفته که در کارت گرافیک دو هسته‌ای GTX 295 شبیه آن را دیده بودیم. mezzanine روشی برای چسباندن دو PCB است که انویدیا همین عنوان را انتخاب کرده است.

nvidia-2014-roadmap-6

nvidia-2014-roadmap-7

البته هنوز هیچ کانکتور خاصی معرفی نشده ولیکن چنین روش جدیدی به اعمال تغییرات جدی در مادربورد نیاز دارد و در واقع مادربوردهایی که از NVLink پشتیبانی می‌کنند، باید طراحی متفاوتی داشته باشند. اما مزیت مهم روش جدید این است که همان‌طور که گفته شد، طراحی کاملاً نقطه به نقطه خواهد بود، به علاوه پردازنده‌ی گرافیکی هم مثل CPU اتصالی شبیه سوکت خواهد داشت و مدارات مربوط به تأمین توان مصرفی و ارتباط با حافظه، روی تراشه‌ی گرافیکی ایجاد می‌شوند.

نمونه‌ای که انویدیا از پاسکال رونمایی کرده، در تصویر زیر دیده می‌شود:

nvidia-2014-roadmap-8

کانکتور در این تصویر مشخص نیست ولیکن روش اتصال قرار گرفتن روی مادربورد است و مثل کارت گرافیک‌های فعلی، به صورت عمودی قرار نمی‌گیرد.

یک مزیت دیگر روش جدید انویدیا این است که می‌توان برای خنک‌کاری، مثل پردازنده‌ی اصلی عمل کرد، البته این موضوع در مورد سرورها اهمیت دارد نه دستاپ‌های معمولی چرا که فضای در دسترس، در مورد سرورها بسیار مهم‌تر از دستاپ‌هاست. برای هر کارت گرافیک با طراحی جدید، یک کانکتور NVLink لازم است.

در تصویر زیر یک کانکتور اصطلاحاً mezzanine با پهنای باند بالا را مشاهده می‌کنید:

nvidia-2014-roadmap-9

آخرین مزیت کاکنتور مِزِنین مانند NVLink این است که در انتقال و تحویل توان مصرفی، بازدهی بالاتری دارد. در واقع بنابر ادعای انویدیا، انرژی لازم برای انتقال هر بایت داده، کمتر از PCIe است. علاوه بر این محدودیت انتقال توان در NVLink بیش از 75 واتی است که در مورد PCIe تعریف شده است، لذا استفاده از کارت گرافیک‌های قوی‌تر بدون نیاز به کابل 6 یا 8 پین ساده‌تر خواهد شد.

آینده‌ی NVLink و طراحی کارت گرافیک‌ها

NVLink از نظر پهنای باند و نوع طراحی بهینه‌تر از PCIe است ولیکن جایگزینی PCIe در ابعاد بزرگ به این سادگی‌ها نیست. در واقع بلوک‌های ارتباطی که انویدیا تعریف کرده، از طریق PCIe هم قابل پیاده‌سازی هستند، درست مثل تصویر زیر:

nvidia-2014-roadmap-10

موضوع دیگر این است که در استفاده از NVLink هم باید برخی دستورات و ارتباطات همچنان از طریق PCIe ارسال و برقرار شوند.

بنابراین در نقشه راه انویدیا، استفاده از PCIe همچنان پابرجاست. لذا انویدیا مجبور است فعلاً از PCIe هم استفاده کند. بهترین پیش‌بینی در مورد آینده‌ی NVLink این است که در سرورها مورد استفاده قرار بگیرد و کاربران عادی از همان PCIe معروف بهره ببرند.

به هر حال تا سال 2016 هنوز 2 سال زمان باقیمانده و فعلاً خبری از پاسکال و NVLink نیست. NVLink قرار است چندین پردازنده‌ی گرافیکی را طوری به هم مربوط کند که گویی همگی یک پردازنده‌ی واحد هستند.

در حال حاضر NVLink به عنوان بخشی از کنسرسیوم OpenPOWER در اختیار طراحان POWER CPU قرار گرفته ولیکن هنوز هیچ پردازنده‌ی خاصی اعلام نشده است. حتی این احتمال هم وجود دارد که انویدیا از پردازنده‌های مبتنی بر ARM برای پیاده‌سازی NVLink استفاده کند، شاید Denver که نام هسته‌های 64 بیتی تراشه‌ی تگرا کی‌وان است هم به این منظور به کار گرفته شود. فعلاً هیچ خبری در این رابطه منتشر نشده است.

بنابر اظهارات انویدیا، نسخه‌ی دوم NVLink برای معماری پس از پاسکال که احتمالاً ولتا باشد، در نظر گرفته شده و در آن حافظه‌ی کش با واسط و پردازنده‌ای که روی آن است، یکی شده و ارتباط بهینه‌تر و سریع‌تری دارد و در ضمن در اجرای منسجم‌تر دستورات مطابق با معماری ناهمگن سیستم (HSA) گامی رو به جلو است.

از سراسر وب

  دیدگاه
کاراکتر باقی مانده