اینتل جزئیات مربوط به معماری گرافیکی Xe را منتشر کرد
اینتل آخرین جزئیات مربوط به محصولات جدید مبتنیبر معماری گرافیکی Xe خود را در کنفرانس مربوط به توسعهدهندگان HPC (مخفف Hight Performance Computing بهمعنی محاسبات ردهبالا) مننتشر کرد. شخصی که روی جایگاه محصولات و سرویسها را معرفی میکرد، راجا کدوری، معاون کل اینتل و مدیر بخش معماری بود. او نخستین نقشهی راه اولین معماری گرافیکی ساخت اینتل، یعنی Xe را آشکار و محصولاتی را معرفی کرد که معماری مذکور در آنها بهکار خواهد رفت.
نکات بسیاری دربارهی محصولات جدید اینتل وجود دارد؛ اما بهتر است ابتدا مهمترین موضوع، یعنی خود معماری Xe را تحلیل کنیم. معماری گرافیکی Xe اینتل مقیاسپذیر است و تراشههای مختلف را میتواند توسعه دهد. تصمیم تیم آبی بر این است تا با تکیه بر معماری Xe، سه نوع ریزمعماری را روانهی بازار کند:
- Xe LP اینتل که کارت گرافیکی مجتمع و پایینرده است؛
- Xe HP اینتل که میانرده است و برای مصارف عمومی و مراکز داده و هوشی مصنوعی کاربرد دارد؛
- Xe HPC اینتل که برای محاسبات پیچیده کاربرد دارد و حداقل یک هگزافلاپس محاسبه را در ثانیه انجام میدهد.
آنچه از نامگذاری پردازندههای گرافیکی مذکور میتوان نتیجه گرفت، نوع کاربری هرکدام از این محصولات است. نام LP مخفف Low-Power به مفهوم کممصرف و عبارت HP مخفف High-Performance به مفهوم عملکرد پیشرفته است. اختصار HPC نیز همانگونه که پیشتر گفته شد، مخفف Hight Performance Computing و اشاره به معماریای است که محاسبات پیچیده را انجام میدهد و از جدیدترین فناوریهای اینتل در آن استفاده شده است. درادامه، فناوریهای یادشده بررسی خواهند شد. بهگفتهی تیم آبی، توان پردازندهی گرافیکی Xe LP بین ۵ تا ۲۰ وات است و تا ۵۰ وات توانایی سازگاری دارد. کارت گرافیک Xe HP اینتل نیز یک سطح بالاتر و توان مصرفی آن بین ۷۵ تا ۲۵۰ وات است. درهمینحال، معماری HPC با توان محاسباتیِ بیشتر درمقایسهبا دو معماری دیگر، توان مصرفی بیشتری خواهد داشت. راجا کدوری دربارهی انواع معماری Xe چنین میگوید:
معماری تضمینی برای سازگاری نرمافزاری است. در ابتدا در حال برنامهریزی بهمنظور استفاده از Xe برای دو میکرومعماری بودیم؛ یعنی معماریهای LP و HP. بااینحال، فرصت را برای ارائهی سومین معماری در قالب HPC مهیا دیدیم.
کارتهای گرافیکی کلاس Xe اینتل عرض بردار (Vector) متغیری خواهند داشت. برای تبیین موضوع این نکته را در نظر بگیرید که کارتهای گرافیک اینتل پردازندههایی برداری یا آرایهای محسوب میشوند. این نوع از پردازندهها مجموعه دستورالعملهایی را اجرا میکنند که دستورالعملهای یکبعدی از دادهها یا خطی داشته باشند. درهرحال، پردازندههای گرافیکی مذکور در انواع مختلف میتوانند دستورالعملها را بهصورت موازی در تعداد زیادی از واحدهای اجرایی (EU) اجرا کنند. عرض بردار در پردازندههای گرافیکی، اشاره به نوع پردازش همزمان و موازی است که در کارتهای گرافیک Xe در انواع SIMT و SIMD و تلفیقی از هر دو تقسیمبندی شده است. SIMD مخفف عبارت Single instruction multiple data به مفهوم دستورالعمل و دادههای چندگانه و SIMT مخفف Single Instruction Multiple Threads به مفهوم دستورالعمل و چندین رشته است.
پردازندهی گرافیکی Ponte Vecchio با بهرهگیری از معماری گرافیکی Xe حداکثر ۱۰۰۰ عدد واحد اجرایی دارد
ازآنجاکه تمامی تمرکز کنفرانس توسعهدهندگان روی محاسبات بالارده (HPC) بود، راجا کدوری نیز بهطور ویژه از پردازندههای گرافیکی HPC کلاس Xe صحبت کرد. پردازندههای مذکور میتوانند ۱۰۰۰ واحد اجرایی (EU) داشته باشند و هر واحد اجرایی بهلطف بهروزرسانیها تا ۴۰ برابر قدرت محاسباتی بیشتری در فرمت عددی double-precision floating-point یا نقطهی شناور با دقت دوگانه ایجاد میکند. در فرمت یادشده (FP64) اطلاعات با حجم ۶۴ بیتی و دقتی فراوان در حافظهی دستگاه ذخیره میشوند.
واحدهای اجرایی در پردازندهی گرافیکی جدید اینتل با پارچهی حافظهی جدیدی با کارایی درخورتوجه در هر شرایطی، به چندین کانال حافظه با پهنای باند بالا متصل شدهاند. پارچهی حافظه در کلاس Xe با نام XEMF شناخته میشود که مخفف XE Memory Fabric بهمعنی پارچهی حافظهی Xe است. معماری پردازندههای گرافیکی HPC از کلاس Xe، شامل حافظهی کش یکپارچهی بسیار بزرگی با نام رمبو (Rambo) است که چندین واحد پردازش گرافیکی را بههم متصل میکند. حافطهی کش رمبو با ارائهی پهنای باند وسیعی از حافظه، توانایی محاسبات پایدار فرمت عددی FP64 را در بارهای کاری با دقت زیاد فراهم میکند. راجا کدوری دربارهی پارچهی جدید حافظه میگوید:
در قلب معماری Xe، پارچهی جدیدی با نام XEMF داریم. این پارچهی XEMF قلب عملکرد این ماشینها است و ما آن را کش رمبو نامیدیم. این حافظهی کش یکپارچهای است که از پردازنده و کارت گرافیک دردسترس است.
اینتل کارتهای گرافیک کلاس HPC از معماری Xe را با آخرین فناوری لیتوگرافی هفت نانومتری خواهد ساخت. این همان لیتوگرافی بالاردهی هفت نانومتری است که این شرکت قبلا دربارهاش حرف زده بود. اینتل برای توسعهی کارتهای گرافیک اگزامقیاس خود بیشترین استفاده را از فناوریهای جدید و پیشرفتهی یکپارچهسازی شرکت مانند رابطهای EMIB و Forveros خواهد کرد. رابطهای مذکور رابطهای دایبهدای است و توانایی اتصال دایهای ناهمگن را با هزینهی مقرونبهصرفه فراهم میآورند. در مبحث مدارهای مجتمع، هر دای (die) یک بلوک کوچک از مواد نیمهرسانا است که مداری با کارکرد خاص در فرایندی مانند فوتولیتوگرافی روی آن ساخته شده است. در بحث مربوط به فرایند ساخت، موارد زیر بهبودهای مهمی هستند که اینتل برای لیتوگرافی ۷ نانومتری خود اعلام کرده است:
- تراشههای هفت نانومتری در همان اندازهی دای ۱۰ نانومتری با دوبرابر تراکم ترانزیستور بیشتر؛
- بهینهسازیهای برنامهریزیشدهی درون گرهها (intra-node)؛
- کاهش چهاربرابری قوانین طراحی؛
- لیتوگرافی بهوسیلهی اشعهی ماوراءبنفش (EUV)؛
- آخرین فناوری از رابطهای EMIB و Forveros.
کارتهای گرافیک Xe HPC از فناوری Forveros برای اتصال به حافظهی کش رمبو بهره خواهند گرفت. شایان ذکر است حافظهی رمبو را میتوان بین چندین کارت گرافیک HPC در مداری یکپارچه به اشتراک گذاشت. EMIB نیز برای اتصال حافظهی با پهنای باند بالا (HBM) به کارت گرافیک استفاده میشود. هر دو این فناوریها جهش بزرگی در کارایی پهنای باند و تراکم پردازنده ایجاد میکنند. دقیقا همانند پردازندههای Xeon، کارتهای گرافیک HPC نیز همراهبا حافظهی ECC و تصحیحکنندهی حافظهی کش و دسترسیپذیری و قابلیت اطمینان و سرویسپذیری در کلاس Xeon همراه خواهند بود.
ابرکامپیوتر آئورورا؛ اولین محصول مجهز به مرکز دادهی هفت نانومتری Ponte Vecchio مبتنیبر معماری Xe
حالکه به تمامی فناوریهای مهم اشاره کردیم، باید اولین محصول هفت نانومتری از معماری Xe HPC را بررسی کنیم. این محصول Ponte Vecchio نام دارد که پردازندهی گرافیکی عظیمی است و هدفش طرح جدیدترین تکتراشهی اگزامقیاس برای ابرکامپیوترها است. Ponte Vecchio با ۱۶ چیپلت محاسباتی روانهی بازار خواهد شد که برپایهی معماری گرافیکی Xe HPC شکل گرفتهاند.
بهنظر میرسد در کارت گرافیک Ponte Vecchio مقادیر عظیمی از حافظهی با پهنای باند بالای DRAM به هر واحد پردازش گرافیکی متصل خواهد بود. تنها یک بستهی پردازشی از این نوع برای ابرکامپیوتر آئورورا (Aurora) استفاده خواهد شد. بستهی مذکور ۶ کارت گرافیک Ponte Vecchio را شامل میشود که با رابطهای CXL (لینک محاسبهی سریع یا Compute Express Link) یا Xe Link بههم متصل شدهاند و از بستهی نرمافزاری OneAPI بهره میبرند. بستهی پردازشی مذکور همچنین دو پردازندهی Sapphire Rapids را درون خود جای داده است که نسل بعدی از لیتوگرافی ++10nm معماری Willow Cove هستند. همانطورکه پیشتر ذکر شد، ابرکامپیوتر آئورورا اولین محصولی است که از مرکز دادهی هفت نانومتری Ponte Vecchio مبتنیبر معماری Xe استفاده میکند. برخی از ویژگیهای مهم در بستهی پردازشی ابرکامپیوتر آئورورا بدینشرح است:
- عملکرد پیشرفته در هوش مصنوعی و محاسبات بالارده و تحلیل داده؛
- معماری یکپارچهی حافظه در سراسر پردازندهها و کارتهای گرافیک؛
- اتصال همهجانبه در بسته که باعث کاهش تأخیر و افزایش پهنای باند شده است؛
- ورودی/خروجیهای غیرموازیِ توسعهپذیر در تمامی گرهها.
رویکرد تیم آبی بسیار شبیه به کاری است که انویدیا با مدل DGX-2 خود انجام داده است. DGX-2 از ۱۶ پردازندهی گرافیکی Volta بهره میبرد که با رابط NVSwitch به بستهای واحد تبدیل شده است؛ اما برخلاف طرح اینتل، انویدیا کل بسته را پردازندهی گرافیکی کامل نامیده است. اینتل ۱۶ چیپلت روی مدار یکپارچه را پردازندهی گرافیکی مینامد و هر بسته ۶ پردازندهی گرافیکی را شامل میشود. بهنظر میرسد انویدیا طراحی چیپلت ماژول چندتراشهای (MCM) را روی محصولات HPC شرکت مذکور دنبال کند؛ همانند پردازندهی Ampere که یک سال زودتر از Ponte Vecchio، یعنی در سال ۲۰۲۰ وارد بازار پردازندههای HPC خواهد شد.
درحالیکه مراکز داده اولین مقصد پردازندههای گرافیکی هفت نانومتری Xe هستند، کارتهای گرافیکی ۱۰ نانومتری Xe که با معماری گرافیکی Xe LP و Xe HP بازار هدفشان مشتریان عادی است، در سال ۲۰۲۰ راه خود را بهسمت کاربریهای عمومی و بازار گیمینگ باز میکنند.