پردازندههای سری Max اینتل از راه رسیدند؛ قدرتنمایی پونته وکیو در دنیای ابرکامپیوترها
اینتل در آستانهی برگزاری رویداد Supercomputing 22، پردازندههای مرکزی کلاس دیتاسنتر زیان مکس (Xeon Max) را معرفی کرده است. گفتنی است پیشتر، از این پردازندهها با کدنام Sapphire Rapids HBM یاد میشد. علاوهبرایی، تیم آبی پردازندههای گرافیکی سری Intel Data Center GPU Max را رونمایی کرده است. پیشازاین، پردازندههای گرافیکی یادشده صرفاً با کدنام پونته وکیو (Ponte Vecchio) خطاب میشدند. اینتل میگوید پردازندههای جدیدش مخصوص پیچیدهترین پردازشهای ابرکامپیوترها هستند.
پردازندههای مرکزی سری Xeon Max
دههها است که پردازندههای مبتنیبر معماری x86 برای انواع پردازشهای فنی استفاده میشوند؛ بههمیندلیل، امروزه میتوان از آنها برای وظایف پردازشی متنوعی استفاده کرد. با وجود بهبود درخورتوجه عملکرد هستههای CPU در سالهای اخیر، پردازندههای امروزی در پردازش وظایف هوش مصنوعی و رایانش با قدرت بالا (HPC) با دو محدودیت مهم مواجه هستند: یکی پهنای باند حافظه و دیگری موازیسازی. اینتل وعده میدهد که پردازندههای سری Xeon Max هر دو محدودیت را دور بزنند.
براساس گزارش تامز هاردور، پردازندههای سری Xeon Max مجهز به حداکثر ۵۶ هستهی پرقدرت برپایهی ریزمعماری Golden Cove هستند. این هستهها در قالب چهار چیپلت روی بستری واحد قرار دارند و اینتل ازطریق فناوری اختصاصی EMIB بین چیپلتها ارتباط برقرار میکند. طبق گفتهی اینتل، تراشههای جدید کلاس دیتاسنتر موتورهای پردازشی ویژهای با تمرکز بر هوش مصنوعی و HPC دارند و از ۶۴ گیگابایت حافظهی آنبرد HBM2E استفاده میکنند.
پردازندههای سری Xeon Max حداکثر ۵۶ هستهی پرقدرت Golden Cove دارند
پردازندههای جدید اینتل همچون سایر محصولات سری Sapphire Rapids از هشت کانال حافظهی DDR5 و رابط PCIe Gen 5 با پروتکل CXL 1.1 پشتیبانی میکنند. هستههای بهبودیافتهی اینتل از AVX-512 و تکنیک Deep Learning Boost و حتی شتابدهندهی ماتریس AMX نیز بهره میبرند. هستههای جدید از DSA هم پشتیبانی میکنند. این تکنیک فشار ناشی از انتقال دادهها را از روی پردازنده برمیدارد.
استفاده از ۶۴ گیگابایت حافظهی آنبرد HBM2E (شامل چهار حافظهی ۱۶ گیگابایتی) به حداکثر پهنای باند یک ترابایت منتهی میشود که معادل تقریباً ۱٫۱۴ گیگابایت حافظه و پهنای باند ۱۸٫۲۸ گیگابایتبرثانیه بهازای هر هسته است. برای فهم بهتر این اعداد، بهتر است بدانید پردازندهی ۵۶ هستهای Sapphire Rapids که هشت ماژول DDR5-4800 داشته باشد، به پهنای باند ۳۰۷٫۲ گیگابیتبرثانیه دست پیدا میکند یا بهبیان بهتر، ۵٫۴۸۴ گیگابایتبرثانیه بهازای هر هسته.
پردازندههای سری Xeon Max میتوانند از حافظهی HBM2E به شیوههای مختلف استفاده کنند: استفاده بهعنوان حافظهی سیستم و استفاده بهعنوان کش پرسرعت برای سابسیستم حافظهی DDR5 و استفاده بهعنوان بخشی از حافظهی یکپارچهی HBM. روش آخر نیازمند بهینهسازیهای نرمافزاری است؛ اما دو روش اول به تغییر کد نیازی ندارند.
اینتل میگوید بسته به نوع پردازش، Xeon Max میتواند حدوداً ۳٫۰ تا ۵٫۳ برابر قویتر از Xeon Scalable 8380 عمل کند. پردازندهی Xeon Scalable 8380 هماکنون در بازار موجود است. پردازندههای نسل جدید اینتل بهلطف حافظهی HBM2E خود در پردازشهایی مثل توسعهی مدل سهبعدی برای مولکولها، حداکثر ۲٫۸ برابر قویتر از AMD EPYC 7773X عمل میکنند. این پردازندهی AMD متکیبر 3D V-Cache است.
استفاده از حافظهی HBM2E مزیت دیگری نیز برای اینتل دارد و آن کاهش میزان حملونقل دادهها در بین CPU و GPU است؛ موضوعی که برای تعدادی از پردازشهای حوزهی HPC اهمیت زیادی دارد.
پردازندههای گرافیکی سری Intel GPU Max
اینتل گفته است پردازندههای گرافیکی جدیدش در حوزهی دیتاسنتر برپایهی نسخهای از معماری پونته وکیو تولید میشوند؛ معماریای که نخستینبار در سال ۲۰۱۹ معرفی شد. اینتل تا مدتها پونته وکیو را در سکوت خبری توسعه میداد تا اینکه در سالهای ۲۰۲۰ و ۲۰۲۱، جزئیات دقیقی دربارهی آن منتشر کرد.
پونته وکیو پیچیدهترین پردازندهی ساختهشده در تاریخ است؛ چون بدون احتساب حافظه، بیش از ۱۰۰ میلیارد ترانزیستور در ۴۷ کاشی پردازشی (شامل هشت کاشی HBM2E) دارد. معماری پونته وکیو بهطورگسترده از فناوریهای مدرن اینتل در حوزهی پکیجینگ تراشه نظیر EMIB استفاده میکند. چندین شرکت با فناوریهای متنوع چیپلتهای پرتعداد پونته وکیو را تولید میکنند.
اینتل میگوید پردازندههای گرافیکی Data Center GPU Max را با بهرهگیری از معماری اصلاحشدهی Xe-HPC تولید میکند که بهطورویژه برای پردازشهای هوش مصنوعی و حوزهی HPC بهینه شده است. بهموجب استفاده از این معماری، پردازندههای جدید تعداد زیادی از فرمتها و دستورالعملها را پشتیبانی میکنند.
مشخصات فنی گرافیکهای کلاس دیتاسنتر جدید اینتل | |||
---|---|---|---|
- | Data Center Max 1100 | Data Center Max 1350 | Data Center Max 1550 |
فرمفکتور | PCIe | OAM | OAM |
کاشیهای پردازشی (چیپلت) | ؟ | ؟ | ۴۷ |
ترانزیستور | ؟ | ؟ | ۱۰۰ میلیارد |
هستههای Xe HPC | ۵۶ | ۱۱۲ | ۱۲۸ |
هستههای رهگیری پرتو | ۵۶ | ۱۱۲ | ۱۲۸ |
موتورهای وکتور ۵۱۲ بیت | ۴۴۸ | ۸۹۶ | ۱٬۰۲۴ |
موتورهای ماتریس ۴٬۰۹۶ بیت | ۴۴۸ | ۸۹۶ | ۱٬۰۲۴ |
کش L1 | ؟ | ؟ | ۶۴ مگابایت |
کش L2 Rambo | ؟ | ؟ | ۴۰۸ مگابایت |
حافظهی HBM2E | ۴۸ گیگابایت | ۹۶ گیگابایت | ۱۲۸ گیگابایت |
توان | ۳۰۰ وات | ۴۵۰ وات | ۶۰۰ وات |
معماری Xe-HPC درمقایسهبا Xe-HPG تعداد بسیار بیشتری سابسیستم برای حافظه و کش دارد و از هستههای متفاوتی استفاده میکند. معماری Xe-HPC واحد بافت ندارد؛ بههمیندلیل، نمیتواند با روشهای سنتی محتوای گرافیکی را پردازش کند. در کمال تعجب، Xe-HPG برای بصریسازی دادهها در ابرکامپیوتر از فناوری رهگیری پرتو (Ray Tracing) پشتیبانی میکند.
یکی از مشخصههای مهم معماری Xe-HPC، تکنیک XMX است که به پردازندههای گرافیکی جدید اینتل کمک میکند تا در فرمت TF32 به قدرت ۴۱۹ ترافلاپس دست پیدا کنند. بررسیهای اولیه نشان میدهد قویترین پردازندهی پونته وکیو در اکثر سناریوها در حدواندازهی Nvidia H100 ظاهر نمیشود و تقریباً در تمامی پردازشها برتری چندانی بر AMD Instinct MI250X ندارد. اینتل میگوید پردازندهی گرافیکی Data Center GPU Max 1550 در شبیهسازیهای Riskfuel تا ۲٫۴ برابر و در شبیهسازیهای NekRS تا ۱٫۵ برابر سریعتر از A100 انویدیا است.
اینتل قصد دارد سه محصول جدید برپایهی پونته وکیو عرضه کند. قویترین مدل Data Center GPU Max 1550 نام دارد و شامل ۱۲۸ هستهی Xe-HPC و ۱۲۸ گیگابایت حافظهی HBM2E و توان ۶۰۰ وات است. مدل دوم، یعنی Data Center GPU Max 1350، از ۱۱۲ هستهی Xe-HPC بههمراه ۹۶ گیگابایت حافظه و توان ۴۵۰ وات استفاده میکند. سومین و ضعیفترین مدل، Data Center GPU Max 1100 است. این پردازنده ۵۶ هستهی He-HPC و ۵۶ گیگابایت حافظهی HBM2E و ۳۰۰ وات توان دارد.
Rialto Bridge؛ نسل بعد گرافیکهای دیتاسنتر اینتل
اینتل افزونبر رونمایی گرافیکهای سری Data Center GPU Max، جزئیاتی مقدماتی از گرافیکهای سری Rialto Bridge را منتشر کرد؛ گرافیکهایی که سال ۲۰۲۴ از راه میرسند. اینتل میگوید محصولات این خانواده از هستههای بهبودیافتهی Xe-HPC استفاده میکنند و همچنان مبتنیبر معماری پونته وکیو خواهند بود. استفاده از هستههای جدید باعث میشود توان مصرفی در Rialto Bridge به حداکثر ۸۰۰ وات برسد. ناگفته نماند مدلهایی از این پردازندهها با توان کمتر تولید میشوند.
اینتل میگوید آزمایشگاه ملی آرگون در ایالات متحده یکی از اولین مشتریانی است که محصولات جدید سری Intel Xeon Max و Intel Data Center GPU Max را دریافت میکند. این آزمایشگاه تحقیقاتی مشغول تولید ابرکامپیوتری با قدرت بیش از دو اگزافلاپس است. شرکای تجاری اینتل در اوایل سال آیندهی میلادی دستگاههای مبتنیبر Xeon Max و Data Center GPU Max را برای بازار سرور عرضه میکنند.