با پردازنده‌ی Xeon Phi Knights Landing اینتل آشنا شوید

شنبه ۹ مرداد ۱۳۹۵ - ۱۴:۰۰
مطالعه 9 دقیقه
شرکت اینتل در رویداد یک ماه پیش محاسبات عملکرد بالای ISC 2016، از پردازنده‌ی Xeon Phi با نام رمز Knights Landing رونمایی کرد. این پردازنده در اصل در کنفرانس ابر محاسبه (Supercomputing) در ماه آبان سال قبل معرفی شده بود که هم‌اکنون فروش آن آغاز شده است. زومیت را همراهی کنید.
تبلیغات

شرکت اینتل در خلال رویداد ISC 2016 یک ماه پیش که مربوط به محاسبات عملکرد بالا (HPC) است، از پردازنده‌ی Xeon Phi با اسم رمز Knights Landing رونمایی کرد که در حقیقت در کنفرانس ابر محاسبه (Supercomputing) ماه آبان سال پیش معرفی شده بود. در حال حاضر، شرکت اینتل فروش این پردازنده را آغاز کرده است. محصولات Knights Landing شامل بخش سخت‌افزاری اضافی Omni-Path Fabric اینتل هستند. همچنین، اینتل در این رویداد از نرم‌افزار HPC Orchestrator برای مدیریت سیستم‌های HPC هم رونمایی کرد.

مقاله‌های مرتبط:

    اینتل اخیرا دوباره تمرکز خود را بر روی رایانه‌های غیر دسکتاپی شامل دیتاسنتر (datacenter)، اینترنت اشیا و بازار حافظه گذاشته است. شاید جالب باشد که بدانید، ۹۹.۲ درصد از سهم بازار سوکت‌های CPU دیتاسنترها متعلق به شرکت اینتل است؛ اما در واقع، توانایی این شرکت به رشد درآمد حاصل از دیتاسنترها محدود شده است. اینتل صرفا در یک چرخه‌ی بروزرسانی بی‌پایانی گیر افتاده که پردازنده‌های خود را با آهنگ منظمی جایگزین می‌کند.

    در کمال تعجب، منابع مالی مربوط به کل سخت‌افزار سرور، در ۲۰ سال گذشته رشد محسوسی نداشته است؛ بنابراین دنبال کردن چرخه‌ی بروزرسانی برای رشد درآمد سودمند نیست. به همین دلیل اینتل در تلاش برای گسترش نفوذ در دیتاسنتر به وسیله‌ی هدف قرار دادن بخش‌های دارای رشد بالا مانند پردازش موازی با پردازنده‌های خانواده‌ی Xeon Phi که ظاهرا جانشین واحد پردازش گرافیکی (GPU) خواهد شد، Omni-Path مربوط به شبکه و فناوری 3D NAND یا 3D XPoint مربوط به حافظه است. راه‌برد اینتل تسلط بیش‌تر بر روی CPU با استفاده از فریم‌ورک سیستم مقیاس‌پذیر (SFF) خود که رویکردی همه جانبه برای معماری‌های مقیاس رک (rack-scale) محسوب می‌شود، است. معماری rack-scale، رویکردی جدید برای طراحی سخت‌افزار دیتاسنترها است. SSF هم نوعی پیکربندی برای افزایش کارایی محاسبات با کارایی بالا (HPC) است.

    پردازنده‌ی Xeon Phi Knights Landing

    خانواده‌ی پردازنده‌ی Xeon Phi (با تلفظ زیئون فای) که از پروژه‌ی Larrabee استنتاج شده، برای انجام عملیات محاسباتی موازی سنگین مرتبط با محاسبات با کارایی بالا (HPC)، یادگیری ماشین، کارهای سنگین مالی و مهندسی طراحی شده است.

    پردازنده زئون فی Knights Landing

    شرکت اینتل به وسیله‌ی افزودن ویژگی سوکت قابل بوت به دومین نسل از پردازنده‌های خانواده‌ی زئون فی تحت عنوان (Knights Landing (KNL، محصولات نسل قبلی Knights Corner را توسعه داده است. اولین نسل از محصولات زئون فی، فقط به صورت کمک‌پردازنده‌های PCIe در دسترس بودند. کمک‌پردازنده‌های (Coprocessor) زئون فی در واقع پردازنده‌های مخصوصی هستند که با بر عهده گرفتن وظیفه‌ی پردازش محاسبات خاص، در مواقع نیاز به کمک پردازنده‌ی اصلی می‌آیند. پردازنده‌های KNL، در دو نسخه‌ی دارای سخت‌افزار Omni-Path fabric یکپارچه با پردازنده و بدون این سخت‌افزار اضافی، موجود هستند. نسخه‌ی دارای سخت‌افزار Omni-Path fabric به وسیله‌ی اتصال دهنده (connector) بیرون زده از نسخه‌ی دیگر قابل تفکیک است. پردازنده‌های KNL، در قالب LGA 3647 سوکت P که دارای دهانه‌ای برای مطابقت با کانکتور Omni-Path fabric است، ارائه می‌شوند. Omni-Path یک مولفه‌ای کلیدی برای فریم‌ورک سیستم مقیاس‌پذیر است؛ بنابراین یکپارچگی عمیق درون پلتفرم KNL، به پیش‌برد اهداف rack-scale اینتل کمک خواهد کرد.

    پردازنده زئون فی Knights Landing

    پردازنده‌ی نسل KNL اولین CPU قابل بوتی است که به طور خاص برای بارِ کاری موازی طراحی شده است. به علاوه، این نسل اولین پردازنده‌ی یکپارچه با چیپ کنترلی اضافی Omni-Path fabric (به چیپ کنترلی اضافی در کانکتور توجه کنید)، یکپارچه با حافظه‌های با پهنای باند بالا (HBM) و دارای واحدهای برداری AVX-512 است.

    شرکت اینتل ادعا می‌کند که پردازنده‌های KNL با از بین بردن تنگناهای PCIe، دارای حداکثر کارایی ۵ برابری، ۸ برابر کارایی بیشتر در هر وات و ۹ برابر کارایی بیش‌تر بر هر دلار نسبت به رهکارهای مبتنی‌بر GPU هستند. این نتایج حاصل از آزمایش‌های داخلی شرکت اینتل است و طبق اظهار این شرکت، به دلیل دسترسی محدود به نمونه، برخی از این نتایج با پردازنده‌های مبتنی‌بر GPU نسل قبلی به دست آمده است.

    پردازنده زئون فی Knights Landing

    پردازنده‌‌ی ۱۴ نانومتری KNL دارای بیش از ۸ میلیارد ترانزیستور و دارای ویژگی ابتکاری معماری ۷۲ هسته‌ای است. معماری یاد شده به ۳۶ کاشی ۲ هسته‌ای که در یک پیکربندی شبکه‌ای (mesh) بازآرایی شده‌اند، تقسیم می‌شود. هر هسته‌ی مبتنی‌بر Silvermont (سیلورمونت ) ۴ ترِدی (رشته‌ی پردازشی)، دارای ۲ عدد VPU (واحد پردازش برداری) AVX-512 از مجموع ۱۴۴ واحد پردازش برداری است. هر خانه‌ی کاشی، ۱ مگابایت حافظه‌ی کش L2 به اشتراک گذاری شده دارد که با این اوصاف کل حافظه‌ی کش L2، برابر با ۳۶ مگابایت خواهد شد. پردازنده‌های KNL دارای کارایی تک رشته‌ای ۳ برابری نسبت به محصولات Knights Crossing نسل قبلی هستند.

    پردازنده‌ی KNL دارای حافظه با پهنای باند بالای DRAM چند کاناله (MCDRAM) شرکت میکرون با ظرفیت ذخیره‌سازی ۱۶ گیگابایتی هستند که توان عملیاتی ۵۰۰ گیگابایت بر ثانیه‌ای را فراهم می‌کند. این میزان از توان عملیاتی به سبب اطلاعات بروز شده، ۱۰۰ گیگابایت بر ثانیه بیش‌تر از عدد موجود در اسلاید نشان داده شده به وسیله‌ی اینتل است. هشت بسته‌ی HBM شرکت میکرون به عنوان یک لایه‌ی حافظه‌ی سریع عمل می‌کنند. پلتفرم KNL دارای سه مدل از عملکرد حافظه‌ی رم شامل کش (cache)، ترکیبی (hybrid) و تخت (flat) را فراهم می‌کند. این پردازنده از حداکثر حافظه‌ی ۳۸۴ گیگابایتی DDR4 که روی ۶ کانال (تقریبا ۹۰ گیگابایت بر ثانیه) گسترده شده و اتصال به میکروچیپ PCH ولزبرگ (Wellsburg) از طریق یک اتصال DMI (رابط رسانه‌ای مستقیم) چهار مسیری، پشتیبانی می‌کند. مرکز کنترل کننده‌ی پلتفرم (PCH) یکی از خانواده‌های میکروچیپ اینتل بوده و رابط رسانه‌ای مستقیم (DMI)، اتصال اختصاصی اینتل بین چیپست پل شمالی و پل جنوبی در مادربردهای قدیمی است.

    سخت‌افزار یکپارچه‌ی Omni-Path fabric یاد شده، از طریق درگاه PCIe x16 به die متصل شده و یک لوله‌ی انتقالی دو درگاهی ۱۰۰ گیگابیت بر ثانیه‌ای برای ترافیک شبکه فراهم می‌کند. این پردازنده همچنین دارای ۳۶ مسیر PCIe 3.0 است. پردازنده‌ی KNL، دارای اتصال QPI (اتصال نقطه به نقطه یا مسیر سریع) برای کاربردهای چند سوکتی نیست. این اتصال از خوشه‌بندی داخلی مختلف یا مدل‌های عملیاتی دارای طراحی حافظه دسترسی غیر یکپارچه (NUMA) پشتیبانی می‌کند. پردازنده‌های سوکتی قابل بوت هستند در حالی که کارت‌های PCIe این‌گونه نیستند.

    پردازنده زئون فی Knights Landing

    شرکت اینتل خانواده‌ی Knights Landing پردازنده‌ی زئون فی خود را در ۴ مدل اصلی عرضه می‌کند؛ هر چند که ممکن است در آینده مدل‌های بیش‌تری هم معرفی شوند. در ظاهر تفاوت اصلی بین هر مدل صرفا در سرعت کلاک و تعداد هسته‌ی پردازشی است. با این حال، مدل سطح پایین 7210 دارای محدودیت پهنای باند در هردو حافظه‌ی استاندارد DRAM و HBM است. اینتل پیش‌بینی می‌کند که مدل 7210، با برخورداری از ۸۰ الی ۸۵ درصد از کارایی مدل سطح بالای 7290 با نصف هزینه، محبوب‌ترین محصول خواهد بود. شرکت اینتل در حال حاضر ۱۰۰۰۰۰ واحد از این پردازنده‌ها را یا به فروش رسانده یا سفارش فروش آن را گرفته است. همچنین اینتل قبل از انتشار رسمی، این پردازنده‌ها را برای یک اکوسیستم متشکل از ۳۲ شرکت تولید کننده‌ی اصلی (OEM) و ۳۰ سازنده‌ی مستقل نرم‌افزار (ISV) تدارک دیده است.

    پردازنده زئون فی Knights Landing

    اینتل ادعا می‌کند که پلتفرم KNL، توان عملیاتی ۳ ترافلاپسی اضافی در حالت ممیز شناور دو دقتی (double-precision) یا ۶ ترافلاپس اضافی در حالت ممیز شناور تک دقتی (single-precision) به ازای گره واحد سوکت، ارائه می‌دهد. فلاپس واحد اندازه‌گیری سرعت پردازش داده‌ها به وسیله‌ی رایانه بوده که هر ترافلاپس معادل یک تریلیارد (یا ۱۰ به توان ۱۲) عملیات ممیز شناور بر واحد ثانیه است. منظور از single-precision، اعدادی باینری هستند که ۳۲ بیت از حافظه‌ی رایانه را اشغال کرده و دامنه‌ی پویایی وسیعی از مقادیر را با استفاده از ممیز شناور ارائه می‌دهند. حالت double-precision هم مشابه با single-precision بوده که ۶۴ بیت از حافظه‌ی رایانه را اشغال می‌کند. همچنین، شرکت اینتل عملکرد خاصی را در پردازنده‌ی KNL فراهم کرده که مربوط به واحدهای پردازش گرافیکی (GPU) برای استفاده در یادگیری ماشین است.

    الگوریتم‌های یادگیری ماشین به دو دسته‌ی عمومی آموزش و استنباط تقسیم می‌شوند. در جایی که کاربران به طور معمول واحدهای پردازش گرافیکی (GPU)، مدارهای مجتمع دیجیتال قابل برنامه‌ریزی (FPGA) و به میزان کم‌تر، مدارهای مجتمع با کاربرد خاص (ASIC) را برای اداره کردن بار سنگین به کار می‌گیرند، دسته‌ی مربوط به آموزش نسبت به استنباط، تمرکز بیش‌تری بر روی محاسبه دارد. در حال حاضر، بیش‌تر شرکت‌ها مانند گوگل که اخیرا واحد پردازش تنسور (ASIC توسعه داده شده برای یادگیری ماشین) را پس از توسعه‌ی دقیق در پلتفرم FPGA معرفی کرد، از ASIC استفاده می‌کنند. هزینه‌ی بالای ASIC باعث می‌شود که فقط در کاربردهای فرا مقیاسی از آن‌ها استفاده شود. هم‌اکنون شرکت اینتل خانواده‌ی پردازنده‌ی زئون فی Knights Landing خود را به عنوان پردازنده‌ای همه کاره و جایگزینی مقرون به صرفه در اختیار این شرکت‌ها قرار می‌دهد.

    نکته‌ی قابل توجه دیگر در مورد معماری‌های مبتنی‌بر ASIC، این است که به طور ثابت و یکنواخت برای تحریک کردن آن‌ها نیازمند نوعی از محاسبه هستیم. اینتل معتقد است که پردازنده‌ی KNL قابل بوت می‌تواند در کاهش هزینه و پیچیدگی معماری ترکیب شده‌ی ASIC با زئون کمک کند.

    اینتل دارای پایگاه تامین کننده‌ی FPGA است. به دست آوردن شرکت آلترا (Altera) برای آوردن FPGA روی سطح die (سطح سیلیکونی، که ترانزیستورها بر روی آن قرار دارند) با برخی از محصولات مبتنی‌بر زئون، می‌تواند کمال مطلوب نمونه‌ها را در آینده تغییر دهد. اینتل معتقد است که پردازنده‌ی KNL به عنوان یک عامل کلیدی در ایجاد تفاوت، جایگاه منحصر به فردی برای به چالش کشیدن GPUها در اعمال آموزشی و بازاریابی توانایی مقیاس‌پذیری و کارایی دارد. اینتل اشاره کرد که GPUها به جای معماری‌های محاسبه‌ی سنگین در چند گره که KNL آدرس‌دهی می‌کند، اغلب به محاسبه‌ی سنگین در یک گره منفرد محدود هستند.

    با این حال، پردازنده‌ی Tesla P100 شرکت انویدیا که به تازگی معرفی شده می‌تواند توانایی مقیاس‌پذیری بیش‌تری در معماری‌های رسمی مبتنی‌بر PCIe چند گره ارائه دهد. جای تعجب نیست که اینتل معتقد است، خانواده‌ی زئون بهترین تناسب را با عمل‌های استنباطی سبک وزن دارد.

    Omni Path و فریم‌ورک سیستم مقیاس‌پذیر (SSF)

    شرکت اینتل یک بروزرسانی در اکوسیستم Omni Path ارائه داده است که هم‌اکنون شامل بیش از ۸۰۰۰۰ گره است (۲۰ الی ۲۵ درصد از تجارت قابل آدرس‌دهی به وسیله‌ی اینتل). طبق اظهار شرکت اینتل، گسترش اکوسیستم Omni Path با فروش Xeon Phi مشترک است و آن‌ها پیش‌بینی می‌کنند که یکپارچه شدن اتصال (کانکشن) دو درگاه ۱۰۰ گیگابیت بر ثانیه‌ای درون یک بسته‌ی KNL، باعث افزایش سرعت این روند خواهد شد.

    پردازنده زئون فی Knights Landing

    در نهایت، شرکت اینتل نرم‌افزار سیستمی HPC Orchestrator را معرفی کرد که برپایه‌ی OpenHPC بوده و متن باز است؛ اما به وسیله‌ی اینتل پشتیبانی و مدیریت می‌شود. این محصول، نصب، مدیریت و نگهداری مداوم از سیستم‌های محاسباتی عملکرد بالا را بسیار ساده می‌کند. محصول پیش تکمیل، پیش تست و تایید اعتبار نشده در حال حاضر در دست آزمایش به وسیله‌ی ترکیب‌کننده‌ها، سازندگان مستقل نرم‌افزار (ISV) و محققان مراکز محاسبات با کارایی بالا (HPC) بوده و در سه ماهه‌ی چهارم امسال منتشر خواهد شد.

    آیا قابلیت‌های پیشرفته‌ی پردازنده‌های Xeon Phi KNL باعث رشد سود خالص شرکت اینتل خواهد شد؟ این پردازنده‌ها را در مقایسه با محصولات رقیب چگونه ارزیابی می‌کنید؟

    تبلیغات
    داغ‌ترین مطالب روز

    نظرات

    تبلیغات