اینتل پردازنده گرافیکی Xe HP با قدرتی در مقیاس پتافلاپس را به‌نمایش گذاشت

سه‌شنبه ۲۸ مرداد ۱۳۹۹ - ۱۵:۴۵
مطالعه 5 دقیقه
راجا کودوری در جریان برگزاری رویداد Hot Chips، پردازنده‌ی گرافیکی خانواده‌ی Xe HP را که متشکل‌از چهار کاشی است و به مقایس پتافلاپس ازلحاظ قدرت پردازشی دست پیدا می‌کند، به‌نمایش گذاشت.
تبلیغات

راجا کودوری، معمار ارشد اینتل و رئیس واحد تجاری کارت گرافیک مجزا در این شرکت که سال ۲۰۱۷ از AMD جدا شد، طی چند ماه اخیر در مراسم‌های مختلف حضور پیدا کرده و جزئیاتی جدید درباره‌ی معماری جدید پردازنده‌های گرافیکی اینتل یعنی معماری Xe و محصولاتی که برپایه‌ی آن ساخته می‌شوند با رسانه‌ها در میان گذاشته است. پردازنده‌های گرافیکی خانواده‌ی Xe تنوع بالایی از محصولات را شامل می‌شوند؛ از پردازنده‌های گرافیکی کم‌مصرف مجتمع‌ و پایین‌رده تحت نام Xe LP Graphics گرفته تا پردازنده‌های گرافیکی مخصوص دیتاسنترها که عموما متشکل‌از چندین تراشه هستند. کودوری به‌تازگی جزئیاتی جدید درباره‌ی پردازنده‌های گرافیکی دسته‌ی دوم دردسترس رسانه‌ها قرار داده است.

همان‌طور که هفته‌ی گذشته اعلام شد، پردازنده‌های گرافیکی سری Xe HP اینتل قرار است در سه نوع روانه‌ی بازار شوند. مدل پایه که تاکنون چند بار در اخبار رسمی ظاهر شده است از یک کاشی (Tile) بهره می‌گیرد که شامل ۵۱۲ واحد اجرایی (EU) و به‌احتمال زیاد دو بسته‌ی HMB2e خواهد بود. اینتل هنوز مشخصات فنی رسمی این پردازنده‌ی گرافیکی را تأیید نکرده، اما به‌تازگی نحوه‌ی عملکرد پردازنده‌های گرافیکی خانواده‌ی Xe که شامل یک، دو یا چهار کاشی هستند را به‌نمایش گذاشته است که جزئیات را می‌توانید در تصویر زیر مشاهده کنید:

برای مشاهده‌ی تصویر بالا در ابعاد اصلی روی آن کلیک کنید

قدرت پردازشی بیشتری که حضور کاشی‌های اضافه به‌همراه می‌آورد در نگاه اول فوق‌العاده است؛ بااین‌حال نباید فراموش کنید نتایج حاضر در تصویر بالا مربوط به انجام وظایف گرافیکی آنی (Real-Time) نیستند. تقسیم کار بین پردازنده‌های گرافیکی به‌منظور دستیابی به فناوری‌هایی نظیر SLI و CrossFire کار بسیار سخت‌تری است و استفاده از پردازنده‌ گرافیکی اضافی در بهترین حالت ممکن، عملکرد اجرای بازی‌های ویدئویی را بین ۵۰ تا ۸۰ درصد بهبود می‌بخشد. برای اهداف غیرگرافیکی که بیشتر روی توان پردازشی متمرکز هستند، کارها به‌طور معمول به‌طور مجزا انجام می‌شوند. 

راجا کودوری در رویداد Hot Chips پردازنده‌ی گرافیکی چهار کاشی Xe HP را جلوی دوربین به‌نمایش گذاشت

در ابتدا تصور می‌شد که پردازنده‌ی گرافیکی متشکل‌از چهار کاشی وجود خارجی ندارد و بیشتر بازی تبلیغاتی اینتل است‌؛ اما راجا کودوری در جریان برگزاری رویداد Hot Chips اینتل، پردازنده‌ی موردبحث را که ابعاد بسیار بزرگی داشت رو به دوربین نشان داد تا ثابت کند اینتل واقعا در حال ساخت پردازنده‌‌ی گرافیکی بسیار رده‌بالا و قدرتمندی است.

پردازنده‌ی متشکل‌از چهار کاشی اینتل واقعا ابعاد بزرگی دارد؛ بزرگ‌تر از تمامی تراشه‌هایی که تاکنون دیده بودیم. اینکه پردازنده‌ی گرافیکی موردبحث سری Xe HP وارد مرحله‌ی تولید نهایی می‌شود یا نه، سؤالی است که فعلا پاسخش را با اطمینان نمی‌دانیم. فراموش نکنید اینتل پردازنده‌ی گرافیکی Xe HPC ملقب‌به پونته وکیو (Ponte Vecchio) را هم دارد و طی چند وقت اخیر به‌شکلی ویژه روی آن مانور داده است.

برای مشاهده‌ی تصویر بالا در ابعاد اصلی روی آن کلیک کنید

پردازنده‌ی گرافیکی Xe HP برای تبدیل‌شدن به پردازنده‌ای با چند کاشی از EMIB استفاده می‌کند. آن‌طور که اینتل در اطلاعیه‌ای رسمی اعلام کرده، پردازنده‌ی گرافیکی Xe HPC قرار است شامل یک کاشی با نام رمبو کش (Rambo Cache) باشد، از فناوری پکیجینگ Foveros استفاده کند و با بهره‌گیری از Co-EMIB بهبودهای بیشتری در زمینه‌ی پردازشی ارائه دهد.

اینتل روی سه مدل از پردازنده‌های گرافیکی Xe HP با یک، دو و چهار کاشی کار می‌کند

اینتل می‌گوید کاشی پایه‌ی پردازنده‌ی پونته وکیو با استفاده از لیتوگرافی جدید ۱۰ نانومتری سوپرفین (SuperFin) ساخته می‌شود که نسخه‌ی بهبودیافته‌ی فین‌فت (FinFET) به‌حساب می‌آید. کاشی رمبو کش از لیتوگرافی «بهبودیافته‌ی» سوپرفین که جزئیات کاملش را دردسترس نداریم استفاده می‌کند. هنوز لیتوگرافی کاشی Xe Link I/O مشخص نشده، اما اینتل گفته که این کاشی توسط شرکتی خارجی تولید می‌شود. درنهایت آن‌طور که تیم آبی می‌گوید، برای تولید کاشی اصلی یعنی کاشی پردازشی، از دو نوع لیتوگرافی بهره گرفته خواهد شد که در نوع خود اتفاق عجیبی است. 

اینتل به‌صورت رسمی اعلام می‌کند که در آزمایشگاه‌هایش درحال کار روی پردازنده‌هایی از خانواده‌ی Xe HP با یک، دو و چهار کاشی است. استفاده از EMIB بدین معنی است که دو پردازنده‌ی گرافیکی آخر به‌ترتیب دو و چهار برابر پردازنده‌ی پایه ابعاد دارند؛ بنابراین لازم است در آن‌ها از سه سوکت مجزا استفاده شود. 

برای مشاهده‌ی تصویر بالا در ابعاد اصلی روی آن کلیک کنید

پردازنده‌ی گرافیکی چهار کاشی Xe HP که راجا کودروی در جلوی دوربین نشانش داد ظاهرا می‌تواند به ۴۲ ترافلاپس قدرت پردازشی FP32 دست پیدا کند؛ البته این عدد، حداکثر توانایی پردازنده‌ی گرافیکی اینتل نیست. کودوری در بخشی از سخنان خود مدعی شد این پردازنده‌ی گرافیکی قدرتمند می‌تواند به قدرت پردازشی در مقایس پتافلاپس دسترسی پیدا کند (به‌عبارتی دیگر، بیش از ۱٬۰۰۰ ترافلاپس). دستیابی به این هدف به‌لطف حضور هسته‌های تنسور (Tensor) ممکن می‌شود؛ البته فعلا پیکربندی دقیق هسته‌ها را در پردازنده‌ی گرافیکی اینتل نمی‌دانیم.

همچون معماری A100 انویدیا و معماری TPUv4 گوگل، Xe HP از هسته‌های تنسور پشتیبانی می‌کند. هنوز اطلاعاتی دقیق اعلام نشده اما حدس می‌زنیم این هسته‌ها می‌توانند به‌ازای هر سیکل، ۱۲۸ عملیات انجام دهند؛ به‌عبارتی، پردازنده‌ی گرافیکی اینتل به‌ازای واحد اجرایی شامل یک هسته‌ی تنسور خواهد بود. این یعنی اگر ۲٬۰۴۸ واحد اجرایی داشته باشیم، با حل کردن این معادله «۲۰۴۸x۱۲۸x۲» به جواب «۵۲۴٬۲۸۸» می‌رسیم. البته در این‌جا سرعت کلاک را لحاظ نکرده‌ایم. انتظار داریم برای یک پتافلاپس شاهد دستیابی به سرعت کلاک دو گیگاهرتز باشیم. شاید اینتل نوع دیگری از هسته‌های تنسور را استفاده کند که بتوانند به‌ازای هر سیکل، بیش از ۱۲۸ عملیات انجام دهند. در هر صورت به‌لطف چنین پردازنده‌ی توانمندی، ابررایانه‌ها ساده‌تر می‌‌توانند به قدرت پردازشی بسیار بالا دسترسی پیدا کنند.

تبلیغات
داغ‌ترین مطالب روز

نظرات

تبلیغات