معماری ناهمگن (HSA) چیست و چطور AMD با بهره‌گیری از آن به پیشرفت صنعت پردازش کمک خواهد کرد؟

دوشنبه ۲۲ مهر ۱۳۹۲ - ۲۳:۳۸
مطالعه 7 دقیقه
وقتی از اجرای یک نرم‌افزار صحبت می‌کنیم همیشه پردازنده‌های مختلفی وارد عمل می‌شوند. در گذشته CPU به تنهایی بار امور را به دوش می‌کشید و حالا کارت گرافیک هم بخش بزرگی از آن را تقبل می‌کند. اما رابطه‌ی بین پردازنده‌های مختلف بهینه نیست و عملکرد کلی سیستم با جابجایی حجم زیادی از داده‌های در حال پردازش همراه است که علاوه بر افزایش مصرف انرژی، عملکرد کلی را از حالت بهینه دور می‌کند. در این مقاله به بررسی HSA که یک راه حل جدی و مناسب برای این مسائل است می‌پردازیم.
تبلیغات

در سال‌های اخیر صنعت پردازش مثل هر زمان دیگری با چند مشکل جدی بوده و هست لذا هر کمپانی بزرگی که مایل به پیشرفت در این عرصه است، می‌بایست چند مشکل کلیدی را حل کند.

اولین مشکل کاهش مصرف انرژی است که در مورد هر پردازنده‌ای و برای هر وسیله‌ای مصداق دارد. دومین مورد قابلیت حمل است. کاربر وسیله‌ی کوچک‌تر و کم‌مصرف‌تر را ترجیح می‌دهد، حال ممکن است از تبلت، لپ‌تاپ یا گوشی استفاده نماید، حتی اگر از پی‌سی هم استفاده کند، کیس و مانیتور جمع‌و‌جور در شلوغی دنیای امروز دل‌پسندتر است. کمپانی‌های بزرگ هم برای خنک‌کاری و نگهداری پایگاه‌های اطلاعاتی خود هزینه‌ی زیادی صرف کرده و لذا از محصولاتی کم‌مصرف‌تر استقبال می‌کنند.

دومین موضوع افزایش قدرت پردازشی است تا بدین وسیله تجربه‌ی کاربری بهتری نصیب کاربر شود. کاربر به واسط کاربری اهمیت زیادی می‌دهد و واسطی با کاربرد ساده‌تر را می‌پسندد. به عنوان مثال استفاده از صدا و ژست‌های حرکتی برای استفاده از وسایل الکترونیکی یک روش طبیعی‌تر و ساده‌تر است که تدریجاً متداول شده و در آینده تکامل می‌یابد. از طرفی بیشتر کاربران حجم زیادی از اطلاعات مالتی‌مدیا مثل فیلم و عکس را نگه داشته و استفاده و مدیریت می‌کنند. همه‌ی این موارد به پردازنده‌های قوی‌تر نیاز دارد.

در نهایت مسأله‌ی نرم‌افزارهای عمومی و چند پلتفرمی است که می‌توان روی ابزارهای مختلف از آنها استفاده کرد. توسعه‌دهندگان نرم‌افزار می‌بایست نرم‌افزارها را برای وسایل مختلف عرضه کنند و لذا با توجه به متنوع‌تر شدن پلتفرم‌ها (هم سخت‌افزار و هم سیستم عامل) اوضاع برای توسعه‌دهندهگان نرم‌افزار پیچیده‌تر می‌شود.

با توجه به موارد فوق مشخص است که صنعت پردازش به یک روش جدید و بهینه‌تر نیاز دارد تا به کمک آن 4 عامل مهم و کلیدی بهینه‌تر شوند که عبارتند از: توان مصرفی، عملکرد، قابلیت برنامه‌نویسی و قابلیت حمل.

HSA چیست؟

Heterogeneous System Architecture در لغت به معنی معماری ناهمگون سیستم است. در گذشته وقتی از یک کامپیوتر صحبت می‌شد، تنها پردازنده‌ی اصلی بود که مسئولیت اجرای پردازش‌های عمومی و متنوع را قبول می‌کرد. اما حالا در یک کامپیوتر ساده و حتی یک گوشی و تبلت هم پردازنده‌های مختلفی وجود دارد که شاید مهم‌ترین آنها پردازنده‌ی گرافیکی است که در پی‌سی‌ها به شکل کارت گرافیک خودنمایی می‌کند.

پردازنده‌ی گرافیکی برای انجام محاسبات خاص مثل محاسبات گرافیکی به صورت موازی کاربرد دارد. پردازنده‌های گرافیکی به مرور زمان قدرتمندتر و عمومی‌تر شدند و حالا قادر به اجرای موازی محاسبات عمومی با مصرف انرژی مناسب هستند.

hsa-1

کارکرد جداگانه‌ی CPU و GPU یک مشکل جدی است

امروزه نرم‌افزارها به سمتی حرکت کرده‌اند که به پردازش موازی و سنگین‌تری نیاز دارند و گاهاً استفاده از توان پردازش موازی پردازنده‌ی گرافیکی برای انجام محاسبات عمومی اجتناب ناپذیر است.

اما یک مشکل جدی این است که در حال حاضر پردازنده‌ی اصلی و گرافیکی یا به اصطلاح CPU و GPU به صورت جداگانه طراحی شده و فعالیت می‌کنند و در نتیجه همکاری بهینه‌ای ندارند. هر یک از پردازنده‌ها به فضای حافظه‌ی خود نیاز دارد و نرم‌افزار می‌بایست مرتباً داده‌ها را از پردازنده‌ی اصلی به پردازنده‌ی گرافیکی و بالعکس کپی کند. یک مشکل دیگر نوشتن برنامه‌هایی است که قادر به استفاده از پردازنده‌ی گرافیکی جهت انجام محاسبات عمومی باشند. این مورد نیز یک چالش جدی است.

در حال حاضر برنامه‌ای که در صف پردازش‌های CPU قرار گرفته با استفاده از فراخوانی‌ها (یا System Call) برای پردازنده‌ی گرافیکی فعالیت می‌کند. فراخوانی از طریق درایور سخت‌افزار صورت گرفته و لذا یک صف زمان‌بندی جداگانه دارد. بنابراین تأخیر زیادی در آماده‌سازی دستورات پردازشی وجود داشته و نتیجه این شده که استفاده از پردازنده‌ی گرافیکی برای انجام محاسبات موازی و عمومی به شرطی مقرون به صرفه است که پردازش بسیار سنگین باشد. در واقع در نرم‌افزارهای معمول از پردازنده‌ی گرافیکی چندان استفاده‌ای نمی‌شود و CPU مسئول اجرای بیشتر فرآیندهاست. مشکل دیگر این است که برنامه‌ای که روی GPU اجرا شده خواهان کنترل مستقیم آیتم‌های کاری خود است، حال آیتم‌ها ممکن است به پردازنده‌ی اصلی مربوط شوند و یا خود پردازنده‌ی گرافیکی از آنها استفاده کند. امروزه این نحوه‌ی کار نیز غیر ممکن است.

HSA با ایجاد طراحی بهینه‌ی پردازنده مشکلات فوق را حل می‌کند

برای اینکه تمام قدرت پردازشی یک پردازنده‌ی موازی مورد استفاده قرار بگیرد، طراحان کامپیوتر باید طرز فکر خود را تغییر دهند. آنها می‌بایست سیستم‌های کامپیوتری را از نو طراحی کنند تا المان‌های مختلف پردازشی در قالب یک پردازنده‌ی مرکزی تکامل یافته در کنار هم مشغول کار شوند. از طرفی باید مسیر نرم‌افزارنویسی ساده‌ای در اختیار توسعه‌دهندگان نرم‌افزار قرار دهند تا برای تهیه‌ی نرم‌افزارهایی که از پردازنده‌ها به شکل بهینه استفاده می‌کنند، به تغییرات اساسی کدها نیازی نباشد. هدف اصلی طراحی جدید HSA همین دو مورد است.

با استفاده از HSA از تمام مزایا و توانمندی‌های عناصر پردازشی قابل برنامه‌ریزی که در کنار هم به صورت یکپارچه فعالیت می‌کنند، استفاده می‌شود. نرم‌افزارها قادر به ایجاد ساختارهای داده در یک بخش از فضای حافظه یکپارچه هستند و می‌توانند هر آیتم کاری را برای سخت‌افزاری که مناسبشان است، ایجاد کنند. اشتراک داده بین پردازنده‌ها به سادگی ارسال یک Pointer یا اشاره‌گر می‌شود. چند فعالیت پردازشی در کنار هم و به شکل منسجم روی یک ناحیه از حافظه قابل اجراست و لذا از اعمال حافظه‌ای مورد نیاز برای همگام‌سازی حافظه استفاده می‌شود. درست چیزی شبیه به آنچه امروز در پردازنده‌های چند هسته‌ای شاهد هستیم.

برنامه‌ی AMD برای HSA

تیم HSA در کمپانی AMD به بررسی کارایی الگوریتم تشخیص چهره‌ی Haar Face Detect پرداخته است، الگوریتمی چند مرحله‌ای برای بررسی یک ویدیو و تشخیص چهره‌های موجود. این تیم مقایسه‌ای بین یک CPU و GPU که با استفاده از OpenCL یا زبان محاسباتی متن‌باز به اجرای این فرآیند پرداخته‌اند و روش HSA انجام داده است. در روش HSA داده‌ها بین دو پردازنده‌ی مورد بحث بدون کپی کردن و استفاده‌ی سنگین از حافظه‌ی کش به اشتراک گذاشته می‌شود. لذا همان‌طور که قبلاً گفتیم، هر یک از پردازنده‌ها برای انجام کار متناسب با توان خود انتخاب شده و داده‌ی موردنیاز در اختیارشان قرار می‌گیرد. نتیجه‌ی مقایسه این بوده که سرعت کار 2.3 برابر شده و در عین حال توان مصرفی 2.4 برابر کاهش یافته است. سخت‌افزار مورد استفاده در این آزمایش به صورت زیر است:

• رم 4 گیگابایت، ویندوز 7 نسخه‌ی 64 بیتی

• پردازنده‌ی اصلی با پردازنده‌ی گرافیکی مجتمع A10 4600M، پردازنده‌ی گرافیکی HD 7660G با پشتیبانی از OpenCL 1.1

• پردازنده‌ی اصلی 4 هسته‌ای با سرعت کلاک 2.3 گیگاهرتز که در حالت توربو به 3.2 گیگاهرتز افزایش می‌یابد، سرعت کلاک پردازنده‌ی گرافیکی نیز 685 مگاهرتز است

این حجم کارایی با استفاده از یک پردازنده‌ی چند هسته‌ای یا یک پردازنده‌ی گرافیکی و حتی ترکیبی از این دو که با مدل درایوری امروزی کار می‌کنند، حاصل نمی‌شود. در ضمن در این آزمایش از افزونه‌های ساده‌ای برای ++C استفاده شده و هیچ مدل جدید برنامه‌نویسی به کار گرفته نشده است. لذا مشخص است که کارایی HSA به مراتب بیشتر از روش‌های امروزی است و جای کار بسیار دارد.

HSA چطور وارد صنعت پردازش می‌شود

برای عمومی شدن و استفاده‌ی گسترده از HSA نمی‌توان روی فعالیت‌های یک کمپانی خاص حساب کرد، هدف نهایی توسعه‌دهندگان نرم‌افزار این عبارت است: "یک بار بنویس، همه جا اجرا کن"، بنابراین باید نصب برنامه و استفاده از آن روی انواع پلتفرم و سخت‌افزار ممکن باشد. بنابراین بنیاد HSA یا HSAF ایجاد شد تا به عنوان یک استاندارد باز در صنعت پردازش، کمپانی‌های مختلف را گرد هم جمع کرده و هماهنگ کند.

در حال حاضر چندین کمپانی بزرگ و مشهور مثل AMD، آرم، ایمجینیشن تکنالوجیز، میدیاتک، تگزاس اینسترومنت، سامسونگ و کوآلکام هستند. تدریجاً سایر کمپانی‌های بزرگ نیز به این جمع اضافه می‌شوند.

hsa-3

بنیاد HSA به طراحان سیستم کمک می‌کند تا به شکلی از عناصر پردازنده مثل CPU و GPU استفاده کنند که ناکارآمدی اشتراک داده و ارسال آیتم‌های کاری بین این پردازنده‌ها برطرف شود. از طرفی یک لایه‌ی واسط در سطح پایین به شکل استاندارد به برنامه‌نویسی ساده‌تر برای معماری HSA کمک می‌کند که نام آن زبان میانی HSA یا HSAIL معرفی که برای استفاده‌ی نرم‌افزاری از سخت‌افزارهای مختلف کاربرد دارد. HSAIL یک هدف مشترک برای نرم‌افزارها و ابزارهای سطح پایین ایجاد می‌کند و به قدری منعطف و عمیق است که به هر سازنده‌ی سخت‌افزاری، اجازه‌ی هماهنگ شدن با سخت‌افزار خاص خود را می‌دهد. بنابراین زحمت هماهنگی نرم‌افزار با یک سخت‌افزار خاص از دوش برنامه‌نویس برداشته می‌شود و در واقع یک کد روی سیستم‌های مختلفی که دارای پردازنده‌ی اصلی و گرافیکی مختلف هستند، قابل اجرا خواهد بود.

hsa-4

HSA از دید نرم‌افزار پنهان است و برنامه‌نویسی را ساده می‌کند

یکی از موفقیت‌های بزرگ HSA ساده کردن فرآیند آماده‌سازی و اجرای نرم‌افزار روی سخت‌افزارهای مختلف یا به عبارت دیگر روی معماری HSA است. در گذشته برای هماهنگی و اجرای یک نرم‌افزار روی یک سخت‌افزار جدید باید نرم‌افزار تغییر می‌کرد و این روش چندان مناسب و راحت نبود. برای عمومی شدن یک نرم‌افزار می‌بایست مشارکت همه‌ی توسعه‌دهندگان و سازندگان سخت‌افزار ساده و امکان‌پذیر باشد.

روش HSA ساده است، سخت‌افزار را در اختیار برنامه‌نویس قرار می‌دهد. در واقع HSA شامل سخت‌افزار، واسط و زبان میانی مشترک و در نهایت اجزای زمان اجراست که تمام کارهای لازم را انجام می‌دهد. HSA هماهنگی حافظه را انجام داده و صفوف کاری را مدیریت می‌کند و پیچیدگی‌ها را از دید توسعه‌دهنده‌ی نرم‌افزار پنهان می‌نماید.

به کمک HSA، زبان برنامه‌نویسی و کتابخانه‌های آن، ابزاری ساده برای میلیون‌ها برنامه‌نویس فراهم می‌شود تا از کدهای خود برای سخت‌افزارهای مختلف و به شکل بهینه‌تری استفاده نمایند. کمپانی AMD به عنوان یکی از پرچم‌داران این عرصه، ابزارهای برنامه‌نویسی بهینه‌شده‌‌ی HSA را برای معمول‌ترین زبان‌های ناهمگون یعنی OpenCL و C++ AMP ارایه کرده است. AMD در ادامه‌کار با همکاری سایر اعضای بنیاد HSA در گسترش ابزارهای نرم‌افزارنویسی کوشش می‌کند و سایر زبان‌ها و کتابخانه‌ها را پوشش می‌دهد.

به نظر شما HSA در آینده تا چه حد موفق خواهد بود؟ آیا در کنسول‌های بازی نسل جدید که از پردازنده‌های AMD استفاده می‌کنند و نیز کامپیوترهای شخصی امروزی می‌توان موفقیت HSA را تجربه کرد و یا می‌بایست چند سالی صبر کنیم؟

تبلیغات
داغ‌ترین مطالب روز

نظرات

تبلیغات