بررسی عمیق تراشه 64 بیتی A7 اپل

شنبه ۱۸ آبان ۱۳۹۲ - ۲۳:۲۴
مطالعه 25 دقیقه
اپل در پردازنده جدید خود نشان داد که می‌تواند با همان 2 هسته همیشگی بازده بالاتری نسبت به پردازنده‌های 4 هسته‌ای بازار ارائه کند.
تبلیغات

A7 هم مثل اکثر سیستم-روی-یک-چیپ‌های بازار از معماری ARM بهره می‌برد، پس اپل نیز همچون سامسونگ، کوالکام، انویدیا و صدها شرکت دیگر گواهی استفاده از معماری آرم را دریافت کرده است.

اما همان طور که پیش‌تر در مقاله اختصاصی زومیت در باره ARM خواندید، دو نوع گواهی استفاده از معماری ARM وجود دارد. برخی از شرکت‌ها مانند سامسونگ یا انویدیا هم معماری کلی استفاده از ARM را اخذ می‌کنند و هم از معماری پیشنهادی ARM برای هسته‌ها استفاده می‌کنند و مثلا پردازنده خود را براساس معماری هسته Cortex A7 یا A15 یا A9 و غیره تولید می‌کنند.

حال برخی از کمپانی‌ها بخش مربوط به معماری هسته‌های اصلی را به همراه معماری پردازنده گرافیکی Mali را از آرم تهیه می‌کنند و برخی نیز گواهی استفاده از معماری هسته‌های آرم را تهیه کرده و سپس از GPU یا واحد پردازش گرافیکی دیگری در سیستم-روی-یک-چیپ خود بهره می‌برند. به عنوان مثال انویدیا از معماری هسته آرم (Cortex A9, A15 و غیره) در کنار گرافیک ساخت خود بهره می‌برد و سامسونگ نیز در پردازنده اُکتا از CPU با معماری Cortex-A15 به همراه هسته‌های گرافیکی طراحی شده توسط Imagination Technologies استفاده می‌‎‌کند.

اما حالت دیگری نیز وجود دارد که شرکت‌هایی همچون کوالکام یا اپل (از A6 به بعد) به سمت آن گرایش پیدا کرده‌اند. اپل یا کوالکام گواهی استفاده از معماری کلی شرکت آرم را تهیه می‌کنند ولیکن برای معماری هسته‌ها، خود وارد عمل شده و هسته‌ی سفارشی خاص خود را طراحی می‌کنند.

هسته‌های A6 اپل براساس معماری کلی ARMv7-ISA طراحی شدند و این هسته‌ها با نام رمز Swift شناخته شده‌اند. اپل با هسته‌های Swift یکی از بهینه‌ترین سیستم-روی-یک-چیپ‌های بازار را رونمایی کرد که از نظر قدرت و مصرف باتری نسبت به A5 که براساس معماری Cortex-A9 ساخته شده بود، بسیار بهتر عمل می‌کرد. A6 در واقع ترکیبی از بازده بالا و مصرف انرژی پایین بود و در محصول موفقی همچون آیفون 5 بکار گرفته شد.

در زمان معرفی A6 اپل توانست عملکرد بهتری نسبت به هسته‌های طراحی شده کوالکام در آن زمان ارائه کند، اما کوالکام آرام ننشست و با معرفی هسته‌های اختصاصی خود با نام‌های Krait 300 و Krait 400 که به ترتیب در پردازنده‌های موفق Snapdragon S600 و Snapdragion 800 بکار گرفته شده، مجدداً رهبری بازار SoCها را بدست گرفت و توانست عملکرد بهتری را نسبت به A6 ارایه کند. S600 در گوشی‌های رده اولی همچون HTC One و گلکسی اس 4 به کار گرفته شده و S800 نیز در پرچم‌دارانی مثل Xperia Z1، LG G2 و گلکسی نوت 3 دیده می‌شود. حالا و پس از گذشت 12 ماه، اپل یک SoC دیگر به نام A7 را رونمایی کرده که در بیشتر بنچمارک‌ها مطلقا بی‌رقیب است!

هنوز اپل به طور رسمی اطلاعات مربوط به سیستم-روی-یک-چیپ جدید خود را منتشر ننموده، اما از آنجایی که این محصول به دست مهندسین AnandTech افتاده، آنها توانسته‌اند بررسی نسبتاً جامعی روی آن انجام دهند و در نهایت نتایج جالبی به دست آمده است.

A7 از لیتوگرافی 28 نانومتری HK+MG سامسونگ بهره می‌برد. این بدین معناست که طراحی کلی تراشه توسط اپل و براساس معماری ARMv7 انجام شده، سپس طرح‌ها در اختیار سامسونگ قرار گرفته تا نسبت به تولید A7 اقدام کند. پس در این بین سامسونگ تراشه A7 اپل را بدون هیچ دخالتی، تولید کرده است. پیش از این شایعه شده بود که A7 از فرایند ساخت 20 نانومتری بهره خواهد برد اما براساس اطلاعات بدست آمده، شرکت TSMC که شریک تجاری جدید اپل است و قرار است به مرور جایگزین سامسونگ شود، هنوز برای ساخت SoC با لیتوگرافی 20 نانومتری آماده نیست و به همین دلیل اپل از لیتوگرافی 28 نانومتری برای A7 بهره برده است و تولید آن را به سامسونگ واگذار کرده است.

لیتوگرافی 28 نانومتری برای A7 از نظر تئوری نسبت به لیتوگرافی 32 نانومتری، گرمای کمتری تولید می‌کند و از نظر ابعاد نیز یک تراشه یکسان با لیتوگرافی 28 نانومتری، نزدیک به 76.5 درصد ابعاد همان تراشه با لیتوگرافی 32 نانومتری را دارد. البته این تخمین به صورت تئوری زده شده و در عمل نمی‌توان همه چیز را به این خوبی کوچک کرد، بنابراین نتیجه‌ی 80 تا 85 درصدی معقول‌تر است.

اپل در کنفرانس معرفی iPhone 5s اعلام کرد که ابعاد تراشه A7 این شرکت 102 میلی‌متر مربع بوده و در آن بیش از 1 میلیارد ترانزیستور جا شده است. اما آنها اطلاعات بیشتری در معماری داخلی A7 بیان نکردند و باید چند روز دیگری برای کسب اطلاعات بیشتر صبر کرد.

به هر حال براساس صحبت‌های اپل در رابطه با تعداد 1 میلیارد ترانزیستور می‌توان متوجه شد که A7 نزدیک به 2 برابر ترانزیستورهای A6 را در خود جای داده است. این بدین معناست که لیتوگرافی 28 نانومتری و احتمالاً معماری متفاوت باعث شده تا علاوه بر کوچک شدن تراشه A7، ترانزیستورهای بیشتری نیز روی آن جا بگیرند و نهایتاً قدرت و بازده به مراتب بالاتری را ارائه کند.

هسته‌های بیشتر و فرکانس بالاتر به معنی قدرت و بازده بیشتر نیست!

نکته جالب توجه دیگر در سیستم-روی-یک-چیپ A7 مربوط به فرکانس کاری 2 هسته‌ی آن است؛ این پردازنده با فرکانس 1.29 گیگاهرتز کار می‌کند که خود شگفت انگیز است. چون این پردازنده 1.29 گیگاهرتزی بهتر از پردازنده پرقدرت S800 با 4 هسته 2.3 گیگاهرتز عمل می‌کند.

همانطور که پیش‌تر نیز اشاره کردیم، بخش CPU در A7 دارای هسته‌‌‌های سفارشی خود اپل است. این هسته‌ها احتمالاً شباهت‌هایی با معماری Cortex A57 شرکت آرم دارند اما هنوز برای صحبت کردن در این باره کمی زود است. به هر حال اپل باز هم معماری Swift را بهینه‌تر کرده و برای طراحی هسته‌های سفارشی A7 از آن استفاده نموده است.

انند از وب سایت AnandTech معتقد است که گذار از 2 هسته به 4 هسته در پردازنده‌های موبایل سریع‌تر از آنچه انتظار می‌رفت، رخ داده است. خوشبختانه نرم افزارهایی وجود دارند که قادر به استفاده‌ی بهینه از 2 هسته و بیشتر بوده و از تمام توان آنها برای اجرای دستورات مورد نظر کاربر بهره می‌برند. اما همان‌طور که مثلاً در تلفن Moto X شاهد بودیم، دو هسته پردازنده این تلفن، به خوبی از پس اجرای سریع امور مختلف بر می‌آید و به دلیل استفاده از فرکانس پایین و هسته‌های کمتر مصرف باتری آن بسیار بهینه‌است. البته پردازنده‌های 4 هسته‌ای امروزی نیز به کمک کاهش توان مصرفی هسته‌های بی‌کار، به خوبی مصرف انرژی را مدیریت می‌کنند و مشکل زیادی ندارند.

انویدیا همه را مجبور کرد تا نسبت به ساخت تراشه 4 هسته‌ای گام بردارند، شاید کوالکام و دیگر تولیدکنندگان برنامه‌ریزی متفاوتی داشتند و تراشه‌های 4 هسته‌ای را برای مدتی بعد در برنامه‌ی خود داشتند ولیکن رونمایی زودهنگام از تگرا 3 باعث شد تا همه مجبور شوند، هر چه سریع‌تر نسبت به ساخت SoCهایی با حداقل 4 هسته اقدام کنید.

متأسفانه بسیاری از بازارهای جهانی، بیش از قدرت هسته‌ها و بازدهی آن به تعداد هسته‌ها پرداخته‌اند و مشتریان هم به دنبال اعداد و ارقام بالاتر برای فرکانس کاری پردازنده و تعداد هسته‌ها هستند. این دقیقاً همان دلیلی است که امروز گجت‌های چینی به پردازنده‌های ارزان قیمت 4 هسته‌ای از نوع Cortex A5 یا Cortex A7 مجهز می‌شوند. این پردازنده‌ها شاید در عمل از یک SoC تک هسته‌ای از نوع Cortex A15 ضعیف‌تر باشند، اما کاربران تمایل بیشتری نسبت به خرید ابزارهای مبتنی بر آنها نشان می‌دهند. به هر حال اپل بار دیگر با معرفی A7 نشان داد که فرکانس بالاتر و تعداد هسته بیشتر لزوماً به معنی قدرت و بازده بالاتر نیست.

اپل باز هم 2 هسته‌ی قدرتمند با فرکانس بهینه را انتخاب کرده است

بهتر است به گفته‌های کمپانی آرم استناد کنیم: «فرکانس بهینه برای هسته‌های Cortex A15 در یک گوشی هوشمند، 1.2 گیگاهرتز است». در حال حاضر سامسونگ در تراشه‌ی اکسینوس 5410 خود از هسته‌های 1.6 گیگاهرتز استفاده می‌کند و در 5420 که قلب تپنده‌ی گلکسی نوت 3 است، فرکانس بیشینه‌ی 1.7 گیگاهرتز را انتخاب کرده است. رابطه‌ی بین فرکانس کاری و توان در یک تراشه‌ حدوداً یک رابطه‌ی مجذوری است به این معنی که که برای فرکانس بیشتر به ولتاژ بالاتر نیاز داریم و ولتاژ 2 برابر، توان مصرفی 4 برابر را به دنبال دارد.

اپل در A7 هم مثل A6 از فرکانس ماکسیمم 1.29 گیگاهرتز استفاده کرده است، یعنی سرعتی مشابه فرکانس حالت پایه در سیستم-روی-یک-چیپ‌های جدید اینتل با نام Bay Trail. با اجرای نرم‌افزارهای مختلف و قرائت فرکانس 2 هسته‌ی اصلی، همیشه فرکانس ماکسیسمم 1.3گیگاهرتز است.

در مورد تعداد هسته‌ها هم اطمینان داریم که تنها 2 هسته‌ی اصلی در A7 وجود دارد و 2 ترد پردازشی را اجرا می‌کنند. در بنچ‌مارک Geekbench 3، تراشه‌ی A7 هم در محاسبات تک‌هسته‌ای و هم در محاسبات چند هسته‌ای رکوردها را شکسته است. با توجه به نتایج مشخص است که در حالت Multi Thread قدرت پردازشی حدود 2 برابر بوده و با یک تراشه‌ی 2 هسته‌ای سر وکار داریم.

همان‌طور که گفته شد عملکرد هسته‌های جدید نسبت به آنچه در A6 یا A6X تجربه کرده بودیم، بالاتر است. اما نام هسته‌های جدید چیست؟ آیا اپل باز هم از عنوان Swift استفاده می‌کند؟ پاسخ منفی است. Cyclone به معنای گردباد نام هسته‌های جدید است. در کنار هسته‌های پردازنده‌ی اصلی یک پردازنده‌ی دیگر هم وجود دارد که برای محاسبات مربوط به حرکات در نظر گرفته شده است. اگر یادتان باشد اپل هنگام رونمایی از آیفون جدید علاوه بر A7 به M7 اشاره کرده بود که نام همین پردازنده است. M7 نیز هسته‌ای به نام Oscar دارد.

آیا 2 هسته‌ی سایکلون واقعاً گردباد ایجاد می‌کنند؟

سایکلون یک هسته‌ی کاملاً جدید نیست بلکه بر اساس سویفت شکل گرفته و طراحی شده است. احتمالاً تبادل داده و به عبارت دیگر پهنای مرز ارتباطی 3 برابر شده و تعداد درگاه‌های اجرایی بین 5 تا 7 برابر بیشتر است. با توجه به عملکرد بسیار خوب تراشه‌ی جدید اپل، احتمالاً اجرای خارج از نوبت دستورات نیز پشتیبانی می‌شود.

سایکلون از لحاظ معماری بر اساس هسته‌های 64 بیتی ARMv8 طراحی شده و لذا معماری مجموعه دستورات یا ISA حاصل کار اپل نیست. اما به هر حال A7 از تمام رقبای خود در گوشی‌های هوشمند سریع‌تر است و حتی مدل‌های مخصوص سرور آرم نیز توان رقابت با آن را ندارند.

استفاده از ARMv8 مزایای خاصی دارد. رجیسترهای بیشتر، معماری مجموعه دستورات بهتر، اکستنشن‌های بهینه‌تر برای دستورات چند داده‌ای (یا SIMD) و عملکرد بالاتر در این نوع دستورات و در نهایت شتاب‌دهی‌های مختلف، همگی در فهرست مزایا قرار دارند.

احتمالاً طول پایپ‌لاین یا کانال اطلاعات تغییری نکرده و حتی کمی افزایش یافته چرا که فرکانس کاری تغییری نکرده است. A7 از هیچ افزایش سرعتی که دمای بالاتری به دنبال دارد، پشتیبانی نمی‌کند.

بزرگ‌ترین تغییری که در اولین تراشه‌ی مبتنی بر ARMv8 اپل شاهد هستیم، 2 برابر شدن حافظه‌ی کش سطح 1 است، کش L1 برای دستور و داده‌ها به ترتیب 64 و 64 کیلوبایت فضا دارد در حالی که قبلاً از 32 و 32 کیلوبایت استفاده می‌شد. تغییر دیگر زمان دسترسی به کش است که از 2 سیکل کلاک به 3 سیکل کلاک افزایش یافته است و احتمالاً یکی از دلایل آن افزایش دفعات استفاده از کش و دسترسی به آن است. چنین کش بزرگی بیشتر در معماری‌های کمپانی AMD دیده می‌شود و در گوشی‌های هوشمند رده اول کم‌سابقه است. کش سطح 1 بزرگ‌تر در آماده نگه داشتن دستورات و داده‌ها برای انجام محاسبات، مفید واقع می‌شود و نشان از وجود هسته‌های پردازشی قوی‌تر دارد.

کنترلر حافظه‌ی تراشه‌ی A7 نیز بسیار بهینه شده به طوری که زمان تأخیر در دستری به حافظه، نسبت به A6 اپل حدود 20 درصد کاهش پیدا کرده است. پیش‌گویی کننده‌ی شاخه‌ها و پیش‌فراخوان‌های حافظه در A7 به مراتب بهتر عمل می‌کنند.

در نهایت بیشینه‌ی پهنای باند حافظه است که در A7 نسبت به A6 افزایش یافته است که توسط بنچ‌مارک‌های مختلف و از جمله Geekbench 3 می‌توان به آن پی برد. افزایش پهنای باند در تست‌های مختلف بین 6 تا 58 درصد است.

البته ممکن است این بنچمارک تنها پهنای باند حافظه را اندازه نگیرند و محاسبات اضافی دیگری نیز در نتایج دخیل شوند. در اجرای برخی کدهای خاص، پهنای باند حافظه رکورد 2 برابری هم ثبت کرده است که با توجه به بهینه‌سازی‌های انجام شده در مورد کش و واسط حافظه چندان غیر طبیعی به نظر نمی‌رسد.

علاوه بر عملکرد بالاتر حافظه و واسط آن، هسته‌ها نیز توانمندتر از A6 هستند، به نتایج Geekbench نگاهی داشته باشیم:

در محاسبات اعداد صحیح یا Integer چه به صورت تک‌‌نخی یا ST و چه به صورت چندنخی یا MT تا 42 درصد افزایش سرعت دیده می‌شود. در محاسبات اعداد ممیز شناور یا FP نیز در حالت تک‌نخی و چندنخی افزایش سرعت 67 درصد است. البته هنوز از توانمندی‌های خاصی که در یک پردازنده‌ی 64 بیتی انتظار می‌رود، صحبت نکردیم و در واقع نتایج مربوط به حالت 32 بیتی است. واسط حافظه پهنای 64 بیت دارد و احتمالاً از حافظه‌ی LPDDR3 با فرکانس بالاتر استفاده شده است.

در حقیقت مجموعه‌ی نتایج گواه این مطلب است که قدرت پردازشی A7 در زمره‌ی پردازنده‌های دستاپ قرار می‌گیرد.

چرایی مهاجرت اپل به سمت معماری 64 بیتی

قبل از عرضه‌ی آیفون 5S شایعاتی در مورد تراشه‌ی A7 و حرکت اپل به سمت معماری 64 بیتی شنیده می‌شد. در ابتدا با توجه به اینکه هیچ یک از رقبا چنین کاری نکرده بود و دردسرهای زیادی داشت، به نظر می‌رسید که همه‌ی شایعات دروغی بیش نیست اما با رونمایی رسمی از آیفون، شایعات رنگ حقیقت گرفتند.

در دنیای پی‌سی معماری 64 بیتی چندان بیگانه نیست چرا که ای‌ام‌دی از اواسط سال 2000 پردازنده‌هایی با معماری 64 بیت عرضه کرده بود. در آن زمان علت اصلی مهاجرت به معماری 64 بیتی، پشتیبانی از آدرس‌دهی گسترده‌تر حافظه بود. در معماری 32 بیتی می‌توان 2 به توان 32 خانه‌ی حافظه را آدرس‌دهی کرد که همان 4 گیگابایت معروف است ولیکن در معماری 64 بیتی می‌توان 2 به توان 64 بیت یا به عبارتی 16 اگزابایت را آدرس‌دهی کرد که رقمی فوق‌العاده است. بنابراین برای استفاده از رم‌های بیش از 4 گیگابایت، ویندوز 64 بیتی کاملاً متداول شده است.

اما در عمل ای‌ام‌دی تنها از 48 بیت برای آدرس‌دهی استفاده کرد و به عبارتی 2 به توان 48 خانه‌ی حافظه یکتا که معادل 256 ترابایت است، آدرس‌دهی می‌شود که شاید هیچ محدودیت خاصی به حساب نیاید.

مسأله‌ی دیگر بهبود پردازش است. در معماری 64 بیتی رجیسترهای بیشتری قابل استفاده است و لذا x64 نسبت به x86 یا معماری 32 بیتی، بهینه‌تر است.

در دنیای پردازنده‌های گوشی و تبلت که بیشتر مبتنی بر طرح‌های کمپانی ARM هستند نیز با توجه به دلایل مطرح شده، تمایل به استفاده از معماری 64 بیتی حس می‌شد. آرم و شرکای بزرگش به فکر بازار سرورها هستند، بازاری که اینتل در آن حاکم شده و سود زیادی به دست می‌آورد. اما مشکل اصلی اینجاست که برای یک سرور، آدرس‌دهی مقدار زیادی حافظه و در واقع داشتن معماری 64 بیتی الزامی است. بنابراین چند ماه قبل در مورد رونمایی از اولین معماری‌های 64 بیتی آرم شنیدیم و دو هسته‌ی Cortex A53 و A57 برای محصولات مختلف معرفی شدند. معماری مجموعه دستورات با همان عنوان ARMv8 شناخته می‌شوند که جانشین نسخه‌ی 32 بیتی فعلی یعنی ARMv7 است.

یکی از مسائلی که رقبای اپل و از جمله کوآلکام به آن اشاره کرده‌اند، حافظه‌ی کم آیفون و آیپدهای جدید است. همان‌طور که گفته شد، در معماری 64 بیتی، آدرس‌دهی گسترده‌تری وجود دارد ولیکن اپل حافظه‌ی بالایی در محصولات خود قرار نداده و لذا هدف اصلی اپل، استفاده از سایر مزایای معماری 64 بیتی بوده است. استفاده از A64 هم مثل استفاده از x86-64 در پی‌سی‌ها به افزایش تعداد رجیسترهای همه‌منظوره منجر می‌شود. در معماری مجموعه دستورات ARMv7 به ازای هر شمارنده‌ی برنامه یا Program Counter از 1 رجیستر یا ثبات استفاده می‌شود ولیکن در ARMv8 یا اصطلاحاً A64 از 31 رجیستر استفاده شده که هر یک پهنایی برابر با 64 بیت دارند. همواره دسترسی به تمام 31 رجیستر وجود دارد.

نمودار زیر حافظه‌ی به کار رفته در آیفون‌ها و آیپدهای اپل را نمایش می‌دهد و مشخص است که در آینده، بالاخره حافظه‌ی این محصولات به بیش از 4 گیگابایت خواهد رسید.

افزایش تعداد رجیسترها در یک معماری منجر به کاهش فشار روی رجیسترها و در نتیجه افزایش عملکرد می‌شود. به عنوان مثال در دنیای پی‌سی استفاده از معماری 64 بیتی یا به عبارتی x86-64 باعث 2 برابر شدن تعداد رجیسترها شده و عملکرد کلی حدود 10 درصد افزایش یافته است.

استفاده از معماری 64 بیتی در تعداد رجیسترهای ممیز شناور یا NEON نیز موثر است. این دسته از رجیسترها در انجام محاسبات اعداد اعشاری و کدهای NEON کاربرد دارند. کدهای NEON برای انجام پردازش‌های خاصی مثل مالتی‌مدیا و کدک‌های صوتی تصویری و پردازش سیگنال و مانند آن، روی سخت‌افزار مناسب اجرا شده و از رجیسترهای ویژه‌ای استفاده می‌کنند و در نهایت عملکرد تراشه در انجام چنین محاسباتی افزایش می‌یابد. تعداد رجیسترهای ممیز شناوری و NEON در معماری 64 بیتی، 32 عدد است که دو برابر ARMv7 می‌باشد.

علاوه بر افزایش تعداد رجیسترها، هر رجیستر به جای 64 بیت از 128 بیت خانه‌ی حافظه برخوردار است. پشتیبانی از رجیسترهای 128 بیتی در افزایش عملکرد SIMD یا دستورات چند داده‌ای، بسیار موثر است. علاوه بر این افزایش تعداد رجیسترها نیز عملکرد کلی را افزایش می‌دهد ولیکن بسته به نوع پردازش، تأثیر دو برابر شدن اندازه‌ی هر رجیستر، به مراتب بیشتر است. در نهایت یک نوع SIMD پیشرفته نیز در ARMv8 وجود دارد و آن محاسبات ریاضی ممیز شناوری با دقت دو برابر یا به صورت خلاصه Double precision SIMD FP است.

در معماری مجموعه دستورات ARMv8 چندین دستور جدید برای پشتیبانی از شتاب‌دهی سخت‌افزاری الگوریتم‌های AES، SHA1 و SHA256 وجود دارد. این دستورات سخت‌افزاری AES . SHA پتانسیل بالایی برای افزایش عملکرد دارند. درست مثل دستورات AES-NI در پردازنده‌های اینتل که چند سال پیش عرضه شدند. در حقیقت دستورات جدید ممیز شناوری با دقت دو برابر و نیز شتاب‌دهی سخت‌افزاری، موج جدیدی از نرم‌افزارهای سیستم عامل iOS را به دنبال خواهند داشت.

دیگر نمی‌توان از اپلیکیشن‌های قدیمی و 32 بیتی استفاده کرد؟

پاسخ کوتاه به این سوال این است که تقریباً هیچ مشکلی وجود ندارد و نرم‌افزارهای قدیمی قابل استفاده است.

در دنیای پی‌سی، مهاجرت به معماری 64 بیتی با اضافه کردن الحاقاتی به مجموعه دستورات 32 بیتی قبلی امکان‌پذیر شد ولیکن در دنیای آرم به معماری جدیدی برای مجموعه دستورات نیاز است. مجموعه دستورات جدید آرم را A64 می‌گویند و دستورات 32 بیتی قبلی که تا حد زیادی با معماری جدید سازگار است نیز A32 نام دارد. هر دو مجموعه دستورات را می‌توان در یک تراشه به کار گرفت کرد چرا که ARMv8 دو حالت معماری دارد، AArch32 و AArch64. تراشه‌هایی که هر دو حالت را به کار ببرند، قادر به تغییر حالت بوده و بسته به شرایط می‌توانند از حالت مناسب استفاده کنند.

بنابراین علی‌رغم جدید و متفاوت بودن A64، اجرای کدهای قدیمی 32 بیتی روی آن با مشکل خاصی روبرو نمی‌شود. به هر حال اپل با تغییرات ناگهانی بیگانه نیست و لذا این تغییر معماری دور از انتظار نبود. سایر شرکای آرم از سال آتی به سمت استفاده از ARMv8 حرکت می‌کنند.

با استفاده از نافعال کردن بیت‌های اضافی، تعداد زیادی از دستورات A64 قادر به استفاده از عمل‌وندهای 32 بیتی هستند. استفاده از A32 در معماری مجموعه دستورات ARMv8 با دستورات جدیدی همراه است. بنابراین می‌توان نرم‌افزارهای AArch32 را در ARMv8 کامپایل کرد ولیکن نتیجه‌ی کامپایل، اپلیکیشنی است که با نسخه‌های قبلی معماری، سازگار نیست. اما بر عکس این عمل یعنی اجرای کدهایی که برای معماری قدیمی‌تر و 32 بیتی ARMv7 نوشته شده بودند با مشکل خاصی روبرو نمی‌شود.

از منظر نرم‌افزاری تمام نرم‌افزارهای اصلی iOS 7 و خود سیستم عامل همگی به صورت 64 بیتی کامپایل شده و به عبارتی برای AArch64 حاضر شده‌اند. در واقع اگر آیفون 5s را راه‌اندازی کنیم و وارد سیستم عامل شویم، هیچ پردازشی برای معماری 32 بیتی اجرا نمی‌شود و همگی مبتنی بر arm64 هستند.

مرورگر Safari، نرم‌افزار Mail و تمام نرم‌افزارهای دیگر برای معماری 64 بیتی بهینه شده‌اند. در حقیقت تنها سخت‌افزار نیست که برای اجرای دستورات 64 بیتی آمادگی دارد، نرم‌افزارهای اصلی و البته محبوب و پرکاربرد iOS 7 برای معماری 64 بیتی کامپایل شده‌اند. این هم نمونه‌ی دیگری از مزیت یکپارچگی عمودی محصولات اپل است که معمولاً در صنعت وسایل الکترونیکی به آن اشاره می‌شود، درست مثل استفاده از صفحه نمایش رتینا به همراه معرفی سیستم عامل OS X که باز هم نوعی یکپارچگی عمودی است.

اجرای نرم‌افزارهای 32 بیتی و 64 بیتی به موازات هم نیز کاملاً عادی است. هنگام استفاده از گوشی نمی‌توان گفت که محیط اجرای نرم‌افزارها، ترکیبی از حالت 32 بیتی و 64 بیتی است یا فقط نرم‌افزارهای 64 بیتی مشغول فعالیت هستند. همه چیز کاملاً عادی است و نرم‌افزارهای 32 و 64 بیتی در کنار هم اجرا می‌شوند.

به نظر می‌رسد که هیچ مشکلی در اجرا و استفاده از نرم‌افزارهای قدیمی 32 بیتی که برای معماری مجموعه دستورات ARMv7 طراحی شده بودند، وجود ندارد. در واقع اینطور می‌توان استنباط کرد که برای یک کاربر عادی، مهاجرت به سیستم عامل و سخت‌افزار 64 بیتی به سادگی خرید گوشی آیفون 5s است.

افزایش عملکرد به خاطر استفاده از معماری 64 بیتی

Geekbench یکی از اولین بنچ‌مارک‌هایی است که برای پشتیبانی از معماری 64 بیتی ARMv8 به روز شده است. تغییرات کوچکی در نسخه‌ی 3.1 این نرم‌افزار نسبت به نسخه‌ی 3.0 دیده می‌شود ولیکن آزمون‌های آن به غیر از آزمون حافظه، تغییری نکرده است. بنابراین می‌توان تأثیر دستورات 64 بیتی ARMv8 و دو برابر شدن تعداد رجیسترها را عملاً بررسی کرد. به عملکرد تراشه‌ی جدید در انجام محاسبات روی اعداد صحیح نگاهی بیاندازیم و تفاوت حالت 32 و 64 بیتی یا به عبارت دیگر A32 و A64 را بررسی کنیم:

تغییر 825 و 245 درصدی در سرعت اجرای الگوریتم‌های AES و SHA مستقیماً به خاطر استفاده از دستورات جدیدی است که در معماری مجموعه دستورات ARMv8 وجود دارد. در دنیای پی‌سی هم معرفی پردازنده‌های Westmere اینتل با پشتیبانی از دستورات AES-NI چنین تغییر بزرگی ایجاد کرد. تنها مشکلی که در نتایج فوق دیده می‌شود، محاسبات Dijkstra است که در آن عملکرد کاهش یافته است. علت این است که تغییر اندازه‌ی اشاره‌گر یا Pointer از 32 بیت به 64 بیت، فشار روی حافظه‌ی کش را بیشتر کرده و عملکرد کاهش یافته است.

ضمناً تغییرات فوق ممکن است کوچک به نظر برسند اما باید این نکته را هم در نظر گرفت که افزایش عملکرد تراشه‌ی جدید A7 نسبت به A6 نیز به ارقام فوق اضافه می‌شود و لذا محصولات جدید، سرعتی به مراتب بیشتر دارند.

محاسبات اعداد صحیح پیشرفت خوبی داشته اما محاسبات اعداد ممیز شناور باز هم بهتر است:

توجه کنید که اعمال DGEMM در ARMv7 پشتیبانی نمی‌شوند اما در ARMv8 با توجه به پشتیبانی از دستورات روی اعدادی با دقت دو برابر، افزایش کارایی بسیار زیاد است. پردازش SFFT که یک تبدیل سریع فوریه است و برای کاربردهایی مثل محاسبه‌ی اندازه‌ی فرکانس‌های مختلف در استریم موسیقی جهت رسم نمودار گرافیکی ستون‌های صدا استفاده می‌شود نیز به لطف دو برابر شدن فضای رجیسترها، پیشرفت قابل ملاحظه‌ای کرده است. منظور از نمودار ستون‌های صدا، ترسیمه‌ای با عنوان Spectrum یا چیزی شبیه به آن در پلیرهای صوتی و تصویری است.

در روش 64 بیتی تعداد دستورات بارگذاری و ذخیره‌سازی حدود 30 درصد کمتر از حالت 32 بیتی است و همین موضوع عملکرد را افزایش می‌دهد.

تراشه‌ی A7 و رابطه‌ی آن با سیستم عامل OS X

چند سال پیش رابطه‌ی اپل و اینتل به دلایل مختلف تیره و تار شد و همیشه این احتمال وجود داشته که در نهایت، اپل شخصاً تراشه‌های مک‌بوک‌ها را طراحی کند و از پردازنده‌های اینتلی بهره نگیرد. اما فعلاً رابطه‌ی اپل و اینتل در عرصه‌ی کامپیوترها بد نیست و فعلاً از تراشه‌های اینتلی بهره می‌برد. از طرف دیگر قدرت پردازشی پردازنده‌های فعلی اینتل که خانواده‌ی هسول است، بسیار بالاتر از تراشه‌هایی نظیر A7 است و فعلاً نمی‌توان روی قدرت A7 به عنوان قلب تپینده‌ی یک مک سریع، حساب باز کرد.

در مجموع فعلاً برای ظهور یک تراشه‌ی اپلی که سیستم عامل OS X را روی یک مک اجرا کند، بسیار زود است و باید چند سال دیگر هم صبر کرد تا شاید اپل سیستم عامل وسایل همراه و مک‌بوک‌های خود را یکسان کند.

بررسی تراشه‌ی A7 توسط بنچ‌مارک‌های عمومی

پلتفرم اندرویدی‌ها و تراشه‌های مرتبط با آن به کلی با iOS و تراشه‌ی A7 که در آیفون 5s به کار رفته متفاوت است ولیکن بنچ‌مارک‌هایی مستقل از سیستم عامل وجود دارد که به کمک آن می‌توان عملکرد تراشه‌های مختلف را مقایسه کرد. به این منظور ترکیبی از بنچ‌مارک‌های مربوط به اجرای جاوااسکریپت و HTML5 را روی وسایل مختلف اجرا کرده و عملکرد تراشه‌ها را بررسی می‌کنیم.

رقبای اصلی تراشه‌ی A7 را تراشه‌های S800 کوآلکام که مدل دقیق آن MSM8974 Snapdragon 800 است و Atom Z3770 که در تبلت طراحی شده توسط اینتل به عنوان طراحی مرجع یا FFRD قرار دارد، تشکیل می‌دهند. تفاوت بین توان مصرفی A7 و رقبا چندان زیاد نیست ولی فاصله‌ی کوچکی وجود دارد. توجه کنید که منظور از MSM8974 Snapdragon 800 MDP/T تراشه‌ای است که در تبلت خاصی که کوآلکام برای نمایش قدرت S800 رونمایی کرده، به کار رفته است و از نظر کارایی و احتمالاً توان مصرفی، کمی بالاتر از سایر محصولات بازار قرار می‌گیرد.

در بسیاری از بنچ‌مارک‌ها نتایج کسب شده توسط A7 نسبت به دو رقیب اصلی خود بهتر است. علاوه بر این با توجه به عملکرد A7 می‌توان تخمینی از عملکرد آیپدهای جدید داشت.

اولین بنچ‌مارک SunSpider است که کدهای جاوااسکریپ را در مرورگر اجرا می‌کند و این روزها سازندگان نرم‌افزار و سخت‌افزار سعی می‌کنند محصولاتشان را برای این بنچ‌مارک کوچک و سبک، بهینه کنند. به هر حال این آزمون معیاری از بهینه بودن مجموعه‌ی حافظه است.

اینتل برای مدت کوتاهی در این آزمون صدرنشین بود و حالا جای خود را به تراشه‌‌ی دو هسته‌ای A7 می‌دهد. A7 حدود 75 درصد سریع‌تر از تراشه‌ی به کار رفته در آیفون 5 است و رقیب کوآلکامی خود یعنی S800 را به راحتی مغلوب کرده است. البته ناگفته نماند که اگر Bay Trail اینتل در مرورگر جدید IE11 فعالیت کند، نتیجه 329.6 میلی‌ثانیه می‌شود که نسبت به A7 سریع‌تر است و همچنان اینتل را در صدر نگه می‌دارد.

بنچ‌مارک سنگین‌تر Kraken در اجرای جاوااسکریپت نتایج واقعی‌تری دارد چرا که الگوریتم‌ها گسترده‌تر و بیشتر هستند و نیز کمتر شناخته شده است و لذا احتمال بهینه‌سازی سخت‌افزار برای این آزمون کمتر می‌شود.

باز هم اینتل صدرنشین است و S800 و هسته‌های Cortex A15 در فرکانس کاری بیشینه‌ی خود نیز از رقیب اپلی عقب مانده‌اند. عملکرد A7 به تراشه‌ی Atom Z3740 اینتل قرابت بیشتری دارد. در واقع منطقی به نظر می‌رسد که A7 با سرعت کلاک 1.4 گیگاهرتز در برابر یک Bay Trail رده متوسط که سرعت مشابهی دارد، قرار بگیرد. A7 نسبت به تراشه‌ی آیفون قبلی حدود 2.3 سریع‌تر ظاهر شده است.

آزمون بعدی Google Octane است که باز هم به اجرای جاوااسکریپت می‌پردازد. برتری با محصولاتی است که قادر به اجرای مرورگر گوگل کروم باشند چرا که هدف موتور اجرایی جاوااسکریپت V8 است. بنابراین آیفون 5s فاقد این مزیت خواهد بود.

باز هم اینتل صدرنشین است. با رونمایی از آیپد 5 باید منتظر نتایج آن باشیم و ببینیم اینتل چطور با آن رقابت می‌کند. برتری A7 نسبت به آیفون قبلی نیز 92 درصد است که بخشی از آن به علت 64 بیتی شدن مرورگر Safari اپل است.

آخرین آزمون Browsermark 2.0 است که تنها به اجرای جاوااسکریپ محدود نمی‌شود بلکه فعالیت‌های مختلفی را در مرورگر انجام می‌دهد و نتیجه‌ی واقعی‌تری دارد.

تراکم حول امتیاز 2500 زیاد است و وسایل زیادی با تفاوت اندکی دیده می‌شوند. در این میان LG G2 و آیفون 5s به وضوح خود را از رقبا جدا کرده و امتیازی فراتر از 3200 به دست آورده‌اند. البته به خاطر داشته باشید که پرچم‌داران امروزی عرصه‌ی اندروید یعنی Galaxy Note 3 سامسونگ و Xperia Z1 سونی هم تراشه‌ی S800 را یدک می‌کشند و امتیازی شبیه به LG G2 به دست می‌آورند.

تفاوت آیفون جدید با نسخه‌ی قبلی در این آزمون به 25 درصد کاهش می‌یابد. اینتل دیگر صدرنشین نیست و کوآلکام باز هم یک رقیب جدی محسوب می‌شود.

معماری پردازنده‌ی گرافیکی در A7 کدام است؟

با نگاهی به گذشته‌ی آیفون‌ها به این نتیجه می‌رسیم که در آیفون جدید هم احتمالاً از طراحی‌های کمپانی نام‌آشنای Imagination Technologies استفاده شده است که حدس کاملاً درستی است. در سال‌های اخیر تمام آیفون‌ها و آیپدها از بهترین پردازنده‌های گرافیکی استفاده کرده‌اند. البته این بار اپل سعی می‌کند که جزئیات کامل در مورد پردازنده‌ی گرافیکی آیفون 5s افشا نشود.

قبلاً گمانه‌زنی‌ها به استفاده از سری 6 پردازنده‌های گرافیکی PowerVR اشاره داشتند. با رونمایی از آیفون 5s و نگاهی به فهرست پشتیبانی‌های سخت‌افزاری از واسط‌های برنامه‌نویسی به این نتیجه می‌رسیم که در آیفون 5s قطعاً یک مدل پیشرفته‌تر از پردازنده‌های سری 5XT استفاده نشده چرا که هیچ یک از اعضای این خانواده، از اکستنشن‌های نسخه‌ی 3 واسط OpenGL پشتیبانی نمی‌کنند. در واقع تنها پردازنده‌های سری 600 آرم یا Mali 6XX و نیز سری 300 پردازنده‌های گرافیکی کوآلکام یا همان Adreno 3XX، استفاده از اکستنشن‌های نسخه‌ی 3.0 را پشتیبانی می‌کنند. لذا با توجه به اینکه A7 یک تراشه‌ی کوآلکامی نیست و اپل علاقه‌ای به استفاده از طراحی‌های گرافیکی آرم ندارد، به این نتیجه می‌رسیم که تراشه‌ی A7 در بخش پردازنده‌ی گرافیکی، یکی از مدل‌های سری 6 ایمجینیشن را در خود جای داده است. در ضمن یادآور می‌شویم که تگرا 4 انویدیا نیز از اکستنشن‌های یاد شده پشتیبانی نمی‌کند و هنوز تا رونمایی از نسل بعدی Logan که مبتنی بر معماری Kepler است، زمان زیادی باقی مانده است.

نکته‌ی دیگر در مورد پردازنده‌ی گرافیکی آیفون جدید این است که از رندر به صورت TBDR استفاده می‌کند. در روش tile-based deferred rendering، نرم‌افزار چندضلعی‌هایی را ایجاد کرده و به درایور پردازنده‌ی PowerVR ارسال می‌کند. فعلاً چیزی رندر نمی‌شود بلکه اطلاعات در حافظه به شکل اندیس‌خورده ذخیره می‌شوند. تفاوت PowerVR با سایر معماری‌ها در این است که معمولاً تا زمانی که اطلاعات مربوط به تمام چندضلعی‌ها آماده نشده، پردازش به تعویق می‌افتد. علاوه بر این فرآیند سنگین تخصیص بافت و سایه‌زنی پیکسل‌ها و در واقع بخش‌های یک فریم نیز تا زمانی که نمایان شدن یک پیکسل در فریم مشخص و قطعی نشده، به تعویق می‌افتد. لذا TBDR یا رندرینگ تعویقی تکه‌تکه‌ای، روشی است که تنها در پردازنده‌های گرافیکی کمپانی ایمجینیشن به کار رفته است. البته آرم نیز مدعی شده که در سری 600 پردازنده‌های گرافیکی‌اش نیز از این روش استفاده شده است.

اما تفاوت نهایی که مدل پردازنده‌ی گرافیکی استفاده شده را آشکار می‌کند، پشتیبانی از anti-aliasing است. منظور از آنتی-الیاسینگ برطرف کردن شکستگی خطوط در تصویر است.

در تصویر فوق عبارت MAX_SAMPLES = 8 به آنتی-الیاسینگ با روش MSAA (یا چندنمونه‌ای) با 8 نمونه اشاره دارد. این حالت در سری 600 پردازنده‌های گرافیکی آرم پشتیبانی نمی‌شود چرا که در اسناد اصلی ارائه شده توسط آرم تنها به دو حالت 4x و 16x اشاره شده است.

نکات دیگری نیز در مورد تراشه‌ی A7 ذکر شده که بر خبر «استفاده از سری 6 پردازنده‌های گرافیکی ایمجینیشن در A7» مهر تأیید می‌زنند.

پردازنده‌ی گرافیکی تراشه‌ی A7 تمام محاسبات اعداد ممیز شناور را با یک پردازنده‌ی اسکالر انجام می‌دهد، حتی آنهایی که مقدارشان به صورت برداری شناسایی شده است. استفاده‌ی درست از الگوی نوشتن و تعریف دقیق محاسبات به افزایش عملکرد شیدرها منجر می‌شود.

مقادیر کوچک یا متوسط شیدرهای ممیز شناوری، یک جور و به صورت مقادیر 16 بیتی ممیز شناوری محاسبه می‌شوند. این تغییر به خاطر پردازنده‌های گرافیکی PowerVR SGX است که برای مقادیر کم‌دقت از حالت 10 بیتی با موقعیت ثابت ممیز استفاده می‌کنند. اگر شیدر شما متغیرهای ممیز شناوری با دقت پایین دارد و نیز از سخت‌افزار PowerVR SGX پشتیبانی می‌کند، باید شیدرهای خود را روی هر دو پردازنده‌ی گرافیکی تست کنید.

در دو بند فوق دقیقاً به سری 6 اشاره شده چرا که ایمجینیشن در سری 6 به معماری اسکالر روی آورده است و همچنین در اسناد ایمجینیشن به این مهم اشاره شده که کم‌دقت‌ترین حالت برای یکی عدد اعشاری، حالتی متشکل از 16 بیت یا به عبارت دیگر FP16 است.

بنابراین مسلم است که از سری 6 استفاده شده و لذا در ادامه به بررسی بیشتر سخت‌افزار سری 6 می‌پردازیم.

در A7 از پردازنده‌ی گرافیکی PowerVR G6430 استفاده شده است

سری 6 پردازنده‌های گرافیکی ایمجینیشن با نام رمز Rouge با چند پیکربندی به صورت زیر طراحی شده‌اند:

با توجه به کارایی A7 در بنچ‌مارک‌های گرافیکی می‌توان گفت که از پردازنده‌ی گرافیکی G6430 استفاده شده، آن هم به صورت 4 تایی. طبق جدول فوق این مدل برای کارایی بهینه شده و مساحت آن در اولویت قرار نگرفته است. توجه کنید که منظور از 4 تایی، 4 هسته نیست بلکه روش استفاده از چند هسته در سری 6 متفاوت از نسل‌های قبلی است که در ادامه به آن خواهیم پرداخت.

بزرگ‌ترین تغییری که در سری 6 نسبت به معماری نسل قبلی یعنی 5XT که در آیفون 5، آیپد 4 و آیپد مینی شاهد هستیم، استفاده از یک معماری کاملاً اسکالر است. درست شبیه به پردازنده‌های گرافیکی که ای‌ام‌دی و انویدیا برای پی‌سی‌ها و لپ‌تاپ‌ها طراحی کرده‌اند.

تفاوت دیگر در نحوه‌ی استفاده از چند پردازنده‌ی گرافیکی در یک تراشه است. در سری 5XT به پردازنده‌های چند هسته‌ای اشاره می‌کردیم و در واقع از چند هسته با تمام اجزا در یک تراشه استفاده می‌شد. در سری 6 روش کار کپی کردن تمام بخش‌های یک هسته‌ نیست لذا از اصطلاح چند Cluster استفاده می‌شود. در این روش تنها چیزی که کپی می‌شود، واحدهای محاسبه و منطق شیدر (یا ALU) و همچنین سخت‌افزار مربوط به بافت است. در نهایت باز هم معماری نسل 6 یک معماری یکپارچه است با این تفاوت که حالا مرز ارتباطی پردازنده با واحد‌های شیدر که داخل آن هستند، نسبت یک به یک ندارد. از جنبه‌های مختلفی می‌توان این روش استفاده از چندین پردازنده را معقول‌تر دانست، همچنان که در بیشتر موارد برای ایجاد یک پردازنده‌ی گرافیکی قوی‌تر از همین روش استفاده می‌شود.

معماری کاملاً اسکالر در پردازنده‌های گرافیکی Rouge

در نسل قبلی پردازنده‌های گرافیکی کمپانی ایمجینیشن یا 5XT، هر یک از هسته‌ها چندین کانال اطلاعات USSE2 داشتند که هر یک قادر به ضرب و جمع بردار 4 بعدی یا Vec4 بود. 4 بعد یک بردار در این معماری برداری، 4 مقدار برای 4 رنگ در یک پیکسل است.

علاوه بر اعمال برداری فوق، انجام یک عمل ممیز شناوری نیز امکان‌پذیر است که بسته به شرایط ممکن است به صورت دوتایی به صف اعمال تخصیص داده شود. ایمجینیشن هیچ‌وقت در مورد تخصیص دوتایی، جزئیات را بیان نکرده لذا برای محاسبه‌ی قدرت پردازنده در انجام محاسبات ممیز شناور یا همان عددی که با واحد FLOPS بیان می‌شود، می‌توان تعداد اعمال جمع و ضرب یا به عبارت دیگر تعداد MADهای بردارهای 4 بعدی را شمارش کرد. اگر هر MAD را به صورت دو عمل ممیز شناوری در نظر بگیریم، در هر کانال اطلاعات USSE2، دقیقاً 4 متغیر و MAD وجود دارد، در نتیجه 8 عمل ممیز شناوری در یک سیکل کلاک قابل انجام است. لذا یک USSE2 که ساختار یک دستوری و چند داده‌ای دارد، تنها یک دستور را برای هر 4 بعد یا متغیر خود می‌پذیرد. اگر تعداد MADها 3 عدد باشد، مشخص می‌شود که بردار 3 بعدی است و به همین ترتیب در مورد MADهای دو تایی و تکی می‌توان نتیجه‌گیری کرد.

در مجموع در نسل قبل، با یک دستور چند داده‌ای، 4 رنگ یک پیکسل محاسبه می‌شد و به عبارتی 1 پیکسل در هر کلاک پردازش می‌شد.

در سری 6 یا Rouge به جای USSE2 از گروه یکپارچه‌ی شیدری یا USC استفاده شده است. هر USC، سخت‌افزاری برای انجام یک دستور چند داده‌ای با پهنای 16 است. هر بخش قادر به انجام 4 محاسبه‌ی عدد اعشاری32 بیتی در یک سیکل کلاک است. لذا در یک سیکل کلاک، هر USC با پهنای 16 قادر به انجام 64 محاسبه روی اعداد اعشاری 32 بیتی خواهد بود. این توان پردازشی معادل 2 هسته‌ی PowerVR SGX 543 از نسل قبل است. مشخص است که نسل جدید بهینه‌تر از نسل قبل طراحی شده و عملکرد بالاتری دارد.

و اما در تراشه‌ی A7 چه می‌گذرد؟ در A7 از یک گروه 4 تایی استفاده شده که در مجموع تعداد USCها و توان محاسبات ممیز شناوری 32 بیتی به ترتیب 4 عدد و 256 فلاپس، البته در یک سیکل کلاک می‌شود. بنابراین اگر سرعت کلاک 200 مگاهرتز باشد، قدرت محاسباتی A7 دو برابر پردازنده‌ی گرافیکی آیفون 5 خواهد بود. با توجه به شایعات سرعت کلاک G6430 به مراتب بیشتر از 200 مگاهرتز است و لذا توان محاسباتی آن بیش از 2 برابر آیفون 5 است.

منظور از معماری تماماً اسکالر در سری 6 این است که 16 پیکسل در یک کلاک پردازش می‌شوند به این صورت که یک USC، خود دارای 16 کانال اطلاعات است که هر کانال در یک سیکل کلاک 4 عمل محاسباتی اعداد اعشاری 32 بیتی را انجام می‌دهد و در مجموع 64 عمل ممیز شناوری در یک کلاک صورت می‌گیرد. با توجه به اینکه این 64 عمل روی 4 رنگ انجام شده، 16 عمل روی هر یک از 4 رنگ صورت گرفته و لذا 16 پیکسل در یک سیکل کلاک پردازش می‌شود.

از طرفی توان محاسباتی A7 بیش از آیپد 4 هست، لذا برای استفاده در آیپد مینی که صفحه نمایش رتینا دارد هم به اندازه‌ی کافی توانمند است. البته مشکل پهنای باند حافظه نیز مطرح است که باید حل شود ولیکن قدرت پردازشی A7 بسیار بالا و کافی است.

عملکرد پردازنده‌ی گرافیکی تراشه‌ی A7 در بنچ‌مارک‌ها

همان‌طور که بحث کردیم، تراشه‌ی A7 اولین تراشه‌ی بازار مصرف‌کنندگان است که از پردازنده‌های گرافیکی نسل 6 کمپانی ایمجینیشن تکنالوجیز بهره می‌برد. G6430 در آیفون 5s چیدمان 4 تایی دارد.

ایمجینیشن بر این باور است که معماری اسکالر جدید بهینه‌تر و متراکم‌تر از معماری نسل قبلی است. البته در بازار پی‌سی هم استفاده از روش اسکالر در مورد کارت گرافیک‌ها چنین نتیجه‌ای را به دنبال داشته است و لذا ادعای این کمپانی کاملاً درست است.

اپل اعلام کرده که قدرت آیفون جدید در محاسبات گرافیکی 2 برابر بیشتر از نسخه‌ی قبلی است اما با توجه به قدرت محاسبات ممیز شناوری که در جدول زیر گردآوری شده، به نظر می‌رسد که قدرت A7 چیزی بیش از 2 برابر A6 باشد.

GFXBench 2.7

اولین آزمون GFXBench 2.7 یا همان GLBenchmark است. بنچ‌مارکی که نسبت به بازی‌های امروزی سنگین‌تر است و از طرفی بیشتر تولیدکنندگان تراشه از آن برای آزمایش قدرت تراشه‌های خود استفاده می‌کنند و در نهایت معیاری است از سرعت اجرای بازی‌ها. نرخ پر کردن پیکسل بسیار بالا و دو برابر بیشتر از آیفون 5 است:

توجه کنید که آزمون فوق در حالت 1080p برای تمام گوشی‌ها صورت گرفته تا تعداد پیکسل‌ها برابر باشد. در غیر این صورت صفحه نمایش آیفون 5s با رزولوشن پایینی که دارد، معیار درستی از قدرت A7 نمایش نمی‌دهد.

نرخ خروجی مثلث‌ها در A7 به دلیل کپی نشدن تمام اجزای یک هسته، قابل قیاس با پردازنده‌ی آیفون 5 نیست:

اما این آزمون چندان در مورد بازی‌ها مهم نیست و در واقع طراحی جدید تعادل بهتری بین چیدن مثلث‌ها برای پردازش و سپس انجام محاسبات شیدری برقرار کرده است.

در مورد خروجی مثلث‌ها و روشن کردن بخش‌ها نیز اوضاع بدتر می‌شود:

لذا بهتر است به بنچ‌مارک‌های نزدیک‌تر به دنیای بازی استناد می‌کنیم، اولین بنچ‌مارک T-Rex HD است که در رزولوشن صفحه نمایش هر گوشی اجرا می‌شود:

مشخص است که سرعت A7 در اجرای این بنچ‌مارک بیش از 2 برابر آیفون 5 است. مهم‌تر از آن اولین گوشی‌ای است که در این آزمون سرعتی بالاتر از 30 فریم بر ثانیه دارد و لذا بیش از آیفون‌های قبلی مورد توجه بازی‌خورهاست و در قفسه‌ی فروشگاه‌ها باقی می‌ماند.

در حالت 1080p طبعاً سایر گوشی‌هایی که صفحه نمایش 1080p دارند، تغییری نمی‌کنند ولی آیفون 5s با کاهش سرعت مواجه می‌شود:

مشخص است که LG G2 و سایر گوشی‌هایی که از تراشه‌ی S800 کوآلکام استفاده می‌کنند، کمی کندتر از A7 هستند. البته S800 بسته به شرایط توان مصرفی ممکن است از A7 سریع‌تر ظاهر شود و لذا MSM8974 MDP/T را در صدر می‌بینیم.

بنچ‌مارک سبک‌تر Egypt HD که به بازی‌های امروزی نزدیک‌تر است هم نتیجه‌ای به صورت زیر دارد:

باز هم تراشه‌ی کوآلکام در صدر قرار گرفته ولیکن توان مصرفی آن احتمالاً در حد آیفون 5s یا LG G2 نیست.

3DMark

در این آزمون فشار روی پردازنده‌ی اصلی به مراتب بیشتر است و از طرفی مالتی‌ترد بوده و از تراشه‌های چند هسته‌ای بهره‌ی بهتری می‌برد. استفاده از CPU در این آزمون گاهاً بیش از 50 درصد است در حالی که در GFXBench بین 6 تا 25 درصد است.

در iOS حالت رزولوشن بالای این آزمون با اصطلاح بی‌نهایت یا Unlimited شناخته می‌شود که نتایج آن به صورت زیر است:

با توجه به تأثیر پهنای باند حافظه و قدرت پردازنده‌ی اصلی، نتیجه تنها به توان پردازنده‌ی گرافیکی بستگی ندارد. در آزمون گرافیکی وضعیت کمی متفاوت می‌شود:

رتبه‌ی خوب Moto X موتورولا به خاطر هسته‌های سریع پردازنده‌ی اصلی است و نشان می‌دهد که در این آزمون باز هم پردازنده‌ی اصلی بی تأثیر نیست.

در آزمون محاسبات فیزیکی تراشه‌های چند هسته‌ای موفق‌تر هستند و سرعت بالاتری دارند:

Basemark X

این بنچ‌مارک هم بسیار پیچیده است و لذا سرعت اجرا بسیار پایین خواهد بود. متأسفانه به علت وجود باگی نامشخص، اجرای آن در رزولوشن 1080p روی iOS 7 ممکن نیست و نتایج در رزولوشن اصلی گوشی‌ها ارایه می‌شود:

سرعت تراشه‌ی آیفون جدید باز هم بیش از 2 برابر آیفون قبلی است. به زودی بررسی کامل آیفون را در زومیت خواهید خواند.

تبلیغات
داغ‌ترین مطالب روز

نظرات

تبلیغات