چرا هوش مصنوعی تشنه‌ حافظه است و دود این عطش چگونه به چشم کاربران عادی می‌رود؟

دوشنبه 8 تیر 1405 - 13:30
مطالعه 14 دقیقه
افزایش قیمت رم و در سایه عطش دیتاسنترهای هوش مصنوعی برای رم
دوران خرید سیستم‌های اقتصادی با حافظه بالا گذشت، حالا جنون هوش مصنوعی بازار رم و اس‌اس‌دی را قبضه کرده است!
تبلیغات

برای چند لحظه خودتان را جای دانشجو، مهندسی یا کاربری عادی بگذارید که بعد از ماه‌ها برنامه‌ریزی راهی بازار می‌شود تا لپ‌تاپ یا گوشی هوشمند جدیدی بخرد. پیش خودمان حساب می‌کنیم که باتوجه‌به سرعت پیشرفت تکنولوژی باید بتوانیم با پرداخت مبلغی معقول دستگاهی با حافظه‌ی بالا و سرعت ایده‌آل تهیه کنیم؛ اما قیمت وسایل الکترونیکی امروزی هر چیزی است به‌جز معقول!

خلاصه صوتی

خلاصه‌ی صوتی، ساخته‌شده با هوش مصنوعی

و بدتر اینکه مشخصات سخت‌افزاری دستگاه‌های میان‌رده واقعا ناامیدکننده‌اند. دیدن لپ‌تاپ‌هایی با تنها ۴ گیگابایت رم در ویترین فروشگاه‌های سال ۲۰۲۶ انگار ما را به یک دهه قبل برمی‌گرداند؛ البته این موضوع فقط مشکل ما نیست و تقریبا همه‌ی کاربران در همه‌ی کشورهای جهان، وضعیت فعلی بازارها را غیرقابل‌توجیه می‌دانند.

شاید در نگاه اول فکر کنید شرکت‌های سازنده دچار خطای محاسباتی شده‌اند یا پای یک نوسان فصلی ساده در میان است؛ اما ماهیت تورمی که امروز تجربه می‌کنیم، با تمام کمبودهای دوران کرونا یا بالا و پایین‌شدن‌های همیشگی بازار فرق دارد. همان‌طور که احتمالا حدس می‌زنید، باید انگشت اتهام را به‌سمت هوش مصنوعی بگیریم.

شرکت‌های بزرگ فناوری با یکدیگر بر سر توسعه و آموزش زیرساخت‌های هوش مصنوعی رقابت می‌کنند و مدل‌های زبانی بزرگ هم برای درک اطلاعات و تولید پاسخ، به حجم عظیمی از داده و سرعت انتقالی بالا نیاز دارند، نیازی روزافزون و پرشتاب که صنعت نیمه‌هادی‌ را با سدی فیزیکی به‌نام دیوار حافظه روبه‌رو کرده است.

تراشه‌سازان بزرگ در پاسخ به تقاضای غول‌های تکنولوژی، مسیر خطوط تولیدشان را تغییر داده‌اند تا تمام ظرفیتشان را روی ساخت محصولات گران‌قیمت مخصوص سرورها متمرکز کنند؛ هرچند این استراتژی عوارض جانبی دیگری هم دارد و هر ویفر سیلیکون اختصاص‌یافته به دیتاسنترها، به‌طور مستقیم از سهم مصرف‌کنندگان عادی کسر می‌شود.

حتی آمار هم تأیید می‌کند که قیمت برخی از انواع حافظه نسبت به اواخر سال گذشته، تا ۹۰ درصد افزایش‌یافته است.

از قفسه فروشگاه تا دیتاسنتر؛ چرخش استراتژیک بازار رم

در دهه‌های گذشته، بازار حافظه‌ مثل ساعت کار می‌کرد و چرخه‌هایی کاملا قابل‌پیش‌بینی داشت. دوران رونق و رکود این بازار، بیشتر با معرفی گوشی‌های موبایل جدید یا کنسول‌های بازی تنظیم می‌شد؛ اما با ورود به سال‌های ۲۰۲۵ و ۲۰۲۶، این الگو به طور کامل تغییر کرد. حالا دیگر رم و فضای ذخیره‌سازی صرفا قطعاتی ساده برای ارتقای سیستم‌های کامپیوتری نیستند و به‌نوعی دارایی استراتژیک، شدیدا کمیاب و رقابتی تبدیل شده‌اند.

گزارش تحلیلی شرکت Aranca در مورد قیمت‌گذاری رم، به نکته‌ی مهمی اشاره می‌کند؛ شتاب دیوانه‌وار برای توسعه‌ی زیرساخت‌های هوش مصنوعی، تمام ظرفیت کارخانه‌های تولید حافظه را تسخیر می‌کند و پیرو آن پس‌از یک دوره‌ی ثبات نسبی، میانگین قیمت رم در برخی فروشگاه‌های خرده‌فروشی تا حدود چهار برابر افزایش می‌یابد.

تمرکز غول‌های فناوری روی سرورها، بازار مصرف‌کنندگان عادی را به حاشیه رانده است

شرکت‌های رده‌اول مانند مایکروسافت، گوگل، متا و آمازون، برنامه‌های سرمایه‌گذاری خود را با اولویت‌دادن به هوش مصنوعی تنظیم می‌کنند و تا به اینجا سرمایه‌گذاری‌شان روی زیرساخت‌های محاسباتی، به بیش‌از ۶۰۰ میلیارد دلار رسیده است که بخش اعظم آن به‌طور مستقیم صرف خرید سخت‌افزار می‌شود.

سرورهای جدیدی که غول‌های فناوری برای هوش مصنوعی می‌سازند، نسبت به نسل‌های قبلی خود به دو تا سه برابر حافظه‌ی بیشتر نیاز دارند و همین امر باعث می‌شود تولیدکنندگانی مانند مایکرون؛ همه‌ی تمرکز خود را روی محصولات گران‌قیمت با حاشیه‌ی سود بالاتر بگذارند. پیامدهای این انحصارطلبی را مصرف‌کنندگان عادی متحمل می‌شوند، ضمن اینکه نوسانات ارزی و سیاست‌های قیمت‌گذاری باعث می‌شود هزینه‌ی نهایی برای خریداران عادی تفاوت‌های فاحشی داشته باشد.

جدول زیر نشان می‌دهد که قیمت یک کیت ۳۲گیگابایتی رم در فاصله‌ی کوتاه سپتامبر تا دسامبر ۲۰۲۵ چگونه در کشورهای مختلف افزایش‌یافته است.

کشور

خرده‌فروش نمونه

قیمت کیت ۳۲گیگابایتی (سپتامبر ۲۰۲۵)

قیمت کیت ۳۲گیگابایتی (دسامبر ۲۰۲۵)

درصد افزایش قیمت

ایالات متحده

Newegg

۱۴۹ دلار

۳۹۲ دلار

۱۶۳درصد

بریتانیا

Overclockers UK

۱۱۹ پوند

۳۷۹ پوند

۲۱۹درصد

آلمان

Mindfactory

۱۳۹ یورو

۳۷۹ یورو

۱۷۳درصد

فرانسه

LDLC

۱۳۹ یورو

۵۲۱ یورو

۲۷۵درصد

استرالیا

PC Case Gear

۱۹۹ دلار استرالیا

۶۸۹ دلار استرالیا

۲۴۶درصد

ژاپن

Kakaku

۱۶,۰۰۰ ین

۱۱۵,۰۹۰ ین

۶۱۹درصد

اعداد جدول بالا به ما می‌گویند که چگونه شرکت‌های بزرگ تأمین‌کننده، هزینه‌های نجومی خود را از جیب بازارهای مصرفی جبران کرده‌اند. در ساختار جدید، تولیدکنندگان سیستم‌های سنگین پردازشی حاشیه‌ی سود خود را حفظ می‌کنند؛ درحالی‌که سازندگان لپ‌تاپ‌های اقتصادی و گوشی‌های میان‌رده زیر بار این فشار آسیب بیشتری می‌بینند.

دیوار حافظه؛ محدودیتی که گریبان پردازنده‌ها را گرفت

برای اینکه بفهمیم چرا هوش مصنوعی تا این حد به حافظه نیاز دارد، باید کمی به لایه‌های عمیق‌تر سیستم‌های کامپیوتری و معماری آن‌ها نفوذ کنیم. سخت‌افزار سنتی برپایه‌ی معماری فون نویمان توسعه یافته‌اند؛ ساختاری که در آن واحدهای پردازشی و ذخیره‌سازی از یکدیگر مجزا هستند و داده‌ها باید به‌طور مداوم میان آن‌ها جابه‌جا شوند.

مشکل از جایی آغاز می‌شود که در دهه‌های اخیر، قدرت محاسباتی پردازنده‌ها با نرخی نمایی رشد کرده است؛ درحالی‌که پیشرفت پهنای باند حافظه یا همان سرعت جابه‌جایی اطلاعات آرام‌تر ارتقا می‌یابد. برای درک بهتر ماجرا سرآشپزی بسیار چابک و سریع را تصور کنید که می‌تواند در کسری از ثانیه غذا را آماده کند؛ اما شاگردی که باید مواد اولیه را از انبار برایش بیاورد، خونسرد و آهسته راه می‌رود!

سرعت انتقال اطلاعات نتوانسته پا به پای قدرت پردازنده‌ها رشد کند

سرآشپز در نهایت به‌ناچار باید صبر کند تا مواد به دستش برسد. مطالعات نشان می‌دهند که توان محاسباتی تراشه‌ها در سال‌های اخیر حدود ۳برابر شده؛ درحالی‌که پهنای باند حافظه تنها ۱٫۶برابر افزایش‌یافته؛ این ناهماهنگی، همان محدودیت فیزیکی معروفی است که با نام دیوار حافظه شناخته می‌شود. امروز سریع‌ترین پردازنده‌های گرافیکی جهان در عمل زمان گران‌بهای خود را صرف انتظار برای رسیدن داده‌ها می‌کنند.

مهندسان برای تحلیل رفتار پردازنده‌ی گرافیکی در تعامل با حافظه از مدل روف‌لاین استفاده می‌کنند که توضیح می‌دهد عملکرد یک واحد پردازشی دارای دو سقف مجزا است؛ نخست قدرت محاسباتی محض که با ترافلاپس سنجیده می‌شود و دوم سقف پهنای باند حافظه بر حسب ترابایت‌برثانیه.

اگر بار کاری برنامه‌ای برای انجام محاسبه‌ای کوچک به خواندن حجم عظیمی از داده نیاز داشته باشد، سیستم به سقف دوم برخورد می‌کند و به‌اصطلاح، دچار محدودیت حافظه یا Memory-Bound می‌شود. در این وضعیت ارتقای پردازنده یا خرید کارت گرافیک قوی‌تر، هیچ تغییری در سرعت نهایی تولید پاسخ ایجاد نمی‌کند؛ مگر اینکه فکری به حال عرض جاده یا همان پهنای باند حافظه کرده باشید.

رم در مدل‌های زبانی بزرگ دقیقا چه کاری انجام می‌دهد؟

وقتی یک سؤال یا درخواست را برای یک مدل هوش مصنوعی ارسال می‌کنید، فرایند تولید پاسخ وارد دو فاز کاملا متفاوت می‌شود: فاز اول پیش‌پُرکردن (Prefill) و فاز دوم رمزگشایی (Decode) نام دارد.

در فاز اول، هوش مصنوعی کل متن ورودی شما را یک‌جا می‌خواند و پردازش می‌کند؛ مرحله‌ای که به ضرب ماتریس‌های بزرگ ریاضی در فضای اعداد اعشاری شباهت دارد و ازآنجاکه داده‌ها در این بخش بسیار فشرده و متراکم‌اند، تراشه تمام توان محاسباتی خود را به‌کار می‌گیرد. در فاز اول، سرعت حافظه چندان تعیین‌کننده نیست و بیشتر، قدرت محض محاسباتی پردازنده موضوعیت دارد.

اما اصل ماجرا و شروع آن بن‌بست معروف، در فاز دوم یعنی رمزگشایی رخ می‌دهد. مدل‌های زبانی بزرگ، پاسخ شما را یک‌باره و به‌صورت کامل تولید نمی‌کنند؛ آن‌ها متن را به‌صورت کلمه‌به‌کلمه یا دقیق‌تر بگوییم، توکن به توکن پدید می‌آورند. مدل برای نوشتن هر کلمه‌ی جدید، باید نگاهی به تمام کلمات قبلی بیندازد و از آن‌ها در محاسبات خود استفاده کند؛ اینجاست که ریاضیات شبکه‌های عصبی با محدودیت فیزیکی رم مواجه می‌شود.

فاز دوم عملکرد مدل‌های زبانی بزرگ، کاملا به سرعت حافظه بستگی دارد

یک مدل میان‌رده، اما قدرتمند ۷۰میلیارد پارامتری را در نظر بگیرید. اگر این مدل بادقت استاندارد ۱۶بیتی بارگذاری شود، حجم فایل آن روی حافظه حدود ۱۴۰ گیگابایت خواهد بود. در فاز رمزگشایی، پردازنده‌ی گرافیکی برای اینکه بتواند فقط و فقط یک کلمه یا توکن تولید کند، به‌ناچار باید تمام ۱۴۰ گیگابایت وزن‌های مدل را از روی حافظه‌ی موقت (VRAM) بخواند و در محاسبات به‌کار بگیرد.

حالا اگر بخواهید مدل ۷۰میلیارد پارامتری موردبحث با سرعت ۴۰ توکن‌برثانیه به شما پاسخ دهد، سیستم باید در هر ثانیه، ۱۴۰ گیگابایت را ۴۰ بار بخواند و جابه‌جا کند؛ یعنی پهنای باندی در حدود ۵٫۶ ترابایت‌بر‌ثانیه!

این مرور ساده نشان می‌دهد چرا در فاز رمزگشایی، عملکرد سیستم کاملا به سرعت انتقال رم بستگی دارد؛ وضعیتی که در آن پردازنده‌های سریع بدون داشتن یک حافظه‌ی موقت حجیم و به‌همان اندازه پرسرعت، عملا کارایی‌شان را از دست می‌دهند.

فرم‌فاکتورها؛ پُشته‌های سه‌بعدی در برابر ماژول‌های سنتی

نیاز مبرم به عبور از محدودیت‌های فیزیکی پهنای باند، صنعت نیمه‌رسانا را به‌سمت دو معماری کاملا متضاد سوق داده است؛ حافظه‌های فوق‌سریع HBM و رم‌های مقرون‌به‌صرفه‌تری مثل DDR5.

بیایید ببینیم وقتی یک مدل هوش مصنوعی در حال اجراست دقیقا چه اتفاقی می‌افتد. مدل‌های زبانی بزرگ هنگام تولید پاسخ، فقط به وزن‌های ثابت خود متکی نیستند و از حافظه‌ی موقتی به‌نام KV Cache هم استفاده می‌کنند؛ به‌عبارتی مقادیر محاسباتی توکن‌های قبلی در این حافظه ذخیره می‌شوند تا مدل مجبور نباشد در هرگام آن‌ها را از نو محاسبه کند.

رم‌های سه‌بعدی (HBM) اتوبان‌های اطلاعاتی عریضی برای انتقال سریع داده‌ها می‌سازند

شما می‌توانید KV Cache را مثل یک دفترچه‌یادداشت موقت در نظر بگیرید که هوش مصنوعی برای به‌خاطرسپردن روند مکالمات از آن استفاده می‌کند؛ هرچه متن طولانی‌تری به آن بدهید یا کاربران بیشتری هم‌زمان از مدل استفاده کنند، دفترچه سریع‌تر پُر می‌شود و با رشدی خطی، خیلی زود تمام فضای موجود را اشغال می‌کند.

برای اینکه سیستم بتواند با چنین حجم انبوهی از اطلاعات همگام شود، مهندسان حافظه‌های با پهنای باند بالا یا HBM را توسعه دادند. رم‌های سنتی معمولا به‌صورت تخت روی مادربرد می‌نشینند؛ اما در معماری HBM، قطعات سیلیکونی مثل طبقات یک برج روی‌هم قرار می‌گیرند و با مسیرهای بسیار ریز درون‌تراشه‌ای به هم متصل شوند.

ساختار سه‌بعدی HBM به طراحان اجازه می‌دهد تا اتوبان‌های اطلاعاتی بسیار عریضی ایجاد کنند که داده‌ها را با سرعت خیره‌کننده‌ی ترابایت‌برثانیه جابه‌جا می‌کنند.

در طرف مقابل، حافظه‌های استاندارد سرورها قرار دارند که مثل همیشه روی شیارهای مادربرد نصب می‌شوند. این ماژول‌ها پهنای باند کمتری دارند؛ اما در عوض ظرفیت بسیار بالاتر و قیمت ارزان‌تری برای مدیریت سیستم‌عامل و آماده‌سازی اولیه‌ی داده‌ها فراهم می‌کنند.

اهمیت حافظه‌ی اختصاصی پردازنده زمانی خودش را نشان می‌دهد که حجم داده‌ها از ظرفیت آن بیشتر شود. اگر مدل هوش مصنوعی مجبور شود برای دسترسی به اطلاعات سرریزشده، از طریق مسیرهای طولانی‌تر مادربرد به حافظه‌ی اشتراکی سیستم مراجعه کند، سرعت پردازش شدیدا افت می‌کند. در این حالت پردازنده‌‌های چند ۱۰هزار دلاری، عملا به قطعه‌ای کند و ناکارآمد تبدیل می‌شود که باید منتظر رسیدن تدریجی داده‌ها بماند.

نقش پنهان درایوهای حالت جامد در خط مقدم داده‌ها

باوجوداینکه این روزها توجه دنیای فناوری بیشتر به رم و پردازنده معطوف شده است، افزایش چشمگیر قیمت درایوهای حالت جامد (SSD) و هاردها، از تحول بزرگی در بخش دیگری از دنیای سخت‌افزار حکایت دارد.

در معماری‌های پردازشی جدید، SSDها دیگر صرفا فضایی راکد برای ذخیره‌سازی محسوب نمی‌شوند و درعوض به بازیگرانی فعال تبدیل شده‌اند که در تمام مراحل دریافت، آماده‌سازی، آموزش و استنتاج هوش مصنوعی نقشی کلیدی ایفا می‌کنند.

یکی از پرفشارترین وظایفی که روی دوش درایوهای SSD قرار دارد، در زمان آموزش مدل‌های زبانی و طی فرایند ذخیره‌ی وضعیت (Checkpointing) اتفاق می‌افتد. هنگامی که یک شبکه‌ی عصبی پیچیده در حال آموزش است، سیستم باید به‌طور مداوم وضعیت لحظه‌ایِ فرایند، شامل وزن‌ها، وضعیت الگوریتم‌های بهینه‌ساز و نرخ یادگیری را ذخیره کند.

توقف ذخیره‌سازی داده‌های هوش مصنوعی، به معنای اتلاف هزینه‌ها و زمان طولانی پردازش است

فرایند ذخیره‌ی وضعیت درست شبیه فشردن دکمه‌ی Save قبل از رسیدن به غول مرحله‌ی آخر در یک بازی ویدیویی است، با این تفاوت که اینجا با صدها گیگابایت اطلاعات روبه‌رو هستیم که باید در کسری از ثانیه ثبت شوند تا در صورت قطعی برق یا خطاهای سخت‌افزاری، هزینه‌های سنگین و زمان طولانی پردازش به هدر نرود.

وقتی زمان ذخیره‌سازی می‌رسد، موج عظیمی از اطلاعات برای نوشتن به‌سوی درایو سرازیر می‌شود. اگر درایو توانایی هضم این ترافیک سنگین را نداشته باشد، ظرفیت حافظه‌ی پنهانش به‌اصطلاح اشباع می‌شود و کل پردازنده‌های شبکه ناچارند فرایند یادگیری را متوقف کنند تا درایو کارش را به پایان برساند. این وقفه یعنی اتلاف توان محاسباتی و زمان.

ازسوی‌دیگر جست‌وجوی آنی در پایگاه‌های داده برای اینکه هوش مصنوعی بتواند پاسخ‌های دقیقی به کاربر بدهد هم نیازمند درایوهایی است که کمترین تأخیر ممکن را داشته باشند؛ به‌همین دلایل، دیتاسنترها به‌شدت به درایوهای کلاس سازمانی با دوام فوق‌العاده‌بالا وابسته هستند؛ قطعاتی که با سلول‌های حافظه‌ی بسیار مقاومی ساخته می‌شوند و به خازن‌های سخت‌افزاری مجهزند تا حتی در صورت قطع ناگهانی برق، داده‌ای از دست نرود.

کنترلر درایوها نیز از فناوری‌های پیشرفته‌ای بهره می‌برند تا پدیده‌ی مخربی به‌نام اثر مخلوط‌کننده‌ی ورودی/خروجی (I/O Blender Effect) را مهار کند؛ پدیده‌ای که در آن، هجوم هم‌زمان و بی‌نظم داده‌ها باعث سردرگمی کنترلر، افت شدید کارایی و استهلاک سریع‌تر درایو می‌شود.

افزایش بی‌سابقه‌ی تقاضا برای درایوهای پرظرفیت و با دوام باعث می‌شود سازندگان تراشه‌های فلش تمام تمرکز خود را معطوف به تولید فرم‌فاکتورهای سازمانی کنند. پیامد این تغییر استراتژی، کمبود جدی عرضه و محدودیت شدید لایه‌ی بازار مصرف‌کنندگان عادی است.

تنگنای میلی‌متری؛ بسته‌بندی پیشرفته در کارخانه‌های تایوان

ابعاد واقعی کمبود جهانی حافظه را زمانی بهتر می‌فهمیم که نگاهمان را معطوف حلقه‌ی پنهان، اما تعیین‌کننده‌ی فناوری بسته‌بندی پیشرفته کنیم.

ساختن تراشه‌های پیشرفته، در واقع تنها نیمی‌از مسیر مهندسی در دنیای تراشه‌هاست. برای اینکه حافظه‌های سه‌بعدی بتوانند پهنای باند بی‌نظیرشان را در عمل نشان دهند، باید با دقتی در مقیاس میکرومتر در مجاورت پردازنده‌ی اصلی و روی یک لایه‌ی میانجی سیلیکونی متصل شوند؛ به‌همین دلیل امروز فناوری انحصاری TSMC برای مونتاژ بسیار ظریف موسوم به CoWoS، مهم‌ترین تنگنای کل زنجیره‌ی تأمین جهان محسوب می‌شود.

تولید پردازنده بدون ظرفیت بسته‌بندی پیشرفته، گره کور این روزهای صنعت است

واقعیت این است که حتی اگر میلیون‌ها پردازنده‌ی گرافیکی تولید شود، تا زمانی که ظرفیت کافی برای بسته‌بندی دقیق آن‌ها در کنار حافظه‌های فوق‌العاده سریع وجود نداشته باشد، این قطعات هرگز محصول نهایی و کارآمدی نخواهند بود.

شرکت TSMC تهاجمی‌ترین برنامه‌ها را برای توسعه‌ی ظرفیت خود اجرا می‌کند؛ ولی هنوز نتوانسته است پاسخگوی تقاضای بی‌پایان بازار باشد. جدول زیر به‌خوبی روند ناترازی را نشان می‌دهد:

وضعیت عرضه و تقاضا

ظرفیت تقریبی CoWoS (ویفر در ماه)

بازه زمانی

آغاز کمبود شدید و صف‌های طولانی انتظار

۳۵,۰۰۰

اواخر ۲۰۲۴

افزایش قیمت‌های خدمات بسته‌بندی

۷۵,۰۰۰

اواخر ۲۰۲۵

پیش‌فروش کامل و رزرو قطعی توسط غول‌های فناوری

۱۲۵,۰۰۰ تا ۱۳۰,۰۰۰

هدف‌گذاری پایان ۲۰۲۶

در این فضای رقابتی، برخی شرکت‌های زیرک‌تر به پیش‌خریدهای کلان روی آورده‌اند؛ تا جایی که انویدیا به‌تنهایی نزدیک به ۶۰درصد از ظرفیت خطوط مونتاژ پیشرفته را برای سال ۲۰۲۶ رزرو کرده است؛ اقدامی که دیگر رقبا را با صف‌های انتظار طولانی یک تا یک‌ونیم ساله مواجه می‌سازد.

تبعات چالش تأمین چنان عمیق است که حتی توسعه‌دهندگان بزرگی مثل گوگل مجبور شده‌اند اهداف تولید پردازنده‌های سفارشی خود را کاهش دهند. امروز موفقیت مالی تولیدکنندگان سخت‌افزار دیگر صرفا در گرو معماری و مهندسی تراشه‌ها نیست؛ بلکه به توانایی آن‌ها در تصاحب سهم بیشتری از زمان خطوط تولید محدود بستگی دارد.

انقراض تدریجی گجت‌های اقتصادی

این چرخه‌ی کلان مالی و تکنولوژیک، تورمی ساختاری و عمیق را به کل پیکره‌ی صنعت الکترونیک تزریق کرده است. در یک‌سوی میدان، دیتاسنترها و غول‌های ابری در حال ثبت سودهای رکوردشکن هستند و در سوی دیگر، سازندگان کامپیوترهای شخصی و گوشی‌های هوشمند برای حفظ حاشیه‌ی سود خود تلاش می‌کنند.

در همین‌حال سهم هزینه‌ی قطعات ذخیره‌سازی در قیمت تمام‌شده‌ی محصولات، از ۱۵ درصد در سال‌های گذشته، حالا به بیش‌از ۵۰درصد هزینه‌ها در دستگاه‌های میان‌رده رسیده است.

پیش‌بینی‌ها نشان می‌دهند که آمار عرضه‌ی گوشی‌های هوشمند در سال ۲۰۲۶ با سقوطی ۱۳٫۹درصدی روبه‌رو خواهد شد. در این میان، گوشی‌های اقتصادی و ارزان‌قیمت بیشترین ضربه را می‌خورند؛ همان دستگاه‌هایی که نقش کلیدی در اتصال افراد کم‌درآمد در مناطق درحال‌توسعه به اینترنت داشتند.

سهم حافظه در قیمت تمام‌شده گجت‌های میان‌رده، به بیش از نیمی از کل هزینه‌ها می‌رسد

حالا فروش گوشی‌های زیر ۱۰۰ دلار در برخی مناطق جهان بیش‌از نیمی از بازار خود را ازدست‌داده و سود شرکت‌هایی که روی این بخش‌ها متمرکز بودند، به‌شدت افت کرده است.

تولیدکنندگان برای مهار فشارهای خردکننده، چاره‌ای جز پایین‌آوردن مشخصات سخت‌افزاری و استفاده از قطعات ارزان‌تر ندارند. حافظه‌های استاندارد ۱۲گیگابایتی گوشی‌های میان‌رده، با نسخه‌های ۸ گیگابایتی جایگزین می‌شوند و شرکت‌ها از کیفیت بدنه و نمایشگرها می‌کاهند تا هزینه‌ی نهایی را مدیریت کنند.

در بازار کامپیوترهای شخصی هم بازگشت لپ‌تاپ‌هایی با رم ۴گیگابایتی را مشاهده می‌کنیم که اجرای سیستم‌عامل مدرن روی آن‌ها، حس کار با گجتی جدید را القا نمی‌کند. مؤسسات تحقیقاتی هشدار می‌دهند که با تداوم این روند، بازار لپ‌تاپ‌های اقتصادی و پایین‌رده به دلیل ناتوانی در همگامی با هزینه‌های جدید، ظرف دو سال آینده با خطر افت شدید تولید مواجه خواهد شد.

کار به جایی رسیده است که حتی غول‌های فناوری که پیش‌ازاین به‌لطف قراردادهای بلندمدت خود را در برابر نوسانات قیمت مصون می‌کردند؛ اکنون برای تضمین دریافت قطعات موردنیاز در محصولات پرچم‌دار خود، ناچارند مبالغ مازادی تا دوبرابر قیمت پایه (۱۰۰درصد پریمیوم) به تأمین‌کنندگان بپردازند.

دورنمای بازار قطعات: آیا دوباره رنگ حافظه‌های ارزان را خواهیم دید؟

فشارهای اقتصادی و بن‌بست‌های زنجیره‌ی تأمین، انگیزه‌ای قوی برای دانشمندان و مهندسان تراشه ایجاد می‌کند تا با ابداع معماری‌های نوین پردازشی، مرزهای سخت‌افزار را جابه‌جا کنند.

یکی از راهکارهای امیدوارکننده را می‌توانیم توسعه‌ی مسیرهای ارتباطی جدیدی مثل فناوری CXL بدانیم. این استاندارد ارتباطی، مفهوم استخر اشتراکی حافظه را محقق می‌سازد تا پردازنده‌های متعدد بتوانند به‌طور هم‌زمان از ماژول‌های رم مقرون‌به‌صرفه‌تر بهره ببرند؛ راهکاری هوشمندانه که می‌تواند وابستگی شدید صنعت به حافظه‌های سه‌بعدی و پرهزینه‌ی HBM را تعدیل کند.

در رویکردی رادیکال‌تر و آینده‌نگرانه‌تر، تحقیقات به سمت ایده‌ی جذاب محاسبات درون‌حافظه‌ای (Computing in-Memory) پیش می‌رود؛ بدین‌ترتیب نیاز به جابه‌جایی فیزیکی داده‌ها بین پردازنده و رم به‌طور کامل حذف می‌شود و پردازش دقیقا همان‌جایی اتفاق می‌افتد که داده‌ها ذخیره شده‌اند. این ایده، به‌طور مستقیم محدودیت پهنای باند و مصرف کلان انرژی را هدف قرار می‌دهد و نویدبخش پیشرفتی بزرگ در معماری کامپیوترها است.

برای عبور از محدودیت‌های مونتاژ و بسته‌بندی نیز راهکارهایی نظیر استفاده از پنل‌های مربعی‌شکل بزرگ‌تر به‌جای ویفرهای دایره‌ای سنتی مطرح می‌شود تا بتوان تراشه‌های بیشتری را به‌طور هم‌زمان تولید کرد؛ اما رهبران صنعت نیمه‌هادی به‌صراحت اعلام کرده‌اند که این فناوری‌ها به‌دلیل محدودیت‌های شدید ابزارهای بسیار ظریف لیتوگرافی، دست‌کم تا اواخر دهه‌ی جاری جایگزین خطوط فعلی تولید نمی‌شوند.

تحلیلگران اقتصادی می‌گویند نباید انتظار داشته باشیم بازار به‌زودی آرام شود و قیمت‌ها پایین بیایند؛ چراکه ساخت کارخانه‌ها و تجهیزات پیشرفته به ده‌ها میلیارد دلار سرمایه و سال‌ها زمان نیاز دارد. از طرفی، شرکت‌های ابری با پیش‌خریدکردن ظرفیت‌های تولید برای سال‌های آینده، خیال خودشان را بابت زیرساخت‌ها راحت کرده‌اند؛ اقدامی که عملا فشار هزینه‌ها بر مصرف‌کننده‌ی نهایی را به واقعیتی ماندگار و گریزناپذیر تبدیل می‌کند.

حالا صنعت قطعات الکترونیک وارد دورانی شده است که از آن به‌عنوان عصر هوش مصنوعی مبتنی‌بر حافظه یاد می‌شود و تمام محاسبات و معماری‌ها حول محور ظرفیت و سرعت ذخیره‌سازی می‌چرخد.

با تکامل روزافزون مدل‌های هوش مصنوعی، ظرفیت فضای پردازشی یکی از مهم‌ترین متغیرهای تأثیرگذار بر قدرت نهایی سیستم‌ها محسوب می‌شود و انگار مصرف‌کنندگان باید بپذیرند که دسترسی به قطعات ذخیره‌سازی اطلاعات، بهایی به‌مراتب سنگین‌تر از گذشته خواهد داشت.

نظرات