چرا هوش مصنوعی تشنه حافظه است و دود این عطش چگونه به چشم کاربران عادی میرود؟
برای چند لحظه خودتان را جای دانشجو، مهندسی یا کاربری عادی بگذارید که بعد از ماهها برنامهریزی راهی بازار میشود تا لپتاپ یا گوشی هوشمند جدیدی بخرد. پیش خودمان حساب میکنیم که باتوجهبه سرعت پیشرفت تکنولوژی باید بتوانیم با پرداخت مبلغی معقول دستگاهی با حافظهی بالا و سرعت ایدهآل تهیه کنیم؛ اما قیمت وسایل الکترونیکی امروزی هر چیزی است بهجز معقول!
خلاصه صوتی
خلاصهی صوتی، ساختهشده با هوش مصنوعی
و بدتر اینکه مشخصات سختافزاری دستگاههای میانرده واقعا ناامیدکنندهاند. دیدن لپتاپهایی با تنها ۴ گیگابایت رم در ویترین فروشگاههای سال ۲۰۲۶ انگار ما را به یک دهه قبل برمیگرداند؛ البته این موضوع فقط مشکل ما نیست و تقریبا همهی کاربران در همهی کشورهای جهان، وضعیت فعلی بازارها را غیرقابلتوجیه میدانند.
شاید در نگاه اول فکر کنید شرکتهای سازنده دچار خطای محاسباتی شدهاند یا پای یک نوسان فصلی ساده در میان است؛ اما ماهیت تورمی که امروز تجربه میکنیم، با تمام کمبودهای دوران کرونا یا بالا و پایینشدنهای همیشگی بازار فرق دارد. همانطور که احتمالا حدس میزنید، باید انگشت اتهام را بهسمت هوش مصنوعی بگیریم.
شرکتهای بزرگ فناوری با یکدیگر بر سر توسعه و آموزش زیرساختهای هوش مصنوعی رقابت میکنند و مدلهای زبانی بزرگ هم برای درک اطلاعات و تولید پاسخ، به حجم عظیمی از داده و سرعت انتقالی بالا نیاز دارند، نیازی روزافزون و پرشتاب که صنعت نیمههادی را با سدی فیزیکی بهنام دیوار حافظه روبهرو کرده است.
تراشهسازان بزرگ در پاسخ به تقاضای غولهای تکنولوژی، مسیر خطوط تولیدشان را تغییر دادهاند تا تمام ظرفیتشان را روی ساخت محصولات گرانقیمت مخصوص سرورها متمرکز کنند؛ هرچند این استراتژی عوارض جانبی دیگری هم دارد و هر ویفر سیلیکون اختصاصیافته به دیتاسنترها، بهطور مستقیم از سهم مصرفکنندگان عادی کسر میشود.
حتی آمار هم تأیید میکند که قیمت برخی از انواع حافظه نسبت به اواخر سال گذشته، تا ۹۰ درصد افزایشیافته است.
از قفسه فروشگاه تا دیتاسنتر؛ چرخش استراتژیک بازار رم
در دهههای گذشته، بازار حافظه مثل ساعت کار میکرد و چرخههایی کاملا قابلپیشبینی داشت. دوران رونق و رکود این بازار، بیشتر با معرفی گوشیهای موبایل جدید یا کنسولهای بازی تنظیم میشد؛ اما با ورود به سالهای ۲۰۲۵ و ۲۰۲۶، این الگو به طور کامل تغییر کرد. حالا دیگر رم و فضای ذخیرهسازی صرفا قطعاتی ساده برای ارتقای سیستمهای کامپیوتری نیستند و بهنوعی دارایی استراتژیک، شدیدا کمیاب و رقابتی تبدیل شدهاند.
گزارش تحلیلی شرکت Aranca در مورد قیمتگذاری رم، به نکتهی مهمی اشاره میکند؛ شتاب دیوانهوار برای توسعهی زیرساختهای هوش مصنوعی، تمام ظرفیت کارخانههای تولید حافظه را تسخیر میکند و پیرو آن پساز یک دورهی ثبات نسبی، میانگین قیمت رم در برخی فروشگاههای خردهفروشی تا حدود چهار برابر افزایش مییابد.
تمرکز غولهای فناوری روی سرورها، بازار مصرفکنندگان عادی را به حاشیه رانده است
شرکتهای ردهاول مانند مایکروسافت، گوگل، متا و آمازون، برنامههای سرمایهگذاری خود را با اولویتدادن به هوش مصنوعی تنظیم میکنند و تا به اینجا سرمایهگذاریشان روی زیرساختهای محاسباتی، به بیشاز ۶۰۰ میلیارد دلار رسیده است که بخش اعظم آن بهطور مستقیم صرف خرید سختافزار میشود.
سرورهای جدیدی که غولهای فناوری برای هوش مصنوعی میسازند، نسبت به نسلهای قبلی خود به دو تا سه برابر حافظهی بیشتر نیاز دارند و همین امر باعث میشود تولیدکنندگانی مانند مایکرون؛ همهی تمرکز خود را روی محصولات گرانقیمت با حاشیهی سود بالاتر بگذارند. پیامدهای این انحصارطلبی را مصرفکنندگان عادی متحمل میشوند، ضمن اینکه نوسانات ارزی و سیاستهای قیمتگذاری باعث میشود هزینهی نهایی برای خریداران عادی تفاوتهای فاحشی داشته باشد.
جدول زیر نشان میدهد که قیمت یک کیت ۳۲گیگابایتی رم در فاصلهی کوتاه سپتامبر تا دسامبر ۲۰۲۵ چگونه در کشورهای مختلف افزایشیافته است.
کشور | خردهفروش نمونه | قیمت کیت ۳۲گیگابایتی (سپتامبر ۲۰۲۵) | قیمت کیت ۳۲گیگابایتی (دسامبر ۲۰۲۵) | درصد افزایش قیمت |
|---|---|---|---|---|
ایالات متحده | Newegg | ۱۴۹ دلار | ۳۹۲ دلار | ۱۶۳درصد |
بریتانیا | Overclockers UK | ۱۱۹ پوند | ۳۷۹ پوند | ۲۱۹درصد |
آلمان | Mindfactory | ۱۳۹ یورو | ۳۷۹ یورو | ۱۷۳درصد |
فرانسه | LDLC | ۱۳۹ یورو | ۵۲۱ یورو | ۲۷۵درصد |
استرالیا | PC Case Gear | ۱۹۹ دلار استرالیا | ۶۸۹ دلار استرالیا | ۲۴۶درصد |
ژاپن | Kakaku | ۱۶,۰۰۰ ین | ۱۱۵,۰۹۰ ین | ۶۱۹درصد |
اعداد جدول بالا به ما میگویند که چگونه شرکتهای بزرگ تأمینکننده، هزینههای نجومی خود را از جیب بازارهای مصرفی جبران کردهاند. در ساختار جدید، تولیدکنندگان سیستمهای سنگین پردازشی حاشیهی سود خود را حفظ میکنند؛ درحالیکه سازندگان لپتاپهای اقتصادی و گوشیهای میانرده زیر بار این فشار آسیب بیشتری میبینند.
دیوار حافظه؛ محدودیتی که گریبان پردازندهها را گرفت
برای اینکه بفهمیم چرا هوش مصنوعی تا این حد به حافظه نیاز دارد، باید کمی به لایههای عمیقتر سیستمهای کامپیوتری و معماری آنها نفوذ کنیم. سختافزار سنتی برپایهی معماری فون نویمان توسعه یافتهاند؛ ساختاری که در آن واحدهای پردازشی و ذخیرهسازی از یکدیگر مجزا هستند و دادهها باید بهطور مداوم میان آنها جابهجا شوند.
مشکل از جایی آغاز میشود که در دهههای اخیر، قدرت محاسباتی پردازندهها با نرخی نمایی رشد کرده است؛ درحالیکه پیشرفت پهنای باند حافظه یا همان سرعت جابهجایی اطلاعات آرامتر ارتقا مییابد. برای درک بهتر ماجرا سرآشپزی بسیار چابک و سریع را تصور کنید که میتواند در کسری از ثانیه غذا را آماده کند؛ اما شاگردی که باید مواد اولیه را از انبار برایش بیاورد، خونسرد و آهسته راه میرود!
سرعت انتقال اطلاعات نتوانسته پا به پای قدرت پردازندهها رشد کند
سرآشپز در نهایت بهناچار باید صبر کند تا مواد به دستش برسد. مطالعات نشان میدهند که توان محاسباتی تراشهها در سالهای اخیر حدود ۳برابر شده؛ درحالیکه پهنای باند حافظه تنها ۱٫۶برابر افزایشیافته؛ این ناهماهنگی، همان محدودیت فیزیکی معروفی است که با نام دیوار حافظه شناخته میشود. امروز سریعترین پردازندههای گرافیکی جهان در عمل زمان گرانبهای خود را صرف انتظار برای رسیدن دادهها میکنند.
مهندسان برای تحلیل رفتار پردازندهی گرافیکی در تعامل با حافظه از مدل روفلاین استفاده میکنند که توضیح میدهد عملکرد یک واحد پردازشی دارای دو سقف مجزا است؛ نخست قدرت محاسباتی محض که با ترافلاپس سنجیده میشود و دوم سقف پهنای باند حافظه بر حسب ترابایتبرثانیه.
اگر بار کاری برنامهای برای انجام محاسبهای کوچک به خواندن حجم عظیمی از داده نیاز داشته باشد، سیستم به سقف دوم برخورد میکند و بهاصطلاح، دچار محدودیت حافظه یا Memory-Bound میشود. در این وضعیت ارتقای پردازنده یا خرید کارت گرافیک قویتر، هیچ تغییری در سرعت نهایی تولید پاسخ ایجاد نمیکند؛ مگر اینکه فکری به حال عرض جاده یا همان پهنای باند حافظه کرده باشید.
رم در مدلهای زبانی بزرگ دقیقا چه کاری انجام میدهد؟
وقتی یک سؤال یا درخواست را برای یک مدل هوش مصنوعی ارسال میکنید، فرایند تولید پاسخ وارد دو فاز کاملا متفاوت میشود: فاز اول پیشپُرکردن (Prefill) و فاز دوم رمزگشایی (Decode) نام دارد.
در فاز اول، هوش مصنوعی کل متن ورودی شما را یکجا میخواند و پردازش میکند؛ مرحلهای که به ضرب ماتریسهای بزرگ ریاضی در فضای اعداد اعشاری شباهت دارد و ازآنجاکه دادهها در این بخش بسیار فشرده و متراکماند، تراشه تمام توان محاسباتی خود را بهکار میگیرد. در فاز اول، سرعت حافظه چندان تعیینکننده نیست و بیشتر، قدرت محض محاسباتی پردازنده موضوعیت دارد.
اما اصل ماجرا و شروع آن بنبست معروف، در فاز دوم یعنی رمزگشایی رخ میدهد. مدلهای زبانی بزرگ، پاسخ شما را یکباره و بهصورت کامل تولید نمیکنند؛ آنها متن را بهصورت کلمهبهکلمه یا دقیقتر بگوییم، توکن به توکن پدید میآورند. مدل برای نوشتن هر کلمهی جدید، باید نگاهی به تمام کلمات قبلی بیندازد و از آنها در محاسبات خود استفاده کند؛ اینجاست که ریاضیات شبکههای عصبی با محدودیت فیزیکی رم مواجه میشود.
فاز دوم عملکرد مدلهای زبانی بزرگ، کاملا به سرعت حافظه بستگی دارد
یک مدل میانرده، اما قدرتمند ۷۰میلیارد پارامتری را در نظر بگیرید. اگر این مدل بادقت استاندارد ۱۶بیتی بارگذاری شود، حجم فایل آن روی حافظه حدود ۱۴۰ گیگابایت خواهد بود. در فاز رمزگشایی، پردازندهی گرافیکی برای اینکه بتواند فقط و فقط یک کلمه یا توکن تولید کند، بهناچار باید تمام ۱۴۰ گیگابایت وزنهای مدل را از روی حافظهی موقت (VRAM) بخواند و در محاسبات بهکار بگیرد.
حالا اگر بخواهید مدل ۷۰میلیارد پارامتری موردبحث با سرعت ۴۰ توکنبرثانیه به شما پاسخ دهد، سیستم باید در هر ثانیه، ۱۴۰ گیگابایت را ۴۰ بار بخواند و جابهجا کند؛ یعنی پهنای باندی در حدود ۵٫۶ ترابایتبرثانیه!
این مرور ساده نشان میدهد چرا در فاز رمزگشایی، عملکرد سیستم کاملا به سرعت انتقال رم بستگی دارد؛ وضعیتی که در آن پردازندههای سریع بدون داشتن یک حافظهی موقت حجیم و بههمان اندازه پرسرعت، عملا کاراییشان را از دست میدهند.
فرمفاکتورها؛ پُشتههای سهبعدی در برابر ماژولهای سنتی
نیاز مبرم به عبور از محدودیتهای فیزیکی پهنای باند، صنعت نیمهرسانا را بهسمت دو معماری کاملا متضاد سوق داده است؛ حافظههای فوقسریع HBM و رمهای مقرونبهصرفهتری مثل DDR5.
بیایید ببینیم وقتی یک مدل هوش مصنوعی در حال اجراست دقیقا چه اتفاقی میافتد. مدلهای زبانی بزرگ هنگام تولید پاسخ، فقط به وزنهای ثابت خود متکی نیستند و از حافظهی موقتی بهنام KV Cache هم استفاده میکنند؛ بهعبارتی مقادیر محاسباتی توکنهای قبلی در این حافظه ذخیره میشوند تا مدل مجبور نباشد در هرگام آنها را از نو محاسبه کند.
رمهای سهبعدی (HBM) اتوبانهای اطلاعاتی عریضی برای انتقال سریع دادهها میسازند
شما میتوانید KV Cache را مثل یک دفترچهیادداشت موقت در نظر بگیرید که هوش مصنوعی برای بهخاطرسپردن روند مکالمات از آن استفاده میکند؛ هرچه متن طولانیتری به آن بدهید یا کاربران بیشتری همزمان از مدل استفاده کنند، دفترچه سریعتر پُر میشود و با رشدی خطی، خیلی زود تمام فضای موجود را اشغال میکند.
برای اینکه سیستم بتواند با چنین حجم انبوهی از اطلاعات همگام شود، مهندسان حافظههای با پهنای باند بالا یا HBM را توسعه دادند. رمهای سنتی معمولا بهصورت تخت روی مادربرد مینشینند؛ اما در معماری HBM، قطعات سیلیکونی مثل طبقات یک برج رویهم قرار میگیرند و با مسیرهای بسیار ریز درونتراشهای به هم متصل شوند.
ساختار سهبعدی HBM به طراحان اجازه میدهد تا اتوبانهای اطلاعاتی بسیار عریضی ایجاد کنند که دادهها را با سرعت خیرهکنندهی ترابایتبرثانیه جابهجا میکنند.
در طرف مقابل، حافظههای استاندارد سرورها قرار دارند که مثل همیشه روی شیارهای مادربرد نصب میشوند. این ماژولها پهنای باند کمتری دارند؛ اما در عوض ظرفیت بسیار بالاتر و قیمت ارزانتری برای مدیریت سیستمعامل و آمادهسازی اولیهی دادهها فراهم میکنند.
اهمیت حافظهی اختصاصی پردازنده زمانی خودش را نشان میدهد که حجم دادهها از ظرفیت آن بیشتر شود. اگر مدل هوش مصنوعی مجبور شود برای دسترسی به اطلاعات سرریزشده، از طریق مسیرهای طولانیتر مادربرد به حافظهی اشتراکی سیستم مراجعه کند، سرعت پردازش شدیدا افت میکند. در این حالت پردازندههای چند ۱۰هزار دلاری، عملا به قطعهای کند و ناکارآمد تبدیل میشود که باید منتظر رسیدن تدریجی دادهها بماند.
نقش پنهان درایوهای حالت جامد در خط مقدم دادهها
باوجوداینکه این روزها توجه دنیای فناوری بیشتر به رم و پردازنده معطوف شده است، افزایش چشمگیر قیمت درایوهای حالت جامد (SSD) و هاردها، از تحول بزرگی در بخش دیگری از دنیای سختافزار حکایت دارد.
در معماریهای پردازشی جدید، SSDها دیگر صرفا فضایی راکد برای ذخیرهسازی محسوب نمیشوند و درعوض به بازیگرانی فعال تبدیل شدهاند که در تمام مراحل دریافت، آمادهسازی، آموزش و استنتاج هوش مصنوعی نقشی کلیدی ایفا میکنند.
یکی از پرفشارترین وظایفی که روی دوش درایوهای SSD قرار دارد، در زمان آموزش مدلهای زبانی و طی فرایند ذخیرهی وضعیت (Checkpointing) اتفاق میافتد. هنگامی که یک شبکهی عصبی پیچیده در حال آموزش است، سیستم باید بهطور مداوم وضعیت لحظهایِ فرایند، شامل وزنها، وضعیت الگوریتمهای بهینهساز و نرخ یادگیری را ذخیره کند.
توقف ذخیرهسازی دادههای هوش مصنوعی، به معنای اتلاف هزینهها و زمان طولانی پردازش است
فرایند ذخیرهی وضعیت درست شبیه فشردن دکمهی Save قبل از رسیدن به غول مرحلهی آخر در یک بازی ویدیویی است، با این تفاوت که اینجا با صدها گیگابایت اطلاعات روبهرو هستیم که باید در کسری از ثانیه ثبت شوند تا در صورت قطعی برق یا خطاهای سختافزاری، هزینههای سنگین و زمان طولانی پردازش به هدر نرود.
وقتی زمان ذخیرهسازی میرسد، موج عظیمی از اطلاعات برای نوشتن بهسوی درایو سرازیر میشود. اگر درایو توانایی هضم این ترافیک سنگین را نداشته باشد، ظرفیت حافظهی پنهانش بهاصطلاح اشباع میشود و کل پردازندههای شبکه ناچارند فرایند یادگیری را متوقف کنند تا درایو کارش را به پایان برساند. این وقفه یعنی اتلاف توان محاسباتی و زمان.
ازسویدیگر جستوجوی آنی در پایگاههای داده برای اینکه هوش مصنوعی بتواند پاسخهای دقیقی به کاربر بدهد هم نیازمند درایوهایی است که کمترین تأخیر ممکن را داشته باشند؛ بههمین دلایل، دیتاسنترها بهشدت به درایوهای کلاس سازمانی با دوام فوقالعادهبالا وابسته هستند؛ قطعاتی که با سلولهای حافظهی بسیار مقاومی ساخته میشوند و به خازنهای سختافزاری مجهزند تا حتی در صورت قطع ناگهانی برق، دادهای از دست نرود.
کنترلر درایوها نیز از فناوریهای پیشرفتهای بهره میبرند تا پدیدهی مخربی بهنام اثر مخلوطکنندهی ورودی/خروجی (I/O Blender Effect) را مهار کند؛ پدیدهای که در آن، هجوم همزمان و بینظم دادهها باعث سردرگمی کنترلر، افت شدید کارایی و استهلاک سریعتر درایو میشود.
افزایش بیسابقهی تقاضا برای درایوهای پرظرفیت و با دوام باعث میشود سازندگان تراشههای فلش تمام تمرکز خود را معطوف به تولید فرمفاکتورهای سازمانی کنند. پیامد این تغییر استراتژی، کمبود جدی عرضه و محدودیت شدید لایهی بازار مصرفکنندگان عادی است.
تنگنای میلیمتری؛ بستهبندی پیشرفته در کارخانههای تایوان
ابعاد واقعی کمبود جهانی حافظه را زمانی بهتر میفهمیم که نگاهمان را معطوف حلقهی پنهان، اما تعیینکنندهی فناوری بستهبندی پیشرفته کنیم.
ساختن تراشههای پیشرفته، در واقع تنها نیمیاز مسیر مهندسی در دنیای تراشههاست. برای اینکه حافظههای سهبعدی بتوانند پهنای باند بینظیرشان را در عمل نشان دهند، باید با دقتی در مقیاس میکرومتر در مجاورت پردازندهی اصلی و روی یک لایهی میانجی سیلیکونی متصل شوند؛ بههمین دلیل امروز فناوری انحصاری TSMC برای مونتاژ بسیار ظریف موسوم به CoWoS، مهمترین تنگنای کل زنجیرهی تأمین جهان محسوب میشود.
تولید پردازنده بدون ظرفیت بستهبندی پیشرفته، گره کور این روزهای صنعت است
واقعیت این است که حتی اگر میلیونها پردازندهی گرافیکی تولید شود، تا زمانی که ظرفیت کافی برای بستهبندی دقیق آنها در کنار حافظههای فوقالعاده سریع وجود نداشته باشد، این قطعات هرگز محصول نهایی و کارآمدی نخواهند بود.
شرکت TSMC تهاجمیترین برنامهها را برای توسعهی ظرفیت خود اجرا میکند؛ ولی هنوز نتوانسته است پاسخگوی تقاضای بیپایان بازار باشد. جدول زیر بهخوبی روند ناترازی را نشان میدهد:
وضعیت عرضه و تقاضا | ظرفیت تقریبی CoWoS (ویفر در ماه) | بازه زمانی |
|---|---|---|
آغاز کمبود شدید و صفهای طولانی انتظار | ۳۵,۰۰۰ | اواخر ۲۰۲۴ |
افزایش قیمتهای خدمات بستهبندی | ۷۵,۰۰۰ | اواخر ۲۰۲۵ |
پیشفروش کامل و رزرو قطعی توسط غولهای فناوری | ۱۲۵,۰۰۰ تا ۱۳۰,۰۰۰ | هدفگذاری پایان ۲۰۲۶ |
در این فضای رقابتی، برخی شرکتهای زیرکتر به پیشخریدهای کلان روی آوردهاند؛ تا جایی که انویدیا بهتنهایی نزدیک به ۶۰درصد از ظرفیت خطوط مونتاژ پیشرفته را برای سال ۲۰۲۶ رزرو کرده است؛ اقدامی که دیگر رقبا را با صفهای انتظار طولانی یک تا یکونیم ساله مواجه میسازد.
تبعات چالش تأمین چنان عمیق است که حتی توسعهدهندگان بزرگی مثل گوگل مجبور شدهاند اهداف تولید پردازندههای سفارشی خود را کاهش دهند. امروز موفقیت مالی تولیدکنندگان سختافزار دیگر صرفا در گرو معماری و مهندسی تراشهها نیست؛ بلکه به توانایی آنها در تصاحب سهم بیشتری از زمان خطوط تولید محدود بستگی دارد.
انقراض تدریجی گجتهای اقتصادی
این چرخهی کلان مالی و تکنولوژیک، تورمی ساختاری و عمیق را به کل پیکرهی صنعت الکترونیک تزریق کرده است. در یکسوی میدان، دیتاسنترها و غولهای ابری در حال ثبت سودهای رکوردشکن هستند و در سوی دیگر، سازندگان کامپیوترهای شخصی و گوشیهای هوشمند برای حفظ حاشیهی سود خود تلاش میکنند.
در همینحال سهم هزینهی قطعات ذخیرهسازی در قیمت تمامشدهی محصولات، از ۱۵ درصد در سالهای گذشته، حالا به بیشاز ۵۰درصد هزینهها در دستگاههای میانرده رسیده است.
پیشبینیها نشان میدهند که آمار عرضهی گوشیهای هوشمند در سال ۲۰۲۶ با سقوطی ۱۳٫۹درصدی روبهرو خواهد شد. در این میان، گوشیهای اقتصادی و ارزانقیمت بیشترین ضربه را میخورند؛ همان دستگاههایی که نقش کلیدی در اتصال افراد کمدرآمد در مناطق درحالتوسعه به اینترنت داشتند.
سهم حافظه در قیمت تمامشده گجتهای میانرده، به بیش از نیمی از کل هزینهها میرسد
حالا فروش گوشیهای زیر ۱۰۰ دلار در برخی مناطق جهان بیشاز نیمی از بازار خود را ازدستداده و سود شرکتهایی که روی این بخشها متمرکز بودند، بهشدت افت کرده است.
تولیدکنندگان برای مهار فشارهای خردکننده، چارهای جز پایینآوردن مشخصات سختافزاری و استفاده از قطعات ارزانتر ندارند. حافظههای استاندارد ۱۲گیگابایتی گوشیهای میانرده، با نسخههای ۸ گیگابایتی جایگزین میشوند و شرکتها از کیفیت بدنه و نمایشگرها میکاهند تا هزینهی نهایی را مدیریت کنند.
در بازار کامپیوترهای شخصی هم بازگشت لپتاپهایی با رم ۴گیگابایتی را مشاهده میکنیم که اجرای سیستمعامل مدرن روی آنها، حس کار با گجتی جدید را القا نمیکند. مؤسسات تحقیقاتی هشدار میدهند که با تداوم این روند، بازار لپتاپهای اقتصادی و پایینرده به دلیل ناتوانی در همگامی با هزینههای جدید، ظرف دو سال آینده با خطر افت شدید تولید مواجه خواهد شد.
کار به جایی رسیده است که حتی غولهای فناوری که پیشازاین بهلطف قراردادهای بلندمدت خود را در برابر نوسانات قیمت مصون میکردند؛ اکنون برای تضمین دریافت قطعات موردنیاز در محصولات پرچمدار خود، ناچارند مبالغ مازادی تا دوبرابر قیمت پایه (۱۰۰درصد پریمیوم) به تأمینکنندگان بپردازند.
دورنمای بازار قطعات: آیا دوباره رنگ حافظههای ارزان را خواهیم دید؟
فشارهای اقتصادی و بنبستهای زنجیرهی تأمین، انگیزهای قوی برای دانشمندان و مهندسان تراشه ایجاد میکند تا با ابداع معماریهای نوین پردازشی، مرزهای سختافزار را جابهجا کنند.
یکی از راهکارهای امیدوارکننده را میتوانیم توسعهی مسیرهای ارتباطی جدیدی مثل فناوری CXL بدانیم. این استاندارد ارتباطی، مفهوم استخر اشتراکی حافظه را محقق میسازد تا پردازندههای متعدد بتوانند بهطور همزمان از ماژولهای رم مقرونبهصرفهتر بهره ببرند؛ راهکاری هوشمندانه که میتواند وابستگی شدید صنعت به حافظههای سهبعدی و پرهزینهی HBM را تعدیل کند.
در رویکردی رادیکالتر و آیندهنگرانهتر، تحقیقات به سمت ایدهی جذاب محاسبات درونحافظهای (Computing in-Memory) پیش میرود؛ بدینترتیب نیاز به جابهجایی فیزیکی دادهها بین پردازنده و رم بهطور کامل حذف میشود و پردازش دقیقا همانجایی اتفاق میافتد که دادهها ذخیره شدهاند. این ایده، بهطور مستقیم محدودیت پهنای باند و مصرف کلان انرژی را هدف قرار میدهد و نویدبخش پیشرفتی بزرگ در معماری کامپیوترها است.
برای عبور از محدودیتهای مونتاژ و بستهبندی نیز راهکارهایی نظیر استفاده از پنلهای مربعیشکل بزرگتر بهجای ویفرهای دایرهای سنتی مطرح میشود تا بتوان تراشههای بیشتری را بهطور همزمان تولید کرد؛ اما رهبران صنعت نیمههادی بهصراحت اعلام کردهاند که این فناوریها بهدلیل محدودیتهای شدید ابزارهای بسیار ظریف لیتوگرافی، دستکم تا اواخر دههی جاری جایگزین خطوط فعلی تولید نمیشوند.
تحلیلگران اقتصادی میگویند نباید انتظار داشته باشیم بازار بهزودی آرام شود و قیمتها پایین بیایند؛ چراکه ساخت کارخانهها و تجهیزات پیشرفته به دهها میلیارد دلار سرمایه و سالها زمان نیاز دارد. از طرفی، شرکتهای ابری با پیشخریدکردن ظرفیتهای تولید برای سالهای آینده، خیال خودشان را بابت زیرساختها راحت کردهاند؛ اقدامی که عملا فشار هزینهها بر مصرفکنندهی نهایی را به واقعیتی ماندگار و گریزناپذیر تبدیل میکند.
حالا صنعت قطعات الکترونیک وارد دورانی شده است که از آن بهعنوان عصر هوش مصنوعی مبتنیبر حافظه یاد میشود و تمام محاسبات و معماریها حول محور ظرفیت و سرعت ذخیرهسازی میچرخد.
با تکامل روزافزون مدلهای هوش مصنوعی، ظرفیت فضای پردازشی یکی از مهمترین متغیرهای تأثیرگذار بر قدرت نهایی سیستمها محسوب میشود و انگار مصرفکنندگان باید بپذیرند که دسترسی به قطعات ذخیرهسازی اطلاعات، بهایی بهمراتب سنگینتر از گذشته خواهد داشت.