پردازنده گرافیکی A100 انویدیا با ۸۰ گیگابایت حافظه معرفی شد

پردازنده گرافیکی A100 انویدیا با ۸۰ گیگابایت حافظه معرفی شد

مدل ارتقایافته‌ی تراشه‌ی امپر A100 به ۸۰ گیگابایت حافظه‌ی گرافیکی مجهز است و پهنای باند بسیار بیشتری درمقایسه‌با مدل قبلی ارائه می‌دهد. ازاین‌پس، این تراشه پرچم‌دار خانواده‌ی امپر انویدیا محسوب می‌شود.

تنها ۶ ماه از رونمایی اولیه‌ی معماری امپر انویدیا (Nvidia Ampere) می‌گذرد و تیم سبز به‌تازگی تصمیم گرفته است پرچم‌دار جدیدی برای این خانواده از تراشه‌های گرافیکی معرفی کند. جدیدترین مدل از تراشه‌های گرافیکی امپر مدل بهبودیافته‌ی پرچم‌دار پیشین محسوب می‌شود و حافظه‌ی گرافیکی (VRAM) بیشتر دارد و پهنای باندش به‌طور درخورتوجهی افزایش پیدا کرده است.

مدل جدید تراشه‌ی A100 امپر این بار ۸۰ گیگابایت حافظه‌ی گرافیکی دارد و از بسیاری از جوانب درمقایسه‌با مدل ۴۰ گیگابایتی بدون تغییر باقی مانده است. بدین‌ترتیب A100 هشتادگیگابایتی همچون A100 چهل‌گیگابایتی از سرعت کلاک بوست (تقویت‌شده) ۱٫۴۱ گیگاهرتز، باس حافظه‌ی ۵،۱۲۰ بیت، قدرت پردازشی دقت تکی ۱۹٫۵ ترافلاپس (TFLOPS) و توان طراحی حرارتی ۴۰۰ وات استفاده می‌کند و از NVLink 3 پشتیبانی می‌کند. هر دو تراشه به ۶،۱۹۲ هسته‌ی گرافیکی مجهز هستند.

اصلی‌ترین تفاوت بین تراشه‌های پرچم‌دار خانواده‌ی امپر، حداکثر حافظه‌ی گرافیکی آن‌ها است که در مدل جدید از ۴۰ گیگابایت به ۸۰ گیگابایت افزایش پیدا کرده است. مدل جدید مجموع پهنای باند حافظه‌ی بیشتری نیز دارد. بر‌اساس اعلام رسمی، پهنای باند مدل ۸۰ گیگابایتی معادل ۳٫۲ گیگابیت‌برثانیه HBMe است؛ درحالی‌که مدل ۴۰ گیگابایت پهنای باند ۲٫۴ گیگابیت‌برثانیه‌ای HBMe ارائه می‌داد.

پهنای باند در سراسر آرایه‌ی HBM2 دو ترابایت‌برثانیه است؛ درحالی‌که این مقدار در مدل ۴۰ گیگابایتی A100 معادل ۱٫۶ ترابایت‌برثانیه بود. آنچه گفتیم، به‌وضوح نشان می‌دهد مدل ۸۰ گیگابایتی A100 بهبودهای محسوسی تجربه کرده است. اگر انویدیا به‌منظور دستیابی به دو برابر ظرفیت بیشتر پهنای باند حافظه‌ی آرایه‌ی HBM2 را کاهش می‌داد، به‌هیچ‌وجه تعجب نمی‌کردیم. بااین‌حال، تیم سبز ترجیح داده است مجموع پهنای باند را نیز ۱٫۲۵ برابر افزایش دهد.

مشخصات فنی پردازنده گرافیکی امپر Nvidia Ampere A100 مدل 80 گیگابایتی

همان‌طور‌که در تصویر بالا مشاهده می‌کنید، تراشه‌ی جدید A100 از ۶ بسته‌ی HBM2 تشکیل شده است. باوجوداین، انویدیا یکی از این بسته‌ها را غیرفعال کرده تا بازده‌ی نهایی تراشه بهبود یابد. هر‌یک از پنج بسته‌ی باقی‌مانده باس حافظه‌ی ۱،۰۲۴ بیتی دارند و همین موضوع باعث شده مجموع باس حافظه‌ی تراشه برابر با ۵،۱۲۰ بیت باشد.

انویدیا در مدل ۸۰ گیگابایتی تراشه‌ی A100 از بسته‌ی HBM2E به‌جای HBM2 استفاده کرده است تا بتواند مشخصه‌های پایه‌ای تراشه را به‌‌طور اساسی ارتقا‌ دهد. مدل ۸۰ گیگابایت تراشه‌ی A100 انویدیا مخصوص آن‌ دسته از وظایف کاری است که به ظرفیت و پهنای باند بیشتر نیاز دارند.

مدل ۸۰ گیگابایتی همچون مدل ۴۰ گیگابایتی می‌تواند حداکثر از هفت دستگاه پشتیبانی کند و به هر‌یک از آن‌ها ۱۰ گیگابایت حافظه‌ی گرافیکی اختصاص دهد. انویدیا قصد دارد پردازنده‌ی گرافیکی جدید خود را در قالب کارت‌های گرافیک تکی Mezzanine Modular و با پیکربندی HGX یا DGX عرضه کند.

علاقه‌مندان به خرید پردازنده‌ی گرافیکی A100 را در قالب کارت گرافیک PCIe همچنان باید به مدل ۴۰ گیگابایتی فکر کنند؛ زیرا انویدیا فعلا مدل ۸۰ گیگابایتی را در کارت‌های PCIe قرار نداده است. با‌این‌حال احتمالا این وضعیت در آینده دستخوش تغییر می‌شود. 

مقایسه‌ی تراشه‌های گرافیکی رده‌بالای انویدیا
-(A100 (80GB(A100 (40GBV100
هسته‌های کودای FP32 ۶،۹۱۲۶،۹۱۲۵،۱۲۰
سرعت کلاک بوست۱،۴۱۰ مگاهرتز۱،۴۱۰ مگاهرتز ۱،۵۳۰ مگاهرتز
سرعت کلاک حافظه۳٫۲ گیگابیت‌برثانیه HBM2e۲٫۴ گیگابیت‌برثانیه HBM2۱٫۷۵ گیگابیت‌برثانیه HBM2
پهنای باس حافظه۵،۱۲۰ بیت۵،۱۲۰ بیت۴،۰۹۶ بیت
پهنای باند حافظه۲٫۰ ترابایت‌برثانیه۱٫۶ ترابایت‌برثانیه۹۰۰ گیگابایت‌برثانیه
حافظه‌ی گرافیکی۸۰ گیگابایت۴۰ گیگابایت۱۶ یا ۳۲ گیگابایت
قدرت پردازشی دقت یگانه۱۹٫۵ ترافلاپس۱۹٫۵ ترافلاپس۱۵٫۷ ترافلاپس
قدرت پردازشی دقت دوگانه۹٫۷ ترافلاپس (یک‌دوم نرخ FP32)۹٫۷ ترافلاپس (یک‌دوم نرخ FP32)۷٫۸ ترافلاپس (یک‌دوم نرخ FP32)
تنسور INT8 ۶۲۴ تاپس۶۲۴ تاپسنامشخص
تنسور FP16۳۱۲ ترافلاپس۳۱۲ ترافلاپس۱۲۵ ترافلاپس
تنسور TF32 ۱۵۶ ترافلاپس۱۵۶ ترافلاپسنامشخص
اینترکانکت

NVLink 3

۱۲ لینک (۶۰۰ گیگابایت‌برثانیه)

NVLink 3

۱۲ لینک (۶۰۰ گیگابایت‌برثانیه)

NVLink 2

۶ لینک (۳۰۰ گیگابایت‌برثانیه)

پردازنده‌ی گرافیکی

GA100 با مساحت ۸۲۵ میلی‌مترمربع

GA100 با مساحت ۸۲۶ میلی‌مترمربع

GV100 با مساحت ۸۱۵ میلی‌مترمربع

تعداد ترانزیستور

۵۴٫۲ میلیارد

۵۴٫۲ میلیارد

۲۱٫۱ میلیارد

توان طراحی حرارتی

۴۰۰ وات

۴۰۰ وات

۳۰۰ یا ۳۵۰ وات

لیتوگرافی 

۷ نانومتری TSMC

۷ نانومتری TSMC

۱۲ نانومتری TSMC

رابط

SXM4

SXM4

SXM2 یا SXM3

معماریامپر (Ampere)

امپر (Ampere)

ولتا (Volta)

برچسب قیمت سرور پر از پردازنده‌های گرافیکی ۸۰ گیگابایتی A100 انویدیا بسیار گران خواهد بود. با‌این‌حال، شرکت‌هایی که به‌طور جدی مشغول کار روی هوش مصنوعی و پردازش‌های سنگین مرتبط ‌به آن هستند، به‌احتمال زیاد درصورت داشتن منابع مالی کافی، حاضر خواهند بود هزینه‌های هنگفتی برای تهیه‌ی سرورهای حاوی پردازنده‌ی گرافیکی جدید انویدیا بپردازند. افزایش حافظه‌ی گرافیکی تراشه‌ی A100 به محققان امکان می‌دهد پیچیدگی مدل‌های هوش مصنوعی خود را افزایش دهند و مشکلاتی را برطرف کنند که مدل ۴۰ گیگابایتی با آن‌ها مواجه بود. 

از سراسر وب

  دیدگاه
کاراکتر باقی مانده

بیشتر بخوانید