پردازنده گرافیکی Hopper H100 انویدیا با ۸۰ میلیارد ترانزیستور معرفی شد

چهارشنبه ۳ فروردین ۱۴۰۱ - ۱۳:۰۰
مطالعه 2 دقیقه
انویدیا پردازنده گرافیکی Hopper H100 را با ۸۰ میلیارد ترانزیستور معرفی کرد.
تبلیغات

امروز، انویدیا در کنفرانس فناوری GPU خود (GPU Technology Conference) ، جزئیات معماری هاپر (Hopper) و پردازنده گرافیکی Nvidia H100 را فاش کرد. می‌دانستیم که انویدیا مدتی است روی پردازنده‌های گرافیکی نسل بعدی کار می‌کند، اما اکنون برخی از مشخصات دقیق آن را دراختیار داریم. معماری هاپر و پردازنده گرافیکی H100 را نباید با Ada، معماری متمرکز بر مصرف‌‌کننده که کارت‌های GeForce آینده را تأمین می‌کند، اشتباه گرفت. انویدیا هنوز هیچ جزئیاتی در مورد Ada فاش نکرده و Hopper H100 جایگزین Ampere A100 خواهد شد که خود جایگزین Volta V100 شده است. این‌ها همه بخش‌های مرکز داده هستند.

به گزارش tomshardware، همان‌طورکه با توجه به میراث آن انتظار می‌رود، H100 برای ابررایانه‌ها با تمرکز بر قابلیت‌های هوش مصنوعی طراحی شده است. این گزینه شامل به‌روز‌رسانی‌ها و ارتقاء‌های متعدد در مقایسه با A100 فعلی است و همه طراحی‌ها برای رسیدن به سطوح جدیدی از عملکرد و کارایی بهبود یافته‌اند. هاپر ۸۰ میلیارد ترانزیستور دارد و با استفاده از فرایند سفارشی TSMC 4N ساخته شده است.

انویدیا تعداد هسته یا کلاک را فاش نکرد، اما جزئیات دیگری را به اشتراک گذاشت. H100 از نسل چهارم رابط NVLink انویدیا پشتیبانی می‌کند که می‌تواند تا ۱۲۸ گیگابایت بر ثانیه پهنای باند ارائه دهد. اتصال NVLink به‌روز شده ۱٫۵ برابر پهنای باند بیشتری نسبت به A100 ارائه می‌دهد، درحالی‌که PCIe 5.0 دو برابر پهنای باند PCIe 4.0 دراختیار سیستم قرار می‌گذارد.

H100 همچنین به‌طور پیش‌فرض از ۸۰ گیگابایت حافظه HBM3 با پهنای باند ۳ ترابایت بر ثانیه پشتیبانی می‌کند که ۱٫۵ برابر سریع‌تر از HBM2E است. به‌طور کلی، H100 نسبت به مدل قبلی خود ۵۰ درصد حافظه و پهنای باند رابط بیشتری دارد.

مطمئناً این پیشرفت خوبی محسوب می‌شود، اما سایر جنبه‌های هاپر پیشرفت‌های بیشتری را تجربه کرده است؛ هاپر پشتیبانی بهبودیافته FP8 را با حداکثر ۴۰۰۰ TFLOPS محاسباتی ارائه می‌دهد که شش برابر سریع‌تر از A100 است. برای کمک به بهینه‌سازی عملکرد، انویدیا موتور ترانسفورماتور جدیدی نیز دارد که براساس حجم‌کاری به‌طور خودکار بین فرمت‌های FP8 و FP16 جابه‌جا می‌شود.

انویدیا دستورالعمل‌های جدید DPX را نیز ارائه خواهد کرد که برای تسریع برنامه‌نویسی پویا طراحی شده‌اند. آن‌ها می‌توانند به طیف گسترده‌ای از الگوریتم‌ها، از جمله بهینه‌سازی مسیر و ژنومیک کمک کنند. انویدیا ادعا می‌کند عملکرد در این الگوریتم‌ها تا ۷ برابر سریع‌تر از GPU‌های نسل قبلی‌اش و تا ۴۰ برابر سریع‌تر از الگوریتم‌های مبتنی بر CPU است. هاپر همچنین روی افزایش امنیت نیز تمرکز کرده است.

همه این تغییرات برای اهداف ابررایانه و هوش مصنوعی انویدیا مهم هستند. بااین‌حال، تغییرات برای بهتر شدن کافی نیست. به‌طور کلی، انتظار داریم H100 عملکرد دو تا سه برابر سریع‌تر از Nvidia A100 باشد.

انویدیا مدعی است اسکیل‌های H100 بهتر از A100 است و می‌تواند تا ۹ برابر توان عملیاتی بیشتری را در آموزش هوش‌مصنوعی ارائه دهد. این شرکت می‌گوید H100 تا ۷ برابر سریع‌تر از A100 است.

تبلیغات
داغ‌ترین مطالب روز

نظرات

تبلیغات