منو سایت

  • خانه
  • وبلاگ
  • شتاب دهنده Instinct MI200 ، که در اواخر سال 2021 با معماری CDNA 2 منتشر شد

شتاب دهنده Instinct MI200 ، که در اواخر سال 2021 با معماری CDNA 2 منتشر شد

 تاریخ انتشار :
/
  وبلاگ

شتاب دهنده Instinct MI200 ، که در اواخر سال 2021 با معماری CDNA 2 منتشر شد

در چند ماه گذشته ، ما چندین گزارش از پیشرفت های جدید در فناوری پردازنده و گرافیک AMD مشاهده کرده ایم. به نظر می رسد این شرکت قصد دارد با راه اندازی شتاب دهنده Instinct MI200 در اواخر سال 2021 معماری CDNA 2 را به بازار HPC وارد کند. البته این اطلاعات از آخرین جلسه سرمایه گذاران در اوایل ماه جاری به دست آمد. در همان زمان ، اعتقاد بر این است که معماری CDNA 2 از طراحی MCM استفاده می کند.

بر خلاف ماه مه ، گزارش جدیدی که در اواخر ژوئیه منتشر شد نشان می دهد که AMD قصد دارد معماری CDNA 2 خود را تا پایان سال 2021 منتشر کند. این شتاب دهنده از فناوری پیشرفته تولیدی استفاده می کند که ممکن است متعلق به TSMC باشد و ممکن است نود و شش یا هفت نانومتر باشد.

  • نمودارهای Navi 31 و Navi 33 بر روی پلتفرم ROCm فهرست شد
  • سهم بازار پردازنده های AMD به نزدیک 17 درصد رسید – بالاترین سطح از سال 2006
  • درایور جدید AMD با مشکل مصرف زیاد در YouTube

شتاب دهنده Instinct MI200 تا پایان سال 2021 عرضه می شود.

معماری AMD HPC

معماری CDNA 2 به شتابدهنده های آینده تیم قرمز HP HP Instinct نیرو می بخشد. انتظار می رود مدل هایی مانند Instinct MI200 از GPU Aldebaran استفاده کنند. همانطور که گفتیم ، این کارت گرافیک احتمالاً اولین کارت گرافیکی خواهد بود که به عنوان ماژول چند تراشه در دسترس خواهد بود. Instinct MI200 در حال آماده شدن برای رقابت با Intel Ponte Vecchio (شتاب دهنده 7 نانومتری) و همچنین بهبود معماری Nvidia Ampere است. البته تیم های سبز و آبی نیز مدلهای MCM خود را ارائه می دهند.

قبلاً تأیید شده است که Aldebaran (یا شتاب دهنده Instinct MI200) از دو تراشه استفاده می کند. بلوک دیاگرام نشان داده شده همچنین دو ماتریس را نشان می دهد که هر کدام شامل 8 موتور سایه زن در مجموع 16 ماتریس است. هر موتور Shader شامل 16 واحد FP64 کامل و بسته بندی FP32 و یک موتور ماتریس نسل دوم برای عملیات FP16 و BF16 است.

هر ماتریس دارای 128 واحد محاسبه است که به معنی 8192 هسته است. در نهایت ما شاهد 256 واحد یا 16384 هسته برای کل تراشه خواهیم بود. Aldebaran همچنین از اتصال جدید XGMI استفاده می کند. هر چیپلت همچنین دارای یک موتور 2.6 VCN و یک کنترلر اصلی ورودی / خروجی است.

در بخش حافظه ، AMD از رابط 8 کاناله با گذرگاه 1024 بیتی استفاده می کند تا کل گذرگاه 8192 بیت شود. هر رابط می تواند از 2 گیگابایت ماژول HBM2e پشتیبانی کند. این به معنای حداکثر 16 گیگابایت حافظه HBM2e در هر پشته است و از آنجا که هشت پشته را می بینیم ، کل حافظه می تواند 128 گیگابایت باشد. این میزان 48 گیگابایت بیشتر از تراشه A100 انویدیا با 80 گیگابایت حافظه HBM2e است. شتاب دهنده جدید AMD در بحث HPC در واقع یک غول پردازنده خواهد بود ، اما ما انتظار داریم که مصرف برق بسیار بالایی نیز داشته باشد. در همین حال ، Kepler_L2 ادعا می کند که شتاب دهنده Instinct MI200 در واقع از تنظیمات کاهش یافته با 224 واحد یا 14336 هسته استفاده می کند. تقریباً 14 co هسته کمتر از تراشه Aldebaran کامل.

بلوک دیاگرام غیر رسمی تراشه AMD Aldebaran

AMD Instinct MI200 همچنین ممکن است با نام Aldebaran شناخته شود ، که یکی از ستاره های غول پیکر برج فلکی برج ثور با شعاع خورشیدی 44.13 یا 75٪ بزرگتر از Arcturus است. این نام نشان می دهد که Aldebaran ممکن است دو برابر Arcturus قدرتمند باشد ، زیرا نام شتاب دهنده های MI معمولاً عملکرد خام آنها را نشان می دهد. اگرچه این در حال حاضر تنها یک حدس است ، اما ممکن است با استفاده از طراحی MCM درست باشد.

نام شتاب دهنده AMD Radeon Instinct MI6 AMD Radeon Instinct MI8 AMD Radeon Instinct MI25 AMD Radeon Instinct MI50 AMD Radeon Instinct MI60 AMD Radeon Instinct MI100 AMD Radeon Instinct MI200
معماری گرافیکی قطبی 10 فیجی XT وگا 10 وگا 20 وگا 20 آرکتوروس آلدباران؟
فن آوری تولید 14 نانومتر
FinFET
28 نانومتر 14 نانومتر
FinFET
7 نانومتر
FinFET
7 نانومتر
FinFET
7 نانومتر
FinFET
تکنولوژی پیشرفته تولید
هسته GPU 2304 4096 4096 3840 4096 7680 14336؟
فرکانس GPU 1237 مگاهرتز 1000 مگاهرتز 1500 مگاهرتز 1746 مگاهرتز 1800 مگاهرتز 1500 مگاهرتز ناشناس
FP16 را محاسبه کنید 5.7 ترافلوپ 8.2 ترافلوپ 24.6 ترافلوپ 26.8 ترافلوپ 29.6 ترافلوپ 185 ترافلاپ ناشناس
FP32 را محاسبه کنید 5.7 ترافلوپ 8.2 ترافلوپ 12.3 ترافلوپ 13.4 ترافلوپ 14.8 ترافلوپ 23.1 ترافلوپ ناشناس
FP62 را محاسبه کنید 384 گیگافلاپس 512 گیگافلاپس 768 گیگافلاپس 6.7 ترافلوپ 7.4 ترافلوپ 11.5 ترافلوپ ناشناس
حافظه تصویری 16 گیگابایت
GDDR5
4 گیگابایت
HBM`
16 گیگابایت
HBM2
16 گیگابایت
HBM2
32 گیگابایت
HBM2
32 گیگابایت
HBM2
64/128 گیگابایت
HBM2e؟
فرکانس حافظه 1750 مگاهرتز 500 مگاهرتز 945 مگاهرتز 1000 مگاهرتز 1000 مگاهرتز 1200 مگاهرتز ناشناس
اتوبوس حافظه 256 بیت 4096 بیت 2048 بیت 4096 بیت 4096 بیت 4096 بیت 8192 بیت
پهنای باند حافظه 224 گیگابیت بر ثانیه 512 گیگابایت بر ثانیه 484 گیگابیت بر ثانیه 1 ترابایت در ثانیه 1 ترابایت در ثانیه 1.23 ترابایت بر ثانیه 2 ترابایت در ثانیه؟
فرم فاکتور اسلات تک
تمام قد
دو شکاف
نیم طول
دو شکاف
تمام قد
دو شکاف
تمام قد
دو شکاف
تمام قد
دو شکاف
تمام قد
دو شکاف
تمام قد
خنک کننده غیر فعال غیر فعال غیر فعال غیر فعال غیر فعال غیر فعال غیر فعال
قدرت حرارتی 150 وات 175 وات 300 وات 300 وات 300 وات 300 وات ناشناس

دیدگاهتان را بنویسید

آدرس ایمیل شما برای عموم منتشر نخواهد شد.