منو سایت

  • خانه
  • وبلاگ
  • AMD Instinct MI200 Accelerator – هیولایی با قدرت چهار برابر بیشتر

AMD Instinct MI200 Accelerator – هیولایی با قدرت چهار برابر بیشتر

 تاریخ انتشار :
/
  وبلاگ

AMD Instinct MI200 Accelerator - هیولایی با قدرت چهار برابر بیشتر

c به زودی شاهد معرفی شتاب دهنده AMD Instinct MI200 خواهیم بود ، که اولین گرافیک HPC با طراحی MCM بر اساس معماری CDNA 2 است. به نظر می رسد که این گرافیک عملکرد دیوانه کننده ای در مقایسه با Instinct MI100 فعلی ارائه می دهد ، که در آن خواهیم دید افزایش چهار برابری در عملکرد محاسباتی FP16.

ما اخیراً بیشتر مشخصات شتاب دهنده Instinct MI200 را دریافت کرده ایم ، اما عملکرد کلی آن تا به امروز یک راز باقی مانده است. حالا کاشف معروف ExecutableFix برای دیدن یک هیولا، اولین معیار عملکرد گرافیکی CDNA 2 را با طراحی MCM به اشتراک بگذارید.

  • نشانگر Ryzen Threadripper 5975WX – سریعتر از 3990X
  • یک پردازنده 8 هسته ای Ryzen Rembrandt – RDNA 2 و DDR5 وجود دارد
  • پردازنده های Ryzen 7000 Raphael H – تا 16 هسته Zen 4 در لپ تاپ ها
  • امکان ترکیب شتاب دهنده AMD Instinct MI300 با گرافیک Quad MCM

شتاب دهنده AMD Instinct MI200

طبق توییت ExecutableFix ، Instinct MI200 تا 1.7 گیگاهرتز اجرا می شود که 13 درصد سریعتر از Instinct MI100 است. این گرافیک دو برابر پردازنده (14080) در 220 واحد دارد. در حالی که ما انتظار داشتیم این واحد 240 واحد و 15360 هسته باشد ، به نظر می رسد به دلیل راندمان تولید بالاتر ، مدل های کاهش یافته ارائه شود. با در نظر گرفتن این موضوع ، می توان در آینده مدلی با تراشه کامل و عملکرد بالاتر ارائه داد.

از نظر عملکرد، AMD Instinct MI200 Accelerator تقریباً 50 ترافلاپس (دقیقاً 47.9) عملکرد را در FP64 و FP32 ارائه می دهد. در مقایسه با Instinct MI100 ، شاهد افزایش 4.16 برابری FP64 هستیم. در واقع، محاسبات Instinct MI200 FP64 حتی از عملکرد FP32 مدل قبلی نیز فراتر رفته است. وقتی به اعداد FP16 و BF16 می رسیم ، عملکرد دیوانه کننده 383 ترافلاپس را مشاهده می کنیم. در مقایسه ، MI100 فقط 92.3 ترافلاپس از عملکرد BFloat16 و 184.6 ترافلاپس از عملکرد FP16 دارد.

شتاب دهنده AMD Instinct

به گفته HPCWire ، Instinct MI200 مقر سه ابر رایانه پیشرفته از جمله US Frontier ، EU LUMI و Setonix استرالیا خواهد بود. رقیب این کارت شامل A100 80GB با قدرت محاسباتی 19.5 ترافلاپس در FP64، 156 ترافلاپس در FP32 و 312 ترافلاپس در FP16 می باشد. البته انتظار داریم انویدیا در سال 2022 گرافیک طراحی MCM را خیلی زود عرضه کند.

معماری CDNA 2 به شتاب دهنده های HPC Red Instinct در آینده نیرو می بخشد. انتظار می رود مدل هایی مانند Instinct MI200 از GPU Aldebaran استفاده کنند. همانطور که گفتیم، این کارت گرافیک احتمالاً اولین کارتی خواهد بود که به عنوان یک ماژول چند تراشه ای عرضه می شود. Instinct MI200 در حال آماده شدن برای رقابت با Intel Ponte Vecchio (شتاب دهنده 7 نانومتری) و همچنین بهبود معماری Nvidia Ampere است. البته هر دو تیم سبز و آبی نیز مدلهای MCM خود را ارائه خواهند داد.

قبلاً تأیید شده است که Aldebaran (یا شتاب دهنده Instinct MI200) از دو تراشه استفاده می کند. بلوک دیاگرام نشان داده شده همچنین دو ماتریس را نشان می دهد که هر کدام شامل 8 موتور سایه زن در مجموع 16 ماتریس است. هر Shader Engine شامل 16 واحد FP64 و بسته بندی شده FP32 با امکانات کامل و یک موتور ماتریس نسل دوم برای عملیات FP16 و BF16 است.

بلوک دیاگرام غیر رسمی تراشه AMD Aldebaran

هر ماتریس دارای 128 واحد محاسبه است که به معنی 8192 هسته است. در نهایت شاهد 256 واحد محاسباتی یا 16384 هسته برای کل تراشه خواهیم بود. Aldebaran همچنین از اتصال جدید XGMI استفاده می کند. هر تراشه همچنین دارای یک موتور 2.6 VCN و یک کنترلر اصلی ورودی / خروجی است.

در مورد حافظه ، AMD از رابط 8 کانالی با گذرگاه 1024 بیتی استفاده می کند تا کل گذرگاه 8192 بیت شود. هر رابط می تواند از 2 ماژول HBM2e گیگابایتی پشتیبانی کند. این به معنای حداکثر 16 گیگابایت حافظه HBM2e در هر پشته است و از آنجا که هشت پشته را می بینیم ، کل حافظه می تواند 128 گیگابایت باشد. این 48 گیگابایت بیشتر از تراشه A100 انویدیا با 80 گیگابایت حافظه HBM2e است. شتاب دهنده جدید AMD در بحث HPC در واقع یک غول پردازشی خواهد بود ، اما ما انتظار داریم که مصرف برق بسیار بالایی نیز داشته باشد. در همین حال ، Kepler_L2 ادعا می کند که شتاب دهنده Instinct MI200 در واقع از پیکربندی کوچک شده با 224 واحد یا 14336 هسته استفاده می کند. تقریباً 14 co هسته کمتر از تراشه Aldebaran کامل.

AMD Instinct MI200 همچنین ممکن است با نام Aldebaran شناخته شود ، که یکی از ستاره های غول پیکر برج فلکی برج ثور با شعاع خورشیدی 44.13 یا 75٪ بزرگتر از Arcturus است. این نام نشان می دهد که Aldebaran ممکن است دو برابر Arcturus قدرتمند باشد ، زیرا نام شتاب دهنده های MI معمولاً عملکرد خام آنها را نشان می دهد. اگرچه این در حال حاضر تنها یک حدس است ، اما ممکن است با استفاده از طراحی MCM درست باشد.

نام شتاب دهنده AMD Radeon Instinct MI6 AMD Radeon Instinct MI8 AMD Radeon Instinct MI25 AMD Radeon Instinct MI50 AMD Radeon Instinct MI60 AMD Radeon Instinct MI100 AMD Radeon Instinct MI200 AMD Radeon Instinct MI300
معماری گرافیکی پولاریس 10 فیجی XT وگا 10 وگا 20 وگا 20 آرکتوروس الدباران ناشناخته (CDNA 3)
فن آوری تولید 14 نانومتر
FinFET
28 نانومتر 14 نانومتر
FinFET
7 نانومتر
FinFET
7 نانومتر
FinFET
7 نانومتر
FinFET
تکنولوژی پیشرفته تولید تکنولوژی پیشرفته تولید
هسته GPU 2304 4096 4096 3840 4096 7680 14080؟ 28160؟
فرکانس GPU 1237 مگاهرتز 1000 مگاهرتز 1500 مگاهرتز 1746 مگاهرتز 1800 مگاهرتز 1500 مگاهرتز 1700 مگاهرتز ناشناس
FP16 را محاسبه کنید 5.7 ترافلوپ 8.2 ترافلوپ 24.6 ترافلوپ 26.8 ترافلاپ 29.6 ترافلوپ 185 ترافلاپ 383 ترافلوپ ناشناس
FP32 را محاسبه کنید 5.7 ترافلوپ 8.2 ترافلوپ 12.3 ترافلوپ 13.4 ترافلوپ 14.8 ترافلاپ 23.1 ترافلاپ 95.8 ترافلوپ ناشناس
FP62 را محاسبه کنید 384 گیگافلاپس 512 گیگافلاپس 768 گیگافلاپس 6.7 ترافلاپ 7.4 ترافلوپ 11.5 ترافلوپ 47.9 ترافلوپ ناشناس
حافظه ویدیویی 16 گیگابایت
GDDR5
4 گیگابایت
HBM`
16 گیگابایت
HBM2
16 گیگابایت
HBM2
32 گیگابایت
HBM2
32 گیگابایت
HBM2
64/128 گیگابایت
HBM2e؟
ناشناس
فرکانس حافظه 1750 مگاهرتز 500 مگاهرتز 945 مگاهرتز 1000 مگاهرتز 1000 مگاهرتز 1200 مگاهرتز ناشناس ناشناس
اتوبوس حافظه 256 بیت 4096 بیت 2048 بیت 4096 بیت 4096 بیت 4096 بیت 8192 بیت ناشناس
پهنای باند حافظه 224 گیگابیت بر ثانیه 512 گیگابایت بر ثانیه 484 گیگابیت بر ثانیه 1 ترابایت در ثانیه 1 ترابایت در ثانیه 1.23 ترابایت بر ثانیه 2 ترابایت در ثانیه؟ ناشناس
فرم فاکتور تک اسلات
تمام قد
دو شکاف
نیم طول
دو شکاف
تمام قد
دو اسلات
تمام قد
دو اسلات
تمام قد
دو شکاف
تمام قد
دو شکاف
تمام قد
ناشناس
خنک کننده غیر فعال غیر فعال غیر فعال غیر فعال غیر فعال غیر فعال غیر فعال ناشناس
قدرت حرارتی 150 وات 175 وات 300 وات 300 وات 300 وات 300 وات ناشناس ناشناس

دیدگاهتان را بنویسید

آدرس ایمیل شما برای عموم منتشر نخواهد شد.