AMD اعلام کرد انسداد جدید GPU MI100 GPU با 10 مانع TFLOPS در FP64 – CloudSavvy IT


با افزایش تقاضا برای برنامه های ابری که توسط HPC و AI طراحی شده اند ، نیاز به پردازنده های گرافیکی بسیار قدرتمند برای مراکز داده وجود دارد. NVIDIA معمولاً سلطان این زمینه است اما آخرین پردازنده گرافیکی MI100 AMD رقیبی جدی است.

نقشه بازار HPC

نقشه سریع ، جدی سریع است. پردازنده گرافیکی پیشرفته A100 NVIDIA با بارگذاری FP64 به 9.7 TFLOPS می رسد. جدید “AMD Instinct MI100” از نسخه با 11.5 TFLOPS رد می شود.

البته ، کارت های NVIDIA از تکنیک های دیگری برای تسریع بارهای ویژه AI در قالب های مختلف با تعداد ، مانند قالب دقیق TensorFloat-32 و نادر بودن ساختار دقیق پشتیبانی می کنند. از نظر میزان کار هوش مصنوعی و یادگیری ماشین ، NVIDIA همچنان سلطان است ، زیرا کارت های آنها به طور خاص برای عملیات مبتنی بر تنش طراحی شده است.

اما برای محاسبات عمومی با کارایی بالا ، MI100 تاج قدرت محاسباتی را به خود اختصاص می دهد. به علاوه تقریباً نصف قیمت آن است و در هر وات بسیار کارآمدتر است.

در میان سایر پیشرفت ها ، معماری جدید پیشرفت های با دقت مختلط را ارائه می دهد ، فناوری Matrix Core 7 برابر عملکرد FP16 نسبت به کارتهای نسل قبلی آنها ارائه می دهد.

پردازنده AMD و Instinct GPUS دو ابررایانه فوق العاده بزرگ وزارت انرژی ایالات متحده را تأمین می کنند. ابر رایانه Frontier قرار است سال آینده با پردازنده های فعلی Epyc و MI100 ساخته شود و بیش از 1.5 مورد از اوج قدرت محاسباتی را ارائه می دهد. ابر رایانه El Capitan قرار است در سال 2023 بر روی سخت افزار نسل بعدی ساخته شود و بیش از 2 تصویر با دقت دوگانه ارائه می دهد.

آیا ROCm می تواند در کنار CUDA زندگی کند؟

البته اگر این نرم افزار از آن پشتیبانی نکند ، تمام این قدرت بی فایده است. هیچ رازی نیست که NVIDIA توانسته است یادگیری ماشین را به یک باغ کوچک حصاری تبدیل کند.

چارچوب محاسباتی NVIDIA CUDA یا Compute Unified Device Architecture نامیده می شود. متعلق به آن است و فقط با کارتهای آنها کار می کند. اما از آنجا که نقشه های آنها سریعترین نقشه در تاریخ بوده است ، بسیاری از برنامه ها فقط در وهله اول و از همه مهمتر با پشتیبانی از CUDA ساخته می شوند.

مدل هایی در سیستم عامل های مختلف برنامه نویسی وجود دارد که عمدتا OpenCL هستند ، AMD با پلت فرم ROCm خود از آنها به خوبی پشتیبانی می کند. هر دو کارت NVIDIA و AMD از OpenCL پشتیبانی می کنند ، اما از آنجا که NVIDIA تنها با ترجمه به CUDA از آن پشتیبانی می کند ، در واقع استفاده از OpenCL با کارت NVIDIA کندتر است. بنابراین ، همه برنامه ها از آن پشتیبانی نمی کنند.

در نهایت ، شما باید تحقیقات خود را انجام دهید و ببینید آیا برنامه ای که قصد دارید اجرا کنید می تواند روی کارتهای AMD اجرا شود یا خیر ، و شاید برای کمی خرابکاری و رفع اشکال آماده باشید. از طرف دیگر ، پردازنده های گرافیکی NVIDIA عمدتا از نوع plug and play هستند ، بنابراین حتی اگر AMD سریعتر باشد ، NVIDIA می تواند با نرم افزارهای منبع بسته با آنها تداخل کند.

با این حال ، این وضعیت رو به بهبود است – AMD متعهد به گشودن همه چیز و ایجاد یک فضای باز است. Tensorflow و PyTorch ، دو چارچوب بسیار محبوب ML ، هر دو از اکوسیستم ROCm پشتیبانی می کنند.

ما امیدواریم که مشخصات خشن آخرین پیشنهادهای AMD بتواند صنعت را به سمت یک فضای رقابتی تر سوق دهد. به هر حال ، آنها در ابر رایانه ها استفاده می شوند


منبع: khabar-mehman.ir

دیدگاهتان را بنویسید

Comment
Name*
Mail*
Website*