مع تزايد الطلب على التطبيقات السحابية HPC والتطبيقات السحابية التي تعمل بالذكاء الاصطناعي ، تبرز الحاجة إلى وحدات معالجة رسومات قوية جدًا لمراكز البيانات. عادةً ما تكون NVIDIA هي ملك هذا المجال ، ولكن أحدث GPU MI100 من AMD يقدم بعض المنافسة الجادة.
بطاقة لسوق HPC
البطاقة سريعة وسريعة للغاية. تصل وحدة معالجة الرسومات A100 المتطورة من NVIDIA إلى ذروتها عند 9.7 TFLOPS في أحمال عمل FP64. يقفز جهاز "AMD Instinct MI100" الجديد بمعدل 11.5 TFLOPS.

بالطبع ، تدعم بطاقات NVIDIA تقنيات تسريع أخرى لأحمال العمل الخاصة بالذكاء الاصطناعي بتنسيقات أرقام مختلفة ، مثل تنسيق الدقة TensorFloat-32 والتباين المنظم الدقيق.بالنسبة لأحمال عمل الذكاء الاصطناعي والتعلم الآلي ، لا تزال NVIDIA هي الأفضل ، حيث تم تصميم بطاقاتها خصيصًا للعمليات القائمة على الموتر.
ولكن ، للأغراض العامة للحوسبة عالية الأداء ، يأخذ MI100 تاج قوة الحوسبة الخام. بالإضافة إلى أنه يقارب نصف السعر ، وهو أكثر كفاءة لكل واط.
بالإضافة إلى التحسينات الأخرى ، تقدم البنية الجديدة أيضًا تحسينات مختلطة الدقة ، حيث توفر تقنية "Matrix Core" الخاصة بهم أداءً أكبر 7 مرات في FP16 مقارنةً بجيلهم السابق من البطاقات.

AMD CPUs و Instinct GPUS تعملان على تشغيل اثنين من أجهزة الكمبيوتر العملاقة exascale التابعة لوزارة الطاقة الأمريكية. من المقرر بناء الكمبيوتر العملاق "Frontier" العام المقبل مع وحدات المعالجة المركزية Epyc CPU و MI100s الحالية ، وسيوفر أكثر من 1.5 exaflops من ذروة قوة الحوسبة. من المقرر أن يتم بناء الكمبيوتر العملاق "El Capitan" في عام 2023 على أجهزة من الجيل التالي ، وسيوفر أكثر من 2 exaflops من الطاقة المزدوجة الدقة.
هل تستطيع ROCm أن ترقى إلى مستوى CUDA؟
بالطبع ، كل هذه القوة عديمة الفائدة إذا كان البرنامج لا يدعمها. ليس سراً أن NVIDIA تمكنت من جعل التعلم الآلي مجرد حديقة مسورة.
إطار عمل حساب NVIDIA يسمى CUDA ، أو Compute Unified Device Architecture. إنها ملكية ، ولا تعمل إلا مع بطاقاتهم. ولكن نظرًا لأن بطاقاتهم كانت الأسرع تاريخياً ، فقد تم إنشاء العديد من التطبيقات فقط بدعم CUDA أولاً وقبل كل شيء.
هناك نماذج برمجة عبر الأنظمة الأساسية ، وأبرزها OpenCL ، والتي تدعمها AMD جيدًا مع منصة ROCm الخاصة بها. تدعم كل من بطاقات NVIDIA وبطاقات AMD OpenCL ، ولكن نظرًا لأن NVIDIA يدعمها فقط عن طريق التحويل إلى CUDA ، فإنه في الواقع يكون استخدام OpenCL مع بطاقة NVIDIA أبطأ. لهذا السبب ، لن تدعمه جميع التطبيقات.
في النهاية ، ستحتاج إلى إجراء البحث الخاص بك ومعرفة ما إذا كان التطبيق الذي تنوي تشغيله يمكن تشغيله على بطاقات AMD ، وربما تكون مستعدًا لبعض التعديلات وإصلاح الأخطاء.من ناحية أخرى ، يتم توصيل وحدات معالجة الرسومات NVIDIA وتشغيلها ، لذلك حتى لو كانت AMD أسرع ، يمكن أن تستمر NVIDIA في إعاقتها ببرامج مغلقة المصدر.
ومع ذلك ، فإن هذا الوضع يتحسن - AMD ملتزمة بفتح مصادر كل شيء وخلق بيئة مفتوحة. Tensorflow و PyTorch ، وهما إطاران شائعان جدًا للتعلم الآلي ، يدعم كلاهما نظام ROCm البيئي.

نأمل أن تتمكن المواصفات الأولية لعروض AMD الأخيرة من دفع الصناعة إلى بيئة أكثر تنافسية. بعد كل شيء ، يتم استخدامها في أجهزة الكمبيوتر العملاقة