Nvidia DGX A100 — компактная станция с производительностью в 5 PFLOPS. Теперь на процессорах AMD
Только что мы разобрались с ускорителем Nvidia A100 и графическим процессором в его основе, а также упоминали станцию DGX A100, основанную на новых ускорителях. Теперь же эта станция представлена официально.
Итак, сама Nvidia называет DGX A100 универсальной системой для всех типов рабочих нагрузок, связанных с искусственным интеллектом, обеспечивающей беспрецедентную плотность вычислений, производительность и гибкость. К тому же это первая система подобного рода с производительностью 5 PFLOPS. Напомним, стоит она 199 000 долларов.
В основе DGX A100 лежат восемь графических ускорителей Nvidia A100 с 40 ГБ памяти у каждого, то есть суммарно в системе 320 ГБ видеопамяти. Также DGX A100 имеет 1 ТБ оперативной памяти и, что интересно, процессоры AMD в основе, тогда как ранее для станций DGX компания Nvidia использовала CPU Intel. В данном случае тут пара 64-ядерных Epyc 7742.
Также Nvidia отмечает наличие девяти сетевых адаптеров Mellanox ConnectX-6 VPI HDR InfiniBand/Ethernet с пиковой двунаправленной пропускной способностью в 450 ГБ/с. Для хранения данных используется система объёмом 15 ТБ с пиковой пропускной способностью в 25 ГБ/с. Всё это потребляет около 6,5 кВт мощности и заключено в корпус габаритами 264,4 х 482,3 х 897,1 мм.
В предыдущей новости мы уже говорили о технологии Multi-Instance GPU, позволяющей «разделить» GPU в ускорителе A100 на семь «отдельных» графических процессоров. MIG работает и в случае станции DGX A100, позволяя создать уже до 56 подобных GPU, выделив для каждого отдельную задачу.
Само собой, станции DGX A100 можно объединять в кластеры. В частности, Nvidia готовит DGX SuperPOD — систему из 140 станций DGX A100 суммарной мощностью в 700 PFLOPS.