Nvidia создала GPU с TDP 1,2 кВт и ускоритель для ИИ с TDP 2,7 кВт. Компания раскрыла новые подробности о Blackwell
Компания Nvidia уже представила архитектуру Blackwell и ускорители на её основе. При этом во время анонса нам раскрыли далеко не все особенности и характеристики. Теперь же некоторые пробелы заполнили старший вице-президент Nvidia и архитектор графических процессоров Джона Албе (Jonah Albe) и вице-президент по гипермасштабированию и HPC Ян Бак (Ian Buck).
Очень важный момент, который Nvidia не объясняла во время анонса, заключается в том, что Blackwell — это совершенно новая архитектура, которая сильно отличается от Hopper. К слову, это может означать, что и игровые адаптер RTX 50 будут сильно отличаться от RTX 40.
Как мы уже отмечали, в Blackwell появился движок Transformer Engine второго поколения, который обеспечивает поддержку вычислений FP4 и FP6, которые попросту отсутствуют у других адаптеров Nvidia. Это нужно для определённых сценариев работы с ИИ, и при ранее такой формат не требовался, поэтому его и не реализовывали. А вот производительность в режиме двойной точности (FP64) выросла относительно Hopper всего на 32%. Просто потому, что для вычислений, связанных с ИИ, такой режим не особо нужен.
Изначально во время анонса Nvidia не назвала прямо имени нового GPU, из-за чего возникла определённая путаница. Судя по всему, полный GPU называется всё же B200. Этот чип лежит в основе GB200 Grace Blackwell Superchip, и TDP одного только GPU достигает 1200 Вт! В итоге GB200 Grace Blackwell Superchip может потреблять до 2,7 кВт мощности.
Также есть версия B200, используемая платформами DGX и HGX. Такой GPU имеет TDP 1000 Вт и обеспечивает почти 90% производительности полного варианта. При этом отличия от полного GPU пока неизвестны.
И ещё имеется Blackwell B100, который представляет собой вариант с TDP 700 Вт, предлагая около 70% производительности полного B200.
Что интересно, Nvidia говорит, что в будущем может выпустить GPU Blackwell с одним кристаллом вместо текущих двух. То есть с производительность ровно вдвое меньше.