Представлен самый мощный в мире суперкомпьютер для обучения ИИ — Condor Galaxy 1. В его основе всего 64 микросхемы, но каждая размером с iPad Pro
Пока в списке самых производительных суперкомпьютеров уже год с огромным отрывом лидирует единственная система с производительностью свыше 1 эксафлопса, а СМИ в основном обсуждают две строящиеся сейчас системы с производительностью свыше 2 эксафлопс, компании Cerebras Systems и G42 неожиданно представили суперкомпьютер Condor Galaxy 1 (CG-1) с производительностью 4 эксафлопса! Правда, тут есть нюансы, да и сам суперкомпьютер крайне необычный и отличается от любой другой привычной системы этого класса.
Указанная производительность — это показатель в задачах обучения искусственного интеллекта. А это вычисления с половинной точностью, то есть FP16. Показателя для FP32 нет, но тот же суперкомпьютер Frontier, который пока ещё возглавляет список Top500, в таком же режиме предлагает мощность около 3,3 эксафлопса. То есть, видимо, CG-1 можно назвать самым производительным суперкомпьютером в мире. Но даже сами создатели всё же говорят чуть иначе: это самый производительный суперкомпьютер для обучения ИИ. При такой формулировке никаких проблем с корректностью не возникает.
Однако это ещё не всё. Дело в том, что CG-1 не зря содержит единицу в названии. Condor Galaxy 1 — это лишь первый из девяти одинаковых суперкомпьютеров, которые планируют построить Cerebras Systems и G42. И это будут не отдельные установки, а одна связанная сеть! Суперкомпьютеры CG-2 и CG-3 будут развёрнуты в США уже в начале следующего года, а итоговая производительность всей системы составит какие-то невероятные 36 эксафлопс. И тут уже вряд ли можно придраться к тому, что компании в своём пресс-релизе говорят, что их сеть суперкомпьютеров совершит революцию в развитии искусственного интеллекта.
Тут стоит напомнить, что Cerebras Systems — это компания, которая в 2019 году поразила всех своей микросхемой размером с iPad Pro. Решение под названием Wafer Scale Engine содержало 1,2 трлн транзисторов и имело максимальные размеры, которые можно выжать из 300-миллиметровой полупроводниковой пластины при прямоугольной форме. В 2021 году компания представила второе поколение этого продукта (Wafer Scale Engine 2 или WSE-2) в тех же размерах, но количество транзисторов благодаря техпроцессу 7 нм выросло до 2,6 трлн. WSE-2 имеет площадь более 46 000 мм2, содержит 850 000 ядер и 40 ГБ собственной памяти с пропускной способностью 20 ПБ/с. Потребление самой микросхемы неизвестно, но система CS-2 на основе одной WSE-2 имеет мощность 23 кВт.
Благодаря колоссальному количеству ядер, для построения самого мощного в своём классе суперкомпьютера понадобилось лишь 64 микросхемы. Если точнее, 64 системы CS-2, но каждая содержит лишь по одной микросхеме WSE-2. В итоге суперкомпьютер располагает более чем 54 млн ядер. Для сравнения: Frontier имеет 8,7 млн ядер.
Рекордная производительность позволяет разработчикам говорить не только о 4 эксафлопсах, но и о 600 млрд параметров с возможностью расширения конфигурации с поддержкой до 100 трлн параметров. К слову, в конфигурацию системы входят и процессоры AMD Epyc, но модель компания не указывает. Известно лишь, что сам суперкомпьютер содержит 72 704 процессорных ядра.
Cerebras и G42 предлагают CG-1 в качестве облачного сервиса, так что воспользоваться мощью нового гиганта смогут условно все желающие.
Предоставляя 4 эксафлопса вычислений ИИ при FP16, CG-1 значительно сокращает сроки обучения ИИ, устраняя при этом проблемы распределённых вычислений. Многие облачные компании анонсировали массивные кластеры графических процессоров, создание которых стоит миллиарды долларов, но которые чрезвычайно сложно использовать. Распространение одной модели среди тысяч крошечных графических процессоров требует месяцев и десятков людей с редким опытом. CG-1 устраняет эту проблему. Настройка генеративной модели ИИ занимает минуты, а не месяцы, и может быть выполнена одним человеком. CG-1 — первый из трёх ИИ-суперкомпьютеров производительностью 4 эксафлопса, которые будут развёрнуты в США. В течение следующего года вместе с G42 мы планируем расширить это развёртывание и обеспечить ошеломляющие 36 эксафлопс эффективных специализированных вычислений ИИ.
Отдельно стоит сказать, что техническая работа полностью лежит на Cerebras Systems. G42 — это технологическая группа из ОАЭ, которая фактически купила у Cerebras аппаратное обеспечение для построения суперкомпьютеров.