Этой весной Япония представит суперкомпьютер Fujitsu HPC / AI
Интегрированный суперкомпьютер Fujitsu HPC / AI, Wisteria, появится в Японии этой весной.Токийский университет готовится к развертыванию вычислительной системы под названием «Wisteria / BDEC-01», которая будет решать задачи моделирования и «обучения» больших данных, в поддержку японского проекта Society 5.0.
Система состоит из двух разделов: группы узлов моделирования, называемой Odyssey, и группы узлов анализа данных, называемой Aquarius. Названия относятся к позывным для командования Аполлона-13 и лунных модулей соответственно. Вместе новые вычислительные системы обеспечивают в совокупности 33,1 пика петафлопс двойной точности. Более крупный кластер, Odyssey, станет одним из самых быстрых в мире компьютеров на базе Arm, уступая только лидеру Top500 Fugaku.
Odyssey охватывает 20 стоек Fujitsu PRIMEHPC FX1000, оборудованных в общей сложности 7680 узлами, каждая из которых оснащена одним 48-ядерным процессором «A64FX» на базе Fujitsu Arm. Система обеспечивает общую пиковую производительность 25,9 петафлопс. Поскольку каждый узел обеспечивает 32 ГиБ памяти HBM2, общий объем памяти Odyssey составляет 240 ТиБ, а общая пропускная способность памяти составляет 7,8 ПБ/с. Узлы подключаются с помощью специализированного соединения Tofu Interconnect D от Fujitsu с пропускной способностью пополам 13,0 ТБ / с.
Aquarius основан на серверах Fujitsu PRIMERGY GX2570 с мощным GPU. Система состоит из 45 таких узлов, в каждом из которых размещены два процессора Intel Ice Lake и восемь графических процессоров Nvidia A100, обеспечивающих пиковую производительность двойной точности 7,2 петафлопс. Nvidia Mellanox HDR 200 Gb / s InfiniBand связывает систему вместе, используя полную пропускную способность пополам. Общий объем системной памяти составляет 36,5 ТБ, а общая пропускная способность памяти - 578,2 ТБ / с. Интерфейс Ethernet со скоростью 25 Гбит / с обеспечивает внешнее подключение со скоростью 800 Гбит/с.
Магистраль InfiniBand EDR 100 Гбит / с соединяет Odyssey и Aquarius с пропускной способностью сети 2 ТБ / с. Wisteria / BDEC-01 использует файловую систему Fujitsu Exabyte File System (FEFS), основанную на Lustre. Фактически существует две файловые системы: большая общая файловая система и высокоскоростная файловая система NVMe.
Система будет поддерживать хорошо известные инструменты программирования HPC, включая Fortran, компилятор C / C ++, интерпретатор Python и коммуникационную библиотеку MPI.
«Мы предоставляем библиотеки, инструменты и приложения в широком спектре областей, таких как вычислительная наука, наука о данных, машинное обучение и искусственный интеллект», - отмечается в пресс-релизе Токийского университета.
По-прежнему существуют открытые технические вопросы, связанные с программированием комбинированных рабочих нагрузок. Учитывая сочетание архитектур (Arm64 и x86), невозможно будет запустить одно задание MPI в двух разделах, но можно будет запускать разные рабочие нагрузки, используя один и тот же сценарий задания.
Руководитель проекта Кенго Накадзима рассмотрел проект системы и цели программного обеспечения во время международного симпозиума Riken R-CCS 15 февраля.
Wisteria / BDEC-01 - первая система японских платформ BDEC. Эта «Иерархическая, гибридная, гетерогенная (h3) система» представит новую программную платформу под названием h3-Open-BDEC, которая облегчает интеграцию моделирования, анализа данных и машинного обучения. Пятилетний проект финансируется правительством Японии с бюджетом в 157 миллионов японских иен (1,48 миллиона долларов США).
«H3-Open-BDEC - это первая инновационная программная платформа, которая реализует интеграцию S + D + L (моделирование, данные и обучение) на суперкомпьютерах в эпоху экзадачности, когда ученые-вычислители могут достичь такой интеграции без поддержки других экспертов по данным», - сказал Накадзима.
Планируется, что предварительная эксплуатация Wisteria / BDEC-01 начнется 14 мая 2021 года, а полное развертывание производства намечено на октябрь 2021 года. Суперкомпьютер будет использоваться для различных совместных программ использования и исследований в рамках программ HPCI и JHPCN и будет поддерживать поставленные цели. of Society 5.0, которое правительство Японии описывает как «ориентированное на человека общество, которое уравновешивает экономический прогресс с решением социальных проблем с помощью системы, которая тесно интегрирует киберпространство и физическое пространство».
Wisteria / BDEC-01 устанавливается в Центре информационных технологий Токийского университета, который обеспечивает высокопроизводительные вычислительные ресурсы для промышленности, научных кругов и государственных учреждений в Японии и за рубежом. Центр управляет Oakforest-PACS и Oakbridge-CX - обеими машинами Top500, построенными Fujitsu - и обслуживает сообщество из примерно 2600 пользователей как внутри, так и за пределами университета.
Еще одна новая система Токийского университета, MDX, должна заработать в следующем месяце.