近日,HPE宣布已与橡树岭国家实验室(Oak Ridge National Laboratory,后简称ORNL)达成合作,将为其构建两套新系统——包括接替Frontier的第二代E级超级计算机Discovery,以及一个新的人工智能集群Lux。

Discovery将基于全新的HPE Cray Supercomputing GX5000平台构建。HPE Cray Supercomputing GX5000专为下一代旗舰级超算系统而生,采用统一的人工智能和高性能计算架构,可简化整个站点及分布式集群的运维。同时,HPE还提供了基于DAOS的HPE Cray Supercomputing Storage Systems K3000存储选项,进一步增强超算平台的性能和能力。未来,Discovery将为人工智能、高性能计算和量子计算提供新动力,预计可将特定应用的生产力提高十倍¹,进而加速科学家在精准医学、癌症研究、核能和航空航天等领域的科研突破。

HPE总裁兼首席执行官
Antonio Neri:

“我们曾助力ORNL构建Frontier超算系统,并由此开启E级计算时代,我们曾登上超级计算史的顶峰。HPE很自豪能够在此之上与ORNL和AMD等伙伴合作,继续构建Discovery和Lux,加速下一代科学发现和人工智能的创新。”

Lux将是一个专用的人工智能系统,基于HPE ProLiant Compute XD685服务器(采用直接液冷技术)打造,并由AMD Instinct MI355X GPU、AMD EPYC™ CPU和AMD Pensando™网络技术提供支持。Lux旨在加强人工智能资源的可用性,为研究人员提供类云访问权限,接入专门用于模型训练和推理的主权AI工厂。

ORNL领导力计算设施科学主任
Bronson Messer:

我们期待Discovery和Lux能够拓展研究人员在ORNL的科研疆界。Discovery将开创融合计算新纪元,实现高性能计算、人工智能与量子计算的三维协同,通过多系统联动产生突破性认知,而Lux则将大幅提升研究人员对专用人工智能资源的获取能力。我们相信,这两大系统将共同推动科研范式的革命性转变,在诸多关键科研领域取得前所未有的突破性进展。”

AMD董事会主席兼首席执行官
Dr. Lisa Su:

“十多年来,AMD和HPE的合作不断拓展着高性能计算的极限,提供能够实现发现并改变世界的解决方案。现在,我们将通过Discovery和Lux推进下一代AI系统演进,赋能研究人员加速创新。”

HPE Cray Supercomputing Storage Systems K3000

Discovery:下一代E级超级计算机

Discovery系统的科学突破将依托于新发布的HPE Cray Supercomputing GX5000超级计算机实现。自1975年首台Cray-1问世以来,HPE积五十载超算创新之底蕴,面向融合人工智能与高性能计算的新纪元打造出这款下一代基础设施。

HPE Cray Supercomputing GX5000超算系统专为E级计算量身定制,在CPU、GPU、加速器、网络、软件、存储及液冷技术等领域实现端到端的尖端技术整合。凭借这一全新架构,Discovery将实现以下突破:
  • 更优性能与空间 新平台专为扩展到E级性能而设计,与上一代版本²相比具有更高密度,每个机柜使用的数据中心空间减少25%。

  • 采用HPE Slingshot的高性能互连 下一代HPE Slingshot为Discovery提供现代、高性能的互连,为HPC、机器学习和分析应用提供高带宽和低延迟。

  • 业界第一的HPC DAOS存储性能³ 得益于HPE Cray SupercomputingStorage Systems K3000,Discovery每个存储机柜的每秒输入/输出操作次数将比Frontier提升300%⁴,从而显著提高AI应用的运行效率。作为业界首个内置DAOS分布式异步对象存储开源软件的工厂集成存储系统,HPE Cray SupercomputingStorage Systems K3000以其卓越的成本效益和全闪存特性,与基于Lustre文件系统的HPE Cray Supercomputing Storage Systems E2000形成完美互补——这两大存储解决方案都将在Discovery系统中协同工作。

  • 下一代液冷加速计算 Discovery将采用名为“Venice”的下一代AMD EPYC处理器和AMD Instinct MI430X GPU,为建模、模拟和AI项目提供先进的性能和精度。依托HPE 50年⁵的液冷创新经验,Discovery的计算基础设施将采用全液冷设计,以优化超级计算环境中的能效和成本效益。

作为超级计算⁶领域的全球领军企业之一,HPE凭借顶尖的人工智能与高性能计算专业积淀,始终为客户提供端到端的完整解决方案与服务体系。作为客户数字化转型进程中不可或缺的合作伙伴,HPE超算服务通过构建基础设施与应用系统的全域统一管理架构,聚焦核心业务需求与持续创新,助力客户实现跨越式发展。

探索-曙光-又现,点击视频了解

1与ORNL前代"Frontier"超级计算机上的应用性能相比

2单个900毫米GX5000机柜与1200毫米EX4000机柜的尺寸比较

3基于DAOS的存储系统在全球IO500存储基准测试中包揽第一和第二名,其合计存储基准得分是后续30个存储系统总得分的四倍

4为"Frontier"部署的Cray ClusterStor E1000存储系统每个存储机柜可提供高达1800万IOPS,而为"Discovery"部署的HPE Cray超级计算存储系统K3000每个存储机柜可提供高达7500万IOPS

5Cray-1超级计算机于1975年发布

6Hyperion Research 2023年第四季度HPC市场数据报告(反映2023日历年),超级计算机细分市场(2024年5月29日),Hyperion Research

相关阅读

韩国科学技术信息研究院携手HPE打造韩国最大超级计算机

再登顶!HPE助力打造的E级超算再度包揽TOP500榜单前三甲

资料来源:https://mp.weixin.qq.com/s/RdezdafMjgZa-wpK3b3xbQ



微信扫描下方的二维码阅读本文

液冷技术通过冷却液直接/间接接触热源,核心结构包括:
  • 热交换核心  :冷板(CPU/GPU专用)、CDU(冷量分配单元);
  • 循环网络  :Manifold分液器、EPDM/PTFE管路、快接头;
  • 动力与控制  :变频循环泵(如飞龙股份电子泵)、智能温控系统。
主流方案中,冷板式兼容现网改造(占存量市场80%),浸没式为超算首选(PUE逼近1.0)。 2025年AI服务器的产值超过4000亿美元,年增45%。随着英伟达从Hopper系列向Blackwell系列转换,整个AI服务器产值提升。预计今年AI服务器的市场占有率会从去年的66%突破到今年的70%以上;另外,液冷散热方案的渗透率也有望从去年的14%提升到今年的30%。 涉及的材料有:铜、铝、复合金属材料、金属焊接材料、不锈钢、氟塑料、橡胶材料、密封材料、特种工程塑料、导热散热材料,热界面材料等 按照部件来分有:冷却塔、管道、CDU 液冷换热单元CDU 液冷板、接头、歧管、主泵和辅泵、流量控制系统、过滤系统等 系统集成方面有:空调、机柜、传感器、电源、泄漏检测、控制单元等 按照产业链来区分有:互联网企业,云服务器企业,代工企业、各个零部件企业、材料企业等; 欢迎大家加入我们,共绘服务器液冷散热未来!
长按识别二维码,申请入群
本群聚焦服务器液冷技术前沿,涵盖: ✅ 冷板/浸没/喷淋式方案设计 ✅ 材料升级(耐腐蚀管路、密封件创新) ✅ CDU运维与能效优化 ✅ 政策标准解读(PUE、OCP规范)

作者 808, ab