6月23日德国汉堡举办的国际超算大会上,最新一期全球TOP500超算榜单正式出炉,深圳超算中心的灵晟以2.19EFLOPS的实测持续算力登顶世界第一!这是自2017年神威·太湖之光之后,我们时隔整整九年,重新站上全球超算的顶峰。
第一,它是人类第一台实测持续算力突破2EFlops,也就是每秒219亿亿次浮点运算的超算,对比霸占榜单两年多的美国酋长岩超算,持续性能领先21%;第二,它彻底抛弃全球主流的CPU搭配GPU异构路线,整机九十二个液冷机柜、近一万个计算节点,合计搭载四万七千颗LX2国产CPU,没有挂载一块海外高端加速卡!
2015年的一纸芯片禁令,切断了咱们天河二号升级所需的英特尔超算芯片,后续又持续封锁英伟达H100、AMD高端加速卡,等于把全球E级超算最通用的算力配件彻底对我们关上了大门!他们认为,只要卡死GPU供给,我们就永远搞不出来世界第一的超算!
灵晟这回给出的方案,就是华为鲲鹏深度定制的LX2处理器!这款芯片单颗集成三百零四个计算核心,片内自带矩阵加速单元,相当于把GPU的核心计算能力直接内嵌进CPU,同时搭配国产HBM高带宽内存,内存带宽是传统服务器CPU的十倍。美国酋长岩硬件理论峰值很高,但实际运算效率只有64%,接近三成多算力浪费在数据传输上,而灵晟依靠鲲鹏LX2芯片全栈协同优化,实测运算效率冲到了叹为观止的80.3%,硬件性能几乎全部释放,这也是为什么灵晟明明没有GPU,却能远远甩开对手的关键原因!
2013到2015年,天河二号靠进口英特尔芯片拿下六连冠,可是后面因为禁令出现升级停滞;2016年神威靠申威芯片短暂登顶,之后的九年间,美国接连推出三台E级超算持续霸榜,一边封锁芯片出口,一边凭借GPU架构拉开算力差距。这九年里,咱们国内科研团队也不服输,华为鲲鹏持续深耕高性能计算场景,针对气象模拟、航空风洞、新药研发、核聚变仿真这些超算核心需求迭代芯片,最终交出适配E级超算的LX2方案,配合深圳超算中心卢宇彤团队完成整机集成,在对方划定的技术壁垒之外,走出一条纯CPU同构超算的全新赛道!
灵晟的出现推翻了全球超算圈多年的固有定论:过去业内普遍认为,想要冲击百亿亿次算力,必须依赖GPU加速,现在我们用鲲鹏芯片证明,纯国产CPU架构完全有能力登顶世界第一!