洛斯阿拉莫斯实验室推出能达到十亿亿次浮点运算的超级计算机“鹿角”

洛斯阿拉莫斯实验室推出能达到十亿亿次浮点运算的超级计算机“鹿角”

洛斯阿拉莫斯国家实验室(LANL)推出了Venado超级计算机。这台怪兽能够提供十亿亿次浮点运算每秒的性能,专门为能源部门的人工智能工作负载而设计。该超级计算机将被用于整合人工智能和机器学习,用于基础科学研究和国家安全。

Venado超级计算机安装在Nicholas C. Metropolis建模与仿真中心,由洛斯阿拉莫斯国家实验室与Nvidia和惠普企业(HPE)合作设计和安装。

Venado超级计算机的容量和架构
Venado超级计算机位于新墨西哥州的LANL,配备了2560个Nvidia的Grace Hopper Superchips和惠普企业的专有Slingshot 11网络连接,专门为超级计算机的人工智能计算需求设计。Venado也是最早采用Nvidia设计的超级芯片的超级计算机之一。

该系统完全采用液冷技术,拥有920个Grace-Grace CPU和2560个GH200(Grace Hopper)超级芯片,总共3480个Nvidia的超级芯片。GH200是处理AI任务的主要系统模块,具有72核的Grace CPU和480GB的内存。由于将GPU替换为第二个Grace CPU,Grace CPU的带宽可达每秒1TB。LANL主任汤姆·梅森表示,

来源:
Straits研究

Venado达到了LANL的期望

尽管Venado拥有Nvidia Grace Hopper Superchips、Nvidia基于Arm架构的超级计算单元和Nvidia Hopper架构,但整个系统非常紧凑。早期测试表明,Venado在天体物理学模拟和材料科学模拟方面能够产生显著的结果。重点是提高工作流程效率而不是极端准确性。

Venado是一台功能强大的超级计算机,适用于处理大型语言模型,因为它以高流量或处理速度为代价,牺牲了准确性,但这正是语言模型所需的,因此是人工智能的合适选择。但与AMD Frontier系统相比,它仍然不匹配,但绝不是一台“慢蛋活塞”。由于人工智能需求,它在管理低精度工作负载方面表现良好。美国能源部副部长大卫·特克表示,

进一步补充道,

Venado是不同供应商的联合专业知识的共同设计的美好范例。特别是在拜登政府的支持下,LANL得到了联邦政府的相当一部分支持。由于美国政府对人工智能非常重视,并倾向于进行机器学习的研究和开发,Venado是一台强大的超级计算机,拥有2560个Nvidia GH200超级芯片,但英国政府的Isambard项目将容纳5448个相同的超级芯片,并计划于今年推出。

请在此处查找洛斯阿拉莫斯国家实验室的说明。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注