Nvidia Blackwell平台旨在将其先进技术整合到Google计算机系统平台中,而Google已经承诺将实现这一目标。最初预计于2025年初推出的该平台配备了超快速的Nvidia HGX B200,该产品专为人工智能和高性能计算(HPC)领域开发,以及用于大型语言模型(LLMs)训练的NBL72 GB200。谷歌将首次引入液冷技术以提高性能和效率,这是液冷技术首次应用于谷歌的云基础设施。
AI加速器和计算服务的扩展
谷歌推出了新的实例类型和各种加速器,以满足每个客户的需求。谷歌云推出的创新之一是定制的人工智能处理器芯片,名为基于Arm架构的Axion,以及广泛的人工智能加速器,甚至包括Nvidia的加速器,最终将为谷歌的产品提供多元选择。除了与Nvidia共同开发的新型A3 Mega实例外,还有其他新的发布。
这款特殊解决方案采用了H100 GPU和一种新的网络系统,每个GPU的带宽增加了一倍。对于开发人员来说,这是一个极好的功能,因为它现在具备了以高效率率训练深度LLMs所需的功率。
谷歌还推出了A3保密实例,旨在防范数据泄露,通过在数据在Intel的CPU和Nvidia H100 GPU之间的传输和移动过程中进行端到端加密来维护敏感数据和人工智能工作负载的机密性和完整性,而无需进行任何代码更改。
谷歌自家的人工智能加速器的进展
谷歌的AI超级计算机Cloud TPU v5处理器现已过热处理,以便长期供所有人使用。谷歌声称,这是他们有史以来最先进的人工智能加速器,其浮点运算速度比之前观察到的速度提高了2倍,内存带宽速度提高了惊人的3倍。
谷歌推出了经过优化的AI存储选项,如Hyper disk(预览版)。这种下一代块存储服务可以大幅减少模型加载时间(根据谷歌的说法,最多可达到3.7倍),谷歌Artisan宣称。尽管广泛利用人工智能和机器学习仍然是谷歌云的核心优势,但谷歌云也越来越多地涉足一般基础设施类别。
该供应商推出了以英特尔第四代和第五代至强(Xeon)CPU为参考的新主题。新的通用型Z4、Z5、N4和C4实例将采用第五代Emerald Rapids至强(Xeon)处理器。Z4面向高性能,而N4则提供了最具成本效益的解决方案。C4实例的演示版本目前处于私有模式,但N4实例将立即供所有用户使用。
扩展谷歌云服务
谷歌展示了运行在旧款英特尔至强(Xeon)处理器的第四代的C3物理实例,以及面向内存优化的X4物理实例,扩大了谷歌基础设施的服务选项。Z系列在谷歌云市场引入了Z3,这是一种面向存储优化的虚拟机,其IOPS在同类产品中处于领先地位,其他主要云服务提供商没有类似产品。
谷歌云在拉斯维加斯活动中的发布进一步巩固了该公司在行业中的地位。这些发布证明,作为云计算行业的领导者,谷歌云仍然保持着强劲的发展势头,并将一直保持在这个位置。到2025年,Nvidia将整合其Blackwell平台,其中包括处理单元、存储解决方案和人工智能加速器已经处于活跃状态。这将使谷歌云站在云计算领域的前沿。
这些转变不仅理想地改善和扩大了谷歌的云计算领域,还为开发人员和企业提供了无限的人工智能/机器学习和一般处理计算的资源。然而,谷歌云追求这个充满活力的云计算生态系统并保持其创新性,公司的战略和发明代表着其对未来更有效、更强大和更多样化的计算系统的坚定意图。