特斯拉的Dojo处理器已经进入了批量生产阶段,并将很快投入使用。Dojo是一种基于晶圆的处理器系统,由一个5×5个独立处理芯片的系列组成,这些芯片固定在另一个称为载体晶圆的晶圆上,并通过台积电的晶圆互连技术进行互连。听起来很复杂?让我们简化一下。
特斯拉的Dojo即将投入使用
特斯拉的Dojo训练瓦片(公司称之为训练瓦片)实际上是一组由25个强大的处理器组成的,它们通过台积电的互连技术连接在一起,以充当一个超强大的处理器,该互连技术专门设计用于高速互连。现在它开始有点意义了,但首先我们需要了解一些背景,为什么特斯拉需要自己的处理器,当半导体巨头Nvidia、IBM和英特尔已经在为计算机和人工智能制造硬件呢。
特斯拉决定进军人工智能、芯片设计和超级计算表明,该公司,尤其是埃隆·马斯克,将创新视为不仅仅是企业业务扩张。特斯拉试图从一开始就开发具备自动驾驶功能的汽车,并且它销售的所有汽车都会向特斯拉传输数据,以帮助该公司构建系统。因此,Dojo也是其垂直整合的一部分。
Dojo与其他可用的人工智能加速器和超级计算工具有很大的区别。例如,Nvidia的A100或A200 GPU嵌入在世界各地的许多超级计算机中,但这些产品和其他产品主要设计用于满足各种任务,包括研究、大数据处理、复杂模拟等等。但Dojo专为像AI计算机视觉这样由现实世界数据驱动的特定任务而设计;关于Dojo还能做什么,目前尚不清楚,因为该公司并未透露太多。
基于晶圆的系统更加高效
如上所述,Dojo由25个独立的高性能处理器组成,因此它对电力有着巨大的需求,并且需要一个有效而复杂的冷却系统。根据Tom’s hardware的报道,为了供电,特斯拉使用了一个电压调节系统,这本身就是一个复杂的模块,可以向处理器提供18000安培的电力。由于这种高功率,该系统散发出15000瓦的热量,为了有效工作,它需要一个液冷系统。
像特斯拉的Dojo这样的基于晶圆的加速器比其他多处理器系统更加高效,性能更好。它们通过通讯核之间的低延迟、高带宽以及由于系统的晶圆技术而带来的更好的能源效率获益。
到目前为止,只有特斯拉和Cerebras拥有基于晶圆的系统设计,但预计其他行业参与者也会加入,因为这种设计具有更高的效率和更低的延迟。然而,这些加速器也存在一些限制;目前的基于晶圆系统必须依赖芯片上的内存,这通常是固定的,可能不足以满足不同类型的用例。但预计在下一代基于晶圆平台实现HBM4内存芯片在加速器瓦片上的三维堆叠时,这个问题将会被解决。