传奇晶片设计师 Jim Keller 打算设计比 NVIDIA 更高效的晶片,以降低 AI 应用价格并抢占市占率。
Jim Keller 目前在 AI 晶片新创公司 Tenstorrent 担任执行长。他认为,很多市场都没得到 NVIDIA 很好的服务,随着 AI 应用扩展到智慧手机、电动车和云端服务,越来越多公司正寻找更便宜的解决方案,有很多小公司不愿为 NVIDIA 高阶 GPU 支付 2 万美元。
Jim Keller 在晶片设计界享有盛誉,也是 AMD Zen 系列的首席设计师,许多人认为这帮助 AMD 东山再起、奋力追赶上英特尔。此外,他也是开发特斯拉自驾软体 Autopilot 晶片组的重要人物。
日本人工智慧独角兽公司 Preferred Networks 运算架构部门副总裁兼技术长 Junichiro Makino 形容,「他(Jim Keller)简直就是一个传奇」。
设计 AI 晶片时,选择舍弃关键的 HBM
Tenstorrent 成立於 2016 年,准备今年底出售第二代多用途 AI 晶片。该公司声称,它在某些领域拥有比 NVIDIA AI GPU 更高的能效和处理效率。此外,其 Galaxy 系统比 NVIDIA DGX 效率高三倍,价格更是便宜 33%。
Keller 指出,之所以能做到这点,是因为 Tenstorrent 没使用高频宽记忆体(HBM),「即使是使用 HBM 的人,也在为成本以及构建 HBM 所需的设计时间而挣扎,因此决定不使用该技术」。
HBM 是生成式 AI 晶片的重要组成,在 NVIDIA 产品成功中发挥重要作用,然而这也是 AI 晶片能耗巨大、价格高昂的罪魁祸首之一。
在典型的人工智慧晶片组中,GPU 每次执行进程时向记忆体发送数据,这需要 HBM 高速数据传输能力。然而,Tenstorrent 专门设计自己的晶片,以大幅减少这种传输。Keller 指出,有了这种新方法,其公司晶片设计可在 AI 开发的某些领域取代 GPU 和 HBM。
此外,Tenstorrent 还在设计产品以尽可能实现成本效益,目前许多公司也在寻求更好的记忆体解决方案,但 Keller 也坦承,要颠覆庞大的现有 HBM 产业,还需要数年时间。他也预期,与其只由一间公司取代 NVIDIA,不如涌现更多新公司,填补美国公司未涉足的各种人工智慧市场。
Tentorrent 晶片主要特点是 100 多个核心中,每个核心都有小型 CPU,即「大脑中的微型大脑」。通常情况下,单个晶片核心只有一个小型电脑和记忆体,只负责解决一个给定的任务,但 Tenstorrent 的核心能独立「思考」,决定先处理哪些数据,或者放弃不必要的任务,从而提高整体效率。
Tentorrent 指出,由於每个核心都相对独立,可将更多或更少核心堆叠,使应用更广泛。例如,智慧手机或可穿戴设备只需少量晶片即可,而 AI 资料中心可将 100 个晶片组合在一起使用,使用上也更加灵活。Keller 指出,目前还无法预测 AI 最佳应用是什麽,因此公司策略是打造适合各种产品的技术。
- U.S. chip designer aims to bring down AI prices pushed up by Nvidia
(首图来源:AMD Jim Keller/Youtube 截图)