it之家 4 月 22 日消息,谷歌在当地时间今日举行的 google cloud next 大会上宣布推出两款定制 ai asic 芯片,分别是为推理优化的 tpu 8t 和面向智能体推理工作负载的 tpu 8i,两款芯片也有承担对方优势任务的能力。
tpu 8t 在处理大规模、计算密集型的训练工作负载时表现出色,其设计具备更高的计算吞吐量和更强的纵向扩展带宽。tpu 8i 则配备了更高的内存带宽,专为处理对延迟最为敏感的推理工作负载而设计。
tpu 8t 的 pod 规模从此前的 9216 颗进一步增加至 9600 颗,但总 fp4 算力规模提升则接近 2 倍。其单芯片横向扩展 (scale-out) 带宽从 100gbps 显著增长至 400gbps,这化解了大规模互联中的瓶颈。
tpu 8i 则拥有 cae 片上加速引擎,配备 384mb 片上 sram 和 288gb 片外 hbm,运行时的数据无需存取。其 pod 规模从上代的 256 颗显著提升至 1152 颗,每 pod 的 fp8 算力和 hbm 内存容量分别提升 8.67 倍和 5.74 倍。
谷歌表示,tpu 8t 和 tpu 8i 的能效是上一代 tpu ironwood 的两倍。