it之家 3 月 19 日消息,英伟达今日正式发布 dynamo,号称是“ai 工厂的操作系统”。
dynamo 是一个“分布式推理服务库”。本质上,它是一个针对用户需求 token 而无法生产足够 token 之间问题的开源解决方案。
黄仁勋展示了一张关于推理的图表,x 轴显示用户每秒的 token 数,y 轴显示工厂每秒的 token 数。
在 dynamo、grace blackwell nvlink72 超级芯片的加持下,blackwell 相比 hopper 可实现 25 倍的性能提升。
而在推理模型中,blackwell 的性能是 hopper 的 40 倍。
it之家注意到,黄仁勋还打趣道,有了上述最新技术加持,搭建 ai 工厂的厂商“买得越多、省得越多”,总而言之就是掏钱吧。
科技分类资讯推荐
科技分类视频推荐