做为今年6站GTC(GPU Technology Conference,GPU技术峰会)的收官之作,本周GTC China在苏州举办,是什么吸引了超过5000人与会,除了创始人黄仁勋的个人魅力,日益火爆的GPU AI世界从蓝图到落地更为引人。
虽然数字货币矿难引发股票价格从高点跌落,但这并不影响人们对NVIDIA英伟达的追捧。2018年以来,NVIDIA自成一体的GTC大会已经走过了6站,做为收官之作的GTC China本周在苏州举办,超过5000人现场聆听了公司创始人兼CEO黄仁勋长达两个小时的演说。
说实话,对CHIP现场编辑来说,今年都不是第一次听GTC或老黄的演讲了,但仍和现场数千人一样,被NVIDIA在GPU及AI方面的快速发展和优势激素所折服。
在传统GPU领域,GeForce RTX 20系列所带来的RTX光线追中技术,无疑是最"亲民"的技术。黄仁勋以国内首款支持此技术的《逆水寒》为例,详细介绍了NVIDIA RTX 光线追踪反射将赋予盔甲、武器、物体、水坑、河流、运河等多种游戏元素栩栩如生的反射属性,使它们能够准确地反映周围的世界。《逆水寒》还是业界首款采用实时光线追踪焦散效果的游戏。焦散是指光线在到达反射或折射表面后重新聚焦或散射,进而形成新的光源,照亮周围的环境、投射阴影。这可以确保焦散效果能够对物体做出相应的反应,改变布景和光线条件,甚至船只的航迹。
RTX OFF
RTX ON
另外《逆水寒》还至此DLSS(Deep Learning Super-Sampling,深度学习超级采样)技术,将性能提升了可达40%,与上一代 GeForce GPU 相比,GeForce RTX GPU 的性能提升可达 90%。而在图像质量方面,DLSS技术 可以提供更清晰的细节。
除了消费级产品,黄仁勋重点介绍了NVIDIA为HPC和大型机 (Hyperscale)分别设计的HGX-2和Turing T4产品。前者已经不是"新"产品了,16颗V100核心就能在单节点中能够提供 2 千万亿次的计算性能、0.5 TB内存和16 TB/s 总内存带宽,与仅使用 CPU 的服务器相比,它将 AI 机器学习工作负载的运行速度提升近 550 倍,将 AI 深度学习工作负载的运行速度提升近 300 倍,将高性能计算工作负载的运行速度提升近 160 倍。
相对更新的信息是,NVIDIA已经完成了对服务器制造商的相关技术授权,目前包括富士康、英业达、云达科技、广达电脑、超微、纬创和纬颖。此外,甲骨文上月宣布其计划为甲骨文云基础设施部署HGX-2 平台,并将采用裸机和虚拟机两种实例,便于顾客轻松访问统一的 HPC 和 AI 计算架构。
相对新的产品是Turing T4,该产品基于全新NVIDIA Turing架构,采用多精度Turing Tensor Core和全新RT Core,与加速的容器化软件堆栈相结合,提供规模空前的性能。成品T4非常小巧,俨然一块半高的AIC插卡,功耗只有70W,是竞争产品的1/4,却能提供多精度功能可支持 4 种不同精度等级的各类 AI 工作负载,助力实现突破性的 AI 性能,FP32精度能够提供8.1 TFLOPS、FP16精度能够提供65 TFLOPS、INT8精度能够提供130 TOPS、INT4精度能够提供260 TOPS。针对 AI 推理工作负载,配备 2 个 T4 GPU 的单个服务器最多可取代 54台CPU服务器。针对AI训练,配备2个T4的单个服务器可取代9台双套接字CPU服务器。在黄仁勋的现场演示中,使用百度人工智能图像搜索应用,4颗T4可提供6k/s以上的识别速度、28颗则达到43k/s水平,而CPU方案仅能达到个位数水平。
除了以上产品,NVIDIA还联手众多中国初创公司、卡车制造商和供应商,为新一代自动驾驶汽车选用NVIDIA DRIVE AGX自动驾驶平台铺路。目前,小鹏汽车及其主要的一级供应商德赛西威将使用30万亿次操作/秒、功率仅30W的DRIVE AGX Xavier,打造面向量产车型的L3 级自动驾驶系统。DRIVE AGX Xavier则为奇点汽车的新车型提供技术支持,此外,SF Motors 计划于明年推出其首款电动分频器SF5,并表示将采用 DRIVE AGX Xavier 开发下一代自主计算平台。
Jetson AGX Xavier可在小空间和功耗情况下,为送货机器人提供大规模计算性能,包括多个高分辨率摄像头和激光雷达等的各种传感器必须感知周围世界,在复杂、动态的城市环境中进行本地化地路径规划和行驶。该模块能够以高达32万亿次操作/秒速度,提供强大工作站般的处理能力,其能效比其前代产品高出10倍,而尺寸仅有手掌大小。
走过多年的GTC大会,已经从简单的图形技术领域应用,向更为广泛的人工智能领域渗透。借助GPU高并行性的优势,无论是张量处理还是进一步强化的深度学习应用,都显现出其"强"的一侧。而在自控驾驶方面,更强的视觉传感、处理结合AI计算,则更多的显示出GPU产品的灵。和传统的CPU解决方案相比,无论是演讲中的黄仁勋,还是会后接受采访的各高管,都显示出对成本的自信,"摩尔定律已经失效"、"只有1/4的功耗却提供4倍的性能"等各种自行溢于言表。