人工智能(AI)半导体市场的强者“英伟达”将于明年第二季度推出更强大的超级芯片。其战略是,将远远甩开展开猛烈攻势的AMD和英特尔,巩固在市场上的地位。
英伟达首席执行官(CEO)黄仁勋8日(当地时间)在美国洛杉矶举行的“Signature 2023”上公布了新一代AI半导体“Grace Hoper Super Chip(GH200)”的生产计划。GH200将基于ARM的Grace CPU(中央处理器)与英伟达的Hoper GPU(图形处理器)相结合。搭载垂直堆叠DRAM的新一代存储芯片HBM3e,存储容量比现有AI半导体“H200”更大。HBM3e将由三星电子和SK海力士提供。黄仁勋表示:“如果在GH200上驱动大部分巨型语言模型(LLM),就可以‘疯狂’地进行推论。LLM的推论成本将大幅降低。”GH200将从明年第二季度开始正式生产,价格待定。
AI半导体市场排名第一的英伟达,由于技术进步,似乎进一步拉大了与AMD、英特尔等追击者的差距。目前英伟达约占AI半导体市场的80%。去年开始的生成AI热潮导致AI芯片的需求剧增,但A100、H100等英伟达的主力产品长期出现缺货现象。即将于23日公布业绩的英伟达通过自身分析表示,今年第二季度(5~7月)的销售额将比去年同期增加64%,达到110亿美元。黄仁勋自信地说:“新推出的GH200比之前的机型强大得多。将为扩大全球数据中心的规模做出贡献。”
AMD、英特尔等也拉着追击的缰绳高喊“打倒英伟达”。据路透社报道,AMD CEO最近表示,针对英伟达的H100需求,将从第四季度开始扩大生产其超级芯片M1300。也就是说,我们将向全球云企业推出AMD的AI芯片,而不是昂贵且难以获得的英伟达产品。科技企业投资公司GP BullHound的经理珍妮·哈迪对路透社说:“在很多人无法使用英伟达芯片的情况下,如果AMD增加MI300的生产,可能会产生强劲的需求。”英特尔今年5月也公开了AI学习用CPU高迪2,向英伟达施压。英特尔首席副总裁桑德拉·里维拉强调:“高迪2在(半导体性能测试人)‘MLPerf’基准测试中表现出色。在语言学习方面比英伟达的A100更出色。”
这些AI半导体企业有望在英伟达的主要市场中国展开激烈角逐。AMD CEO1日在接受路透社采访时解释说:“我们正在确认在中国AI市场的销售潜力。我们将继续朝着为中国客户开发产品的方向前进。”英特尔也在加快在中国的业务。英特尔上月29日在中国广东深圳开设了“英特尔大湾区创新中心”。与当地6家企业签订协议,计划在AI、半导体、尖端计算领域进行共同研究。英特尔方面在当天的启动仪式上表示:“高迪2是为了提高中国客户的AI使用能力而设计的。将帮助中国构建AI未来。”
但随着美国加大对中国的施压力度,全球AI半导体企业的营商环境将不容乐观。据路透社报道,美国政府即将发布行政令,限制本国企业在半导体、AI等尖端技术领域在中国的投资。英伟达等公司为了绕过美国拜登政府的半导体出口限制措施,正在开发低性能AI芯片供应中国。这种销售战略今后能否实现还是未知数。
当天,英伟达宣布不久后将推出生成AI开发平台“AI工作台”。利用英伟达的AI超级计算服务“DGX云”和生成AI项目示例,可以轻松创建生成AI服务。这将与谷歌开放的生成AI平台“Vertex AI”类似。DAS英伟达首席副总裁曼努维克表示:“AI学习有多种方案,结果必然会有所不同。我们将继续支持针对生成AI开发和利用进行优化的软件和硬件。”