划重点:
微软新一代maia ai芯片的量产时间将从2025年推迟至2026年。
延期的主要原因包括芯片设计变化、研发团队人手不足以及员工流动性过高。
微软的ai芯片在能效方面将难以与英伟达同类产品竞争。
微软已花费多年时间设计自家的人工智能芯片,部分原因是希望减少对英伟达的依赖。然而,这一计划的进展并不顺利。
微软ai芯片延期 存在三大致命硬伤
按照年收入计算,微软是英伟达最大的客户之一,但其最新一代ai芯片的设计进展远远落后于预期。这意味着,当这些芯片投入量产时,可能会远远落后于英伟达的同类产品,缺乏足够的竞争力。
微软面临的困境凸显了一个问题:随着ai技术的飞速发展,企业在开发专用ai芯片时,面临的挑战愈发严峻。而英伟达的通用处理器以其卓越的性能主导着整个行业。
芯片开发通常需要至少两年的时间,但随着ai领域的快速突破,专用ai芯片需要应对不断变化的技术需求,面临着随时过时的风险,特别是在ai模型的构建和运行方式发生重大变化时。
据知情人士透露,微软的下一代ai芯片代号为braga,计划推迟至少六个月才能进入量产。这意味着,量产时间将从2025年推迟至2026年。即使braga芯片投产,预计其性能也将远逊于英伟达的旗舰芯片blackwell,后者在2024年底发布。
微软原计划今年将braga芯片部署到其数据中心。但项目负责人表示,braga芯片的推迟主要由于设计发生预料之外的变化、研发团队人员不足以及员工流动性过高等因素。微软发言人拒绝对此发表评论。
微软ai路线图:三年发三款推理芯片
微软从2019年开始开发其首款ai芯片,并于2023年发布了maia 100芯片。当时,微软将maia 100宣传为“颠覆性”产品,称其能够支持copilot等ai助手和chatgpt等ai服务。openai首席执行官山姆·奥特曼(sam altman)也高度评价了这款芯片,表示它为训练更多模型、降低运行成本打开了大门。
然而,实际情况却并非如此。微软主要将maia 100用于内部测试,而非实际生产环境。根据多位在职及离职的微软员工透露,maia 100并未为微软的任何ai服务提供支持,主要原因是该芯片最初于2019年设计,正好发生在openai发布chatgpt之前,其设计重点是图像处理,而非生成式ai。
在2024年maia 100发布后,微软启动了一个雄心勃勃的计划,计划在2025年、2026年和2027年分别发布三款后续芯片,代号分别为braga、braga-r和clea,并将它们部署到数据中心。然而,braga芯片推迟至2026年,这引发了人们对微软是否能够按时推出剩余两款芯片的担忧。
据三位微软芯片团队成员透露,这三款芯片均为推理芯片,主要用于将训练好的模型应用到新数据上,以生成回应或做出决策。微软原计划设计一款用于训练ai模型的芯片,但在2024年初取消了这一计划。
在braga芯片开发的过程中,微软要求对其设计进行更改,以满足openai提出的新功能需求。这使得芯片在模拟测试中变得不稳定,工程师不得不花费几个月时间来解决问题。
尽管braga芯片的设计经历了重大变化,但微软高层依然坚持要求在年底前完成设计。这一最后期限给芯片团队带来了极大的压力,导致有五分之一的团队成员离开了项目。多位参与者表示,微软的芯片团队人员流动性较高。
据知情人士透露,微软的ai芯片在至少maia 300(代号clea)问世之前,将难以与英伟达的产品竞争。clea将采用全新设计,与braga相比,其性能将大幅提升。但在此之前,maia系列芯片的电力消耗较高,性能也大幅落后于英伟达的同类产品。
针对日益增多的竞争性自主芯片项目,英伟达也做出了回应。据参与该项目的人员透露,英伟达为了使客户难以用其它芯片替代其产品,已为其旗舰ai硬件系统gb200设定了极为激进的性能目标。
微软/谷歌/亚马逊集体造芯 却还是干不过英伟达!
微软并不是唯一一家计划开发自家ai芯片的大型科技公司。亚马逊也在研发其第三代ai芯片——trainium 3,预计将在今年年底前交付客户。亚马逊发言人表示,项目进展顺利,trainium 3将提供比前一代trainium 2高出两倍的计算能力。
与此同时,谷歌已经花费约十年时间自研ai芯片,称为tpu(张量处理单元)。因此,谷歌无需依赖英伟达的芯片来训练或运行大多数ai模型。据知情人士透露,谷歌的下一代tpu芯片代号为ironwood,预计将在今年底开始小规模生产,并于明年大规模量产。
不过,谷歌依然是英伟达的重要客户,因为它租赁搭载英伟达芯片的服务器供云计算客户使用,同时也使用英伟达芯片来支持一些不适合由谷歌tpu处理的ai服务。
谷歌也面临着其他问题。去年,谷歌与联发科合作设计下一代tpu芯片,但该合作遭遇了挫折。负责tpu网络技术的联发科核心团队多位成员离职,转而加入英伟达。这项技术对于ai至关重要,因为它能让多个芯片协同工作。
英伟达ceo黄仁勋6月初在开发者大会上表示,大多数大型科技公司正在推进的竞争性芯片项目最终会被放弃。他还质问道:“如果你做的asic(特定应用集成电路)不比现有的更好,那还有什么意义?” (腾讯科技特约编译 金鹿)