腾讯科技特约作者丨苏扬
编辑丨郑可君
昆仑芯近期完成了新一轮融资,但融资的传播却呈现以下现象:相关方都在宣传,当事方则默不作声。
7月4日,上河动量资本宣布参与昆仑芯最新一轮的融资,华兴资本作为fa(财务顾问)也对外宣布了该消息。
就在此前一天,山证投资确认参与了昆仑芯新一轮亿元融资,而在更早的6月26日,国新基金下属的高层次人才基金,也宣布完成对昆仑芯的投资。
投资方、财务顾问都先后披露了融资进展,昆仑芯却保持沉默,未在其官方渠道披露任何有关本轮融资的消息,这背后反映了什么问题?
昆仑芯近期融资情况,来源:天眼查
一位半导体行业投资人认为,投资方和财务顾问抢跑宣布融资消息是基于自身传播的需要,“这种操作是为了告诉外界,他们也在看这个赛道的项目。”在该人士看来,大家可能只是节奏不同,昆仑芯的传播应该也很快会跟上节奏。
“有一些股东不希望公开,另外一些希望公开,像山证这种。”另一位从业者这样解读。
01 借ipo“换血”
作为国产ai芯片创业项目,昆仑芯前身为百度智能芯片及架构部,其自研芯片项目最早可追溯到2011年,该项目于2021年4月完成独立融资,基本对应国产gpu创业热潮,百度芯片首席架构师欧阳剑出任独立公司的ceo,其首轮估值约130亿元。
到目前为止,昆仑芯先后经历6轮融资,目前百度仍为第一大股东,但其持股比例已从早期的76.17%,稀释至当前的67.49%。
昆仑芯股权关系,来源:天眼查
昆仑芯的新一轮融资,是在国产gpu、ai芯片集中筹备ipo的背景下进行的。
此前,6月30日,国产gpu项目摩尔线程和沐曦先后递交招股书,拟于科创板上市,除了上述两家外,壁仞、燧原、格兰菲等都有相关的上市安排,gpu、ai asic芯片赛道短时间内将会出现近10家拟上市公司,这被外界形象地称之为“中国英伟达”集体冲刺ipo。
国产gpu排队ipo,与一级市场融资困难有关。“亏成这样,一级市场很难找到投资人。”一位长期跟踪半导体行业数据的分析师说。
此前,也有多位投资人对腾讯科技强调,现在不是投gpu赛道的好时候。“美元基金在撤,国内的投资人都在等着查账,尤其是那些拿了地方钱的(项目),大家的投资欲望都在下降。”一位投资人表示。
一级市场收缩是一方面,gpu赛道重投入、持续亏损也是关键影响因素。
根据公开资料,已上市的寒武纪2024年亏损4.52亿元,刚刚提交招股书的摩尔线程和沐曦,三年累计亏损超过80亿元。
借助ipo,企业可以获得资金“输血”,投资人也可以获得退出机会。
和诸多排队ipo的友商一样,昆仑芯已多次传出ipo的消息,本轮的融资目标也直指ipo。前述从业者表示,“(昆仑芯)这一轮融资,相当于对投资方有了明确上市计划的承诺。”
在他看来,这一阶段投资者看重的是确定性,尤其是国资,更在意投资回报相对有确定性的项目。
值得注意的是,壁仞科技也采取了类似安排,根据天眼查披露的数据,其于5月份完成了由上海国投、海通开元等投资人参与的d轮融资,拟于香港联交所ipo,融资3亿美元。
02 背靠“大树”百度的优势
2021年,昆仑芯从百度体系中独立出来,同期推出第一代芯片,随后于2023年推出第二代芯片,基于这两代新品,先后推出了k100加速卡,rh800服务器等sku。2025年,正式推出第三代芯片p800。
3月份,百度ceo李彦宏曾对外透露,2025年初点亮了国内首个自研的p800万卡集群,随后在4月份的百度ai开发者大会再度宣布点亮昆仑芯3万卡集群。
“这是国内首个全自研的3万卡集群,可同时承载多个千亿参数大模型的全量训练,支持1000个客户同时做百亿参数的大模型精调。”李彦宏说。
需要注意,百度官宣的“点亮”,对应的是内部验证成功,而最终兑现成业绩,还要看出货量。
根据腾讯科技获得的消息,昆仑芯p800的价格基本接近英伟达此前特供中国市场的h20,单卡在10万元左右。“价格可以对标h20,甚至会高一些,具体要看推广策略。”一位知情人士说。
也就是说,3万张gpu在全部出售的前提下,对应的销售额为30亿元。
在业绩兑现上,相比其他国产竞品,昆仑芯有一个优势——背靠百度这一大树,可以更好的实现“设计、生产、销售”循环。
去年,腾讯科技就“大厂自研asic芯片”与联想控股副总裁于浩有过一次交流,在他看来,大厂做芯片自研的逻辑是比较顺的,“它的客户就在那儿,这是个明确的优势。”
前述国产芯片从业者也认同这种观点,他说:“尽管(昆仑芯)是独立公司,但关系近,比如政企行业客户,百度智能云做私有化、混合云解决方案输出,底层ai芯片用昆仑芯,很正常。”
在该人士看来,百度+昆仑芯的组合,前者可以投入资源做一些偏上层、应用层的工作,昆仑芯就可以在这方面减少一些投入。
03 颇具争议的“国产第二”
半导体综研整理的数据显示,国产芯片绝大部分fp16算力都在300tflops左右,具体为:寒武纪思元590(314.6tflops)、海光bw100(350tflops)、平头哥含光800(205tflops)、沐曦曦云c500(240tflops)、壁仞br104(512tflops)、壁仞br100(1024tflops)。
国产芯片算力及发布时间,来源:半导体综研
根据我们了解到的数据,昆仑芯p800 fp16算力为345tflops,远超h20的148tflops,不考虑集群的损耗等因素,理论上万卡集群的 fp16算力为3.45eflops,3万卡集群算力可达10.35eflops。
单纯看算力,昆仑芯p800单卡性能在国产中处于第一梯队,但也远低于一些特殊的产品,例如壁仞br100,其fp16算力可达1000+tflops,主要在于后者采用了双die设计,并且采用cowos封装,die size(芯片面积)高达1074mm²,晶体管数量也达到了770亿,而国产芯片的die size基本都在600mm²以下,也有少数单die产品比如平头哥含光800,die size达到709mm²。
br100 2.5d封装+双die方案,来源:壁仞
性能之外,昆仑芯在国产芯片当中的排行,就显得颇具争议性。
5月份,idc发布《2024年中国大陆数据中心ai加速卡市场排名》报告,在该报告中,英伟达凭借190万多张gpu,占据70%的份额,国产生态当中,昆仑芯凭借69279张卡,位列国产第二。
2024年中国大陆数据中心ai加速卡市场排名,来源:idc
多位国产芯片从业者都认为该数据准确性存疑,海光、平头哥、壁仞都没有纳入到报告中,“壁仞新产品没有出现不清楚为何,老产品总有点量,而且也缺少平头哥的数据,平头哥量不小,所以这个数据不准确。”一位国产芯片从业者解释道。
在该从业者看来,idc这则报告中提及2024年昆仑芯近7万的量,与回片-量产交付周期对不上。“(昆仑芯)7万的交付数据太夸张了,2024年上半年回片,要达到量产出货标准,一般需要半年时间。”
换句话说,如果昆仑芯要实现2024年数据中心采用量达到7万张,必须在年底完成突击部署,时间上不太乐观。
晶圆代工产能方面,如果idc报告提及的近7万张产能符合实际情况,那么按照每片晶圆出50颗gpu die的良率,预计需要1400片晶圆。
由于bis在2024年年底才推动新一轮针对ai芯片的管制,2024年上半年这一时间点,作为大陆企业的昆仑芯,可以很容易的从台积电拿到1400片 7nm晶圆的代工产能。
不过,随着新规落地,产能将成为影响国产ai芯片企业市场排名的重要因素,谁拿到更多的产能,谁的排名就会靠前,相关的风险提示,在沐曦、摩尔线程的招股书中,也都做了重点提及。
“公司采用 fabless 经营模式,主要负责芯片的研发、设计与销售,生产环节由专业的外协厂商完成,主要包括晶圆代工厂和封装测试厂,报告期内公司与部分境外供应商进行合作”,沐曦在招股书中写道。“因相关政策影响,公司目前在先进制程晶圆代工和 hbm 供应等方面受到不利限制。”