大模型價格戰白熱化 通義千問主力模型降價97%

5月21日,阿里雲拋出重磅炸彈:通義千問GPT-4級主力模型Qwen-Long,API輸入價格從0.02元/千tokens降至0.0005元/千tokens,直降97%。這意味着,1塊錢可以買200萬tokens,相當於5本《新華字典》的文字量。這款模型最高支持1千萬tokens長文本輸入。阿里雲方面稱,降價後約為GPT-4價格的1/400,「擊穿全球底價」。

據悉,Qwen-Long是通義千問的長文本增強版模型,性能對標GPT-4,上下文長度最高達1千萬。除了輸入價格降至0.0005元/千tokens,Qwen-Long輸出價格也直降90%至0.002元/千tokens。相比之下,國內外廠商GPT-4、Gemini1.5Pro、Claude3Sonnet及Ernie-4.0每千tokens輸入價格分別為0.22元、0.025元、0.022元及0.12元,均遠高於Qwen-long。

通義千問本次降價共覆蓋9款商業化及開源系列模型。不久前發佈的通義千問旗艦款大模型Qwen-Max,API輸入價格降至0.04元/千tokens,降幅達67%。

業界普遍認為,隨着大模型性能逐漸提升,AI應用創新正進入密集探索期,但推理成本過高依然是制約大模型規模化應用的關鍵因素。

在武漢AI智領者峰會現場,阿里雲智能集團資深副總裁、公共雲事業部總裁劉偉光說:「作為中國第一大雲計算公司,阿里雲這次大幅降低大模型推理價格,就是希望加速AI應用的爆發。我們預計未來大模型API的調用量會有成千上萬倍的增長。」

在不久前,位元組跳動高調入局大模型戰場,其首次發佈旗下大模型就主動打起了大模型領域的價格戰,宣布把旗下大模型的計價單位從分降至厘,並稱價格比同行低99%。