今天,百度OpenAI對普通用戶免費!DeepSeek的API已漲價

新一輪大模型算力價格戰,一觸即發!

作者/  it時報記者  毛宇

編輯/  郝俊慧  孫妍

deepseek的「鯰魚效應」正在加速。


2月13日,文心一言宣布,4月1日起全面免費,同時上線深度搜索功能。此前,百度基於文心一言 4.0 turbo推出的專業版會員服務定價為59.9元/月。

同日,openai宣布gpt-4.5和gpt-5路線圖更新、模型規範重大更新,並預告gpt-4.5和gpt-5將在幾周/幾個月內推出,更重要的是,chatgpt的免費套餐將在標準智能設置下獲得對gpt-5的無限制聊天訪問許可權。


不過,對於業內更為關注的api(應用程序編程介面)服務費用,百度和openai卻沒有給出更多信息,當c端用戶可以免費獲得越來越好的ai服務時,開發者們更希望大模型的算力價格戰來得更猛烈些。


2月9日,deepseek-v3宣布,結束api服務45天優惠期,價格回調至原價,輸入每百萬token收費0.5元(緩存命中)至2元(緩存未命中),輸出價格則定為每百萬token 8元,是優惠期的4倍。


不過,在業內人士看來,這個價格「仍然是高性價比」,儘管從2024年5月開始,國內各大模型廠商先後展開多輪價格戰,但在開發者看來,只是「噱頭更足」,因為性能強大的高階模型「還是很貴」,deepseek的演算法架構創新和分散式訓練優化等創新,才真正將價格打下來。


新一輪的大模型價格戰,箭在弦上。有分析指出,這場由演算法突破驅動的價格革命,可能重塑全球ai服務市場格局,加速市場洗牌進程。


價格更為敏感的算力市場已暗流涌動,山海引擎coo彭璐告訴《it時報》記者,國內企業都已經在加快提升國產算力部署規模,其中華為昇騰、寒武紀、摩爾線程等國產gpu產品需求顯著上升。不過,基於「deepseek的低成本能力,預計數據中心的算力價格不會上漲」。

創新誕生「ai界拼多多」

deepseek被稱為「ai界的拼多多」是有道理的。


目前,openai gpt-4o api服務定價為每百萬輸入token 1.25美元(緩存命中)(約9.13元人民幣)/ 2.5美元(緩存未命中)(約18.27元人民幣),每百萬輸出token 10美元(約73.091元人民幣),而claude 3.5-sonnet依然是最昂貴的模型,價格高出deepseek-v3數倍。

即便是deepseek推理能力更強、性能比肩openai o1正式版的r1模型,每百萬輸入token 1元(緩存命中)/4元(緩存未命中),每百萬輸出token 16元的api服務價格,也幾乎是openai o1同等規模輸入15美元(約109元人民幣)和輸出60美元(約437元人民幣)的二十分之一到百分之一。


國內大模型企業從2024年5月進入降價周期,通義、豆包、kimi、百度的降幅大多在80%以上,但當去年12月deepseek發布v3時,尤其是在45天優惠期內,價格非常香。


「deepseek的低價源自成本夠低。」上述ai業內人士表示,deepseek採用的moe模型架構並不很新,minimax等國內廠商也早已開始應用,但deepseek-v3引入了多頭潛在注意力機制,通過低秩壓縮技術減少了推理時的key-value緩存,顯著提升了推理效率,此外,deepseek-r1在做訓練時,跳過了傳統訓練中的監督微調(sft)步驟,使用了rl強化學習的方法,完全依賴環境反饋來優化模型行為,同樣省去很多算力成本。

大模型算力價格有望普降

沒讓大家失望,「ai界拼多多」果然將價格打下來了。由於deepseek完全採用開源模式,這些技術創新正在被全球人工智慧產業學習並復刻,大模型算力價格有望迎來一次普降。


短短一個多月過去,deepseek橫空出世帶來的「鯰魚效應」明顯。據《it時報》記者觀察,截至目前,已有多家國產大模型廠商推出新的性能比肩deepseek-v3的產品,加上優惠期結束,v3已不是絕對的「性價比之王」。


同樣走開源路線的阿里雲大模型通義,在2月4日三方基準測試平台chatbotarena公布的最新大模型盲測榜單上,以剛剛發布的qwen2.5-max超越deepseek v3、o1-mini和claude-3.5-sonnet等模型,成為非推理類的中國大模型冠軍。目前qwen2.5-max的api調用價格還未公布,而在2024年9月發布的價格表上,通義的上一代旗艦模型、性能逼近 gpt-4o的qwen-max每百萬token輸入成本為2.4元,輸出成本為每百萬token9.6元,略高於deepseek-v3。

另一家國內ai創業公司minimax(稀宇)也於1月15日推出minimax-text-01,基準測試結果顯示,性能比肩gpt-4o和claude-3.5,價格為輸入每百萬token0.2美元(1.45元人民幣),輸出每百萬token1.1美元(8元人民幣),和deepseek-v3幾乎持平。

當然,也有分析人士指出,雖然價格較高,但閉源大模型openai gpt-4o和claude 3.5-sonnet在多模態、泛化能力以及綜合能力上的優勢依然存在,不少開發者暫時還不會放棄。

英偉達模組出現低價拋售

同時,隨著deepseek開源模型的廣泛應用,國產gpu服務商迎來新一輪增長機遇,算力市場格局也正經歷深刻變革。


一名算力廠商工作人員告訴《it時報》記者,目前國產gpu相較英偉達更受市場青睞,華為昇騰、寒武紀、摩爾線程等國產gpu需求顯著上升,部分企業開始轉向國產晶元進行模型推理和微調,但價格還算平穩,沒有明顯變化。


當下,國內多數企業都在自行部署deepseek。其中deepseek滿血版模型對顯存要求較高,需要1.25台h100或1台h200支持,但4位量化版僅需400gb左右的顯存。上述人士透露,有客戶已經在國產gpu伺服器上做本地化部署的適配,從成本上來說,雖然仍需數萬元,但較之前已大幅降低。


據了解,目前亞馬遜和阿里雲平台已有服務商在低價拋售h100模組,上述人士分析,此前生成式ai大模型廠商選擇英偉達,是因為其成熟的cuda生態和gpu的通用能力,也是當時性價比最高的方案,因此大廠爭相堆砌算力資源。「小力同樣也能出奇蹟」的deepseek靠演算法突破算力限制,且客戶需求逐漸向推理和微調轉移,國產gpu適配性正在提升,從而擠壓了英偉達的部分市場空間。


deepseek的api商業化,本質上是一場深刻的「技術效能革命」。彭璐認為,deepseek的出現,推動算力市場開始思考如何從「堆算力」轉向「精細化運營」,企業更注重單位算力的效能,市場供需平衡正在重構。同時,deepseek的開源策略也降低了ai應用的門檻,未來入局ai賽道的中小企業或會大幅增加。

排版/ 季嘉穎

圖片/ chatbotarena  豆包ai  百度 網路  

來源/《it時報》公眾號vittimes