作者 | 辰紋
來源 | 洞見新研社
今年年初,deepseek橫空出世,讓世界重新認識了中國大模型。
幾乎在deepseek爆紅的同一時間,科大訊飛發布了全國產算力平台上首個深度推理大模型——訊飛星火x1,其獨一無二的標籤是「唯一基於全國產算力訓練的深度推理模型」。
1萬張華為昇騰910b國產算力卡,訓練出的星火x1在模型參數比業界同類小一個數量級的情況下,整體效果卻能對標openai o1和deepseek r1。
在曠日持久的科技賽跑中,科大訊飛用實際行動走出了一條自主可控,雖然艱辛,但更值得誇讚大模型發展路線。
01 技術突圍,國產算力的極限挑戰
從表面上看,科大訊飛選擇「全棧自主可控」路線是出於中美競爭的地緣環境,兩次被美國列入實體清單,無法獲得英偉達晶元算力的「另闢蹊徑」,然而更深層次的內里,人工智慧競爭的實質已經演算法與模型的性能優劣,演變成算力/演算法/應用這一整條鏈接綜合能力的考驗。
因而科大訊飛從一開始就確定了「全棧自主可控」的方向,算力國產化,演算法自研。
2023年5月,訊飛星火大模型發布,5個月後,首個支撐萬億參數大模型訓練的萬卡國產算力平台「飛星一號」也宣布正式啟用。
2024年,在「飛星一號」算力平台的支持下,訊飛星火大模型不斷升級,從v3.5到v4.0再到v4.0 turbo,核心能力全面對標gpt-4 turbo。
取得上述成績的背後是科大訊飛與華為共同攻克的技術無人區。自2023年5月起,雙方團隊在萬卡高速互聯組網、計算通信隱藏、訓練推理強交互等關鍵領域取得突破,將昇騰910b的訓練效率從最初相當於英偉達a100的30%-50%提升至85%-95%。
今年1月,科大訊飛又發布了國內首個基於全國產算力訓練的具備深度思考和推理能力的大模型——訊飛星火x1。
這個僅130億參數的「小模型」實力「驚人」,在高考題、aime競賽題和高中奧賽題解答中,不僅答案準確,還能提供接近人類「慢思考」的詳細解題步驟。
3個月後,科大訊飛與生態企業組成的聯合團隊通過多種優化手段提升「飛星一號」平台上 moe 模型集群推理的性能上限,並實現大規模專家並行集群推理性能翻番,訊飛星火x1也由此迎來了全新升級,在數學、代碼、邏輯推理、文本生成、語言理解、知識問答等通用任務上效果顯著提升。
科大訊飛的實踐充分證明了基於國產算力訓練的全棧自主可控大模型具備登頂業界最高水平的實力和持續創新的潛力,與此同時,也在「自主可控」語境下,為中國的大模型行業提供了一條可供借鑒的破局之路。
02 應用為王,從教育醫療到央國企的全面滲透
研發實現了「全棧自主可控」,其價值最終要體現在落地應用上,科大訊飛的戰略是以「1+n」的形式進行業務體系布局, 「1」是指通用底座大模型,「n」是指以底座大模型賦能教育、醫療、汽車、辦公、工業、智能硬體等多個行業領域,並形成獨具優勢的行業大模型。
比如,訊飛星火x1在教育場景中落地時,聯合中國教育科學研究院發布基於「問題鏈」的高中數學智能教師助手,在全國百個試點區域部署,與上千名優秀教研員打造了上萬個優秀案例。
在實際教學中,老師們發現x1在一題多解、教學知識關聯、拓展學生高階思維等方面表現出色。相關技術的融入,科大訊飛ai學習機的學習推薦和診斷也變得更加精準,解題思路和知識鏈條更加清晰。
在醫療領域,x1的模型策略已使專科輔助診斷和複雜病歷內涵質控準確率達90%。科大訊飛還表示將在年內發布基於x1的醫療大模型升級版,確保其深層次診斷推理效果業界領先。
更令人矚目的是在央國企市場的攻城略地,科大訊飛為央企打造的專業大模型已成為行業標杆。
與中國石油共建的崑崙大模型使代碼開發效率提升73%,行業知識問答採納率超95%;為國家能源集團開發的智能評標助手獲國資委點名表揚;與中海油合作的 「海能」人工智慧模型已在招標採辦、員工健康等領域應用,並正在研發海上油田穩產增產等專業場景模型。
科大訊飛之所以能夠在idc的報告中拿下去年央國企大模型解決方案市場份額第一,其核心原因在於滿足了產業應用「既要又要還要」的需求,即工程能力與技術能力雙向驅動。
在具體實踐中,科大訊飛通過「通專結合、端雲聯動與軟硬一體」(通用大模型與專業大模型結合、端側大模型與雲端大模型聯動、軟硬體一體化)來實現部署成本與用戶體驗的平衡,提出「建算力、理數據、訓模型,到落場景、保安全、精運營」的全鏈路方法,從場景出發,給客戶提供人工智慧的解決方案。
在工具層面上,科大訊飛進一步升級了模型定製優化工具鏈,支持監督微調、強化學習兩種模型定製優化方案,持續簡化定製步驟和成本。
03 星火燎原後的硬仗與新征途
從上文的分析不難看出,科大訊飛不僅證明了國產算力登頂技術巔峰的實力,更為中國大模型行業開闢了一條可借鑒的破局路徑。然而,大模型行業的競逐正步入深水區,訊飛面臨的考驗更為複雜。
其一,全球大模型正加速向多模態、強推理、高能效演進。昇騰910b效率雖追至a100的85%-95%,但面對英偉達h200等新一代晶元及集群效率的持續躍升,保持算力底座競爭力仍需在晶元互聯、訓練框架、集群調度等「硬骨頭」上持續攻堅。
其二,大模型之爭終將演化為生態之爭,科大訊飛「1+n」戰略雖已鋪開,但相比互聯網巨頭在消費端的海量觸達和開發者生態號召力,其仍需在吸引廣大開發者、構建繁榮的工具鏈與社區生態上傾注更多資源與開放誠意,避免成為「孤勇者」。
其三,行業落地已從「能用」邁向「好用且經濟」,科大訊飛在央企、教育、醫療的標杆案例雖亮眼,但需將「通專結合、端雲聯動」方法論沉澱為可快速複製的規模化能力,在確保「自主可控」前提下持續優化部署成本與用戶體驗,實現商業價值的可持續閉環。
今年4月份的業績說明會上,科大訊飛官方認為,「目前底座大模型還有很大的增長空間,通過預訓練和強化訓練兩種方法,大模型的自主進化在未來2-3年內還有巨大的提升空間,天花板非常高。」
科大訊飛董事長劉慶峰也表示,會繼續加大「1+n」的投入,搶抓通用人工智慧的根紅利。「在完全自主可控的基礎上,我們的通用底座大模型要做到第一梯隊,永爭行業第一,不僅僅是跟隨,並推動更多演算法研發和創新。」
很明顯,科大訊飛的挑戰主要來源於持續不斷的創新與投入和長盈利周期的平衡,好就好在,科大訊飛以篳路藍縷的實踐點燃了希望之火,至少在當前這個時間節點,科大訊飛仍處於領跑的位置。
科大訊飛的未來如何,既取決於其在技術深水區持續攻堅的硬實力,也考驗其構建開放生態、實現規模落地的軟智慧。