阿里雲劉偉光:新一代大模型鎖定兩大技術演進方向

ai時代,伴隨大模型極速迭代,推理效率突破,工具鏈生態愈發繁榮,一切都在以前所未有的速度進化。4月9日,在2025阿里雲ai勢能大會上,阿里雲智能集團資深副總裁、公共雲事業部總裁劉偉光表示,2025年ai應用爆發沒有最快,只有更快,應該推動基礎模型、推理服務、開發工具三要素全速演變,為ai應用提速蓄力。

根據斯坦福最新的2025年ai指數報告,中美頂級ai模型的性能差距已縮小到了 0.3%,而在2023年差距是20%,中國模型正在快速追趕美國的領先地位。從行業主導企業來看,2024年90%的知名ai模型來自企業,美國以40個模型領先,中國有15個。更明顯的一個趨勢是如今大模型的性能已經趨同。在2024年,top1和top10的模型的差距能有12%,如今差距已經越來越小,銳減至5%。
春節期間,deepseek在全世界的火爆出圈,讓公眾對大語言模型能力的認知水平有了顯著提升。這些利好消息鼓舞着社會各界加入ai浪潮,基於基礎大模型做更多的ai agent、ai原生應用、推理應用等創新。“所以我非常有理由相信,2025年一定是中國ai應用爆發的元年。”劉偉光說道。
他表示,過去一年,很多企業都在積極擁抱大語言模型,從簡單的文生圖、文生視頻、創作文檔到數據應用等,均湧現出一批令人興奮的應用。光是在阿里雲平台上就可以看到,2024年12月與2024年1月相比,大語言模型api調用量增長接近100倍,接入大語言模型的企業數量同樣是一個接近100倍的增長比例。
“這是ai應用快速落地的前奏和序曲。”劉偉光表示,“未來,ai會和很多產業進行有機融合,爆發出更多嶄新商業模式和生產路徑。”在他看來,從深度推理模型到多模態能力,中國基礎模型能力大幅提升,讓很多產業有了強化學習的想法,也讓更多ai應用的落地成為可能。伴隨ai發展不斷提速,訓練和推理所需的資源成本也在不斷降低。
當前,各行各業尤其是雲計算公司、ai創業公司都在加大投入。以阿里云為例,未來將投入3800億元進行人工智能基礎設施建設,這恰恰證明了其對於未來整個人工智能和雲計算前景的期待與信心。模型開源生態建設也跑出了“加速度”。今天,開源模型和商業化模型已經呈現出並駕齊驅之勢。經過市場的篩選,標準協議開始收斂,這將大大簡化模型調用,推動ai應用的生態繁榮。
不過,ai應用爆發對模型的性能、模型之下的基礎設施以及ai應用開發工具都提出更高的要求。以大語言模型為例,全世界的大語言模型幾乎以每兩周為一個時間單位高速演進。基礎模型作為整個ai應用生態最核心的引擎,通過提供深度的推理能力、多模態理解和交互能力,支持多樣化、高質量服務,基於不同類型、尺寸的模型滿足複雜、輕型以及更多探索型需求。
“很多客戶在探索ai應用過程中不約而同地發現,大語言模型需要支撐ai應用的基礎設施能力,特別是推理服務能力,它是保障ai應用服務順暢、平滑、穩定、高效運行的重要基礎設施。”劉偉光表示,“今天我們看到雲計算也在慢慢地為ai所改變,在計算、存儲、網絡方面圍繞ai發展做了非常多的優化,讓所有ai訓練、推理、應用能夠在雲基礎設施上進行更穩定、平滑、高效地運行。”
他認為,當模型能力足夠強大,當ai應用呼之欲出的時候,更多客戶需要更完整、更完備的工具鏈進行基於模型的ai應用開發。ai開發工具是連通大語言模型和真實應用最重要橋樑,用戶需要更多功能齊全、生態豐富、靈活部署的工具,以加速ai應用開發。
談及大模型未來發展趨勢,劉偉光表示,新一代模型最重要的技術發展方向在於兩個重要領域:reasoning(推理)和omin(全模態融合)。大模型會向越來越強的推理能力演化,基於強化學習不斷提升思維鏈的能力。伴隨着模型內生的任務規劃、工具使用能力不斷增強,大模型會越來越智慧,可以不斷思考更難的問題,完成更複雜的任務。“未來會有更多的企業基於強化學習、基於更強大的基礎模型開發出嶄新的、更有價值的ai原生應用和aiagent。”他說。
另一個方向是omni,也就是音頻、視頻、聲音和文字全模態融合。它打破了單一的文生圖、文生視頻單項能力,跨越模態的界限,整合不同類型的要素,為解決複雜問題提供強有力的支撐,並激發新的可能性。“omin未來更多是讓模型像人一樣去識別圖像、文字,實現對用戶意圖、視頻、聲音的理解,以創造更多嶄新的商業模式。”劉偉光表示。
此外,劉偉光指出,在模型工程領域,moe架構成為全球關注焦點。該架構能夠降低模型推理的資源消耗,提升模型的技能表現,尤其在垂直領域的表現大大超越傳統的小模型。“我們對模型的應用絕不僅僅局限在屏幕上、電腦上,而要從虛擬世界走向物理世界。小尺寸端側模型將為手機、汽車、終端等各種交互設備帶來巨大的利好。
關於產業熱點agent(智能體),劉偉光表示,今天,agent已經從手機端、電腦端功能插件,延伸到自動駕駛等走進生活場景的大型智能體。為了讓ai agent有“更聰明的大腦”、“更豐富的交互”,阿里雲百鍊上線業界首個全生命周期mcp服務,未來,阿里雲將通過agentstore模式,把阿里巴巴集團和生態夥伴的agent向外開放,讓各行各業的人都可以擁有自己專屬的助理。
編輯丨邱江勇
美編丨馬利亞
監製丨趙晨