百度文心4.5將於“316”發布,哪個能力最值得期待?


編輯|易瑾



2月28日,百度官方公眾號宣布,將於3月16日發布文心大模型4.5。此前據百度創始人李彥宏在2024年q4及全年財報電話會上透露4.5將開源。

與deepseek重點在文本模型上不同的是,據官方介紹文心大模型4.5除了在基礎模型能力上有大幅提升外,還具備原生多模態、深度思考等能力。

公開資料顯示,百度文心大模型是全球最早對標gpt的llm大模型,並將於今年內發布5.0版本。也就在今日凌晨,openai正式發布gpt4.5,只是一經發布該模型便受到不少質疑,一方面是持續的高價策略,另一方面則是產品性能和使用體驗。

人工智能行業的大模型之戰愈演愈烈,一直堅定投入大模型的百度,近期免費、開源動作頻頻,文心4.5即將發布,有哪些能力是值得期待的呢?

開放動作接連不斷

春節期間,deepseek如同鯰魚一般攪動了整個大模型市場。除了模型能力強外,開源+性價比是讓deepseek引發潑天熱度的重要原因。

受其影響,國內外大模型廠商迅速捲入到模型發布和開源的陣容中。毫不例外,百度也迅速“出招”以開放的策略以求佔據主動權。

2月13日,百度宣布文心一言將於4月1日起全面免費,所有pc端和app端用戶均可體驗文心系列最新模型,以及超長文檔處理、專業檢索增強、高級ai繪畫、多語種對話等功能。

在此之前,文心一言一直採取和chatgpt類似的收費模型,免費用戶只能使用文心大模型3.5,想要使用更高級的文心大模型4.0的用戶,需要開通會員。

同時,文心一言上線深度搜索功能,該功能具備更強大的思考規劃和工具調用能力,可為用戶提供專家級內容回復,並處理多場景任務,實現多模態輸入與輸出。截至目前,文心一言用戶規模達到4.3億,文心大模型日均調用量超過16.5億次。

面向b端客戶,百度也為企業和開發者提供了不少福利。在2月5日,千帆上架了deepseek-r1和deepseek-v3模型後,百度推出了超低價格方案,最低至deepseek官方定價的30%,同時還推出了限時免費服務。模型上線首日,超過1.5萬家客戶通過千帆平台進行模型調用。

次日,百度宣布將在未來幾個月中陸續推出文心大模型4.5系列,並於6月30日起正式開源。現在來看,文心4.5版本將更快速地與用戶見面。

據官方透露隨着文心大模型的迭代升級,其訓練和推理成本正在迅速下降。在不久前,李彥宏也在迪拜ai峰會上表示,當前的創新速度比以往快得多,大模型的推理成本每年能降低90%以上,並表示將持續投入ai基礎設施,以打造下一代大模型。

在這之後,百度app全量上線新的ai入口、搜索和文心智能體平台全面接入deepseek和文心大模型最新的深度搜索功能等一系列動作,讓用戶體驗提升到新的高度。

定檔3月16日的文心4.5,在此前百度財報會上透露是史上最強大的文心大模型,又會有哪些驚喜呢?

幻覺能力或將降低到新水平

從2023年“百模大戰”到2024年應用全面開花,大模型基座能力的比拼依然是在你追我趕的狀態。尤其在今年年初deepseek憑藉高性能、低成本模型引發業界關注後,全球不少大模型廠商爭先恐後地發布自家模型。

anthropic的發布首款混合推理模型claude 3.7 sonnet、馬斯克的人工智能初創公司xai推出更新版grok 3大模型、openai 最新大模型gpt-4.5正式推出……

據悉gpt-4.5是openai最後一代不具備“思維鏈推理”機制的模型。在廣大用戶的期待下,gpt-4.5有“進步”也有不少“爭議”。

“情商”能力是被業內廣泛認可的核心突破,而成本與價格是gpt-4.5的主要爭議點:每百萬輸入是75美元、每百萬輸出是150美元,是claude 3.7 sonnet的25倍。

在用戶體驗上gpt-4.5也受到了不少“詬病”,有科技博主實測表示該模型在編碼等方面並不比gpt-4o好太多、也有用戶稱不如grok。因此,業內也有一種觀點是:這是openai倉促發布的一個產品。

即將在3月16日發布文心4.5,也引起了廣泛關注,不少從業者都在期待新的突破。



實際上,從文心一言發布之初,百度就強調檢索增強,到現在一年半多時間,檢索增強的價值,已經成為業界共識。

百度基於搜索技術的積累在rag上具備明顯優勢,推出百度ai原生檢索。從rag能力實測來看,國內外主流大模型中,百度文心一言綜合表現都很突出。公開資料顯示,百度研發了“理解-檢索-生成”協同優化的檢索增強技術,顯著提升了大模型技術及應用的效果。

理解階段,基於大模型理解用戶需求,對知識點進行拆解;檢索階段,面向大模型進行搜索排序優化,並將搜索返回的異構信息統一表示,送給大模型;生成階段,綜合不同來源的信息做出判斷,並基於大模型邏輯推理能力,解決信息衝突等問題,從而生成準確率高、時效性好的答案。

另外在2024世界大會上百度還發布了檢索增強的文生圖技術(irag),將百度搜索的億級圖片資源跟強大的基礎模型能力相結合,可以生成各種超真實的圖片,整體效果遠遠超過文生圖原生系統,去掉了機器味兒,具備無幻覺、超真實、低成本、立等可取等特點。

結合百度官方介紹,文心大模型4.5在基礎模型能力上有大幅提升,且具備原生多模態、深度思考等能力。結合rag、irag等百度一貫具備優勢的能力,不難推測文心大模型4.5將在幻覺方面降低到新水平。

結語

一直以來,李彥宏都強調大模型應用的價值,也持續通過降低成本、提升模型性能等方式,降低大模型的應用普及落地門檻。

在他的願景中是希望大模型能人人都用得起,人人都用得上。近期,在接連開源、免費等諸多動作下,開源的文心4.5給予市場更大的期待。



   推薦閱讀