百度文心4.5將於“316”發布,哪個能力最值得期待?

2025年02月28日23:40:35 科技 8907
百度文心4.5將於“316”發布,哪個能力最值得期待? - 天天要聞


編輯|易瑾



2月28日,百度官方公眾號宣布,將於3月16日發布文心大模型4.5。此前據百度創始人李彥宏在2024年q4及全年財報電話會上透露4.5將開源。


deepseek重點在文本模型上不同的是,據官方介紹文心大模型4.5除了在基礎模型能力上有大幅提升外,還具備原生多模態、深度思考等能力。

百度文心4.5將於“316”發布,哪個能力最值得期待? - 天天要聞


公開資料顯示,百度文心大模型是全球最早對標gpt的llm大模型,並將於今年內發布5.0版本。也就在今日凌晨,openai正式發布gpt4.5,只是一經發布該模型便受到不少質疑,一方面是持續的高價策略,另一方面則是產品性能和使用體驗。


人工智能行業的大模型之戰愈演愈烈,一直堅定投入大模型的百度,近期免費、開源動作頻頻,文心4.5即將發布,有哪些能力是值得期待的呢?


開放動作接連不斷


春節期間,deepseek如同鯰魚一般攪動了整個大模型市場。除了模型能力強外,開源+性價比是讓deepseek引發潑天熱度的重要原因。


受其影響,國內外大模型廠商迅速捲入到模型發布和開源的陣容中。毫不例外,百度也迅速“出招”以開放的策略以求佔據主動權。


2月13日,百度宣布文心一言將於4月1日起全面免費,所有pc端和app端用戶均可體驗文心系列最新模型,以及超長文檔處理、專業檢索增強、高級ai繪畫、多語種對話等功能。


在此之前,文心一言一直採取和chatgpt類似的收費模型,免費用戶只能使用文心大模型3.5,想要使用更高級的文心大模型4.0的用戶,需要開通會員。


同時,文心一言上線深度搜索功能,該功能具備更強大的思考規劃和工具調用能力,可為用戶提供專家級內容回復,並處理多場景任務,實現多模態輸入與輸出。截至目前,文心一言用戶規模達到4.3億,文心大模型日均調用量超過16.5億次。


面向b端客戶,百度也為企業和開發者提供了不少福利。在2月5日,千帆上架了deepseek-r1和deepseek-v3模型後,百度推出了超低價格方案,最低至deepseek官方定價的30%,同時還推出了限時免費服務。模型上線首日,超過1.5萬家客戶通過千帆平台進行模型調用。


次日,百度宣布將在未來幾個月中陸續推出文心大模型4.5系列,並於6月30日起正式開源。現在來看,文心4.5版本將更快速地與用戶見面。


據官方透露隨着文心大模型的迭代升級,其訓練和推理成本正在迅速下降。在不久前,李彥宏也在迪拜ai峰會上表示,當前的創新速度比以往快得多,大模型的推理成本每年能降低90%以上,並表示將持續投入ai基礎設施,以打造下一代大模型。


在這之後,百度app全量上線新的ai入口、搜索和文心智能體平台全面接入deepseek和文心大模型最新的深度搜索功能等一系列動作,讓用戶體驗提升到新的高度。


定檔3月16日的文心4.5,在此前百度財報會上透露是史上最強大的文心大模型,又會有哪些驚喜呢?


幻覺能力或將降低到新水平


從2023年“百模大戰”到2024年應用全面開花,大模型基座能力的比拼依然是在你追我趕的狀態。尤其在今年年初deepseek憑藉高性能、低成本模型引發業界關注後,全球不少大模型廠商爭先恐後地發布自家模型。


anthropic的發布首款混合推理模型claude 3.7 sonnet、馬斯克的人工智能初創公司xai推出更新版grok 3大模型、openai 最新大模型gpt-4.5正式推出……


據悉gpt-4.5是openai最後一代不具備“思維鏈推理”機制的模型。在廣大用戶的期待下,gpt-4.5有“進步”也有不少“爭議”。


“情商”能力是被業內廣泛認可的核心突破,而成本與價格是gpt-4.5的主要爭議點:每百萬輸入是75美元、每百萬輸出是150美元,是claude 3.7 sonnet的25倍。


在用戶體驗上gpt-4.5也受到了不少“詬病”,有科技博主實測表示該模型在編碼等方面並不比gpt-4o好太多、也有用戶稱不如grok。因此,業內也有一種觀點是:這是openai倉促發布的一個產品。


即將在3月16日發布文心4.5,也引起了廣泛關注,不少從業者都在期待新的突破。


百度文心4.5將於“316”發布,哪個能力最值得期待? - 天天要聞


實際上,從文心一言發布之初,百度就強調檢索增強,到現在一年半多時間,檢索增強的價值,已經成為業界共識。


百度基於搜索技術的積累在rag上具備明顯優勢,推出百度ai原生檢索。從rag能力實測來看,國內外主流大模型中,百度文心一言綜合表現都很突出。公開資料顯示,百度研發了“理解-檢索-生成”協同優化的檢索增強技術,顯著提升了大模型技術及應用的效果。


理解階段,基於大模型理解用戶需求,對知識點進行拆解;檢索階段,面向大模型進行搜索排序優化,並將搜索返回的異構信息統一表示,送給大模型;生成階段,綜合不同來源的信息做出判斷,並基於大模型邏輯推理能力,解決信息衝突等問題,從而生成準確率高、時效性好的答案。


另外在2024世界大會上百度還發布了檢索增強的文生圖技術(irag),將百度搜索的億級圖片資源跟強大的基礎模型能力相結合,可以生成各種超真實的圖片,整體效果遠遠超過文生圖原生系統,去掉了機器味兒,具備無幻覺、超真實、低成本、立等可取等特點。


結合百度官方介紹,文心大模型4.5在基礎模型能力上有大幅提升,且具備原生多模態、深度思考等能力。結合rag、irag等百度一貫具備優勢的能力,不難推測文心大模型4.5將在幻覺方面降低到新水平。


結語


一直以來,李彥宏都強調大模型應用的價值,也持續通過降低成本、提升模型性能等方式,降低大模型的應用普及落地門檻。


在他的願景中是希望大模型能人人都用得起,人人都用得上。近期,在接連開源、免費等諸多動作下,開源的文心4.5給予市場更大的期待。



   推薦閱讀   

科技分類資訊推薦

長安與東風重組新進展:朱華榮稱不會改變長安既定戰略 - 天天要聞

長安與東風重組新進展:朱華榮稱不會改變長安既定戰略

2月9日,長安汽車和東風集團股份(00489.HK)同步發布了控股股東“正在與其他國資央企集團籌劃重組事項”的信息。長安汽車的控股股東是兵裝集團,而東風集團股份的控股股東是東風公司。隨即,長安汽車和東風集團這兩家汽車央企將合併重組,成為業內關注的焦點。
公安部出手了!年齡限制放寬10年、送考下鄉,2025年考駕照不難了 - 天天要聞

公安部出手了!年齡限制放寬10年、送考下鄉,2025年考駕照不難了

電動車加強管理以後,要求機動車類型的車輛需要持證上路,但是老年人考駕照卻受阻,一方面有年齡的限制,另一方面偏遠山區考駕照不方便,所以在2025年公安部出手了,年齡限制放寬10年,同時推出送考下鄉服務,還進一步的降低考駕照的費用,2025年起考摩托車駕照不難了。
從“星靈安全守護體系”到昊鉑HL,看懂廣汽科技日 - 天天要聞

從“星靈安全守護體系”到昊鉑HL,看懂廣汽科技日

發布會以技術切入,並全程圍繞安全展開。廣汽集團董事長、總經理馮興亞率先登場,宣布2025年四季度將正式上市支持L3級智能駕駛的車型,他同時強調面向自動駕駛時代對智能駕駛技術、整車安全架構以及突發風險處理能力的要求更高。如何才能滿足更高的要求?馮興亞提到了“廣汽
關稅大棒下,最受傷的車企出現了 - 天天要聞

關稅大棒下,最受傷的車企出現了

特朗普的關稅大棒剛揮出,尚未嚇退“外敵”,卻先刺痛了自己。近日,擁有瑪莎拉蒂、Jeep等14個品牌的全球第四大車企斯泰蘭蒂斯突然宣布裁撤900名美國工人,關閉加拿大和墨西哥兩家工廠,北美生產線陷入癱瘓。幾乎同一時間,捷豹路虎宣布暫停對美出口一個月,奧迪更是直接