對大企業來說,保守不單單是因循守舊,更多時候,則是無法與昨日成功的自己,奮力作別。
可面對未來,百度還在持續張開懷抱。
2月28日,百度官方公眾號宣布,將於3月16日發布文心大模型4.5,繼續自身開放的戰略轉軌,並且,一些更加明朗且積極的信號,也在該事件中悄然傳出。
按照百度的說法,即將全面開放的文心大模型4.5,將是百度最強的下一代大模型。尤其在基礎模型能力上,文心大模型4.5將迎來大幅提升,且具備原生多模態、深度思考等能力。
到了今年的6月30日,該模型還將正式開源,這或將帶給用戶更好的體驗,以及對GPT-4.5發起全面挑戰。
不僅如此,算上此次文心大模型4.5推出,以及DeepSeek橫空出世後,百度接連宣布文心一言免費和上線深度搜索功能,加上旗下搜索、地圖、小度等相繼接入了 DeepSeek,可以說,百度近期打出了系列「開放」的組合拳,無疑正以一種開放的姿態,直面行業的劇烈變化。
而這一切,看似是戰略的轉變,實則,更是一種技術積澱的必然迴響。
百度讓Open Ai臉紅心跳?
在DeepSeek掀起行業開放浪潮之時,百度,無疑是國內響應最為迅捷的企業之一。
這一次,即將在3月16日發布的文心大模型4.5,或也將為行業聚光燈下,對百度「大模型」的期中大考。
不過,據百度方面透露,文心大模型4.5在基礎模型能力上已經有了大幅提升,且具備原生多模態、深度思考等能力,號稱百度最強大模型。
具體而言,此次文心大模型4.5,具有當前行業內幾乎最強的RAG(檢索增強生成)能力,而該能力,也是衡量大模型優劣的重要標準之一。
為此,百度的RAG,可在大模型理解用戶需求階段,不斷對知識點進行拆解,細化問題。到了檢索階段,又可向大模型展開搜索排序優化,並將搜索返回的異構信息統一表示,送給大模型。
到了最終的生成階段,百度RAG還可綜合不同來源的信息獨自判斷,尤其加上百度實時和全面的搜索生態後,基於大模型邏輯推理能力,就可一舉解決信息衝突等問題,從而生成準確率高、時效性好的答案。
事實上,自文心一言發布初,百度便一直強調檢索增強,隨後經過近兩年技術沉澱,百度的檢索增強能力不斷提升的同時,也讓該能力的價值,受到業界一致認可。
並且,百度即將推出的文心大模型4.5,更在百度自研的iRAG等技術加持下,可將百度搜索的億級圖片資源與自身強大的基礎模型能力相結合,從而生成種類繁多的真實圖片。甚至,iRAG可以做到在生成特定物品、特定人物以及特定人物與任意背景結合的圖像時,在準確率、真實性上都有顯著突破,極大減少幻覺。
其呈現的整體效果,將會遠遠超過文生圖原生系統,不僅能夠去掉了Ai味兒,而且成本很低,在使用場景上,不論是影視作品、漫畫作品,還是連續畫本、海報製作等領域,無疑帶給用戶留有大量施展才華的空間。
一個可以預見的例子是,在文心大模型4.5正式上線後,用戶如果有品牌宣傳的需求,則可以藉助iRAG技術下,在幾乎0成本操作中,像素極復刻以往大片宣傳海報動輒需要一二十萬,甚至大幾十萬成本的圖片。
此外,文心一言還將上線的深度搜索功能,可為用戶提供專家級內容回復,實現多模態輸入與輸出。不僅如此,深度搜索功能下,還能提供多項工具調用,包含了高級聯網、文檔問答、圖片理解等功能,在用戶處理多場景任務中,效能無疑將得到極大提升。
值得注意的是,先前的2月27日,百度準備發布文心大模型4.5消息一經公布,2月28日的凌晨,OpenAi則迅速發布了GPT-4.5模型。似乎,雙方正在暗自較勁。
不過,OpenAi的發布或許略顯倉促。據報道,OpenAi前員工安德烈·卡帕西,曾提前體驗了GPT-4.5後,認為GPT-4.5主要提升在非推理密集型任務上的改進,這些任務多與情商有關,而在數學、代碼等領域,GPT-4.5並不擁有最強的能力。
當然,GPT-4.5與文心大模型4.5雙方具體表現如何,仍有待進一步驗證。
不過,從先前文心一言和ChatGPT對比來看,文心一言在中文語境與本土化上,往往有著GPT難以比擬的優勢:尤其在問答準確性、實時性上,文心一言的幻覺較少,對時事的反應也更加迅捷。
從這點上說,百度的文心大模型4.5的深度思考能力,加上自身極強的多模態功能,對中國用戶而言,或許在未來能有更好的體驗。
例如,從RAG能力實測來看,在國內外主流大模型中,百度文心一言綜合表現一直屬於第一梯隊。即使是春節檔電影細節、春晚節目等內容,文心一言都可以準確回答,做到文能對題,相比之下,OpenAi雖能檢索到信源,卻無法生成準確回答。
更重要的是,文心一言將於4月1日全面免費,PC端和App端用戶均可體驗。與之相對的是,GPT-4.5雖接入API,但OpenAi計劃逐步轉向GPT-5的免費基礎版(額度受限),付費用戶需升級至Plus/Pro版本。
從這點上說,免費且開源的文心大模型4.5,起碼在普惠性上,將帶給用戶更多的誠意。
開放,不僅僅是一種姿態
DeepSeek橫空出世後,浪潮風波席捲全球。
對此,百度卻沒有故步自封,反而動作頻頻,持續以一種開放的姿態,直面變化。
此前的2月13日,文心一言就正式宣布,將於4月1日起全面免費,所有PC端和App端用戶均可體驗文心系列最新模型,以及超長文檔處理、專業檢索增強、高級Ai繪畫等功能,一舉引起社會廣泛討論。
一天後的2月14日,百度接著宣布,將在未來幾個月陸續推出文心大模型4.5系列,以及在6月30日起正式開源。
兩天的2月16日,百度的開放,也延續到了對DeepSeek態度上:彼時,百度將全面接入DeepSeek和文心大模型最新的深度搜索功能。並且,搜索用戶可免費使用DeepSeek和文心大模型深度搜索功能。
在百度全面轉向開源、開放的戰略轉軌下,百度旗下的搜索、地圖、小度等也相繼接入 DeepSeek,由此,Ai浪潮引發產品升級的紅利,也不斷分享到了更多百度系的用戶。
從大模型到搜索,百度的開源、免費,共同打出了一套開放「組合拳」。
從這點上說,在李彥宏帶領下的百度,無疑正展開了一場自我變革,此時,決心和勇氣缺一不可。
更重要的是,在這場開放過程中,又將會帶給用戶、公司、乃至整個行業哪些真正的價值?
對此,先前李彥宏曾談到,開源4.5系列的決策,源自於對技術領先地位的堅定信心,開源將進一步促進文心大模型的廣泛應用,並在更多場景中擴大其影響力:「我想強調的是,無論開源閉源,基礎模型只有在大規模解決現實問題時,才具備真實價值。」
可以說,大模型烈火烹油的兩周後,以OpenAi、百度等為首的頭部玩家,已將這場大模型的競爭,步步進逼,終於嚮應用層面全面進擊。此時,百度也在用一種更加開放的策略,試圖去佔據大模型第二場的主動權。
而在這場競爭中,更多應用層面的創新,無疑將惠及全球範圍內,越來越多的用戶。
「技術」如何打敗「故事」?
「過去,我們談論摩爾定律時,每18個月,性能水平或價格都會減半。但是今天,當我們談論大語言模型時,增加的成本基本上降低了,可以在12個月內降低90%以上」
百度CEO李彥宏在世界政府峰會上,曾如此說道。
事實上,能夠在DeepSeek衝擊中迅速調整船頭,而不一味固守「閉源」,這既是百度戰略轉折的勇氣,也離不開百度長年以來技術沉澱的支撐。
李彥宏曾談到:「不僅在Ai領域或IT行業,回顧過去幾百年的歷史,大多數創新都與降低成本有關。如果成本降低一定比例,生產力也隨之提高同樣比例,這就是創新的本質。在今天,創新速度比以往都快得多。」
事實上,Ai行業發展至今,「技術實力」正在取代「故事性」,逐漸成為該行業的核心競爭力。
從這點上說,當下,能夠撐起百度文心大模型強功能、快更迭、免費開源的根本,則源於百度在技術上的底氣。其中,百度在大模型上訓練成本的持續降低,也離不開百度崑崙芯和百舸平台的助力。
近期,百度智能雲成功點亮崑崙芯三代萬卡集群,這也是國內首個正式點亮的自研萬卡集群。據悉,百度智能雲將進一步點亮三萬卡集群。
值得注意的是, 崑崙芯萬卡集群具有極強的規模效應,大規模集群可以通過任務並行調度、彈性算力管理等方式,提高計算資源利用率,避免算力閑置,提高單任務的計算效率,降低整體算力成本,最終實心可大幅提高資源利用率。
這也意味著,在崑崙芯萬卡集群規模效應的作用下,百度大模型的推理和訓練所需的計算量一直在持續減少,從而直接降低算力成本。
不僅如此,百度的百舸平台,還能對大規模集群進行高效的部署管理。
例如,為解決大模型訓練時高通信帶寬的需求,百度不僅建設了超大規模HPN高性能網路,還可通過優化的擁塞控制演算法、集合通信演算法策略,提升了通信效率,將帶寬有效性提升到90%以上。
同時,由於萬卡集群的能耗極高,常規的散熱方案能耗可達十兆瓦或更高,這將提升企業進行模型訓練的電力成本,為此,百舸還採用了創新性散熱方案,可以有效降低能耗,進一步降低模型訓練成本。
此外,為提升GPU 的有效利用率(通常用MFU來表示GPU的有效利用率),百舸還在持續優化並完善模型的分散式訓練策略,通過高效並行化任務切分策略,將訓練主流開源模型的集群MFU提升至58%。
以及,為了保證大規模集群執行訓練任務的穩定性,百舸提供全面的故障診斷手段,可快速自動偵測到導致訓練任務異常的節點故障。加上百度自研的BCCL,目前已經將故障恢復時間從小時級降低到分鐘級,保障集群有效訓練率達到98%。
於是,當以上技術形成源源不斷的合力後,到了24年初的財報電話會上,李彥宏則表示,文心大模型的推理成本,已經已降低至一年前的1%。
此次文心大模型4.5能夠迅速推出,最大的原因之一,或許源於推理成本不斷降低。
對此,有觀點指出,百度在模型推理部署上的優勢,尤其是在飛槳深度學習框架的支持下,其中並行推理、量化推理等都是飛槳在大模型推理上的自研技術。受此影響,飛槳和文心的聯合優化,則可以實現推理性能提升,推理成本降低。
而面對機遇與風險並存的未來,人們可以預見的是,文心大模型4.5的推出以及近期百度頻頻開放的動作,遠遠不是終點——
「我們仍需對晶元、數據中心和雲基礎設施進行持續投入,來訓練更好、更智能的下一代模型。」李彥宏曾談到。