對百度而言,文心一言不是一個結果,而僅僅是這家技術企業在過去多年投入的一個縮影和側寫。
作者|皮爺
出品|產業家
「第一槍」打響。
伴隨着一身「工程師範」的李彥宏出現在台上,在市場備受期待的文心一言正式亮相。在發佈會現場,作為百度的掌門人,他依次演示了文心一言的各項功能板塊,並基於文心一言的特殊性和未來百度智能雲的聯動進行了闡述。
功能必然是值得且應該被核心關心的,包括文心一言的回答精準度,包括文心大模型背後的中文數據訓練量,以及其能支持多模態的能力。
但在功能背後,一個更應該被思考的視角是,文心一言發佈的價值是什麼?
對於中國科技的發展,市面上往往有「跟隨」和缺乏創新的論調,這種論調在pc互聯網以及移動互聯網都被一部分人詬病。但在如今的大模型時期,文心一言的出現似乎在向市場證明,中國在科技的創新能力,已經具備了和海外同台競技的能力。
誠如李彥宏所說,文心一言是如今全世界唯一一個由大廠推出的生成式ai應用。在過去的一段時間裏,儘管各家磨刀霍霍,但真正由大廠開發的生成式ai並沒有出現。比如微軟僅是調用openai的能力,將其集成進自己的產品,而其他廠商如谷歌、facebook等都沒有成型產品的發佈。
在當下的節點,文心一言更像一個特殊的「有勇氣」的領頭人。
關於百度,一個公認的點是百度一直是中國技術的代表企業,不論是被無數人推崇的「工程師文化」,還是百度對於ai長期以往真刀真槍的投入,這些在中國一眾互聯網大廠中都獨具一格。
或者也更可以說,縱觀中國科技行業,能夠打響,並且能夠打好大模型第一槍的,也只能是百度。
一、文心一言,打響中文大模型「第一槍」
第一槍。這是文心一言發出後,不少業內人士對它的評價。
文心一言到底如何?整體來看,中國大模型的第一槍,百度沒有令人失望。
首先來看功能層面。從目前發佈會介紹的功能來看,文心一言目前在公開場合演示的有文學創作、商業文案創作、數理推算、中文理解和多模態生成能力。其中,文學創作可以說是基於獨特的中文大模型生成的,後續四個能力也都在現場做了不錯的演示。
而在發佈會之後,各方人士也紛紛對文心一言進行了測試。根據文心一言在市場反饋的程度來看,它的回答符合人們對其的預期,尤其是在中文語義的問題表達上,文心一言的表現甚至要高於市場預期,明顯優於chatgpt。
一個背景信息是,文心一言背靠的是文心大模型。而文心大模型的定位是基於中文語義的知識增強大模型。從背後訓練的數據來看,其訓練數據包括萬億級網頁數據、數十億的搜索數據和圖片數據、百億級的語音日均調用數據,以及5500億事實的知識圖譜等,這使得文心一言在中文語言的問題處理上具備天然優勢。
或者也可以說,從使用體驗來說,相較於chatgpt,文心一言更符合中國人的使用習慣。
在單純的創作之外,一個市面上普遍的反饋是,文心一言在推理能力上也有不錯的表現。除了李彥宏在現場演示的「比較」的問題,比如對某些計算相關的問題,文心一言也都有不錯的回答,其答案的準確性、邏輯性、流暢性也都基本符合預期。
儘管文心一言後續的強預測和推理能力仍需要更多的測試,但人們的正向預期在發佈後的幾個小時內,就有了充分的良性反饋。
根據數據顯示,截至3月16日晚間,百度智能雲已經與5家企業完成首批簽約合作,並與650家企業啟動簽約,申請文心一言的api調用服務測試的企業突破6.5萬。而在3月17日港股開盤後,百度股價上漲超過10%。
二、「歡迎邁進大模型時代」
那麼,為什麼在當下產業數字化的節點,各個大廠對生成式ai,以及其背後的大模型有這麼高的熱情?或者也更可以說,為什麼百度要在海外chatgpt推出的很短時間內,迅速推出自己的大模型?
關於大模型,一個通俗的定義是相較於之前的模型訓練,其採用的數據更為原始和無秩序,模型框架可以基於深度學習的方式進行自監督學習,基於海量數據進行特殊的智能表達和推理運算。
如果對其做一個更精確的定義是,大模型或將是未來產業數字化的終極方式。
「未來會是大模型+行業模型的時代。」在百度陽泉智算中心的現場,百度智能云云計算產品解決方案和運營部總經理宋飛告訴我們,「在過去的幾年時間裏,百度已經幫不少企業落地了行業模型的模式。」
類似的形式不罕見。不單純在國內的部分產業側,在國外,微軟推動的「通用行業模型+行業模型」也在成為各個行業數字化轉型的依託。這樣做的好處在於,企業可以基於自身的大模型進行內部不同環節的產業表達,比如營銷、智能客服等等,幫助企業實現一定程度地智能,進而減少人員成本。
而除了企業內部自行測試之外,在模型被正式推出後,其可以利用外部輸入的數據進行深度學習。換言之,伴隨着模型被使用次數的越來越多,其智能化程度將會越來越高,模型本身也將越來越成熟。openai推出的gpt大模型就是一個鮮明的例子。
除此之外,儘管當下不論谷歌還是微軟,抑或是百度推出的通用大模型更大的預訓練模式都集中在c端板塊,但未來其將可以與其前端的saas應用,以及公有雲和私有雲產品進行深度耦合,進而提供一個具有實際生產力的工具。
對數字服務廠商而言,這是一個先發戰。誰能率先跑出第一步,就能佔據先發優勢。
但這並不是一件容易的事情。以國外的預訓練語言大模型為例,根據國盛證券報告《chatgpt 需要多少算力》現實,gpt-3 訓練一次的成本約為 140 萬美元,對於一些更大的 llm(大型語言模型),訓練成本介於 200 萬美元至 1200 萬美元之間。以 chatgpt 在 1 月的獨立訪客平均數 1300 萬計算,其對應芯片需求為 3 萬多片英偉達 a100 gpu,初始投入成本約為 8 億美元,每日電費在 5 萬美元左右。
這並不是一筆任何企業都能夠且願意投入的費用。那麼,為什麼在今天,百度會優先選擇站在舞台之上?答案同樣是業務本身。
從當下百度的業務模式來看,其上到百度智能雲業務、無人駕駛,下到小度等智能終端,以及百度固有的基本盤搜索,本質都可以與文心一言以及文心大模型有足夠強的連接力和協同力,且有強加持。
此外,從實際投入來看,早在2019年,百度就已經推出了文心大模型ernie 1.0。在2021年,百度又基於ernie發佈了全球首個百億參數的對話大模型plato-xl。
截止目前,百度最新發佈的ernie 3.0 zeus,已經擁有千億級參數,並具備智能創作等各類自然語言理解和生成任務。與業界其他模型相比,其在公開數據集上的小樣本學習、理解和生成任務效果也已經處於非常領先的水平。
換言之,在當下大模型時代即將來臨的當下,百度需要並且有能力構建自己的生成式ai產品,以此更好地滿足市場需求。此外,通過此,也更能展現中國企業在過去十年里基於技術上的投入和科技厚度。
一個形象的比喻是,如果說openai打開的是ai發展的一道門,那麼百度本身已經在這個ai的門內騰挪。
三、我們應該如何理解文心一言?
再說迴文心一言產品本身。在打響中國生成式ai產品第一槍背後,我們應該對文心一言有一個怎樣客觀評價和感知?
綜合來看,目前文心一言的表現有驚喜,也有不足。但在chatgpt成為大模型時代的唯一代表的當下,不可否認的是,文心一言正在成為一個中國大模型的新代表。
這種代表不單純在產品本身,也更在其背後文心大模型代表的中國企業的新側寫。比如百度是如今全球為數不進行全棧布局的人工智能公司,這次文心一言背後的技術棧,從高端芯片崑崙芯,到飛槳深度學習框架,再到文心預訓練大模型,各個層面都有領先業界的關鍵自研技術,並且幾乎全部是自研產品。
再比如,百度擁有強大的算力基礎,其目前擁有陽泉、徐水、定興三個雲計算中心,僅陽泉一個智算中心,就承載着24萬台服務器,為大模型的研發提供着強大的底層支持。
同樣因為這次文心一言,還被人知道的是百度一直保持的壓強式、馬拉松式的研發投入。比如在2022 年百度核心研發費用 214.16 億元,佔百度核心收入比例達到 22.4%。
也可以說,在文心一言發佈背後,市場能看到的不單純是產品本身,也更能看得到中國企業愈發強大的技術實力和為技術持續投入的決心。
此外,在投入之外,百度也恰是在自證。即能感知到的是,伴隨着文心一言的發佈,百度也在開始享受自己多年技術投入帶來的紅利反哺,比如文心一言將會給百度智能雲強大的ai加持,能給客戶提供更為徹底和更為專業的數字化服務,同時結合「通用大模型+產業模型」的形式,為企業打磨自己的模型。
實際上,在過去的幾年時間裏,百度已經基於文心大模型為客戶提供行業模型的解決方案,比如和國家電網一起打造的電力大模型等等,這些模型層的解決方案也終將會反哺到底層的算力層,推動百度智能雲的增長和強服務力。
對百度而言,文心一言不是一個結果,而僅僅是這家技術企業在過去多年投入的一個縮影和側寫。「做自己擅長的事情。」這是百度的最真實寫照。