文心一言背後,百度還是那個百度

2023年03月20日19:12:10 科技 9273

文心一言背後,百度還是那個百度 - 天天要聞

對百度而言,文心一言不是一個結果,而僅僅是這家技術企業在過去多年投入的一個縮影和側寫。

作者|皮爺

出品|產業家

「第一槍」打響。

伴隨着一身「工程師範」的李彥宏出現在台上,在市場備受期待的文心一言正式亮相。在發佈會現場,作為百度的掌門人,他依次演示了文心一言的各項功能板塊,並基於文心一言的特殊性和未來百度智能雲的聯動進行了闡述。

功能必然是值得且應該被核心關心的,包括文心一言的回答精準度,包括文心大模型背後的中文數據訓練量,以及其能支持多模態的能力。

但在功能背後,一個更應該被思考的視角是,文心一言發佈的價值是什麼?

對於中國科技的發展,市面上往往有「跟隨」和缺乏創新的論調,這種論調在pc互聯網以及移動互聯網都被一部分人詬病。但在如今的大模型時期,文心一言的出現似乎在向市場證明,中國在科技的創新能力,已經具備了和海外同台競技的能力。

誠如李彥宏所說,文心一言是如今全世界唯一一個由大廠推出的生成式ai應用。在過去的一段時間裏,儘管各家磨刀霍霍,但真正由大廠開發的生成式ai並沒有出現。比如微軟僅是調用openai的能力,將其集成進自己的產品,而其他廠商如谷歌、facebook等都沒有成型產品的發佈。

在當下的節點,文心一言更像一個特殊的「有勇氣」的領頭人。

關於百度,一個公認的點是百度一直是中國技術的代表企業,不論是被無數人推崇的「工程師文化」,還是百度對於ai長期以往真刀真槍的投入,這些在中國一眾互聯網大廠中都獨具一格。

或者也更可以說,縱觀中國科技行業,能夠打響,並且能夠打好大模型第一槍的,也只能是百度。

一、文心一言,打響中文大模型「第一槍」

第一槍。這是文心一言發出後,不少業內人士對它的評價。

文心一言到底如何?整體來看,中國大模型的第一槍,百度沒有令人失望。

首先來看功能層面。從目前發佈會介紹的功能來看,文心一言目前在公開場合演示的有文學創作、商業文案創作、數理推算、中文理解和多模態生成能力。其中,文學創作可以說是基於獨特的中文大模型生成的,後續四個能力也都在現場做了不錯的演示。

而在發佈會之後,各方人士也紛紛對文心一言進行了測試。根據文心一言在市場反饋的程度來看,它的回答符合人們對其的預期,尤其是在中文語義的問題表達上,文心一言的表現甚至要高於市場預期,明顯優於chatgpt。

一個背景信息是,文心一言背靠的是文心大模型。而文心大模型的定位是基於中文語義的知識增強大模型。從背後訓練的數據來看,其訓練數據包括萬億級網頁數據、數十億的搜索數據和圖片數據、百億級的語音日均調用數據,以及5500億事實的知識圖譜等,這使得文心一言在中文語言的問題處理上具備天然優勢。

或者也可以說,從使用體驗來說,相較於chatgpt,文心一言更符合中國人的使用習慣。

在單純的創作之外,一個市面上普遍的反饋是,文心一言在推理能力上也有不錯的表現。除了李彥宏在現場演示的「比較」的問題,比如對某些計算相關的問題,文心一言也都有不錯的回答,其答案的準確性、邏輯性、流暢性也都基本符合預期。

儘管文心一言後續的強預測和推理能力仍需要更多的測試,但人們的正向預期在發佈後的幾個小時內,就有了充分的良性反饋。

根據數據顯示,截至3月16日晚間,百度智能雲已經與5家企業完成首批簽約合作,並與650家企業啟動簽約,申請文心一言的api調用服務測試的企業突破6.5萬。而在3月17日港股開盤後,百度股價上漲超過10%。

二、「歡迎邁進大模型時代」

那麼,為什麼在當下產業數字化的節點,各個大廠對生成式ai,以及其背後的大模型有這麼高的熱情?或者也更可以說,為什麼百度要在海外chatgpt推出的很短時間內,迅速推出自己的大模型?

關於大模型,一個通俗的定義是相較於之前的模型訓練,其採用的數據更為原始和無秩序,模型框架可以基於深度學習的方式進行自監督學習,基於海量數據進行特殊的智能表達和推理運算。

如果對其做一個更精確的定義是,大模型或將是未來產業數字化的終極方式。

「未來會是大模型+行業模型的時代。」在百度陽泉智算中心的現場,百度智能云云計算產品解決方案和運營部總經理宋飛告訴我們,「在過去的幾年時間裏,百度已經幫不少企業落地了行業模型的模式。」

類似的形式不罕見。不單純在國內的部分產業側,在國外,微軟推動的「通用行業模型+行業模型」也在成為各個行業數字化轉型的依託。這樣做的好處在於,企業可以基於自身的大模型進行內部不同環節的產業表達,比如營銷、智能客服等等,幫助企業實現一定程度地智能,進而減少人員成本。

而除了企業內部自行測試之外,在模型被正式推出後,其可以利用外部輸入的數據進行深度學習。換言之,伴隨着模型被使用次數的越來越多,其智能化程度將會越來越高,模型本身也將越來越成熟。openai推出的gpt大模型就是一個鮮明的例子。

除此之外,儘管當下不論谷歌還是微軟,抑或是百度推出的通用大模型更大的預訓練模式都集中在c端板塊,但未來其將可以與其前端的saas應用,以及公有雲和私有雲產品進行深度耦合,進而提供一個具有實際生產力的工具。

對數字服務廠商而言,這是一個先發戰。誰能率先跑出第一步,就能佔據先發優勢。

但這並不是一件容易的事情。以國外的預訓練語言大模型為例,根據國盛證券報告《chatgpt 需要多少算力》現實,gpt-3 訓練一次的成本約為 140 萬美元,對於一些更大的 llm(大型語言模型),訓練成本介於 200 萬美元至 1200 萬美元之間。以 chatgpt 在 1 月的獨立訪客平均數 1300 萬計算,其對應芯片需求為 3 萬多片英偉達 a100 gpu,初始投入成本約為 8 億美元,每日電費在 5 萬美元左右。

這並不是一筆任何企業都能夠且願意投入的費用。那麼,為什麼在今天,百度會優先選擇站在舞台之上?答案同樣是業務本身。

從當下百度的業務模式來看,其上到百度智能雲業務、無人駕駛,下到小度等智能終端,以及百度固有的基本盤搜索,本質都可以與文心一言以及文心大模型有足夠強的連接力和協同力,且有強加持。

此外,從實際投入來看,早在2019年,百度就已經推出了文心大模型ernie 1.0。在2021年,百度又基於ernie發佈了全球首個百億參數的對話大模型plato-xl。

截止目前,百度最新發佈的ernie 3.0 zeus,已經擁有千億級參數,並具備智能創作等各類自然語言理解和生成任務。與業界其他模型相比,其在公開數據集上的小樣本學習、理解和生成任務效果也已經處於非常領先的水平。

換言之,在當下大模型時代即將來臨的當下,百度需要並且有能力構建自己的生成式ai產品,以此更好地滿足市場需求。此外,通過此,也更能展現中國企業在過去十年里基於技術上的投入和科技厚度。

一個形象的比喻是,如果說openai打開的是ai發展的一道門,那麼百度本身已經在這個ai的門內騰挪。

三、我們應該如何理解文心一言?

再說迴文心一言產品本身。在打響中國生成式ai產品第一槍背後,我們應該對文心一言有一個怎樣客觀評價和感知?

綜合來看,目前文心一言的表現有驚喜,也有不足。但在chatgpt成為大模型時代的唯一代表的當下,不可否認的是,文心一言正在成為一個中國大模型的新代表。

這種代表不單純在產品本身,也更在其背後文心大模型代表的中國企業的新側寫。比如百度是如今全球為數不進行全棧布局的人工智能公司,這次文心一言背後的技術棧,從高端芯片崑崙芯,到飛槳深度學習框架,再到文心預訓練大模型,各個層面都有領先業界的關鍵自研技術,並且幾乎全部是自研產品。

再比如,百度擁有強大的算力基礎,其目前擁有陽泉、徐水、定興三個雲計算中心,僅陽泉一個智算中心,就承載着24萬台服務器,為大模型的研發提供着強大的底層支持。

同樣因為這次文心一言,還被人知道的是百度一直保持的壓強式、馬拉松式的研發投入。比如在2022 年百度核心研發費用 214.16 億元,佔百度核心收入比例達到 22.4%。

也可以說,在文心一言發佈背後,市場能看到的不單純是產品本身,也更能看得到中國企業愈發強大的技術實力和為技術持續投入的決心。

此外,在投入之外,百度也恰是在自證。即能感知到的是,伴隨着文心一言的發佈,百度也在開始享受自己多年技術投入帶來的紅利反哺,比如文心一言將會給百度智能雲強大的ai加持,能給客戶提供更為徹底和更為專業的數字化服務,同時結合「通用大模型+產業模型」的形式,為企業打磨自己的模型。

實際上,在過去的幾年時間裏,百度已經基於文心大模型為客戶提供行業模型的解決方案,比如和國家電網一起打造的電力大模型等等,這些模型層的解決方案也終將會反哺到底層的算力層,推動百度智能雲的增長和強服務力。

對百度而言,文心一言不是一個結果,而僅僅是這家技術企業在過去多年投入的一個縮影和側寫。「做自己擅長的事情。」這是百度的最真實寫照。

科技分類資訊推薦

華工科技等在蘇州成立科技公司 - 天天要聞

華工科技等在蘇州成立科技公司

每經AI快訊,天眼查App顯示,近日,蘇州立華智維科技有限公司成立,法定代表人為王建剛,註冊資本2億元人民幣,經營範圍包括增材製造裝備製造、增材製造裝備銷售、3D打印基礎材料銷售、3D打印服務、通用設備製造、金屬切割及焊接設備製造等。股權全景穿透圖顯示,該公司由華工科技(000988)旗下武漢華工激光工程有限責任公...
iPadOS 26 生產力迎來史詩級躍升:融入液態玻璃設計|MacOS級多任務處理 - 天天要聞

iPadOS 26 生產力迎來史詩級躍升:融入液態玻璃設計|MacOS級多任務處理

在今日凌晨舉行的WWDC25開發者大會上,蘋果正式發佈了包括iOS 26、iPadOS 26、MacOS 26在內的一系列系統更新,並帶來了近年來最大規模的設計語言升級 —— 「Liquid Glass」(液態玻璃)風格。這一新視覺系統橫跨全生態平台,採用半透明的動態玻璃質感,主屏幕圖標呈現出漂浮感與真實的折射效果,鎖屏界面的時間數字也會根據...
蘋果 iOS 26 升級電池管理:使用數據更透明、耗電應用無處遁形 - 天天要聞

蘋果 iOS 26 升級電池管理:使用數據更透明、耗電應用無處遁形

IT之家 6 月 10 日消息,科技媒體 MacRumors 今天(6 月 10 日)發佈博文,報道稱蘋果公司在 iOS 26 系統,更新了電池相關設置,提供了更深入的電池使用分析。用戶可以清晰了解 iPhone 使用習慣如何影響電池壽命,查看各應用耗電情況,並體驗全新的電池管理工具。IT之家註:在 iOS 26 的電池設置界面頂部,用戶能直接看到當...
中證1000指增:為何它是目前指增產品中的優選 | 資產配置啟示錄 - 天天要聞

中證1000指增:為何它是目前指增產品中的優選 | 資產配置啟示錄

指數增強型基金(簡稱「指增產品」)憑藉「指數β+超額α」的雙重收益邏輯,近年來成為投資者資產配置的熱門選擇。指增產品兼具指數基金和主動管理基金的特點,其收益由指數基礎收益β和「增強」超額收益α共同構成。β部分為跟蹤指數組合而獲得的市場平均收益,它是投資收益的基礎。而α部分則來自於基金經理通過主動管理...
蘋果WWDC2025大會將召開!消費電子ETF下跌0.51%,勝宏科技上漲4.36% - 天天要聞

蘋果WWDC2025大會將召開!消費電子ETF下跌0.51%,勝宏科技上漲4.36%

6月10日早盤,A股三大指數集體上漲,上證指數盤中上漲0.17%,休閑用品、摩托車、辦公用品等板塊漲幅靠前,航天、互聯網跌幅居前。消費電子個股分化,截至9點54分,消費電子ETF(159732)下跌0.51%,其成分股勝宏科技上漲4.36%,安克創新上漲1.72%,傳音控股上漲0.84%,欣旺達上漲0.81%。然而,瑞芯微、恆玄科技等表現不佳,...
主頻300MHz!豪威集團推出車規MCU—OMX2x4B系列芯片 - 天天要聞

主頻300MHz!豪威集團推出車規MCU—OMX2x4B系列芯片

快科技6月10日消息,今日,豪威集團正式推出全新一代OMX2xx系列高性能MCU——OMX2x4B。隨着中國汽車市場消費者對於汽車智能化需求的提升,智能輔助駕駛和智能座艙成為更多車型的標配,同時,汽車 EEA 架構的更新迭代也逐漸加速,越來越多的ECU集成至單個或者多個域控制器中。上述兩大趨勢對於MCU的性能、功能安全、信息安全...
360度無死角!華為乾崑告訴你為何尊界S800要裝四顆激光雷達 - 天天要聞

360度無死角!華為乾崑告訴你為何尊界S800要裝四顆激光雷達

快科技6月10日消息,華為乾崑智能汽車解決方案發佈第二期《乾崑答網友問》,回應了公眾關注的多個問題。其中,官方回應了為何尊界S800要裝四顆激光雷達。據悉,尊界S800搭載的華為乾崑智駕系統配備了四顆激光雷達,每顆雷達都有其獨特的用途,共同實現360度無死角的全方位感知。其中,車頂的激光雷達主要負責前向安全。它能...