文 | 《財經》記者 劉以秦
編輯 | 謝麗容
以chatgpt為代表的aigc(ai生成內容)應用爆火,帶動全球人工智慧領域的第二波熱潮。2022年11月人工智慧公司openai推出chatgpt後,估值一路走高,已達290億美元。美國一眾科技公司聞風而動,中國科技領域也在跟進,投資機構們看到了新熱點,重點尋找相關初創公司。
與語音交互、圖像識別等ai應用類似,chatgpt也是一種人機交互。人通過文字和機器對話,獲得內容。但是chatgpt的突破之處在於,它可以基於大數據集自己生成內容,而不是簡單的比對和匹配。這意味著ai掌握了一定的自學習能力,技術迭代的速度大幅提升。ai進入2.0時代。
在1.0時代,我們使用語音交互時,獲得的內容是技術人員提前預設的,ai只是在海量資料庫中做快速比對,如果資料庫中並沒有對應內容,ai的回答就會是「對不起,我沒聽懂您的問題。」1.0時代應用最廣泛的ai技術是人臉識別,同樣也是資料庫比對,ai起到的作用更多是提高效率。
ai 2.0時代的先發者chatgpt是一次令科技行業震驚的技術進展,未來會影響到各行各業。但需要釐清的是,openai是一家有獨特背景的創業公司,chatgpt是該公司基於ai大模型,長期燒錢砸出來的人機交互服務,再加上明星創始人以及資本方的影響力,共同打造一次全球科技領域的營銷活動。
中國科技公司需要學習先進技術,而不是簡單模仿一家暫時炙手可熱的公司。有人擔心若不快速跟進,會讓中國在ai領域失去主動權。掌握主動權不是跟風,是要結合自身特點做出獨特優勢。
很難學
中國公司很難在短時間內學會chatgpt。
chatgpt能夠火爆,是多重因素共同作用的結果。包括長期高額投入且沒有盈利壓力;全球雲計算市場份額排名第二的微軟雲提供算力支持;以及創始團隊的營銷能力。
openai成立於2015年,含著金湯匙出生,三位創始人分別是馬斯克、美國創業孵化器y combinator總裁阿爾特·曼、paypal聯合創始人彼得·蒂爾。創立之初就抱上了微軟的「大腿」,目前微軟持股比例49%。這些背景讓openai在前幾年沒有營收壓力,可以專心投入技術研發、迭代、優化,在它尚未起勢之前,曾多次被外界嘲諷。各國媒體報道稱,為了做出chatgpt,投入了數十億美元。更具體的數字是,大約每年25億美元。
即使公司名字里有「open」這個單詞,openai目前使用的模型、參數等,均未開源。這意味著其他公司目前想要跟進,只能同樣的路子一步不差照樣走一遍,同樣「燒錢」。
在中國,一家創業公司很難有這樣的成長環境,或許在初期可以通過融資,專心技術研發,但很快就要面臨商業化的挑戰。甚至會為了商業化,不斷調整研發方向。大型科技公司則大多都在「降本增效」,一個還難以看到明確商業回報的技術趨勢,可以布局,但不會一年燒掉幾十億美元。
此外,chatgpt是一次ai技術的「暴力式」突破,用當下最極端的方式,通過大算力的堆疊,全球大數據集不計成本的訓練,最高性能硬體的支持,以及頂尖人才等因素共同實現。也就是說,如果說ai的投入是一個吞金獸,那chatgpt就是一個超級吞金獸。
chatgpt使用的是transformer架構,擅長處理大量數據和處理語言長期依賴性,可以並行處理,能夠極大縮短模型訓練時間。這一架構2017年已經出現,並非openai獨創,有不少ai公司都在使用這一架構。
算力,硬體,人才,是可以在短期內用資金投入來跟上,但是數據不同,尤其是能夠滿足大模型運轉的高質量數據,在中國相對稀缺。
過去我們常說,中國ai產業的優勢之一是有海量豐富的數據,這一點放在今天依然成立,但是在過去幾年,中國的ai公司們並沒有在數據的質量和廣度上花太多功夫。為了做具體行業的商業化應用,中國公司更多精力用於紮根具體行業或細分場景,例如應用最廣泛的人臉識別,積累了大量同質化數據。
也就是說,我們有海量數據,但是這些數據需要通過專業的人力,進行挖掘、採集、標註、整理。中國的數據採集標註行業雖然不缺人,但缺專業團隊,也缺少有效的管理方式。
還有一點中國公司們難以學習的,是影響力。美國公司擅於做宏大敘事下的「病毒式營銷」。以馬斯克為代表的美國商人們,能夠通過講故事,激發討論度,共識與熱情,質疑或否定,他們自己就是公司和產品的代言人。
當下不值得學
chatgpt代表了新一代ai技術方向,幫助openai估值大漲,但目前還處於非常初級的階段。就像是自動駕駛,看起來很酷炫,一旦真的嘗試,就會發現很多問題。
chatgpt能實現流暢對話,甚至探討一些專業話題,但更多時候是一個「胡編亂造的語言大師」,存在數據過時、偏見、虛假信息、價值觀不正等問題。如果真的把它當成搜索工具來用,得到的結果還需要在傳統搜索引擎或其他地方進行二次驗證,反而會降低效率。
當然現在只是新技術萌芽階段,這些問題未來都能被優化。拋開這點,chatgpt目前最主要的矛盾是,在還沒能創造真實價值,且需要更多用戶參與交互來幫助機器優化的階段,它選擇了以交互次數來收費。
這是一個不太成立的商業模式。交互本身並不能產生價值,能夠收費的是交互帶來的產品和服務。例如,我們去剪頭髮,需要和理髮師交流。付錢是為了得到新髮型,而不是為了和理髮師聊天。
對於微軟來說,chatgpt是一個可以嵌入不同應用的工具,但以目前的成熟度來看,還未能給微軟帶來商業價值。當前,即使是巨頭公司,也很難支持一項長期高額虧損的業務。openai即使沒有盈利壓力,也有營收壓力,所以只能儘快收費。
openai估值大漲後,商業化壓力會變得更大。回溯幾年前,中國有不少類似的ai公司,高估值,高融資,招徠全世界優秀的技術人才,也會講故事,且沒有清晰的商業模式。為了提振估值,只能硬著頭皮做收入,不斷轉變業務方向,或是把攤子鋪得越來越大。到今天,他們大多變成了泡沫。
引發上一輪ai熱潮的是谷歌旗下的deepmind推出alphago,但是谷歌從一開始就堅持開源,讓其他科技公司能夠快速跟進。
目前,谷歌已經開始有目的性的布局語言模型。今年2月,谷歌宣布向ai公司anthropic投資3億美元,這家公司的創始人就來自openai,其產品也是智能聊天機器人,號稱與chatgpt水平相當。
ai技術,包括自然語言處理、人機交互、ai大模型等,都是中國科技公司應該關注的重要方向。中國公司擅長做工程優化,或許可以等到新技術成本更低時,再結合自身的特點,放大優勢,專註於行業應用。