發布兩大“超級有用”AI技術，AI長期主義者李彥宏的非共識解法

2024年11月30日08:31:37 科技 8136

2022年底，能夠與人類自如、深度對話的聊天機器人chatgpt一經發布，便在全球掀起火熱的生成式ai浪潮。而早在2013年，百度就成立了深度學習實驗室，是國內最早入局ai領域的企業，趕在了其他同行之前。

11月12日，在百度世界2024大會上發表演講時，百度創始人李彥宏卻拋出了一個現實的問題：“客觀地講，大家期待的超級應用還沒有出現，甚至有人開始問，過去這24個月，這種全球性的大模型狂熱，究竟是一場新的技術革命，還是新一輪泡沫？”

作為中國人工智能的扛旗者，百度給出的回答是：ai是真實的需求。李彥宏提到，今年5月，百度的高管們曾在一起討論ai大模型怎樣才算“成了”。他給出的關鍵指標是，大模型api調用量能夠在一年時間內從2億上漲10倍至20億。而僅僅半年之後，百度文心大模型的日均調用量已經超過15億，增長了7.5倍。相較於一年前首次披露的5000萬次，更是大幅增長約30倍。

在李彥宏看來，這條陡峭的增長曲線也是過去兩年中國大模型應用爆發的縮影。“今天，基礎模型能力就緒，我們即將迎來ai應用的群星閃耀時刻。每一個應用都是一顆星，每一個應用都將成為改變世界的力量。”他表示。

李彥宏的“非主流”ai觀：優先解決幻覺、重點發展智能體

和ai行業的其他玩家相比，李彥宏和百度在很多時候都顯得有些“非主流”。當許多公司陷入“百模大戰”的廝殺中，把關注焦點放在大模型的性能和參數上時，李彥宏在多個公開場合反覆強調“要卷應用不要卷大模型”、“沒有應用ai模型一文不值”。面對開閉源之爭，李彥宏又旗幟鮮明地站到閉源模型陣營中，稱閉源才有真正的商業模式。

今年2月，openai亮出文生視頻模型sora再次引爆全球互聯網，很多中國企業也紛紛開始跟進這一賽道。但李彥宏在一場內部講話中表態稱，無論多麼火爆，百度都不會去做sora類的視頻生成模型，因為投入周期太長，10年、20年都可能拿不到業務收益。

在百度世界2024大會上，李彥宏對此進一步作出闡釋。他表示比起sora，百度更希望解決圖像生成的幻覺問題，即大模型的生成內容與事實不符或毫無根據。李彥宏稱，“這個問題看起來更簡單、甚至更枯燥，但是不解決就不會有應用。”他認為，過去24個月內，對行業而言最大的變化就是大模型基本消除了幻覺，回答問題的準確性大大提升，讓ai從“一本正經的胡說八道”，變得可用、可被信賴。

而解決大模型幻覺問題的關鍵在於rag（檢索增強）技術，讓大模型利用檢索到的信息來指導文本或答案的生成。在當日與硅星人創始人駱軼航、甲子光年創始人張一甲的“ai圓桌對談”上，李彥宏提到，過去兩年rag讓大語言模型具備了實用價值，可以有效控制幻覺生成，所以才在各個場景尤其是to b方面應用起來。他強調，百度不做sora不等於百度不做多模態，“多模態要想進入真正實用階段，也得有準確性、可控性，應用空間才能打開。”

因此百度瞄準了圖像等多模態內容與rag的結合，在活動上發布了檢索增強的文生圖技術irag（image based rag）。irag能夠結合百度搜索的億級圖片資源跟強大的基礎模型能力，生成各種超真實的圖片。

李彥宏現場展示了一幅由文心大模型生成的大眾攬巡汽車飛躍長城的圖片。通過文心irag技術，無論是這款特定型號汽車的車型車標、還是作為背景的長城，均未出現錯誤或變形的幻覺問題。藉助這項技術，以前需要花費幾十萬才能完成的海報拍攝，現在的創作成本近乎於0。其商業價值就體現在無幻覺、超真實、沒成本，立等可取。

隨着全球科技巨頭將目光轉向尋找ai落地應用場景，智能體這一能夠自主感知環境、執行行動並完成設定目標的系統也受到了更多關注。但李彥宏強調，像百度這樣把智能體作為最重要戰略方向的並不多。百度認為，作為ai應用的最主流形態，智能體即將迎來爆發點。目前，百度旗下文心智能體平台已吸引15萬家企業和80萬名開發者，覆蓋了廣泛的應用場景。

百度將智能體主要分為四類：公司類智能體，角色類智能體，工具類智能體和行業類智能體。具體而言，公司類智能體能夠在傳統公司網站的基礎上提供主動推薦等服務，未來將可能成為直接面向消費者的第一界面。角色類智能體是高度擬人化的數字人，行業類智能體則專註於法律等垂直領域。百度文庫與百度網盤還聯合發布了工具類智能體“自由畫布”，全面打通公域與私域資料的限制，實現輸入、編輯、創作、分享自由。

自由畫布生成多模態調研報告

行業智能體—法行寶

代碼生成是大模型的一大核心能力，李彥宏也曾多次表示生成式ai將會讓每個人都具備程序員的能力。在百度世界2024大會上，李彥宏宣布正式推出無代碼工具“秒噠”。與輔助代碼生成工具不同，藉助“秒噠”這個由大模型和智能體組成的全新軟件，用戶甚至不再需要看懂代碼，就能構建出各種應用，“將迎來一個前所未有的、只靠想法就能賺錢的時代”。

秒噠

在演講的最後，李彥宏稱自己是軟件工程師出身，國外有一種說法叫“軟件吞噬世界”。但在他看來，世界不應該被吞噬，而應該被創造。“ai時代，應用創造世界。”這位科技領袖如是說道。

一位ai長期主義者的布局與遠見

創立百度二十餘年，跟在李彥宏身上的標籤有很多，其中就包括“ai的長期主義者”。這不僅寓意着李彥宏在人工智能方面的早期布局，也代表他對未來持續投入的堅實決心。

李彥宏曾在2023年登上《時代》周刊首屆全球百大ai人物榜單，一同被評為全球ai領袖的還包括特斯拉ceo埃隆·馬斯克、英偉達創始人兼ceo黃仁勛、openai ceo薩姆·奧特曼等人物。《時代》肯定了李彥宏對ai的長期投入及百度在ai方面取得的多項成就，評價其為“中國最傑出的未來主義者，長期投身於ai發展的浪潮”。

ai教父、圖靈獎得主楊立昆也曾在自己的《科學之路》中文版自序中提到，百度是最早部署商業化深度學習系統的大型公司之一，領先於谷歌和微軟。早在2012年，李彥宏在看到深度學習技術對搜索的改進後，就鼓勵全百度產品經理了解ai技術的最新趨勢。一年後，百度成立了深度學習實驗室，由李彥宏擔任院長，正式開啟對ai的探索。

事實上，百度與當今多位ai領軍者之間都有着千絲萬縷的關係。斬獲2024年諾貝爾物理學獎的“神經網絡之父”geoffrey hinton就曾拒絕百度4400萬美元的最高競價，最終選擇帶領團隊加入谷歌。當時，geoffrey hinton團隊憑藉新的神經網絡算法alexnet，一舉奪得2012年imagenet挑戰賽冠軍，一時聲名鵲起。其團隊成員就包括後來的openai聯合創始人ilya sutskever。

除此之外，谷歌ai項目google brain的聯合創始人和負責人吳恩達曾於2014年加入百度，擔任首席科學家一職。在百度工作的三年時間內，吳恩達帶領百度人工智能團隊增長至1300人，其中百度研究院成員300人，幫助百度培養出大量ai人才。如今openai的最大競爭對手、ai初創企業anthropic的聯合創始人兼ceo dario amodei，從斯坦福大學博士後畢業後的第一份工作，就是在百度的硅谷ai實驗室擔任研究員。

走過十年ai探索之路，百度在人工智能領域的成就和影響力已然深得認可。諮詢公司沙利文近日發布的《2024年全球ai生態全景概覽》報告顯示，自生成式ai浪潮爆發後，以英偉達為代表的芯片廠商和微軟等雲廠商開始吃到紅利，開源模型、創企、軟件應用廠商也在加速搶佔市場份額。而在全球ai生態全景中，表現亮眼的當屬ai原生巨頭，除了openai、谷歌外，百度也被列進了同一象限中。

2021年，李彥宏在《致股東信》中提到，在過去的十年里，百度致力於打基礎、建生態，開始大舉投入對ai的研發，期待用技術讓複雜的世界更簡單。因此，在人工智能大潮奔涌而來的當下，百度得以成為領先的ai生態型公司，擁有強大的互聯網用戶基礎。“百度有定力，有耐心。因為我們深知，最前沿的技術浪潮是等不來的，你必須提前10年、20年去布局。”

對ai的堅定信仰也深刻影響着百度對未來的展望。見證並親歷過90年代末到2000年初的互聯網泡沫，李彥宏對於大模型熱潮有着清晰的認識。在10月對談哈佛商業評論總編輯時，他提出生成式ai就像歷史上許多次技術浪潮一樣，在度過最初的興奮階段之後，也會不可避免地經歷泡沫的過程，那些無法滿足市場需求的偽創新將會被清洗掉。

但對於大模型的長期前景，這位互聯網先驅仍然持有樂觀態度，認為這是一次顛覆式的技術革命。“面對新的技術周期，堅持長期主義的創業者必會脫穎而出。”李彥宏曾表示。

大模型技術在狂飆之後逐漸歸於理性務實，百度的態度也日益清晰：不是要推出一個“超級應用”，而是要不斷地幫助更多人、更多企業打造出數百萬“超級有用”的應用。如今，其大模型應用已落地能源、電力、製造等數十個行業、幾百個場景。在世界2024大會上，百度還明確透露，文心大模型仍在持續訓練中，更強大的新版本值得期待。