2022年底,能夠與人類自如、深度對話的聊天機器人chatgpt一經發布,便在全球掀起火熱的生成式ai浪潮。而早在2013年,百度就成立了深度學習實驗室,是國內最早入局ai領域的企業,趕在了其他同行之前。11月12日,在百度世界2024大會上發表演講時,百度創始人李彥宏卻拋出了一個現實的問題:“客觀地講,大家期待的超級應用還沒有出現,甚至有人開始問,過去這24個月,這種全球性的大模型狂熱,究竟是一場新的技術革命,還是新一輪泡沫?”作為中國人工智能的扛旗者,百度給出的回答是:ai是真實的需求。李彥宏提到,今年5月,百度的高管們曾在一起討論ai大模型怎樣才算“成了”。他給出的關鍵指標是,大模型api調用量能夠在一年時間內從2億上漲10倍至20億。而僅僅半年之後,百度文心大模型的日均調用量已經超過15億,增長了7.5倍。相較於一年前首次披露的5000萬次,更是大幅增長約30倍。在李彥宏看來,這條陡峭的增長曲線也是過去兩年中國大模型應用爆發的縮影。“今天,基礎模型能力就緒,我們即將迎來ai應用的群星閃耀時刻。每一個應用都是一顆星,每一個應用都將成為改變世界的力量。”他表示。李彥宏的“非主流”ai觀:優先解決幻覺、重點發展智能體和ai行業的其他玩家相比,李彥宏和百度在很多時候都顯得有些“非主流”。當許多公司陷入“百模大戰”的廝殺中,把關注焦點放在大模型的性能和參數上時,李彥宏在多個公開場合反覆強調“要卷應用不要卷大模型”、“沒有應用ai模型一文不值”。面對開閉源之爭,李彥宏又旗幟鮮明地站到閉源模型陣營中,稱閉源才有真正的商業模式。今年2月,openai亮出文生視頻模型sora再次引爆全球互聯網,很多中國企業也紛紛開始跟進這一賽道。但李彥宏在一場內部講話中表態稱,無論多麼火爆,百度都不會去做sora類的視頻生成模型,因為投入周期太長,10年、20年都可能拿不到業務收益。在百度世界2024大會上,李彥宏對此進一步作出闡釋。他表示比起sora,百度更希望解決圖像生成的幻覺問題,即大模型的生成內容與事實不符或毫無根據。李彥宏稱,“這個問題看起來更簡單、甚至更枯燥,但是不解決就不會有應用。”他認為,過去24個月內,對行業而言最大的變化就是大模型基本消除了幻覺,回答問題的準確性大大提升,讓ai從“一本正經的胡說八道”,變得可用、可被信賴。而解決大模型幻覺問題的關鍵在於rag(檢索增強)技術,讓大模型利用檢索到的信息來指導文本或答案的生成。在當日與硅星人創始人駱軼航、甲子光年創始人張一甲的“ai圓桌對談”上,李彥宏提到,過去兩年rag讓大語言模型具備了實用價值,可以有效控制幻覺生成,所以才在各個場景尤其是to b方面應用起來。他強調,百度不做sora不等於百度不做多模態,“多模態要想進入真正實用階段,也得有準確性、可控性,應用空間才能打開。”因此百度瞄準了圖像等多模態內容與rag的結合,在活動上發布了檢索增強的文生圖技術irag(image based rag)。irag能夠結合百度搜索的億級圖片資源跟強大的基礎模型能力,生成各種超真實的圖片。李彥宏現場展示了一幅由文心大模型生成的大眾攬巡汽車飛躍長城的圖片。通過文心irag技術,無論是這款特定型號汽車的車型車標、還是作為背景的長城,均未出現錯誤或變形的幻覺問題。藉助這項技術,以前需要花費幾十萬才能完成的海報拍攝,現在的創作成本近乎於0。其商業價值就體現在無幻覺、超真實、沒成本,立等可取。隨着全球科技巨頭將目光轉向尋找ai落地應用場景,智能體這一能夠自主感知環境、執行行動並完成設定目標的系統也受到了更多關注。但李彥宏強調,像百度這樣把智能體作為最重要戰略方向的並不多。百度認為,作為ai應用的最主流形態,智能體即將迎來爆發點。目前,百度旗下文心智能體平台已吸引15萬家企業和80萬名開發者,覆蓋了廣泛的應用場景。百度將智能體主要分為四類:公司類智能體,角色類智能體,工具類智能體和行業類智能體。具體而言,公司類智能體能夠在傳統公司網站的基礎上提供主動推薦等服務,未來將可能成為直接面向消費者的第一界面。角色類智能體是高度擬人化的數字人,行業類智能體則專註於法律等垂直領域。百度文庫與百度網盤還聯合發布了工具類智能體“自由畫布”,全面打通公域與私域資料的限制,實現輸入、編輯、創作、分享自由。