AI大模型企業開始了企業軟件改造探索

大模型的核心價值,不是聊天,而是生產力。大模型的技術關鍵,不是作詩,而是思維鏈。

文|周享玥

編|趙艷秋

靠着顛覆式的「chat」能力從2023年q1火到q2後,大模型的生產力工具屬性正在加速被重視和加強。

4月26日下午,人工智能企業第四範式展示其大模型產品「式說3.0」。一同被公布的還有這家公司最新提出的aigs戰略(ai-generated software):以生成式ai重構企業軟件。

「從我的視角看,無論中美,並不缺任何一個基於gpt的聊天平台,如果有,很好;如果沒有,也無所謂。但生產力的平台是決不能錯過的。」第四範式創始人兼ceo戴文淵說出了他對大模型關鍵性的思考,在他看來,ai大模型是一個生產力級別的事物,能帶來全社會效率的提升。

此前,國內外大廠已開始探索aigc大模型對生產力的改造。

其中備受關注的是微軟。從去年開始,微軟宣布了一系列copilot(副駕駛)產品,將aigc布局到代碼生成、office辦公軟件、crm企業軟件以及安全等領域。此後,亞馬遜、salesforce、華為、阿里、位元組跳動也有相關動作。

第四範式選擇的切入口是嘗試改造b端企業級軟件,也叫aigs。戴文淵提到,aigs的想法源於一個很多人都比較直觀的認知——相比已經逼近用戶體驗和效率上限的c端產品,b端的企業級軟件還處於交互體驗極為複雜、開發效率極低的階段,這些恰恰為生成式ai留下了足夠大的重構和改造空間。

業界人士將大模型類比於當年第一台蒸汽機,在新的aigc時代,「蒸汽機」正在帶來對各行各業生產效率的提升。

01

大模型的高段位不是聊天,而是思維鏈

第四範式的大模型名為「式說」。與此前公布的多個ai大模型一樣,式說具有多輪對話、圖片理解、寫小說、畫圖、知識庫等多模態基礎能力。比如,在現場演示中,式說完成了畫「獅子頭」和「紅燒獅子頭」、編寫了《流浪地球3》的劇本,完成「用python編寫求斐波那契數列前30項的程序」、「編寫一個隨機數的遊戲程序」等代碼生成。

「式說」裝配集裝箱

數智前線觀察,式說將上述功能歸為「基礎能力」。而把能力重心更多放在copilot(副駕艙)和思維鏈cot(chain of thoughts,多步推理)上,二者也是實現aigs的關鍵能力。

比如,式說要完成一個更為複雜的物流運輸行業的「裝箱」操作——將貨物放入集裝箱,如何最大化裝箱效率。現場,戴文淵下達「幫我執行一個裝箱任務」的指令後,式說便會推理出接下來一步步要執行的子任務:

它先確認「這是一個裝箱任務」,並自動設定了「任務目標」:分析集裝箱及小箱子的尺寸,設計裝箱方案。

之後,又把目標拆分成三個具體步驟:主動要求戴文淵分步驟輸入集裝箱尺寸、待裝箱貨物尺寸和數量,以及其他約束條件。

然後,對不同類型的箱子進行堆疊組合,經過多輪嘗試,耗時幾十秒之後,輸出了自己通過思考後在65種裝箱方案中找出的最優裝箱結果。

最後,在交互界面中完整展示出了自己的「思考」過程。

「它干這個事比我厲害,我沒半個小時做不出來。」戴文淵表示,這背後正是思維鏈的能力起了作用。簡單來說,就是在解決多步驟推理問題時,模型可以模仿人類思維過程,將複雜任務拆分,逐步推理並執行。

一位互聯網大廠資深人士告訴數智前線,業界現在其實還存在一種意識誤區,「很多人都在強調chat,看到大模型熱熱鬧鬧地寫了個作文、作了一首詩,卻很少注重思維鏈,而實際上,思維鏈才是大模型背後真正最核心的東西。

他舉例稱,最近國內某大型金融企業就推出了一個ai大模型產品,但從命名來看,其去掉了chatgpt中最重要的gpt,反而保留了相對不那麼重要的chat。

為什麼思維鏈遠比chat重要?這就好像是如果沒有理解和推理能力,就相當於在沙漠中蓋高樓。

戴文淵也強調:「因為思維鏈的能力就是只有當它聰明到一定程度,干別的事也可以。」這正是通用大模型的本質。

以企業軟件為例,在學習企業軟件大量的數據和「套路」後,ai能形成中間的邏輯推理步驟,從而更好地配合人在軟件上執行複雜的工作。

「就像是ps一張照片,機器可以做到把圖片調亮20%、調一下陰影等單點步驟,但你最終的訴求並不是這些步驟本身,而是把人像修的好看。進化至』把圖p好看』就需要用到思維鏈。思維鏈的能力就像是一個人一直看着別人用photoshop,看了幾百遍他就學會了。

這也是為什麼要將思維鏈作為實現aigs的關鍵能力的原因。

關於怎麼提高思維鏈的問題,上述大廠資深人士告訴數智前線,目前大家都在採取各種不同的方式來探索提升思維鏈,比如一些企業餵給大模型更有邏輯性的語料,以及用到程序、提示學習等方式。

戴文淵稱,對於企業軟件合作夥伴來說,可以基於範式的大模型能力,在一個個領域裏面鑽得足夠深,學習到足夠多的數據和攻略,最終形成所在領域的思維鏈,發展成「領域」大模型。而當思維鏈複雜度到一定程度以後,它的軟件就能夠自動執行越來越複雜的功能,最終形成壁壘。

02

如何用生成式ai重構企業軟件?

作為一家人工智能公司,第四範式此前一直與軟件公司互為生態,「範式做軟件裏面的ai決策,軟件公司做功能和流程的實現」。但此前他們經常遇到一個問題,比如用ai改造供應鏈場景時,模型相關的工作兩周就能搞定,但整個智慧供應鏈卻往往因為軟件的開發周期需要做一年,大大拖慢了ai整體的落地速度。

這背後代表的是b端軟件在體驗和開發效率上的巨大改造空間。戴文淵曾在與合作夥伴交流時發現,對方給他展示行業內所使用的軟件,下拉菜單甚至已經超過電腦屏幕的大小。實際上,即便是c端的office軟件,用戶要真正用好也是有難度的,更何況是cad、erp、crm等面向功能導向、使用門檻更高的b端企業軟件。

生成式ai的出現,帶來了改變這種困境的機會,ai對軟件和產業的改造從原來的決策部分,進一步擴展至了前端交互。一個aigs軟件(大概率是一個對話框的形式),有機會創造一個體驗優秀、界面極簡、自我迭代的新型軟件工作流。

「之前b端企業軟件基於菜單式的開發,每次一個功能升級,又要周而復始的經歷原型圖、設計、開發等,至少是月級別的開發時間。」戴文淵稱,但隨着大模型帶來的「對話框」式固定界面出現,現在功能和邏輯只需在數據、api和內容層面下功夫即可,可以提速到以天為級別的開發效率。

一家國內航空製造企業當日演示了與第四範式在cad工業軟件上的共創情況。這也是一個功能菜單遠超屏幕大小的軟件,在軟件庫中,自研零部件幾十萬,型號上百萬,更別說外采零部件的信息(描述、標籤、屬性、參數)等,一般來說,廠商會投入大量時間和精力在「三維數模」的搜索、聚類、生成等設計過程中

在探索引入大模型後,該企業相關負責人現場直接用語音提問,「幫我找類似的零件」,「給出這兩個零件的裝配方案」,這樣的自然語言,就能在 cad 系統的龐大工程中,找到所有與之類似的三維數模零件,給出多種數模組裝方案

「aigs 的一小步,對我們來說已經是邁出了一大步。這些功能對於動輒需要幾百萬個零部件的飛機製造來說,將帶來巨大的生產力提升。」相關負責人表示。

實際上,這樣的創新符合國內製造龍頭在工業軟件上的創新趨勢。數智前線此前了解到諸如造船業要涉及幾乎80%的工業門類,使用幾十種工業軟件,這些軟件主要來自國外不同供應商,他們都是封閉的,導致數據在設計、製造、採購、維修等流程中無法流轉。國內已有龍頭企業對工業軟件從底座上進行改變,以提升效率。而aigs對數據流轉和傳統軟件開發應用將帶來巨大變革。

03

aigs在行業中的共創

在提出aigs理念并迭代相關技術的同時,第四範式已將其帶入行業,在場景中與行業龍頭進行聯合創新。

4月26日當天,一批來自金融、醫療、航空製造等領域的企業,也在現場分享了他們有關大模型的思考和實踐。

一家醫療企業已經開始探索將式說大模型引入到患者關懷、醫生提效、業務助力等關鍵場景中。比如基於專業知識,用生成式ai為患者提供更加專業、真實、符合個人情況的關懷。比如幫助醫生提醒沒有按時隨訪、且指標有可能存在異常的患者。比如通過模型思維鏈能力,賦能醫藥代表如何一步步解答醫生疑慮,更好地完成業務目標。

不過,通過生成式大模型改造生產力的過程並非一蹴而就,戴文淵總結為三個階段:

1.0階段是以copilot將企業軟件改造成自然語言的交互形式,背後是企業內部應用庫、私有數據之間的「聯網」;

2.0則在這個基礎上,基於copilot不停地豐富對話框的能力,並且積累企業用戶的行為數據來形成基於企業規則的「知識庫」,這個「知識庫」可以作為ai一次次執行複雜工作的「攻略」;

最終的3.0,具有推理能力的大模型會自己形成中間步驟,從而替人來拆分並執行複雜工作。

但這個跨越需要建立在大量數據以及行為數據的積累之上。「通常絕大多數企業會直接從aigs的1.0階段快速進入到2.0,而3.0是需要一定的時間去進行數據積累的。」戴文淵說。但他也表示,隨着大模型能力的加強,3.0並不像以前那樣需要積累幾百萬、上千萬的樣本才能做。

第四範式主任科學家塗威威介紹,目前已搭建了一個在aigs領域的四層布局,分別是底層的式說大模型,能力層的思維鏈cot、copilot、知識庫,平台層的開發平台,以及基於上面這三層,在金融、零售、醫療、製造、能源、交運領域開發的企業級應用。

一家金融企業的人士現場表示,他們在感受到chatgpt帶來的衝擊後,就第一時間聯繫了國內能做這方面能力的企業諮詢相關事宜。「這是我們必須面對的挑戰和做出的變化,不能逃避。」該人士表示。最終,他們選擇了第四範式,因為它是第一家向他們承諾能私有化部署的企業。

大模型的私有化部署的確已經成為一些國內企業的迫切需求。"像金融行業相對是比較敏感的,當然也有些行業其實不那麼敏感。」戴文淵表示。