2023年服貿會期間,大模型在各領域的應用成為熱門話題。9月5日,北京商報記者就大模型在金融領域應用的相關內容,對百融雲創科技股份公司(以下簡稱「百融雲創」)AI創新負責人陳昀彰進行了專訪。
陳昀彰直言,當前大模型應用還存在諸多難點,提升算力、優化演算法等技術手段之外,從業機構還需要充分的行業Know-how,注重對大模型落地場景的深入挖掘,「模型-行業理解-應用」將決定大模型企業的成敗,未來垂直類場景應用和模型能力的結合將更為緊密。
深入挖掘落地場景
2022年末,ChatGPT橫空出世,在金融圈、科技圈掀起狂潮。AIGC、⽣成式⼈⼯智能、語⾔模型、⼤模型等概念層出不窮。進入2023年後,業內多家金融科技公司也加入到大模型領域的比拼中。
根據北京商報記者過往採訪的情況,當前金融科技領域大模型的應用大多還停留在智能交互層面,距離其大範圍落地還有一定距離。其中,生成式AI更是存在「模型崩潰」「機器幻覺」等弊端。
針對這一現狀,陳昀彰告訴北京商報記者,從技術上來說,大模型的應用難點有很多。例如模型訓練的數據存在一定偏差、模型具有「黑箱」特性以及在湧現行為出現的同時還存在「預測困境」等。
「生成式AI模型通過機器學習會生成一些事實性錯誤。」陳昀彰表示。例如,對於大模型的訓練數據中未曾覆蓋到的信息,大模型會按照上下文的概率進行事實編造,從而導致發生大模型「幻覺」的問題。
如何應對上述技術難點,陳昀彰也給出了自己的答案。陳昀彰指出,提升算力、優化演算法之外,還需要充分的行業Know-how、行業知識庫以及對於落地場景的深入挖掘。簡而言之,「模型-行業理解-應用」將決定大模型企業的成敗。
在陳昀彰看來,當前在大模型真正落地的環節,更多用戶還是將其當作「玩具」,還不足以作為「工具」使用。但實際上,⼤模型建設的業務拆解中最重要的是確定應⽤場景,這決定了⽤戶所需要的功能、⽤戶能以何種表達⽅式與這些功能產⽣鏈接。強化「工具」能力讓大模型自主完成指令,在場景應用中能夠解決非常大的問題。
陳昀彰以百融雲創企業內部的應用場景為例進行了進一步解釋,公司員工提出請假需求是常見的場景之一,通過百融對話大模型,能夠直接找到發起審批流程,極大地壓縮了中間溝通過程帶來的信息損耗。
據了解,BR-LLMs百融⼤模型采⽤MoE模型路由⽅案,將不同場景的請求分發給不同的模型,這其中包括對話⼤模型、編程⼤模型、擴散模型等⽣成式模型和判別式模型,在保證應⽤效果的同時可以降低訓練成本,全面提升業務轉化效果。
大模型將在更多垂直領域落地
在採訪過程中,陳昀彰多次強調,企業建立大模型要結合具體的應用場景才能發揮最大效率。但需要注意的是,大模型在向外輸出的過程中,不僅僅面臨準確性、穩定性方面的考驗,在隱私數據保護上也是市場關注的焦點。
對於百融大模型如何解決數據隱私這一問題,陳昀彰指出,百融雲創的定位並不是大模型的廠商,而是將大模型的能力包裝成業務場景應用。在其他業務與銀行等金融機構的合作中,通過有效授權讓百融大模型的運轉更順暢、成本更低。
「其次大模型的訓練是不斷沉澱的過程,面對金融行業的使用場景中,我們考慮將大模型工具和行業大模型給到銀行,銀行根據其具體業務在開發工具下進行微調,這樣能保證數據在銀行系統內部流轉。」陳昀彰補充道。
事實上,大模型並非是行業內的全新概念,從最初的智能客服到如今的生成式AI、決策式AI,科技助力下大模型能力實現跨越式提升,也滿足了更多金融場景的使用需求,進一步加快了金融行業的數字化進程。
對於下一階段大模型的發展,陳昀彰認為,生成式AI和決策式AI的有機融合發展料將是一大方向。比如針對生成式AI在權衡一些對沖性的信息時,不能做出正確取捨的弊端,可以在模型建設中加入決策式AI的決策樹等演算法,通過引入顯性的邏輯規則來判斷相互矛盾的信息,進而給出最優解。
陳昀彰指出,目前整個AI產業呈現出「百模大戰」的格局,隨著技術的演進發展,行業也將發展出幾大不同的路徑,即以科技巨頭為主的通用型大模型、新興創業公司主導的各類「小模型」,以及像百融雲創這樣的AI科技公司研發的行業大模型。後續,外界對於大模型的關注將轉向其在垂直領域的落地,行業大模型勢必將迸發更多勢能,垂類應用和模型能力的結合也會更為緊密。
此外,陳昀彰透露,目前公司正與⾏業中的各個合作夥伴緊密溝通拆解場景。預計百融大模型會在⾦融⾏業的營銷、客服、合規審查、報告⽣成、信息總結等多個場景中進⾏應⽤。
北京商報記者 廖蒙