第四範式發佈AI大模型「式說」 現場演示文字生成軟件

國內人工智能大模型又增一家入局者——第四範式發佈的「式說3.0」。

4月26日,第四範式創始人兼ceo戴文淵現場演示了「式說」的各類能力,新京報貝殼財經記者注意到,相比其他大模型,「式說」除了展示文本生成、圖片生成和編寫代碼能力外,還在實機演示中重點展示了ai在b端的各類應用場景,如輸入文字後自動判斷任務,主動向用戶提問,使用戶可以直接用文本執行「裝箱」目標的能力。

以此為契機,戴文淵提出了aigs戰略(ai-generated softwareai生成軟件):以生成式ai重構企業軟件。他表示「式說」將定位為基於多模態大模型的新型開發平台,提升企業軟件的體驗和開發效率,實現aigs,「c端產品已經逼近用戶體驗的上限,而b端的企業級軟件往往是個十分複雜的執行系統,堆砌十幾層菜單和成千上萬功能也不算多,目前這些b端軟件極為複雜的交互體驗,以及複雜性帶來的極低開發效率,恰恰為生成式ai留下足夠大的重構和改造空間。」

「式說」有何能力?寫作、製圖、編程 然後將三者結合「裝集裝箱」

新京報貝殼財經記者在現場看到,第四範式一共準備了數個場景的演示,包括ai對話、ai群聊總結、ai生圖、ai預定會議日程以及ai在金融、醫療、航空等領域的應用等。

「式說」首先展示了日常的文案寫作功能,如生成旅遊計劃、編寫研發大語言模型步驟等。其還展現了連續對話能力,在編寫劇本的演示中,「式說」首先編寫了一個《流浪地球3》劇本,當戴文淵要求「式說」在此基礎上再寫一個《流浪地球4》劇本,並加入第四範式公司元素時,「式說」同樣完成了要求,「可以讓第四範式科技公司的人工智能應用到電影中,比如讓人工智能成為電影中一個重要角色,幫助救世主人公完成他的使命。」

此外,「式說」還展示了文生圖和寫代碼功能,如「畫一張配色鮮艷的籃球鞋」、「用vba編寫一個求兩個數乘積的代碼」。

值得注意的是,第四範式別出心裁地將上述三種能力「融為一體」,現場演示了「式說」執行集裝箱「裝箱」任務的流程。在實機演示中,戴文淵下達指令「幫我執行一個裝箱任務」,之後「式說」在交互界面中展現了其「思考」過程,表示「我認為這是一個裝箱任務」,給出了「任務目標」,並主動要求戴文淵輸入集裝箱尺寸、數量和其他約束條件,最後生成了裝箱演示的動圖,耗時1分鐘左右,耗時無疑快於人工手動撰寫方案。

「過去很難通過人類語言(自然語言)的方式去調用企業軟件的功能,現在當我們有更強的語義理解和生成能力,再加上gpt任務翻譯、任務分發和推理的能力,就可以通過更好的對話框式交互方式實現功能的調用,不再需要找到某個位於十幾級的菜單目錄之下的功能。」戴文淵說。

此外,針對b端的應用場景,第四範式還展示了「式說」對圖片的理解能力,如輸入圖片後令其「找相同」等。

在戴文淵看來,要做到aigs,大模型未必需要是知識廣博、十項全能冠軍的通才,更重要的在於模型具備copilot(副駕艙),和思維鏈cot(chain of thoughts,多步推理)的能力。

貝殼財經記者了解到,實際上「式說」在2.0階段就加入了多模態和copilot,這是因為很多企業軟件里的數據是多模態的,而copilot能把人的指令翻譯成要調用後台的哪個api。此前發佈的「式說」2.0的demo中,門店員工通過語音、文本等交互方式向「式說」發起指令,「式說」理解後,聯網門店監控軟件調出後廚未戴口罩的圖片,並直接將圖片以對話框的形式輸出給員工。

戴文淵表示,大模型去調用軟件內置的一個個功能、數據來對話框式完成任務,已經能產生巨大價值。但員工用企業軟件時也會面臨複雜任務,需要人按照順序執行一個個功能。因此,「式說」3.0強調的是copilot加上思維鏈cot,具有更強的推理能力,在學習大量數據和「攻略」後,能形成中間的邏輯推理步驟,從而做到拆分並執行複雜工作。

入局大模型如何選擇發展方向?第四範式ai要走「aigs戰略」

第四範式方面對新京報貝殼財經記者表示,在bert(谷歌早年發佈的自然語言處理框架)出來時,範式研究院就已經開始關注並投入在這個技術領域,gpt3出來以後更加明確了要朝這個方向。chatgpt熱潮對該公司最大的幫助,就是整個市場的信心一下從0調滿,確定性的投入更大了,再往後就是推動產品和商業化。

該公司也透露了「式說」的迭代過程——「式說1.0」為在chatgpt爆紅之後推出的第一代產品,有生成語言的能力;「式說2.0」則在語言能力基礎上,加入了文本、語音、圖像、表格、視頻等多模態輸入及輸出能力,並增加了企業級copilot能力。以與企業內部應用庫、企業私有數據等進行聯網,對信息和數據進行分析,回答員工的問詢或執行相關任務,從知識助手成為業務助手;「式說3.0」則在生成式和語言能力的基礎之上,發力copilot和思維鏈cot(多步推理、複雜任務拆分、形成數據飛輪),改造傳統b端企業軟件的體驗與開發效率,因此稱之為aigs,以生成式ai重構企業軟件。

在與國內大模型「同行」的對比上,第四範式方面表示,中國目前還沒有像openai那樣在大模型上絕對領先的公司,也會有更多的大模型。大模型是新的生產力,大家都得有大模型作為底座,所以入局的門檻變高了,但是在達到這個門檻之後,重點在於如何選擇方向。

第四範式方面認為,比較大的機會在於改造整個的企業軟件行業,也就是aigs。發力的大模型技術方向是copilot可控(執行可控、知錯能改),和思維鏈cot((chain of thoughts,多步推理、複雜任務拆分)的能力,形成數據飛輪(比如將某垂直領域的數據和流程投入大模型,很快可以形成模型在該領域的思維鏈)。

戴文淵表示,第四範式的aigs戰略,就是指基於式說大模型背後的copilot+cot能力,把企業軟件改造成新型的交互範式,並在新型交互上不斷地學習軟件的使用過程,形成領域軟件的「思維鏈」。最終,由於新的交互形式的出現,企業軟件的開發效率變得更高。

戴文淵現場演示「式說」大模型 新京報記者攝

記者聯繫郵箱:luoyidan@xjbnews.com

新京報貝殼財經記者 羅亦丹

編輯 岳彩周

校對 柳寶慶