第四範式發佈AI大模型「式說」現場演示文字生成軟件

分類：科技

瀏覽數：6441

2023-04-26

國內人工智能大模型又增一家入局者——第四範式發佈的「式說3.0」。

4月26日，第四範式創始人兼ceo戴文淵現場演示了「式說」的各類能力，新京報貝殼財經記者注意到，相比其他大模型，「式說」除了展示文本生成、圖片生成和編寫代碼能力外，還在實機演示中重點展示了ai在b端的各類應用場景，如輸入文字後自動判斷任務，主動向用戶提問，使用戶可以直接用文本執行「裝箱」目標的能力。

以此為契機，戴文淵提出了aigs戰略（ai-generated softwareai生成軟件）：以生成式ai重構企業軟件。他表示「式說」將定位為基於多模態大模型的新型開發平台，提升企業軟件的體驗和開發效率，實現aigs，「c端產品已經逼近用戶體驗的上限，而b端的企業級軟件往往是個十分複雜的執行系統，堆砌十幾層菜單和成千上萬功能也不算多，目前這些b端軟件極為複雜的交互體驗，以及複雜性帶來的極低開發效率，恰恰為生成式ai留下足夠大的重構和改造空間。」

「式說」有何能力？寫作、製圖、編程然後將三者結合「裝集裝箱」

新京報貝殼財經記者在現場看到，第四範式一共準備了數個場景的演示，包括ai對話、ai群聊總結、ai生圖、ai預定會議日程以及ai在金融、醫療、航空等領域的應用等。

「式說」首先展示了日常的文案寫作功能，如生成旅遊計劃、編寫研發大語言模型步驟等。其還展現了連續對話能力，在編寫劇本的演示中，「式說」首先編寫了一個《流浪地球3》劇本，當戴文淵要求「式說」在此基礎上再寫一個《流浪地球4》劇本，並加入第四範式公司元素時，「式說」同樣完成了要求，「可以讓第四範式科技公司的人工智能應用到電影中，比如讓人工智能成為電影中一個重要角色，幫助救世主人公完成他的使命。」

此外，「式說」還展示了文生圖和寫代碼功能，如「畫一張配色鮮艷的籃球鞋」、「用vba編寫一個求兩個數乘積的代碼」。

值得注意的是，第四範式別出心裁地將上述三種能力「融為一體」，現場演示了「式說」執行集裝箱「裝箱」任務的流程。在實機演示中，戴文淵下達指令「幫我執行一個裝箱任務」，之後「式說」在交互界面中展現了其「思考」過程，表示「我認為這是一個裝箱任務」，給出了「任務目標」，並主動要求戴文淵輸入集裝箱尺寸、數量和其他約束條件，最後生成了裝箱演示的動圖，耗時1分鐘左右，耗時無疑快於人工手動撰寫方案。

「過去很難通過人類語言（自然語言）的方式去調用企業軟件的功能，現在當我們有更強的語義理解和生成能力，再加上gpt任務翻譯、任務分發和推理的能力，就可以通過更好的對話框式交互方式實現功能的調用，不再需要找到某個位於十幾級的菜單目錄之下的功能。」戴文淵說。

此外，針對b端的應用場景，第四範式還展示了「式說」對圖片的理解能力，如輸入圖片後令其「找相同」等。

在戴文淵看來，要做到aigs，大模型未必需要是知識廣博、十項全能冠軍的通才，更重要的在於模型具備copilot（副駕艙），和思維鏈cot（chain of thoughts，多步推理）的能力。

貝殼財經記者了解到，實際上「式說」在2.0階段就加入了多模態和copilot，這是因為很多企業軟件里的數據是多模態的，而copilot能把人的指令翻譯成要調用後台的哪個api。此前發佈的「式說」2.0的demo中，門店員工通過語音、文本等交互方式向「式說」發起指令，「式說」理解後，聯網門店監控軟件調出後廚未戴口罩的圖片，並直接將圖片以對話框的形式輸出給員工。

戴文淵表示，大模型去調用軟件內置的一個個功能、數據來對話框式完成任務，已經能產生巨大價值。但員工用企業軟件時也會面臨複雜任務，需要人按照順序執行一個個功能。因此，「式說」3.0強調的是copilot加上思維鏈cot，具有更強的推理能力，在學習大量數據和「攻略」後，能形成中間的邏輯推理步驟，從而做到拆分並執行複雜工作。

入局大模型如何選擇發展方向？第四範式ai要走「aigs戰略」

第四範式方面對新京報貝殼財經記者表示，在bert（谷歌早年發佈的自然語言處理框架）出來時，範式研究院就已經開始關注並投入在這個技術領域，gpt3出來以後更加明確了要朝這個方向。chatgpt熱潮對該公司最大的幫助，就是整個市場的信心一下從0調滿，確定性的投入更大了，再往後就是推動產品和商業化。

該公司也透露了「式說」的迭代過程——「式說1.0」為在chatgpt爆紅之後推出的第一代產品，有生成語言的能力；「式說2.0」則在語言能力基礎上，加入了文本、語音、圖像、表格、視頻等多模態輸入及輸出能力，並增加了企業級copilot能力。以與企業內部應用庫、企業私有數據等進行聯網，對信息和數據進行分析，回答員工的問詢或執行相關任務，從知識助手成為業務助手；「式說3.0」則在生成式和語言能力的基礎之上，發力copilot和思維鏈cot（多步推理、複雜任務拆分、形成數據飛輪），改造傳統b端企業軟件的體驗與開發效率，因此稱之為aigs，以生成式ai重構企業軟件。

在與國內大模型「同行」的對比上，第四範式方面表示，中國目前還沒有像openai那樣在大模型上絕對領先的公司，也會有更多的大模型。大模型是新的生產力，大家都得有大模型作為底座，所以入局的門檻變高了，但是在達到這個門檻之後，重點在於如何選擇方向。

第四範式方面認為，比較大的機會在於改造整個的企業軟件行業，也就是aigs。發力的大模型技術方向是copilot可控（執行可控、知錯能改），和思維鏈cot（（chain of thoughts，多步推理、複雜任務拆分）的能力，形成數據飛輪（比如將某垂直領域的數據和流程投入大模型，很快可以形成模型在該領域的思維鏈）。

戴文淵表示，第四範式的aigs戰略，就是指基於式說大模型背後的copilot+cot能力，把企業軟件改造成新型的交互範式，並在新型交互上不斷地學習軟件的使用過程，形成領域軟件的「思維鏈」。最終，由於新的交互形式的出現，企業軟件的開發效率變得更高。

戴文淵現場演示「式說」大模型新京報記者攝

記者聯繫郵箱：luoyidan@xjbnews.com

新京報貝殼財經記者羅亦丹

編輯岳彩周

校對柳寶慶

「第四範式發佈AI大模型「式說」現場演示文字生成軟件」相關視頻

科技分類資訊推薦