訊飛現場演示大模型40分鐘：可語音文字轉換，擅長醫療數學

分類：科學

瀏覽數：3629

2023-05-06

5月6日下午兩點，訊飛星火大模型成果發布會在合肥舉辦。會上，科大訊飛董事長劉慶峰宣布正式推出星火認知大模型，並在現場進行了超過40分鐘的實時演示。劉慶峰稱，當前星火大模型在中文領域對話能力、數學能力已超過chatgpt。

這是國內繼百度、阿里、商湯、崑崙萬維之後，第五家正式發布大語言模型的公司。與已有的國產大模型相比，星火認知大模型的一大特點是能在語音與文字之間進行轉換——既可以直接通過語音輸入問題，也能將模型輸出的答案實時轉變為語音，並通過持續對話調整語音的風格（比如溫柔的女聲等等）。

發布會現場宣布，訊飛星火認知大模型目前已向行業合作夥伴和開放平台開發者開放，可通過訊飛開放平台官網進行預約。

科大訊飛董事長劉慶峰

···

可文字語音轉換，有兩個對話版本

在現場演示中，首先可以看到，星火大模型的ui也沿用了當前語言大模型的一貫設計：左側為歷史對話窗口，對話框佔據主要畫面。不過，星火大模型也增加了一些新功能。

比如，左下角有兩個可以點擊切換的“純凈”與“沉浸”自研，根據星火大模型自己的回答，“純凈”模式只能訪問到一些基本的搜索功能和頁面元素，例如標題、鏈接等，而“沉浸”則能瀏覽整個網站的所有內容，包括圖片、視頻、文章等等，同時也需要更長的加載時間和更高的電池消耗。

此外，星火大模型還結合了訊飛一貫的長項：語音文字之間的轉換。在輸入框旁邊有一個話筒圖標，點擊就能直接語音輸入文字；同時，大模型的每一個回答右下角有一個小三角圖標，點擊也能實時將回答轉成語音播放。

右下角為現場演示的電腦

而具體演示則從文本生成、語言理解、知識問答、邏輯推理、數學能力、編程能力、多模態七個方面進行。在現場，星火大模型實時地展現了發言稿、郵件、營銷方案、英文品宣文案、小紅書風格改寫的效果。

此外，現場還抽取了幾條彈幕問題進行提問。比如，當有網友問“外星人感冒需要戴口罩嗎”，星火大模型的回答是——“作為ai語言模型，我無法確定外星人是否存在，但是如果假設外星人確實存在，那麼他們可能不需要戴口罩，因為他們的生理結構和呼吸系統可能與人類不同。此外我們也不知道外星人是否會感染疾病，因此無法確定需不需要採取預防措施。”

在演示中，劉慶峰特彆強調了星火大模型的部分功能。比如，他表示，在與醫學相關的知識問答上，星火大模型擁有訊飛醫療專業系統中的一部分通用能力，因此在醫療能力上比chatgpt、gpt4都要強。而在未來，訊飛還會將與醫療機構合作中獲得的醫療專業知識逐步放到這一通用大模型中，使其“成為醫生的診療助力、用戶的健康顧問。”同時，劉慶峰還透露，專業的醫療領域的模型將在今年的10月24日正式推出。

而在多模態能力上，除了語音文字之間的轉換，還有一些目前尚在研發內測階段的功能。比如，輸入一張英文菜單圖，星火大模型可以識別其中的文字，並將其改成一張中文版菜單圖返還回來。

再比如，星火大模型還可以結合訊飛的虛擬人，製作一段由虛擬人朗誦ai生成文字的視頻。

在演示過程中，劉慶峰這樣表示：“科大訊飛在國內目前已推出的認知大模型中，明顯是領先的，中文超過了chatgpt的水平。英文如果滿分以5分來算，chatgpt現在是4.48分，而我們已經達到4.29分。”

···

10月要整體趕超chatgpt

其實，在發布會開始時，劉慶峰就介紹道，訊飛在去年12月15日就啟動了認知智能大模型的專項攻關，他們與中國科技大學共同承建的認知智能全國重點實驗室牽頭，設計了一套針對科學系統的評測體系，也就是通過上述的7大類，一共481個細分的任務類型對認知智能大模型進行評測。

在演示之後，劉慶峰也表示，星火大模型當前已有具體應用場景中的落地產品，即訊飛ai學習機、訊飛聽見、訊飛智能辦公本、訊飛智慧艙、訊飛開放平台等5項應用，而相關功能已經可以即時上手試用。

同時，劉慶峰還現場公布了三個未來的關鍵時間點：6月9日，星火大模型將實現突破開放式問答，多輪對話能力提高，數學能力增強；8月15日，代碼能力“大上台階”；10月24日，在中文上超越chatgpt，在英文上也要達到與之相當的水平。

采寫：南都記者楊博雯

“訊飛現場演示大模型40分鐘：可語音文字轉換，擅長醫療數學”相關視頻

科學分類資訊推薦