2行代碼與DeepSeek語音對話,1分鐘不到一毛錢,所有大模型都開口

2025年03月07日16:03:05 科技 1269

夢晨 發自 凹非寺
量子位 | 公眾號 QbitAI

起猛了,DeepSeek開口說話了

而且是超低延遲實時秒回,還可以隨時打斷的那種。

DeepSeek以及其他任意大模型接入這樣的高質量對話引擎,全程只需要兩行代碼

2行代碼與DeepSeek語音對話,1分鐘不到一毛錢,所有大模型都開口 - 天天要聞

開發一款語音交互的AI應用,門檻低到如此令人髮指了嗎?

這不算完,價格方面還有驚喜:每分鐘0.098元,不到一毛錢,單次還贈送1000分鐘。

這就是來自聲網的對話式AI引擎了。

2行代碼與DeepSeek語音對話,1分鐘不到一毛錢,所有大模型都開口 - 天天要聞

聲網AI RTE產品線負責人姚光華在3月6日對話式AI引擎發佈會上提到,「經過一段時間與客戶的打磨及實際使用場景調研,我們統計出,用戶與AI 每產生1次對話中,平均會有約3輪問答,計算下來平均對話時長約為21.1s,單次成本僅需3分錢。如果每月對話次數15次,那麼月成本不到5毛錢,年成本也只需5元。」

聲網在價格上做到了極致,按用量付費的模式更是不設上限,讓多模態AI交互應用服務百萬級用戶規模成為可能。

這樣便宜又好用,聲網是怎麼做到的呢?

揭秘AI對話流暢體驗關鍵

AI對話要想體驗絲滑,低延遲是必不可少的。

這裡有一個關鍵數據:延遲是否低於1.7秒

如果低於這個值,人們會覺得與AI交流很自然;當延遲達到2秒-3秒,使用體驗上感覺到有些卡頓,反應稍顯遲緩。

而聲網對話式AI引擎,經過在中、美、歐、東南亞主要城市實測,能夠做到響應延遲中位數650毫秒。這樣的反應速度就能做到與人類對話體驗相仿,消除用戶等待的焦慮感。

響應延遲只是保障流暢對話體驗的基礎,進入實際應用後,還有更多關鍵技術。

真實人類對話的一個重要特徵是可以自然地打斷對方,而大多數AI對話系統在這方面表現不佳。聲網對話式AI引擎支持用戶隨時打斷AI的回應,打斷響應低至340ms,真正模擬人與人之間的自然對話節奏。

嘈雜環境下,普通語音識別往往難以準確捕捉用戶意圖。聲網的對話式AI引擎能屏蔽95%的環境人聲和噪聲干擾,精準識別對話人聲,即使在人聲嘈雜的公共場所,也能保持對話質量。

以下視頻來源於

聲網

在地鐵、地下車庫等網絡信號不佳的環境下,普通語音互動應用往往卡頓或斷連。

聲網之所以能解決這個問題,是因為聲網的軟件定義實時網SD-RTN在全球建設了200多個數據中心,建立連接時選址也都是選在離終端用戶最近的地方。

再結合獨家智能路由+抗弱網算法,可以做到各種複雜網絡環境下的跨區域絲滑互動,在面臨80%丟包的情況下人與Agent也能穩定交流,即使斷網3-5s依舊可以流暢對話。

最後,該引擎不局限於特定大模型,能實現DeepSeek、ChatGPT等全模型適配,同時其音視頻SDK支持30000+終端機型,徹底解決多設備兼容性的後顧之憂。

15分鐘任何應用加裝AI語音交互

對於開發者而言,聲網對話式AI引擎最大的魅力在於其極簡的開發接入流程和強大的靈活性:

極簡接入:

通過聲網Console後台,開發者可以自行開通服務、在Playground中調參測試並生成代碼,僅需2行核心代碼,15分鐘即可完成從零到部署一個基於大模型的對話式AI Agent的全過程。

2行代碼與DeepSeek語音對話,1分鐘不到一毛錢,所有大模型都開口 - 天天要聞

這一」傻瓜式」接入方式極大降低了技術門檻,讓更多開發者能夠快速進入AI語音交互領域。

靈活切換:

開發者可以根據應用場景需求,自由選擇和切換底層大模型,而無需改變前端交互邏輯。支持全球幾乎所有大模型廠商,只要和OpenAI接口協議兼容的模型廠商,自3月6日起,全部原生支持。

同時也支持全球主流語音合成供應商任意切換,支持開發者通過語音合成供應商定製的自定義音色接入。

2行代碼與DeepSeek語音對話,1分鐘不到一毛錢,所有大模型都開口 - 天天要聞

比如在應用中不同的功能接入不同的模型,都只需簡單配置即可完成切換,真正實現一次開發,全模型適配。

廣泛兼容:

一方面是支持第三方雲端大模型服務、企業私有化模型及本地化部署的開源模型無縫接入。

另一方面則是對硬件的兼容。現實場景中不同的設備可能對於語音處理效果產生影響,性能相對差一些的設備可能會產生更高的延時,需要音視頻SDK做到海量設備的兼容性,提供統一的低延時傳輸。聲網的RTC SDK支持30+平台開發框架,30000+終端機型適配,即使是中低端機型也適用。

語音交互即服務模式誕生

聲網對話式AI引擎不僅為開發者提供了一個優質選擇,更意味着一種新模式的誕生:語音交互即服務。

讓RTC(實時音視頻)技術與大模型技術解耦,每個部分都可以交給專業的團隊去做,大模型廠商無需再花時間精力自建語音交互體系。

在這個趨勢之中,聲網通過統一API接口廣泛兼容模型,站穩了「AI語音交互中間件」這個的新生態位

作為生成式AI行業一種全新的基礎設施供應商,聲網首席運營官劉斌也在去年底參加了量子位舉辦的MEET2025智能未來大會

在演講中,劉斌曾強調:

任何涉及大模型多模態實時交互的應用,無論是語音還是視頻,只要存在多模態交互,這類Agent應用的落地都離不開RTC技術的支持。

幾個月後,聲網對話式AI引擎正在「讓所有AI都能開口說話」,把RTC技術落地到各類AI應用,進一步推進整個生成式AI行業變革。

科技分類資訊推薦

無線信號增強秘籍,橋接和中繼模式哪個更強? - 天天要聞

無線信號增強秘籍,橋接和中繼模式哪個更強?

【ZOL中關村在線原創技術解析】隨着無線通信與計算機技術飛速發展,人們愈發渴望隨時隨地享受穩定的數據通信服務。無線路由器作為無線網絡核心設備,作用關鍵。但當其信號覆蓋不足,如穿過兩堵牆後信號微弱時,可通過無線橋接或中繼模式連接兩個無線路由器,擴展網絡、增強信號。中繼模式和橋接模式雖都能擴展網絡覆蓋,但...
流暢更耐用 魅族Note 16將預裝Flyme 12 - 天天要聞

流暢更耐用 魅族Note 16將預裝Flyme 12

魅族官方透露,將於5月發佈的魅族Note 16系列將出廠預裝Flyme 12新系統,這也是Flyme系統大版本首次在非旗艦機型上首發。魅族Note 16搭載紫光展銳T765處理器,配備6.78英寸LCD屏,分辨率達2460*1080。後置採用八邊形相機模組,由5000萬像素主攝和200萬像素鏡頭組成。續航方面,內置6600mAh大容量電池,支持40W有線充電
跨境電商迎「成本地震」,行業洗牌加速 - 天天要聞

跨境電商迎「成本地震」,行業洗牌加速

【環球網財經綜合報道】近日,美國正式終止了對中國價值不超過800美元的小額包裹免徵關稅的政策,這一變化引發了中國跨境電商行業的連鎖反應。多家物流公司隨即調整策略,物流費用普遍上漲,並增加了高額預收稅金。(圖片來源:東方IC)美國的800美元小額免稅政策(De Minimis)自2016年實施以來,極大地推動了全球跨境電商...
音樂節超時粉絲吵上熱搜!羅雲熙周深發佈聯合說明 - 天天要聞

音樂節超時粉絲吵上熱搜!羅雲熙周深發佈聯合說明

5月4日,太湖灣音樂節組委會「關於5月1日太湖灣音樂節的相關討論」,聯合羅雲熙工作室、周深工作室作出如下說明:在演出過程中,現場因節奏調整產生變化,相關團隊均已積極協作,確保了整體流程順利完成。對於由此引發的相關關注,我們充分理解大家的關心
國外一公司推出「空中單車」:可垂直起飛、極速200公里/時 - 天天要聞

國外一公司推出「空中單車」:可垂直起飛、極速200公里/時

快科技5月5日消息,近日,國外一家名為Volonaut的新成立公司推出了一款 「空中單車」,這是一款具有創新性和顛覆性的飛行載具。其由Jetson One(註:一款飛行器)創造者托馬斯・帕坦(Tomasz Patan)在波蘭研發,其設計靈感源自科幻電影,尤其是《星球大戰》中的飛行摩托。外觀上沒有傳統飛行器的冗餘結構,僅見容納推進...
全球首款雙形態人形機械人正式發佈! - 天天要聞

全球首款雙形態人形機械人正式發佈!

前言首次定義具身人形機械人商用範式。近日消息,全球首款雙形態人形機械人——數字華夏IP系列開山之作星行俠P01正式發佈。顏值高、智商高、易使用首次定義具身人形機械人商用範式據悉,數字華夏推出IP系列的初衷,是打造屬於這個時代的「商用機械人」。「外形潮流時尚、智商情商兼具、使用維護極簡,首次定義具身人形機...
三星One UI 8測試版或下月推出 給後續修復留出時間 - 天天要聞

三星One UI 8測試版或下月推出 給後續修復留出時間

【CNMO科技消息】三星已經開始內部測試全新的One UI 8系統,同時也在包括Galaxy Z Flip6在內的多款設備上進行適配測試。按照目前的進度來看,這次更新的到來時間可能比很多人預想得更早,有可能會在今年7月或8月之前就正式推出。 和以往一樣,三星應該會先上線One UI 8的測試版計劃,給部分用戶提前嘗鮮的機會。根據最新消...
蘋果引入Anthropic開發的Claude AI系統 欲放棄自研? - 天天要聞

蘋果引入Anthropic開發的Claude AI系統 欲放棄自研?

【CNMO科技消息】蘋果最近開始引入Anthropic公司開發的Claude AI系統,用於協助其工程師更高效地編寫代碼。 長期以來,蘋果一直堅持自主研發核心技術,很少依賴外部力量。但這一次,它選擇與Anthropic合作,將後者的Claude Sonnet模型集成到自家開發工具Xcode的升級版本中。據彭博社報道,這項合作已經開始在內部落地,主要...
6 大升級!Apple Watch SE 3 入門款到底有多能打? - 天天要聞

6 大升級!Apple Watch SE 3 入門款到底有多能打?

文 | 路邊同學還有 4 個月,蘋果將推出新一代入門級智能手錶 —— Apple Watch SE 3。這款原計劃在 2024 年發佈的機型,因市場節奏調整延後至今,卻也讓外界對其升級細節有了更充分的爆料空間。