實測新版通義 APP:更好用的個人 AI 助理,需要什麼?

2025年03月13日18:33:08 科技 1219

來源:極客公園

正式併入阿里 AI To C 業務之後,通義有了新的動作。

最近,通義 App 全新升級——整合了上周剛剛開源的 QwQ-32B,並上線了人格化的智能體作為主產品要交互對象。

與 AI 大模型不同,「智能體」所強調的除了模型本身能力之外,多了目標導向的需求,通過感知環境、自主決策與執行動作,從而在真實環境中完成操作。

這次更新,可以說是通義 App 上線以來最重要的一次產品迭代。一方面,上周開源的 QwQ-32B,因為以更低的參數量實現了媲美 R1 的推理和通用能力,而被全球 AI 行業關注;另一方面,由於 Monica 團隊推出的 Manus 一夜爆火,智能體也是近期行業關注的焦點,人們期待看到更多可以影響真實世界的 AI 應用誕生。

而過去兩年,通義千問一直憑藉著模型能力本身,通過 AI 模型生成視頻等方式,多次在全球社交媒體上「出圈」,因此也有很多人期待通義 APP 的這次更新,能真正做到整合阿里在模型領域的競爭優勢,在面向 C 端用戶的 App 應用場景中打造爆款。

當然,路遙知馬力,通義 App 這次能否在用戶體驗上帶來驚喜,還是要試試才知道。

01

實測效果

如其名,QwQ-32B 是一款擁有 320 億參數的大模型,但阿里通過基礎模型 + 大規模強化學習的方式,在前代模型的基礎上實現性能提升。

在此前開源版本的基準測試中就已經能看出,其數學推理、編程能力以及通用能力,已經可與具備 6710 億參數的 DeepSeek-R1 媲美。

在保持強勁性能的同時,千問 QwQ-32B 還大幅降低了部署使用成本,在消費級顯卡上也能實現本地部署。

本次更新之後,通義 App 首頁就能看到千問 QwQ-32B 的應用,同時提供了多個能夠體現深度思考能力的問題供用戶體驗。

實測新版通義 APP:更好用的個人 AI 助理,需要什麼? - 天天要聞

整合深度思考能力的通義 App,在面對如「若 A=5,B=3*A,C=B+2,求 C 的值」這樣的數學邏輯問題,亦或是「分析《哪吒 2》三個關鍵角色的 MBTI 這樣根據互聯網內容」「把橙汁加進牛奶里」這樣結合知識庫的解答問題。

實測新版通義 APP:更好用的個人 AI 助理,需要什麼? - 天天要聞

在實際的問題測試中,深度思考讓通義 App 成功通過了數學題這樣的基準測試理解,同時也展示出了針對現實物理現象的推導能力,同時相比於同期其他模型的回答,通義 App 更強調對結果的複核以及謹慎列出其他可能的特徵。

比如在處理另一個容易誤導 AI 的經典問題「為什麼爸媽結婚沒有叫我參加婚禮?」時,通義 App 成功識別到其中的邏輯漏洞,但仍然從「時間因素」以及「婚禮習俗」等角度,謹慎地為這個明顯看起來很「抽象」的問題,絞盡腦汁地幫你從各種角度,想出了更多可能性。

實測新版通義 APP:更好用的個人 AI 助理,需要什麼? - 天天要聞

QwQ-32B 處理問題時展現出了更強的邏輯性以及對回答更謹慎的態度 | 圖片來源:極客公園

不過上面也提到,QwQ-32B 模型本身的強大,並不是構成「超級智能體」的全部要素。隨着大模型應用在端側設備上的整合越來越深入,「不同任務不同模型」的這個邏輯概念也被越來越多人所熟知。

首先從模型能力上來說,通義 App 這個超級智能體是一個複合模型,比如問答、聊天等等調用的都是阿里不同的模型能力,例如代碼、翻譯、邏輯推理這些就是調用的通義千問的旗艦模型 Qwen2.5-MAX。

除了模型能力本身,本次通義 App 更新的另一個重點,則是聚焦在了 App 本身:這在近兩年 AI 應用能力軍備競賽如火如荼的情況下,是一個很罕見的情況,但因此也更加值得關注。

新版通義 App 將主頁設計分為了三部分,左滑右滑對應着不同的功能。首頁左滑是歷史記錄,包括聊過的智能體、對話記錄等,便於高效管理與資產沉澱。右滑則進入通義豐富的智能體生態,覆蓋學習、工作、娛樂等多元場景。類似拍照講題、思維導圖這樣新增的功能,在首頁的輸入欄上方就能找到。

實測新版通義 APP:更好用的個人 AI 助理,需要什麼? - 天天要聞

新版通義 App 主要可交互界面分為左滑/右滑兩個頁面 | 圖片來源:極客公園

在首頁,通義 App 還增加了一個可愛的「鄰家女孩」,作為此前以科研、代碼能力專長的通義千問大模型產品中,從未出現過的 AI 陪伴形象,用戶可以通過與她的對話,直接使用到 QwQ-32B 的全部能力。

實測新版通義 APP:更好用的個人 AI 助理,需要什麼? - 天天要聞

除了新形象之外,在右滑之後進入到的界面中,你能找到各種對應具體應用場景的模型能力,例如「健康顧問」「AI 擴圖」這樣的重要但小到不會有人專為其開發 App 的場景。都被通義 App 整合到了這個「工具箱」中。用戶還可以在這裡根據自己的具體使用需求,創建屬於自己的智能體:例如讓模型模仿某個劇中的角色,或是利用模型能力,創建各種娛樂遊戲。

實測新版通義 APP:更好用的個人 AI 助理,需要什麼? - 天天要聞

除此之外,通義 App 就沒有其他的主要交互方式了,所有內容被濃縮在這三大頁面中,讓已經習慣當代各種應用層層嵌套操作邏輯的我,甚至一時間都沒有適應這種突如其來的簡潔。

按照官方開發人員的介紹,未來通義 App 還會繼續在 App 中塞入更多 AI 能力,但不會跳出這「三大頁面」的框架。未來,通義 App 還能實現根據用戶的問題,自動識別到應該調用哪個具體的智能體。

實測新版通義 APP:更好用的個人 AI 助理,需要什麼? - 天天要聞

這個變化,有體驗新版通義 App 後的網友感慨說,通義 App 讓「最強 AI 飛入尋常百姓家」。

02

行業意義

在軟件領域,「殺手級應用」(Killer App)是一個已經頗有年頭的名詞。按照通義 App 的說法,「殺手級應用」的定義是「一種具有顛覆性吸引力或功能」的 App。

實測新版通義 APP:更好用的個人 AI 助理,需要什麼? - 天天要聞

按照這個定義,實際上 ChatGPT 之後,AI ToC 應用生態直到目前,都還沒有產生真正的「殺手級應用」。

這一現象與 2025 年 AI Agent 的爆火背道而馳,AI Agent「代替你做一切」概念的出現,其實反而倒逼着大模型應用在體驗上要做到「更好用」:不僅能聊,還要在類似幫用戶規划行程、查找資料等相關場景中,體現出「超級入口」應有的智能。

「AI 即 APP」最大的挑戰在於用戶習慣的改變——畢竟,不是每個人都願意為一個個 AI 單獨下載一個又一個的 APP,甚至更習慣在已有的 APP 里順手調用 AI。

對於通義 App 團隊來講,他們或許是讓用戶感受到「這個超級智能體啥都會幹」;不僅能問能聊能寫作,能生圖能拍圖能翻譯這些基礎需求,還能在此基礎上,做到更多基於用戶個人需求專屬定製的智能化。

03

總結

「智能體」這一概念,從誕生一開始,就以追求目標導向為設計指標。

對於通義 App 來講,無論是更強悍的基座模型,還是「可愛的鄰家女孩」,都是在這個目標導向下所作出的努力,為了讓 AI App 變得更智能,真正成為一個滿足用戶預期的超級入口。

一個讓用戶足夠方便的 AI App,並不只是一個簡單的提效工具,更將會成為我們的「數字世界代理人」。

隨着模型能力的逐步提升,個人 AI 助理這個概念能做到的事,也在逐漸變得更多。

或許,隨着 AI Agent 進化到極致,我們甚至將不再需要一個可以用於觸控的 UI:無論是 AI 應用早期出現的 Rabbit R1,還是近期爆火的 Manus AI,這些 AI Agent 產品,實際上都是通向這個目標的不同階段。通義 App 實際上也是在這個方向上,向著成為一個更好用的產品,又邁進了堅實的一步。

科技分類資訊推薦

三星One UI 8部分更新名單曝光:涉及這些S系列機型 - 天天要聞

三星One UI 8部分更新名單曝光:涉及這些S系列機型

【CNMO科技消息】隨着Android 16穩定版本的提前發布,三星旗下的定製系統One UI 8也進入最後開發階段。根據最新消息,三星正在加快One UI 8的開發進度,並已啟動相關Beta測試程序,距離正式推送的時間已經不遠。 雖然三星尚未正式公布完整的升級設備名單,但基於其一貫透明的軟件更新政策,有海外媒體已經整理出即將獲得On...
中央媒體看安徽 | 科技創新與網絡文明同頻共振 - 天天要聞

中央媒體看安徽 | 科技創新與網絡文明同頻共振

第三屆中國(安徽)科技創新成果轉化交易會上,磐石科技生產的機器人正在彈鋼琴。何曉珺攝2025年中國網絡文明大會現場。侯莉莉攝合肥城市風光。皖宣 攝網絡空間是億萬民眾共同的精神家園。作為社會主義精神文明在網絡空間的延伸和拓展,加強網絡文明建設是順應信息時代潮流、提高社會文明程度的必然要求。6月10日至11日,以...
雷軍感謝北京這片沃土,透露未來五年將投入2000億元做研發 - 天天要聞

雷軍感謝北京這片沃土,透露未來五年將投入2000億元做研發

6月16日,“活力中國調研行”北京市主題採訪活動首站來到北京小米汽車工廠。該工廠於2024年3月揭幕,坐落於北京經濟技術開發區,佔地約72萬平方米,建有6大車間、29個研發實驗室,投資超50億元。今年是小米創業15周年。在當天的調研活動現場,小米集團創始人、董事長兼CEO雷軍表示,“一直以來,小米都是一家土生土長的北京...
余承東揭秘華為鴻蒙系統命名由來 - 天天要聞

余承東揭秘華為鴻蒙系統命名由來

6月16日,華為常務董事、終端BG董事長余承東透露了華為鴻蒙系統名字的由來。余承東介紹,華為早在10年前就開始研發操作系統等根技術,當時該系統尚未命名。2019年,華為為操作系統的內核申請了“鴻蒙”商標。由於網友誤將“鴻蒙”內核商標當作操作系統的名字,華為便順勢將操作系統命名為“鴻蒙”,寓意“萬物初開的元氣”...
廣州新華攜手華為、訊方成立人工智能產業學院,今年擬招生150人 - 天天要聞

廣州新華攜手華為、訊方成立人工智能產業學院,今年擬招生150人

近日,廣州新華學院與華為技術有限公司簽署全面框架合作協議,聯合深圳市訊方技術股份有限公司共建“人工智能產業學院”,該學院今年開始招生,擬招150人。此次簽約揭牌儀式在東莞校區舉行,校企三方將通過整合教育資源、技術優勢與行業經驗,共同構建“產學研用”一體化人才培養體系,助力人工智能技術創新與教育數字化轉...
被冷落的高端旗艦!驍龍8至尊版+16G+512G+真全面屏,低至3499元 - 天天要聞

被冷落的高端旗艦!驍龍8至尊版+16G+512G+真全面屏,低至3499元

開頭問大家一個問題,如果你的預算達到了5000元左右,你會選擇哪個品牌的高端手機呢?相信大部分網友第一印象都是選擇蘋果或者是華為手機。之所以會出現這樣的局面,主要是因為這兩個品牌的產品已經給消費者留下了比較刻板的印象,一聽到這兩個品牌,不少
雷軍:造車難度極高 - 天天要聞

雷軍:造車難度極高

作者 |第一財經武子曄“小米汽車工廠目前每月能生產兩三萬輛車,工廠實現了高度自動化,絕大部分工序都由機器完成。”小米集團創始人雷軍6月16日在“活力中國調研行”活動上表示。雷軍認為,小米汽車首戰告捷,在過去的14個月銷售了25萬輛汽車,智能製造能力是小米汽車成功的原因之一。他還表示,造車難度極高,小米汽車的...
華為Pura80Ultra和華為Pura70Ultra的區別是什麼? - 天天要聞

華為Pura80Ultra和華為Pura70Ultra的區別是什麼?

華為Pura系列一直憑藉著出色的影像深受大家的喜愛,那麼這次發布的Pura80Ultra和上代Pura70Ultra相比,又有什麼區別呢?老規矩,先來了解雙方的參數配置:一、屏幕方面華為P80 Ultra和P70 Ultra都是6.