实测新版通义 APP:更好用的个人 AI 助理,需要什么?

2025年03月13日18:33:08 科技 1219

来源:极客公园

正式并入阿里 AI To C 业务之后,通义有了新的动作。

最近,通义 App 全新升级——整合了上周刚刚开源的 QwQ-32B,并上线了人格化的智能体作为主产品要交互对象。

与 AI 大模型不同,“智能体”所强调的除了模型本身能力之外,多了目标导向的需求,通过感知环境、自主决策与执行动作,从而在真实环境中完成操作。

这次更新,可以说是通义 App 上线以来最重要的一次产品迭代。一方面,上周开源的 QwQ-32B,因为以更低的参数量实现了媲美 R1 的推理和通用能力,而被全球 AI 行业关注;另一方面,由于 Monica 团队推出的 Manus 一夜爆火,智能体也是近期行业关注的焦点,人们期待看到更多可以影响真实世界的 AI 应用诞生。

而过去两年,通义千问一直凭借着模型能力本身,通过 AI 模型生成视频等方式,多次在全球社交媒体上“出圈”,因此也有很多人期待通义 APP 的这次更新,能真正做到整合阿里在模型领域的竞争优势,在面向 C 端用户的 App 应用场景中打造爆款。

当然,路遥知马力,通义 App 这次能否在用户体验上带来惊喜,还是要试试才知道。

01

实测效果

如其名,QwQ-32B 是一款拥有 320 亿参数的大模型,但阿里通过基础模型 + 大规模强化学习的方式,在前代模型的基础上实现性能提升。

在此前开源版本的基准测试中就已经能看出,其数学推理、编程能力以及通用能力,已经可与具备 6710 亿参数的 DeepSeek-R1 媲美。

在保持强劲性能的同时,千问 QwQ-32B 还大幅降低了部署使用成本,在消费级显卡上也能实现本地部署。

本次更新之后,通义 App 首页就能看到千问 QwQ-32B 的应用,同时提供了多个能够体现深度思考能力的问题供用户体验。

实测新版通义 APP:更好用的个人 AI 助理,需要什么? - 天天要闻

整合深度思考能力的通义 App,在面对如“若 A=5,B=3*A,C=B+2,求 C 的值”这样的数学逻辑问题,亦或是“分析《哪吒 2》三个关键角色的 MBTI 这样根据互联网内容”“把橙汁加进牛奶里”这样结合知识库的解答问题。

实测新版通义 APP:更好用的个人 AI 助理,需要什么? - 天天要闻

在实际的问题测试中,深度思考让通义 App 成功通过了数学题这样的基准测试理解,同时也展示出了针对现实物理现象的推导能力,同时相比于同期其他模型的回答,通义 App 更强调对结果的复核以及谨慎列出其他可能的特征。

比如在处理另一个容易误导 AI 的经典问题“为什幺爸妈结婚没有叫我参加婚礼?”时,通义 App 成功识别到其中的逻辑漏洞,但仍然从“时间因素”以及“婚礼习俗”等角度,谨慎地为这个明显看起来很“抽象”的问题,绞尽脑汁地帮你从各种角度,想出了更多可能性。

实测新版通义 APP:更好用的个人 AI 助理,需要什么? - 天天要闻

QwQ-32B 处理问题时展现出了更强的逻辑性以及对回答更谨慎的态度 | 图片来源:极客公园

不过上面也提到,QwQ-32B 模型本身的强大,并不是构成“超级智能体”的全部要素。随着大模型应用在端侧设备上的整合越来越深入,“不同任务不同模型”的这个逻辑概念也被越来越多人所熟知。

首先从模型能力上来说,通义 App 这个超级智能体是一个复合模型,比如问答、聊天等等调用的都是阿里不同的模型能力,例如代码、翻译、逻辑推理这些就是调用的通义千问的旗舰模型 Qwen2.5-MAX。

除了模型能力本身,本次通义 App 更新的另一个重点,则是聚焦在了 App 本身:这在近两年 AI 应用能力军备竞赛如火如荼的情况下,是一个很罕见的情况,但因此也更加值得关注。

新版通义 App 将主页设计分为了三部分,左滑右滑对应着不同的功能。首页左滑是历史记录,包括聊过的智能体、对话记录等,便于高效管理与资产沉淀。右滑则进入通义丰富的智能体生态,覆盖学习、工作、娱乐等多元场景。类似拍照讲题、思维导图这样新增的功能,在首页的输入栏上方就能找到。

实测新版通义 APP:更好用的个人 AI 助理,需要什么? - 天天要闻

新版通义 App 主要可交互界面分为左滑/右滑两个页面 | 图片来源:极客公园

在首页,通义 App 还增加了一个可爱的“邻家女孩”,作为此前以科研、代码能力专长的通义千问大模型产品中,从未出现过的 AI 陪伴形象,用户可以通过与她的对话,直接使用到 QwQ-32B 的全部能力。

实测新版通义 APP:更好用的个人 AI 助理,需要什么? - 天天要闻

除了新形象之外,在右滑之后进入到的界面中,你能找到各种对应具体应用场景的模型能力,例如“健康顾问”“AI 扩图”这样的重要但小到不会有人专为其开发 App 的场景。都被通义 App 整合到了这个“工具箱”中。用户还可以在这里根据自己的具体使用需求,创建属于自己的智能体:例如让模型模仿某个剧中的角色,或是利用模型能力,创建各种娱乐游戏。

实测新版通义 APP:更好用的个人 AI 助理,需要什么? - 天天要闻

除此之外,通义 App 就没有其他的主要交互方式了,所有内容被浓缩在这三大页面中,让已经习惯当代各种应用层层嵌套操作逻辑的我,甚至一时间都没有适应这种突如其来的简洁。

按照官方开发人员的介绍,未来通义 App 还会继续在 App 中塞入更多 AI 能力,但不会跳出这“三大页面”的框架。未来,通义 App 还能实现根据用户的问题,自动识别到应该调用哪个具体的智能体。

实测新版通义 APP:更好用的个人 AI 助理,需要什么? - 天天要闻

这个变化,有体验新版通义 App 后的网友感慨说,通义 App 让“最强 AI 飞入寻常百姓家”。

02

行业意义

在软件领域,“杀手级应用”(Killer App)是一个已经颇有年头的名词。按照通义 App 的说法,“杀手级应用”的定义是“一种具有颠覆性吸引力或功能”的 App。

实测新版通义 APP:更好用的个人 AI 助理,需要什么? - 天天要闻

按照这个定义,实际上 ChatGPT 之后,AI ToC 应用生态直到目前,都还没有产生真正的“杀手级应用”。

这一现象与 2025 年 AI Agent 的爆火背道而驰,AI Agent“代替你做一切”概念的出现,其实反而倒逼着大模型应用在体验上要做到“更好用”:不仅能聊,还要在类似帮用户规划行程、查找资料等相关场景中,体现出“超级入口”应有的智能。

“AI 即 APP”最大的挑战在于用户习惯的改变——毕竟,不是每个人都愿意为一个个 AI 单独下载一个又一个的 APP,甚至更习惯在已有的 APP 里顺手调用 AI。

对于通义 App 团队来讲,他们或许是让用户感受到“这个超级智能体啥都会干”;不仅能问能聊能写作,能生图能拍图能翻译这些基础需求,还能在此基础上,做到更多基于用户个人需求专属定制的智能化。

03

总结

“智能体”这一概念,从诞生一开始,就以追求目标导向为设计指标。

对于通义 App 来讲,无论是更强悍的基座模型,还是“可爱的邻家女孩”,都是在这个目标导向下所作出的努力,为了让 AI App 变得更智能,真正成为一个满足用户预期的超级入口。

一个让用户足够方便的 AI App,并不只是一个简单的提效工具,更将会成为我们的“数字世界代理人”。

随着模型能力的逐步提升,个人 AI 助理这个概念能做到的事,也在逐渐变得更多。

或许,随着 AI Agent 进化到极致,我们甚至将不再需要一个可以用于触控的 UI:无论是 AI 应用早期出现的 Rabbit R1,还是近期爆火的 Manus AI,这些 AI Agent 产品,实际上都是通向这个目标的不同阶段。通义 App 实际上也是在这个方向上,向着成为一个更好用的产品,又迈进了坚实的一步。

科技分类资讯推荐

三星One UI 8部分更新名单曝光:涉及这些S系列机型 - 天天要闻

三星One UI 8部分更新名单曝光:涉及这些S系列机型

【CNMO科技消息】随着Android 16稳定版本的提前发布,三星旗下的定制系统One UI 8也进入最后开发阶段。根据最新消息,三星正在加快One UI 8的开发进度,并已启动相关Beta测试程序,距离正式推送的时间已经不远。 虽然三星尚未正式公布完整的升级设备名单,但基于其一贯透明的软件更新政策,有海外媒体已经整理出即将获得On...
中央媒体看安徽 | 科技创新与网络文明同频共振 - 天天要闻

中央媒体看安徽 | 科技创新与网络文明同频共振

第三届中国(安徽)科技创新成果转化交易会上,磐石科技生产的机器人正在弹钢琴。何晓珺摄2025年中国网络文明大会现场。侯莉莉摄合肥城市风光。皖宣 摄网络空间是亿万民众共同的精神家园。作为社会主义精神文明在网络空间的延伸和拓展,加强网络文明建设是顺应信息时代潮流、提高社会文明程度的必然要求。6月10日至11日,以...
雷军感谢北京这片沃土,透露未来五年将投入2000亿元做研发 - 天天要闻

雷军感谢北京这片沃土,透露未来五年将投入2000亿元做研发

6月16日,“活力中国调研行”北京市主题采访活动首站来到北京小米汽车工厂。该工厂于2024年3月揭幕,坐落于北京经济技术开发区,占地约72万平方米,建有6大车间、29个研发实验室,投资超50亿元。今年是小米创业15周年。在当天的调研活动现场,小米集团创始人、董事长兼CEO雷军表示,“一直以来,小米都是一家土生土长的北京...
余承东揭秘华为鸿蒙系统命名由来 - 天天要闻

余承东揭秘华为鸿蒙系统命名由来

6月16日,华为常务董事、终端BG董事长余承东透露了华为鸿蒙系统名字的由来。余承东介绍,华为早在10年前就开始研发操作系统等根技术,当时该系统尚未命名。2019年,华为为操作系统的内核申请了“鸿蒙”商标。由于网友误将“鸿蒙”内核商标当作操作系统的名字,华为便顺势将操作系统命名为“鸿蒙”,寓意“万物初开的元气”...
广州新华携手华为、讯方成立人工智能产业学院,今年拟招生150人 - 天天要闻

广州新华携手华为、讯方成立人工智能产业学院,今年拟招生150人

近日,广州新华学院与华为技术有限公司签署全面框架合作协议,联合深圳市讯方技术股份有限公司共建“人工智能产业学院”,该学院今年开始招生,拟招150人。此次签约揭牌仪式在东莞校区举行,校企三方将通过整合教育资源、技术优势与行业经验,共同构建“产学研用”一体化人才培养体系,助力人工智能技术创新与教育数字化转...
被冷落的高端旗舰!骁龙8至尊版+16G+512G+真全面屏,低至3499元 - 天天要闻

被冷落的高端旗舰!骁龙8至尊版+16G+512G+真全面屏,低至3499元

开头问大家一个问题,如果你的预算达到了5000元左右,你会选择哪个品牌的高端手机呢?相信大部分网友第一印象都是选择苹果或者是华为手机。之所以会出现这样的局面,主要是因为这两个品牌的产品已经给消费者留下了比较刻板的印象,一听到这两个品牌,不少
雷军:造车难度极高 - 天天要闻

雷军:造车难度极高

作者 |第一财经武子晔“小米汽车工厂目前每月能生产两三万辆车,工厂实现了高度自动化,绝大部分工序都由机器完成。”小米集团创始人雷军6月16日在“活力中国调研行”活动上表示。雷军认为,小米汽车首战告捷,在过去的14个月销售了25万辆汽车,智能制造能力是小米汽车成功的原因之一。他还表示,造车难度极高,小米汽车的...
华为Pura80Ultra和华为Pura70Ultra的区别是什么? - 天天要闻

华为Pura80Ultra和华为Pura70Ultra的区别是什么?

华为Pura系列一直凭借着出色的影像深受大家的喜爱,那么这次发布的Pura80Ultra和上代Pura70Ultra相比,又有什么区别呢?老规矩,先来了解双方的参数配置:一、屏幕方面华为P80 Ultra和P70 Ultra都是6.