阿里通义实验室黄斐:开源进入千问时代,即将发布的推理模型会更好用

2025年02月21日23:00:18 科技 3269

阿里通义实验室黄斐:开源进入千问时代,即将发布的推理模型会更好用 - 天天要闻

阿里通义千问已成全球第一大开源模型系列,将“很快”放出基于最新模型qwen2.5-max的推理模型。

2月21日,全球开发者大会(gdc)在上海开幕,在阿里云魔搭社区主办的论坛上,据阿里巴巴通义实验室科学家黄斐介绍,到目前为止,整个通义千问(qwen)系列模型的下载量达到了1.8亿,累计衍生模型总数达到9万个,衍生模型数已经超越meta的llama系列,成为了全球第一大开源模型系列,并在hugging face等第三方榜单和用户反馈上也取得了不错的成绩:“所以现在开始,我们就是一个千问的时代,而不是之前llama的时代了。”

今年1月底,阿里发布了ai基础大模型千问旗舰版qwen2.5-max,在多项权威基准评测中处于业界领先水平。黄斐表示,qwen2.5-max的性能已经超越了deepseek-v3,不过没有超越作为推理模型的deepseek-r1,正如阿里巴巴集团ceo吴泳铭此前所透露的那样,通义千问正在qwen2.5-max的基础上建立推理模型,“很快就会把这个模型放出来”。

据黄斐介绍,qwen2.5已经开放了7个不同规模的dense(稠密)模型,基于传统的transformer架构,从规模最小的0.5b到最大的72b,不同大小的模型会有不同的能力和速度,以适配不同场景的需求。同时,在千问系列的迭代中,预训练数据的大小已经从qwen1.5-72b时的3t迅速增长到了qwen2.5-72b的18t,通过规模化法则(scaling law)达到了很好的效果。

此外,qwen2.5还包括3个采用moe(混合专家模型)架构的api(应用程序编程接口)模型,在dense模型的基础上“加宽加大”以减少训练代价,用户可以通过api去调用,包括turbo、plus和max这三个版本。

除了为用户提供充分的选择以外,黄斐还揭露了另一个让千问系列如此受欢迎的“秘诀”,即其支持包括中英文、日语、韩语、西欧各国语言在内的超过29种语言:“千问现在在东南亚国家也用得非常多,在多语言支持上会比其他模型好很多。”

对于未来的发展方向,黄斐谈到推理模型、“smarter models(更智慧的模型)”和全能模型(omni models)。黄斐解释道,接下来放出的千问推理模型“会比大家现在能用到的更好一些”,而“更智慧的模型”不仅会更聪明,还包括了更快的响应和更低的成本。全能模型则是指能将多模态混合的模型,在输入输出方面更加自由。

黄斐认为,在模型之外,ai agent(智能体)也是一个需要重点关注的领域:“未来的一段时间内,ai agent一定也是一个比较火热的话题。它能够帮助我们解决比较复杂的任务,尤其是结合近期推理模型的发展,我相信最终很多行业都可以运用到这个模型的能力,去完成现在只能由人完成的任务。”

据魔搭社区技术负责人陈颖达在该论坛上的介绍,自2022年11月创建以来,目前,魔搭社区的模型总量已超过4.5万个,涵盖llm、对话、语音、文生图、图生视频、ai作曲等多个领域,魔搭社区已经服务超过1100万开发者。

在21日的gdc大会上,阿里云魔搭社区首发阶跃星辰最新开源的两款多模态模型,包括全球参数量最大的开源视频生成模型step-video-t2v,以及业界首款产品级开源语音交互模型step-audio。其中,step-video-t2v是基于300亿参数的文本转视频预训练模型,能够生成高达 204 帧的视频;step-audio则是业界首个产品级开源语音模型,参数规模达1300多亿。目前,这两款模型均可在魔搭社区下载和体验。

2月20日晚间,阿里巴巴集团公布新季度业绩,该季度营收2801.5亿元,预估2773.7亿元,同比增长8%。阿里云季度营收317.42亿元,同比增长13%,公共云收入持续两位数增长,ai相关收入连续六个季度三位数增长,调整后ebita增长33%至31.38亿元。

阿里巴巴集团ceo吴泳铭在财报会上表示,面向未来,阿里巴巴将继续专注三大业务类型:国内外电商业务、ai+云计算的科技业务、互联网平台产品。未来三年,阿里将围绕ai这个战略核心,在ai基础设施、基础模型平台及ai原生应用、现有业务的ai转型等三方面加大投入。其中,集团未来三年在云和ai的基础设施投入预计将超越过去十年的总和。

科技分类资讯推荐

11家创新公司亮相金隅智荟中心,共探智能制造新机遇 - 天天要闻

11家创新公司亮相金隅智荟中心,共探智能制造新机遇

当前,全球制造业正迈向一个全新的阶段。人工智能、物联网、数字孪生以及生成式 AI 等技术的飞速发展,为制造业带来了前所未有的变革机遇。从智能工厂到 Industry 5.0 的人机协同模式,智能制造正在重新定义生产效率、创新能力与可持续发展路径。为了深度发掘智能制造领域的新锐力量,助力优秀企业加速成长,2025 年 6 月 ...
香港首条无人机配送航线运营,跨海送餐仅5分钟 - 天天要闻

香港首条无人机配送航线运营,跨海送餐仅5分钟

昨日(6日)香港首条常态化无人机配送航线正式投入运营香港警方首次开展无人机巡逻香港“低空经济”发展更进一步无人机送餐迎首飞美食5分钟“从天而降”记者在现场看到,香港首条常态化无人机配送航线选择“跨海+公园”场景,从香港科学园起飞,降落在马鞍山海滨长廊,跨海飞行需约5分钟,对比传统骑行配送方式效率提升近7...
美团无人机开通香港首条常态化航线,麦当劳必胜客等接入服务 - 天天要闻

美团无人机开通香港首条常态化航线,麦当劳必胜客等接入服务

近日,美团无人机宣布,在香港低空经济监管沙盒框架下,公司首条常态化航线正式投入运营。新航线设在“跨海+公园”场景,无人机会由香港科学园起飞,降落在马鞍山海滨长廊,目前已有香港麦当劳、必胜客等商户接入服务。美团副总裁、无人机业务负责人毛一年表示:“我们首条航线选择‘跨海+公园’场景,是因为这一场景在香港...
聚信传媒助力万人就业,龙哥:用直播经济赋能普通人逆袭 - 天天要闻

聚信传媒助力万人就业,龙哥:用直播经济赋能普通人逆袭

近日,曾创造“9个月开店1200家、营收48亿”商业传奇的企业家龙哥再度出山,公开力挺聚信传媒。他表示,聚信不仅是一家直播机构,更是一个帮助普通人实现逆袭的平台。 据龙哥透露,他加入聚信后已帮助1.5万人解决就业问题,其中不乏负债者、失业人员甚至“黑户”。通过聚信的免费培训体系,许多人在3-5天内就能在抖音实现变...
工号02494429京东外卖全职骑手程小冲:急送合肥高考学生取证,助其顺利开考 - 天天要闻

工号02494429京东外卖全职骑手程小冲:急送合肥高考学生取证,助其顺利开考

6月7日高考首日,全国各地考点外出现一抹靓丽的京东红!高考期间,京东外卖在全国近50城数百个考点组建全职骑手助考应急小队,为送考途中忘带证件、文具,或因交通原因影响考生和家长,在确保配送安全的前提下,免费提供帮助。合肥三中考点外,一位考生忘带身份证,向京东外卖全职骑手小队求助,骑手程师傅第一时间载他回去...
手机内存多大采购,128GB还能买吗?还是直接冲1TB? - 天天要闻

手机内存多大采购,128GB还能买吗?还是直接冲1TB?

多大才够?这首先取决于你的预算和应用场景。当年在某轻奢消费类社区里面,二手区卖得最多的就是16GB内存的iphone。这就是典型的丐版买回来不够用,逼着出掉的问题。现在iphone的大内存版本还是挺贵的,但安卓阵营的门槛倒是低不少。那么,我
【市场】618国内高端手机卖的咋样?销量排行 - 天天要闻

【市场】618国内高端手机卖的咋样?销量排行

昨天分析机构公布了2025年Q1全球手机800美元+畅销机型TOP20,苹果上榜五款,华为上榜八款,三星/谷歌上榜三款。那么今天让我们来看看国内市场京东618活动期间,高端市场的销量如何吧:4000~5999元,累计榜TOP1~5:iPhone16,小米15,iPhone15,华为Mate70 Pro,一加13TOP6~10:华为Pura70,iPhone1
天玑8400+7620mAh大电池,vivo这款新机挺能打,1529能到手! - 天天要闻

天玑8400+7620mAh大电池,vivo这款新机挺能打,1529能到手!

蓝厂这几年可谓是风生水起了!各个产品线都有优秀的产品的同时,也彻底摆脱了“低配高价”的厂妹机头衔,比如,咱们今天要给大家种草的这款vivo Y系列机型--vivo Y300 GT就是这样一款性价比还不错的产品。从厂家的命名大家应该也能看出端倪了吧?“GT”的意思就是偏电竞的意思,Y系列要做入门电竞产品这你敢信?先来看设计...