阿里云发布通义千问2.5版 性能赶超GPT-4 Turbo

2024年05月10日00:40:58 科技 8620

站长之家(chinaz.com)5月9日 消息:阿里云今日正式发布通义千问2.5版本,该版本在模型性能上全面赶超了gpt-4turbo,展现了其强大的技术实力。与此同时,通义千问最新开源的1100亿参数模型qwen1.5-110b在多个基准测评中取得了卓越成绩,超越了meta的llama-3-70b模型,成为开源领域的新星。

与通义千问2.1版本相比,2.5版本在理解能力、逻辑推理、指令遵循和代码能力等方面均有了显著提升。具体而言,理解能力提升了9%,逻辑推理能力提升了16%,指令遵循能力提升了19%,而代码能力则提升了10%。这一飞跃性的进步使得通义千问2.5在权威基准opencompass上的得分与gpt-4turbo持平,证明了其在自然语言处理领域的领先地位。

阿里云发布通义千问2.5版 性能赶超GPT-4 Turbo - 天天要闻

除了通义千问2.5的发布,通义还推出了最新款开源模型qwen1.5-110b。这款拥有1100亿参数的模型在mmlu、theoremqa、gpqa等基准测评中均表现出色,成功超越了meta的llama-3-70b模型。在huggingface推出的开源大模型排行榜open llm leaderboard上,qwen1.5-110b更是荣登榜首,进一步巩固了通义开源系列在业界的领先地位。

通义的多模态模型和专有能力模型同样令人瞩目。其中,通义千问视觉理解模型qwen-vl-max在多个多模态标准测试中超越了gemini ultra和gpt-4v,其强大的视觉理解能力已经在实际应用中得到了广泛验证。而通义千问代码大模型codeqwen1.5-7b则是huggingface代码模型榜单big code的头名选手,展现了其在代码生成和代码理解方面的卓越能力。

这一模型的推出不仅满足了开发者对于高效代码生成的需求,也为企业客户提供了更为智能的代码管理和优化解决方案。

科技分类资讯推荐

万物新生(爱回收)Q1营收36.5亿,non-GAAP经营利润同比增长80% - 天天要闻

万物新生(爱回收)Q1营收36.5亿,non-GAAP经营利润同比增长80%

连续七个季度实现运营盈利。本文为IPO早知道原创作者|Stone Jin据IPO早知道消息,二手消费电子产品交易和服务平台万物新生(爱回收)集团(NYSE:RERE)于5月20日发布了2024年第一季度业绩报告。财报显示,2024年第一季度,万物新生集团总收入36.5亿元,同比增长27.1%,达到收入指引区间高端。从营收构成来看,1P(自营)...
“专网通信案”骗局落定,国瑞科技虚增营收2.3亿遭处罚,公司将被实施“ST” - 天天要闻

“专网通信案”骗局落定,国瑞科技虚增营收2.3亿遭处罚,公司将被实施“ST”

封面图片由AI生成2021年引爆的“专网通信”案,历经三年进入尾声。5月19日晚,涉事企业之一国瑞科技(300600.SZ)发布公告称,公司于5月17日收到中国证监会下发的《行政处罚决定书》。经查,公司通过参与专网通信虚假自循环业务,2020年年报虚增营业收入2.26亿元,虚增利润总额4025.77万元。证监会决定对公司责令改正,给予...
天猫618上线苹果、华为等100个「王炸全家桶」 - 天天要闻

天猫618上线苹果、华为等100个「王炸全家桶」

鞭牛士 5月20日消息,今晚8点,投入最大的一届天猫618将正式开启。 近日,网民热议的“天猫618王炸全家桶仅为麦当劳桶”事件,迎来反转。 5月20日午间,天猫官宣,“王炸全家桶”不只麦当劳,天猫618期间将上线包括苹果、戴森、华为、小米、索尼、大疆、雅诗兰黛、海蓝之谜、赫莲娜、乐高、梅森马吉拉、祖玛珑等在内的10...
南京又添“万人大厂“,你准备好简历了吗? - 天天要闻

南京又添“万人大厂“,你准备好简历了吗?

作者 | 深水财经社 何离“网红”雷军昨天来南京,引发南京市民的强烈围观。在2017年在南京建设华东总部之后,这些年一直不声不响,但是昨天小米科技园的开园终于让小米的大计划得以曝光。
国内主流软件上线时间盘点:看到“快播”多少人泪目了? - 天天要闻

国内主流软件上线时间盘点:看到“快播”多少人泪目了?

【CNMO科技消息】近些年,中国互联网行业涌现出一批批优秀的社交媒体和电子商务平台。今天,借着网友汇总的图片,我们简要回顾一下这些主流软件的上线时间及其发展情况。快播微信,作为一款全球知名的即时通讯工具,于2011年1月21日正式上线,至今已有13年的历史。