腾讯混元自研深度思考模型T1发布:吐字快、能秒回

2025年03月21日23:54:05 科技 1132

IT之家 3 月 21 日消息,IT之家从腾讯混元微信公众号获悉,今日腾讯混元正式推出自研深度思考模型混元 T1 正式版。

腾讯混元自研深度思考模型T1发布:吐字快、能秒回 - 天天要闻

腾讯混元自研深度思考模型T1发布:吐字快、能秒回 - 天天要闻

据官方介绍,“T1”吐字快、能秒回,还擅长超长文处理,是腾讯自研的强推理模型。通过大规模强化学习,并结合数学、逻辑推理、科学和代码等理科难题的专项优化,混元 T1 正式版进一步提升了推理能力。

在体现推理模型基础能力的常见 benchmark 上,如大语言模型评估增强数据集 MMLU-PRO 中,混元 T1 取得 87.2 分,仅次于 o1。在 CEval、AIME、Zebra Logic 等中英文知识及竞赛级数学、逻辑推理的公开基准测试中,混元 T1 的成绩也达到业界领先推理模型的水平。

“T1”还在多项对齐任务、指令跟随任务和工具利用任务中展现出了非常强的适应性。

腾讯混元自研深度思考模型T1发布:吐字快、能秒回 - 天天要闻

腾讯混元自研深度思考模型T1发布:吐字快、能秒回 - 天天要闻

注:表格中,其它模型的评测指标来自官方评测结果,官方评测结果中没有的部分来自混元内部评测平台结果

官方称,混元 T1 正式版沿用了混元 Turbo S 的创新架构,采用 Hybrid-Mamba-Transformer 融合模式。这是工业界首次将混合 Mamba 架构无损应用于超大型推理模型。这一架构有效降低了传统 Transformer 结构的计算复杂度,减少了 KV-Cache 的内存占用,从而显著降低了训练和推理成本。

官方还称,混元 T1 在超长文本推理领域也展现出独特优势。基于出色的长文捕捉能力,混元 T1 能有效解决长文推理中常见的上下文丢失和长距离信息依赖问题。同时,混合 Mamba 架构针对长序列处理进行了专项优化,通过高效的计算方式,在确保长文本信息捕捉能力的同时大幅降低资源消耗,在相近的激活参数量下,实现了解码速度提升 2 倍。

腾讯混元 T1 目前已经上线:https://llm.hunyuan.tencent.com/#/chat/ hy-t1

API 使用方面,混元 T1 已在腾讯云官网上线,输入价格为每百万 tokens 1 元,输出价格为每百万 tokens 4 元。

科技分类资讯推荐

代码织就星河幕!看95后无人机群飞行规划员的“追光”路 - 天天要闻

代码织就星河幕!看95后无人机群飞行规划员的“追光”路

日前,人社部发布公示,拟新增17个新职业,“无人机群飞行规划员”位列其中。无人机群飞行规划员的重要职能之一就是操控无人机编队进行夜空表演,为了筹备一场精彩的演出,他们都需要做哪些工作?张超是一名进入无人机编队行业7年的老飞手,今年,他将会有一个新身份转变——无人机群飞行规划员。大学学习计算机专业的张超...
开发无限,自在松湖!松山湖开发者嘉年华2025精彩启动 - 天天要闻

开发无限,自在松湖!松山湖开发者嘉年华2025精彩启动

6月19日,以“开发无限,自在松湖”为主题的松山湖开发者嘉年华2025正式启动。华为云中国区副总裁、生态发展与运营部部长陶志强,东莞市副市长、松山湖党工委书记陈庆松,松山湖党工委副书记、管委会主任杨阳,以及东莞市委宣传部副部长、市新闻办主任
京东侵入携程“舒适区” - 天天要闻

京东侵入携程“舒适区”

出品|达摩财经6月18日,京东集团官方发布《致全体酒店经营者的一封公开信》,正式宣布向酒旅赛道全面进军。京东(9618.HK)表示,近年来,旅游市场日益繁荣,同步催生出了更多元的需求,京东希望通过新通路的方式为酒店行业提供供应链服务,优化供应链成本,推动酒店业经营成本下降,从而释放更多精力聚焦服务品质与体验焕...
微信出“外挂”了?新功能支持电脑、U盘等存储设备 - 天天要闻

微信出“外挂”了?新功能支持电脑、U盘等存储设备

前几天,我们简单聊了一下微信 8.0.60 版本的新功能。随着时间推进,一些功能扩大了灰度测试范围,还有一些小更新。iOS微信支持自动备份根据被测试到的用户反馈,新功能位于微信“设置”-“通用”-“聊天记录与迁移”-“备份与恢复”中。
华为迭代双折、三折工程机曝光:后置5000万像素三摄 - 天天要闻

华为迭代双折、三折工程机曝光:后置5000万像素三摄

据博主@数码闲聊站 最新爆料,某厂迭代双折和三折工程机均采用 50Mp 大底三摄方案,配备可变光圈主摄 + 高像素潜望长焦 + 多光谱摄像头,部分镜组上 GP 方案,有深度参与的自研硬件落地。结合评论区讨论及产品迭代情况来看,该厂预计指华为
本月vivo“全家桶”来袭,7月还有新机 - 天天要闻

本月vivo“全家桶”来袭,7月还有新机

此前爆料显示,vivo 将于2025 年7月发布 X200 FE手机。目前,这款新机的具体参数和售价信息已经曝光。据悉,vivo X200 FE 主打轻薄设计,机身尺寸为150.8×71.8×7.99毫米,重量仅186克。
三星Galaxy Z Fold7 发布时间曝光,还有Watch 8系列 - 天天要闻

三星Galaxy Z Fold7 发布时间曝光,还有Watch 8系列

最近,三星开始了下一代折叠屏新机的产品预热。结合以往的消息来看,其有望在下个月就带来新品发布。现在,最新的一份爆料中也提到了具体的新品发布时间信息。按照爆料中的说法,三星计划于当地时间 7 月 9 日 10 点(北京时间 9 日 22 点)
李斌为四季度盈利拼了!曝蔚来为芯片部门引入战略投资者 - 天天要闻

李斌为四季度盈利拼了!曝蔚来为芯片部门引入战略投资者

车东西作者 | 张睿编辑 | 志豪车东西6月19日消息,日前,据晚点Auto报道称,蔚来拟为旗下芯片相关业务引入战略投资者。相关人士回应:这属于猜测性信息。蔚来于2021年启动芯片自研项目,目前已推出两款自研芯片产品,一个是辅助驾驶芯片 “神玑 NX9031”,另一个是激光雷达主控芯片 “杨戬”。▲蔚来神玑NX9031在2025年4...