騰訊混元自研深度思考模型T1發佈:吐字快、能秒回

2025年03月21日23:54:05 科技 1132

IT之家 3 月 21 日消息,IT之家從騰訊混元微信公眾號獲悉,今日騰訊混元正式推出自研深度思考模型混元 T1 正式版。

騰訊混元自研深度思考模型T1發佈:吐字快、能秒回 - 天天要聞

騰訊混元自研深度思考模型T1發佈:吐字快、能秒回 - 天天要聞

據官方介紹,「T1」吐字快、能秒回,還擅長超長文處理,是騰訊自研的強推理模型。通過大規模強化學習,並結合數學、邏輯推理、科學和代碼等理科難題的專項優化,混元 T1 正式版進一步提升了推理能力。

在體現推理模型基礎能力的常見 benchmark 上,如大語言模型評估增強數據集 MMLU-PRO 中,混元 T1 取得 87.2 分,僅次於 o1。在 CEval、AIME、Zebra Logic 等中英文知識及競賽級數學、邏輯推理的公開基準測試中,混元 T1 的成績也達到業界領先推理模型的水平。

「T1」還在多項對齊任務、指令跟隨任務和工具利用任務中展現出了非常強的適應性。

騰訊混元自研深度思考模型T1發佈:吐字快、能秒回 - 天天要聞

騰訊混元自研深度思考模型T1發佈:吐字快、能秒回 - 天天要聞

註:表格中,其它模型的評測指標來自官方評測結果,官方評測結果中沒有的部分來自混元內部評測平台結果

官方稱,混元 T1 正式版沿用了混元 Turbo S 的創新架構,採用 Hybrid-Mamba-Transformer 融合模式。這是工業界首次將混合 Mamba 架構無損應用於超大型推理模型。這一架構有效降低了傳統 Transformer 結構的計算複雜度,減少了 KV-Cache 的內存佔用,從而顯著降低了訓練和推理成本。

官方還稱,混元 T1 在超長文本推理領域也展現出獨特優勢。基於出色的長文捕捉能力,混元 T1 能有效解決長文推理中常見的上下文丟失和長距離信息依賴問題。同時,混合 Mamba 架構針對長序列處理進行了專項優化,通過高效的計算方式,在確保長文本信息捕捉能力的同時大幅降低資源消耗,在相近的激活參數量下,實現了解碼速度提升 2 倍。

騰訊混元 T1 目前已經上線:https://llm.hunyuan.tencent.com/#/chat/ hy-t1

API 使用方面,混元 T1 已在騰訊雲官網上線,輸入價格為每百萬 tokens 1 元,輸出價格為每百萬 tokens 4 元。

科技分類資訊推薦

長安與東風重組新進展:朱華榮稱不會改變長安既定戰略 - 天天要聞

長安與東風重組新進展:朱華榮稱不會改變長安既定戰略

2月9日,長安汽車和東風集團股份(00489.HK)同步發佈了控股股東「正在與其他國資央企集團籌劃重組事項」的信息。長安汽車的控股股東是兵裝集團,而東風集團股份的控股股東是東風公司。隨即,長安汽車和東風集團這兩家汽車央企將合併重組,成為業內關注的焦點。
公安部出手了!年齡限制放寬10年、送考下鄉,2025年考駕照不難了 - 天天要聞

公安部出手了!年齡限制放寬10年、送考下鄉,2025年考駕照不難了

電動車加強管理以後,要求機動車類型的車輛需要持證上路,但是老年人考駕照卻受阻,一方面有年齡的限制,另一方面偏遠山區考駕照不方便,所以在2025年公安部出手了,年齡限制放寬10年,同時推出送考下鄉服務,還進一步的降低考駕照的費用,2025年起考摩托車駕照不難了。
從「星靈安全守護體系」到昊鉑HL,看懂廣汽科技日 - 天天要聞

從「星靈安全守護體系」到昊鉑HL,看懂廣汽科技日

發佈會以技術切入,並全程圍繞安全展開。廣汽集團董事長、總經理馮興亞率先登場,宣布2025年四季度將正式上市支持L3級智能駕駛的車型,他同時強調面向自動駕駛時代對智能駕駛技術、整車安全架構以及突發風險處理能力的要求更高。如何才能滿足更高的要求?馮興亞提到了「廣汽
關稅大棒下,最受傷的車企出現了 - 天天要聞

關稅大棒下,最受傷的車企出現了

特朗普的關稅大棒剛揮出,尚未嚇退「外敵」,卻先刺痛了自己。近日,擁有瑪莎拉蒂、Jeep等14個品牌的全球第四大車企斯泰蘭蒂斯突然宣布裁撤900名美國工人,關閉加拿大和墨西哥兩家工廠,北美生產線陷入癱瘓。幾乎同一時間,積架路虎宣布暫停對美出口一個月,奧迪更是直接