IT之家 3 月 21 日消息,IT之家從騰訊混元微信公眾號獲悉,今日騰訊混元正式推出自研深度思考模型混元 T1 正式版。
據官方介紹,「T1」吐字快、能秒回,還擅長超長文處理,是騰訊自研的強推理模型。通過大規模強化學習,並結合數學、邏輯推理、科學和代碼等理科難題的專項優化,混元 T1 正式版進一步提升了推理能力。
在體現推理模型基礎能力的常見 benchmark 上,如大語言模型評估增強數據集 MMLU-PRO 中,混元 T1 取得 87.2 分,僅次於 o1。在 CEval、AIME、Zebra Logic 等中英文知識及競賽級數學、邏輯推理的公開基準測試中,混元 T1 的成績也達到業界領先推理模型的水平。
「T1」還在多項對齊任務、指令跟隨任務和工具利用任務中展現出了非常強的適應性。
官方稱,混元 T1 正式版沿用了混元 Turbo S 的創新架構,採用 Hybrid-Mamba-Transformer 融合模式。這是工業界首次將混合 Mamba 架構無損應用於超大型推理模型。這一架構有效降低了傳統 Transformer 結構的計算複雜度,減少了 KV-Cache 的內存佔用,從而顯著降低了訓練和推理成本。
官方還稱,混元 T1 在超長文本推理領域也展現出獨特優勢。基於出色的長文捕捉能力,混元 T1 能有效解決長文推理中常見的上下文丟失和長距離信息依賴問題。同時,混合 Mamba 架構針對長序列處理進行了專項優化,通過高效的計算方式,在確保長文本信息捕捉能力的同時大幅降低資源消耗,在相近的激活參數量下,實現了解碼速度提升 2 倍。
騰訊混元 T1 目前已經上線:https://llm.hunyuan.tencent.com/#/chat/ hy-t1
API 使用方面,混元 T1 已在騰訊雲官網上線,輸入價格為每百萬 tokens 1 元,輸出價格為每百萬 tokens 4 元。