騰訊混元自研深度思考模型T1發布：吐字快、能秒回

分類：科技

瀏覽數：1132

2025-03-21

IT之家 3 月 21 日消息，IT之家從騰訊混元微信公眾號獲悉，今日騰訊混元正式推出自研深度思考模型混元 T1 正式版。

據官方介紹，「T1」吐字快、能秒回，還擅長超長文處理，是騰訊自研的強推理模型。通過大規模強化學習，並結合數學、邏輯推理、科學和代碼等理科難題的專項優化，混元 T1 正式版進一步提升了推理能力。

在體現推理模型基礎能力的常見 benchmark 上，如大語言模型評估增強數據集 MMLU-PRO 中，混元 T1 取得 87.2 分，僅次於 o1。在 CEval、AIME、Zebra Logic 等中英文知識及競賽級數學、邏輯推理的公開基準測試中，混元 T1 的成績也達到業界領先推理模型的水平。

「T1」還在多項對齊任務、指令跟隨任務和工具利用任務中展現出了非常強的適應性。

註：表格中，其它模型的評測指標來自官方評測結果，官方評測結果中沒有的部分來自混元內部評測平台結果

官方稱，混元 T1 正式版沿用了混元 Turbo S 的創新架構，採用 Hybrid-Mamba-Transformer 融合模式。這是工業界首次將混合 Mamba 架構無損應用於超大型推理模型。這一架構有效降低了傳統 Transformer 結構的計算複雜度，減少了 KV-Cache 的內存佔用，從而顯著降低了訓練和推理成本。

官方還稱，混元 T1 在超長文本推理領域也展現出獨特優勢。基於出色的長文捕捉能力，混元 T1 能有效解決長文推理中常見的上下文丟失和長距離信息依賴問題。同時，混合 Mamba 架構針對長序列處理進行了專項優化，通過高效的計算方式，在確保長文本信息捕捉能力的同時大幅降低資源消耗，在相近的激活參數量下，實現了解碼速度提升 2 倍。

騰訊混元 T1 目前已經上線：https://llm.hunyuan.tencent.com/#/chat/ hy-t1

API 使用方面，混元 T1 已在騰訊雲官網上線，輸入價格為每百萬 tokens 1 元，輸出價格為每百萬 tokens 4 元。

科技分類資訊推薦