騰訊混元自研深度思考模型T1發布:吐字快、能秒回

2025年03月21日23:54:05 科技 1132

IT之家 3 月 21 日消息,IT之家從騰訊混元微信公眾號獲悉,今日騰訊混元正式推出自研深度思考模型混元 T1 正式版。

騰訊混元自研深度思考模型T1發布:吐字快、能秒回 - 天天要聞

騰訊混元自研深度思考模型T1發布:吐字快、能秒回 - 天天要聞

據官方介紹,「T1」吐字快、能秒回,還擅長超長文處理,是騰訊自研的強推理模型。通過大規模強化學習,並結合數學、邏輯推理、科學和代碼等理科難題的專項優化,混元 T1 正式版進一步提升了推理能力。

在體現推理模型基礎能力的常見 benchmark 上,如大語言模型評估增強數據集 MMLU-PRO 中,混元 T1 取得 87.2 分,僅次於 o1。在 CEval、AIME、Zebra Logic 等中英文知識及競賽級數學、邏輯推理的公開基準測試中,混元 T1 的成績也達到業界領先推理模型的水平。

「T1」還在多項對齊任務、指令跟隨任務和工具利用任務中展現出了非常強的適應性。

騰訊混元自研深度思考模型T1發布:吐字快、能秒回 - 天天要聞

騰訊混元自研深度思考模型T1發布:吐字快、能秒回 - 天天要聞

註:表格中,其它模型的評測指標來自官方評測結果,官方評測結果中沒有的部分來自混元內部評測平台結果

官方稱,混元 T1 正式版沿用了混元 Turbo S 的創新架構,採用 Hybrid-Mamba-Transformer 融合模式。這是工業界首次將混合 Mamba 架構無損應用於超大型推理模型。這一架構有效降低了傳統 Transformer 結構的計算複雜度,減少了 KV-Cache 的內存佔用,從而顯著降低了訓練和推理成本。

官方還稱,混元 T1 在超長文本推理領域也展現出獨特優勢。基於出色的長文捕捉能力,混元 T1 能有效解決長文推理中常見的上下文丟失和長距離信息依賴問題。同時,混合 Mamba 架構針對長序列處理進行了專項優化,通過高效的計算方式,在確保長文本信息捕捉能力的同時大幅降低資源消耗,在相近的激活參數量下,實現了解碼速度提升 2 倍。

騰訊混元 T1 目前已經上線:https://llm.hunyuan.tencent.com/#/chat/ hy-t1

API 使用方面,混元 T1 已在騰訊雲官網上線,輸入價格為每百萬 tokens 1 元,輸出價格為每百萬 tokens 4 元。

科技分類資訊推薦

卡邦電氣 PLC 控制櫃:工業控制主體力量! - 天天要聞

卡邦電氣 PLC 控制櫃:工業控制主體力量!

在現代工業領域,自動化控制的重要性不言而喻,而 PLC 控制櫃則是實現這一關鍵環節的核心設備。今天,我們就來深入了解一下卡邦電氣的 PLC 控制櫃,看看它是如何在工業舞台上大放異彩的。
2025品牌影響力大,姚遠新能源榮獲多個獎項! - 天天要聞

2025品牌影響力大,姚遠新能源榮獲多個獎項!

2025年6月14日至15日,由《中國企業報》、《中國商界》雜誌社、CCTV《發現品牌》欄目組和中國品牌影響力評價辦公室聯合主辦的「2025(第十二屆)品牌影響力發展大會暨成果發布活動」在北京隆重舉行。
螞蟻消金林嘉南:大模型賦能智能風控,額度互動促進金融健康 - 天天要聞

螞蟻消金林嘉南:大模型賦能智能風控,額度互動促進金融健康

「螞蟻消金希望利用互動式智能風控技術,挖掘年輕人努力成長的證明」。6月19日,在上海舉行的2025中國國際金融展上,螞蟻消金首席風險官林嘉南分享了,如何將大模型技術應用在互動式智能風控領域,從而促進額度的互動性,促進用戶與機構的金融健康。這契合了本屆展會 「開放創新,科技賦能,共創金融新未來」的主題。普惠金...
德國西格瑪(SIGMA Audio)品牌介紹 - 天天要聞

德國西格瑪(SIGMA Audio)品牌介紹

德國西格瑪(SIGMA Audio)品牌溯源:精密工藝與純粹音質的融合德國西格瑪(SIGMA Audio)是享譽全球的高端音響品牌,誕生於德國精密工程與聲學技術的沃土。
海爾位列谷歌&凱度BrandZ中國全球化品牌第6,蟬聯行業第一 - 天天要聞

海爾位列谷歌&凱度BrandZ中國全球化品牌第6,蟬聯行業第一

海南陵水 2025年6月19日 -- 6月19日,谷歌Google攜手凱度BrandZ發布《2025年中國全球化品牌50強》榜單,海爾蟬聯行業第一,位列第6位,連續9年穩居中國全球化品牌前十之列,品牌排名與全球影響力持續攀升。 自主創牌的行業標杆 作為權威的品牌價值評估體系之一,《2025年中國全球化品牌50強》榜單覆蓋了澳大利亞、巴西、法...