DeepSeek 致謝騰訊技術團隊優化DeepEP通信框架

來源:環球網

環球網科技綜合報道】5月8日消息,騰訊技術團隊近日針對DeepSeek開源的DeepEP通信框架進行了深度優化,使其在多種網絡環境下的性能實現了顯著提升,為企業開展AI大模型訓練提供了更高效的解決方案。

據測試結果顯示,優化後的DeepEP通信框架在RoCE網絡環境下的性能提升了100%,而在IB(InfiniBand)網絡環境下也實現了30%的性能提升。這一技術突破得到了DeepSeek的公開致謝,被讚譽為一次“huge speedup”的代碼貢獻。

騰訊星脈網絡團隊在DeepEP開源後迅速展開技術攻關,針對該框架存在的兩大關鍵瓶頸——雙端口網卡帶寬利用率不足和CPU控制面交互時延問題,進行了深入研究和優化。經過不懈努力,他們不僅成功解決了這些問題,還使DeepEP在RoCE網絡環境下的性能實現了翻倍,同時在IB網絡環境下的通信效率也再提升了30%。

目前,這一優化後的技術方案已經全面開源,並成功應用於騰訊混元大模型等項目的訓練推理中。在騰訊星脈與H20服務器構建的環境中,這套方案展現出了出色的通用性和穩定性。(純鈞