阿里雲開源代碼模型Qwen2.5-Coder 可適配多應用場景

分類：科技

瀏覽數：7419

2024-11-12

【環球網科技報道記者勃潺】11月12日，阿里雲通義大模型團隊宣布開源通義千問代碼模型全系列，共6款qwen2.5-coder模型。基於qwen2.5-coder，ai編程性能和效率均實現大幅提升，編程「小白」也可輕鬆生成網站、數據圖表、簡歷、遊戲等各類應用。

編程語言是高度邏輯化和結構化的，代碼模型要求理解、生成和處理這些複雜的邏輯關係和結構，通常也被認為是大模型邏輯能力的基礎來源之一，對於整體提升大模型推理能力至關重要。qwen2.5-coder基於qwen2.5基礎大模型進行初始化，使用源代碼、文本代碼混合數據、合成數據等5.5t tokens的數據持續訓練，實現了代碼生成、代碼推理、代碼修復等核心任務性能的顯著提升。

此次開源，qwen2.5-coder推出0.5b/1.5b/3b/7b/14b/32b 等6個尺寸的全系列模型，每個尺寸都開源了base 和 instruct 模型，其中，base模型可供開發者微調，instruct模型則是開箱即用的官方對齊模型。

qwen2.5-coder全系列開源，可適配更多應用場景，無論在端側還是雲上，都可以讓ai大模型更好地協助開發者完成編程開發，即便是編程「小白」，也可基於內置qwen2.5-coder的代碼助手和可視化工具，用自然語言對話生成網站、數據圖表、簡歷和遊戲等各類應用。

截至目前，qwen2.5已開源100多個大語言模型、多模態模型、數學模型和代碼模型，幾乎所有模型都實現了同等尺寸下的最佳性能。據了解，全球基於qwen系列二次開發的衍生模型數量9月底突破7.43萬，超越llama系列衍生模型的7.28萬。

科技分類資訊推薦