阿里雲發布通義千問2.5版性能趕超GPT-4 Turbo

分類：科技

瀏覽數：8620

2024-05-10

站長之家（chinaz.com）5月9日消息:阿里雲今日正式發布通義千問2.5版本，該版本在模型性能上全面趕超了gpt-4turbo，展現了其強大的技術實力。與此同時，通義千問最新開源的1100億參數模型qwen1.5-110b在多個基準測評中取得了卓越成績，超越了meta的llama-3-70b模型，成為開源領域的新星。

與通義千問2.1版本相比，2.5版本在理解能力、邏輯推理、指令遵循和代碼能力等方面均有了顯著提升。具體而言，理解能力提升了9%，邏輯推理能力提升了16%，指令遵循能力提升了19%，而代碼能力則提升了10%。這一飛躍性的進步使得通義千問2.5在權威基準opencompass上的得分與gpt-4turbo持平，證明了其在自然語言處理領域的領先地位。

除了通義千問2.5的發布，通義還推出了最新款開源模型qwen1.5-110b。這款擁有1100億參數的模型在mmlu、theoremqa、gpqa等基準測評中均表現出色，成功超越了meta的llama-3-70b模型。在huggingface推出的開源大模型排行榜open llm leaderboard上，qwen1.5-110b更是榮登榜首，進一步鞏固了通義開源系列在業界的領先地位。

通義的多模態模型和專有能力模型同樣令人矚目。其中，通義千問視覺理解模型qwen-vl-max在多個多模態標準測試中超越了gemini ultra和gpt-4v，其強大的視覺理解能力已經在實際應用中得到了廣泛驗證。而通義千問代碼大模型codeqwen1.5-7b則是huggingface代碼模型榜單big code的頭名選手，展現了其在代碼生成和代碼理解方面的卓越能力。

這一模型的推出不僅滿足了開發者對於高效代碼生成的需求，也為企業客戶提供了更為智能的代碼管理和優化解決方案。

「阿里雲發布通義千問2.5版性能趕超GPT-4 Turbo」相關視頻

科技分類資訊推薦