阿里雲發布通義千問2.5版 性能趕超GPT-4 Turbo

站長之家(chinaz.com)5月9日 消息:阿里雲今日正式發布通義千問2.5版本,該版本在模型性能上全面趕超了gpt-4turbo,展現了其強大的技術實力。與此同時,通義千問最新開源的1100億參數模型qwen1.5-110b在多個基準測評中取得了卓越成績,超越了meta的llama-3-70b模型,成為開源領域的新星。

與通義千問2.1版本相比,2.5版本在理解能力、邏輯推理、指令遵循和代碼能力等方面均有了顯著提升。具體而言,理解能力提升了9%,邏輯推理能力提升了16%,指令遵循能力提升了19%,而代碼能力則提升了10%。這一飛躍性的進步使得通義千問2.5在權威基準opencompass上的得分與gpt-4turbo持平,證明了其在自然語言處理領域的領先地位。

除了通義千問2.5的發布,通義還推出了最新款開源模型qwen1.5-110b。這款擁有1100億參數的模型在mmlu、theoremqa、gpqa等基準測評中均表現出色,成功超越了meta的llama-3-70b模型。在huggingface推出的開源大模型排行榜open llm leaderboard上,qwen1.5-110b更是榮登榜首,進一步鞏固了通義開源系列在業界的領先地位。

通義的多模態模型和專有能力模型同樣令人矚目。其中,通義千問視覺理解模型qwen-vl-max在多個多模態標準測試中超越了gemini ultra和gpt-4v,其強大的視覺理解能力已經在實際應用中得到了廣泛驗證。而通義千問代碼大模型codeqwen1.5-7b則是huggingface代碼模型榜單big code的頭名選手,展現了其在代碼生成和代碼理解方面的卓越能力。

這一模型的推出不僅滿足了開發者對於高效代碼生成的需求,也為企業客戶提供了更為智能的代碼管理和優化解決方案。