阿里雲發布通義千問2.5版 性能趕超GPT-4 Turbo

2024年05月10日00:40:58 科技 8620

站長之家(chinaz.com)5月9日 消息:阿里雲今日正式發布通義千問2.5版本,該版本在模型性能上全面趕超了gpt-4turbo,展現了其強大的技術實力。與此同時,通義千問最新開源的1100億參數模型qwen1.5-110b在多個基準測評中取得了卓越成績,超越了meta的llama-3-70b模型,成為開源領域的新星。

與通義千問2.1版本相比,2.5版本在理解能力、邏輯推理、指令遵循和代碼能力等方面均有了顯著提升。具體而言,理解能力提升了9%,邏輯推理能力提升了16%,指令遵循能力提升了19%,而代碼能力則提升了10%。這一飛躍性的進步使得通義千問2.5在權威基準opencompass上的得分與gpt-4turbo持平,證明了其在自然語言處理領域的領先地位。

阿里雲發布通義千問2.5版 性能趕超GPT-4 Turbo - 天天要聞

除了通義千問2.5的發布,通義還推出了最新款開源模型qwen1.5-110b。這款擁有1100億參數的模型在mmlu、theoremqa、gpqa等基準測評中均表現出色,成功超越了meta的llama-3-70b模型。在huggingface推出的開源大模型排行榜open llm leaderboard上,qwen1.5-110b更是榮登榜首,進一步鞏固了通義開源系列在業界的領先地位。

通義的多模態模型和專有能力模型同樣令人矚目。其中,通義千問視覺理解模型qwen-vl-max在多個多模態標準測試中超越了gemini ultra和gpt-4v,其強大的視覺理解能力已經在實際應用中得到了廣泛驗證。而通義千問代碼大模型codeqwen1.5-7b則是huggingface代碼模型榜單big code的頭名選手,展現了其在代碼生成和代碼理解方面的卓越能力。

這一模型的推出不僅滿足了開發者對於高效代碼生成的需求,也為企業客戶提供了更為智能的代碼管理和優化解決方案。

科技分類資訊推薦

「專網通信案」騙局落定,國瑞科技虛增營收2.3億遭處罰,公司將被實施「ST」 - 天天要聞

「專網通信案」騙局落定,國瑞科技虛增營收2.3億遭處罰,公司將被實施「ST」

封面圖片由AI生成2021年引爆的「專網通信」案,歷經三年進入尾聲。5月19日晚,涉事企業之一國瑞科技(300600.SZ)發布公告稱,公司於5月17日收到中國證監會下發的《行政處罰決定書》。經查,公司通過參與專網通信虛假自循環業務,2020年年報虛增營業收入2.26億元,虛增利潤總額4025.77萬元。證監會決定對公司責令改正,給予...
天貓618上線蘋果、華為等100個「王炸全家桶」 - 天天要聞

天貓618上線蘋果、華為等100個「王炸全家桶」

鞭牛士 5月20日消息,今晚8點,投入最大的一屆天貓618將正式開啟。 近日,網民熱議的「天貓618王炸全家桶僅為麥當勞桶」事件,迎來反轉。 5月20日午間,天貓官宣,「王炸全家桶」不只麥當勞,天貓618期間將上線包括蘋果、戴森、華為、小米、索尼、大疆、雅詩蘭黛、海藍之謎、赫蓮娜、樂高、梅森馬吉拉、祖瑪瓏等在內的10...
南京又添「萬人大廠「,你準備好簡歷了嗎? - 天天要聞

南京又添「萬人大廠「,你準備好簡歷了嗎?

作者 | 深水財經社 何離「網紅」雷軍昨天來南京,引發南京市民的強烈圍觀。在2017年在南京建設華東總部之後,這些年一直不聲不響,但是昨天小米科技園的開園終於讓小米的大計劃得以曝光。
國內主流軟體上線時間盤點:看到「快播」多少人淚目了? - 天天要聞

國內主流軟體上線時間盤點:看到「快播」多少人淚目了?

【CNMO科技消息】近些年,中國互聯網行業湧現出一批批優秀的社交媒體和電子商務平台。今天,借著網友匯總的圖片,我們簡要回顧一下這些主流軟體的上線時間及其發展情況。快播微信,作為一款全球知名的即時通訊工具,於2011年1月21日正式上線,至今已有13年的歷史。
【月報】2024年4月中國彩電內容電商市場總結 - 天天要聞

【月報】2024年4月中國彩電內容電商市場總結

市場表現量降額升,市場規模仍在擴容在4月彩電整體市場規模同比處於量額雙降的背景下,內容電商市場零售額對比去年同期仍保持正增長,奧維雲網(AVC)《2024年4月中國彩電內容電商市場月度數據報告》數據顯示,2024年4月中國彩電內容電商市場零售量規模為10.1萬台,同比下降11.9%,環比增長25.8%;零售額規模為3.4億元,同...
【S&S專刊徵稿】網路模擬與評估中的一體化安全 - 天天要聞

【S&S專刊徵稿】網路模擬與評估中的一體化安全

專刊徵稿網路模擬與評估中的一體化安全專刊背景:信息技術的廣泛應用與網路空間的蓬勃發展,極大地推動了經濟社會的繁榮與進步,但與此同時,也伴隨著新的安全風險和挑戰的湧現。在網路空間中,新技術與新應用的層出不窮,使網路安全面臨著前所未有的挑戰。一方面,數據科學和人工智慧的廣泛運用,為網路空間的安全防禦提供...
【發現最美鐵路】新科技守護「新蜀道」 - 天天要聞

【發現最美鐵路】新科技守護「新蜀道」

西成高鐵嘉陵江特大橋下,一艘小型無人船在水面上來回遊弋,一架無人機緊隨其後,配合默契,彷彿在執行什麼重要任務。記者跟隨「發現最美鐵路·春涌秦巴走西成」採訪團在四川廣元了解到,這是中國鐵路成都局集團有限公司成都高鐵工務段橋隧技術科橋路質量管控工區作業人員正在利用無人船和無人機進行檢查工作。高鐵列車通過...
小米即將在迪拜發布POCO Pad 支持TF卡 配1萬毫安電池 - 天天要聞

小米即將在迪拜發布POCO Pad 支持TF卡 配1萬毫安電池

【CNMO科技消息】近日,CNMO注意到,據小米海外官方消息,小米海外子品牌POCO旗下的POCO Pad將於5月23日在迪拜正式發布。  在之前的消息中,這款平板電腦的型號為2405CPCFBG,已在多個認證平台上被發現,包括SDPPI Indonesia、TDRA(阿聯酋)、IMDA(新加坡)和EEC(歐洲)。  POCO Pad預計將配備一塊12.1英