阿里通義實驗室黃斐:開源進入千問時代,即將發佈的推理模型會更好用

2025年02月21日23:00:18 科技 3269

阿里通義實驗室黃斐:開源進入千問時代,即將發佈的推理模型會更好用 - 天天要聞

阿里通義千問已成全球第一大開源模型系列,將「很快」放出基於最新模型qwen2.5-max的推理模型。

2月21日,全球開發者大會(gdc)在上海開幕,在阿里雲魔搭社區主辦的論壇上,據阿里巴巴通義實驗室科學家黃斐介紹,到目前為止,整個通義千問(qwen)系列模型的下載量達到了1.8億,累計衍生模型總數達到9萬個,衍生模型數已經超越meta的llama系列,成為了全球第一大開源模型系列,並在hugging face等第三方榜單和用戶反饋上也取得了不錯的成績:「所以現在開始,我們就是一個千問的時代,而不是之前llama的時代了。」

今年1月底,阿里發佈了ai基礎大模型千問旗艦版qwen2.5-max,在多項權威基準評測中處於業界領先水平。黃斐表示,qwen2.5-max的性能已經超越了deepseek-v3,不過沒有超越作為推理模型的deepseek-r1,正如阿里巴巴集團ceo吳泳銘此前所透露的那樣,通義千問正在qwen2.5-max的基礎上建立推理模型,「很快就會把這個模型放出來」。

據黃斐介紹,qwen2.5已經開放了7個不同規模的dense(稠密)模型,基於傳統的transformer架構,從規模最小的0.5b到最大的72b,不同大小的模型會有不同的能力和速度,以適配不同場景的需求。同時,在千問系列的迭代中,預訓練數據的大小已經從qwen1.5-72b時的3t迅速增長到了qwen2.5-72b的18t,通過規模化法則(scaling law)達到了很好的效果。

此外,qwen2.5還包括3個採用moe(混合專家模型)架構的api(應用程序編程接口)模型,在dense模型的基礎上「加寬加大」以減少訓練代價,用戶可以通過api去調用,包括turbo、plus和max這三個版本。

除了為用戶提供充分的選擇以外,黃斐還揭露了另一個讓千問系列如此受歡迎的「秘訣」,即其支持包括中英文、日語、韓語、西歐各國語言在內的超過29種語言:「千問現在在東南亞國家也用得非常多,在多語言支持上會比其他模型好很多。」

對於未來的發展方向,黃斐談到推理模型、「smarter models(更智慧的模型)」和全能模型(omni models)。黃斐解釋道,接下來放出的千問推理模型「會比大家現在能用到的更好一些」,而「更智慧的模型」不僅會更聰明,還包括了更快的響應和更低的成本。全能模型則是指能將多模態混合的模型,在輸入輸出方面更加自由。

黃斐認為,在模型之外,ai agent(智能體)也是一個需要重點關注的領域:「未來的一段時間內,ai agent一定也是一個比較火熱的話題。它能夠幫助我們解決比較複雜的任務,尤其是結合近期推理模型的發展,我相信最終很多行業都可以運用到這個模型的能力,去完成現在只能由人完成的任務。」

據魔搭社區技術負責人陳穎達在該論壇上的介紹,自2022年11月創建以來,目前,魔搭社區的模型總量已超過4.5萬個,涵蓋llm、對話、語音、文生圖、圖生視頻、ai作曲等多個領域,魔搭社區已經服務超過1100萬開發者。

在21日的gdc大會上,阿里雲魔搭社區首發階躍星辰最新開源的兩款多模態模型,包括全球參數量最大的開源視頻生成模型step-video-t2v,以及業界首款產品級開源語音交互模型step-audio。其中,step-video-t2v是基於300億參數的文本轉視頻預訓練模型,能夠生成高達 204 幀的視頻;step-audio則是業界首個產品級開源語音模型,參數規模達1300多億。目前,這兩款模型均可在魔搭社區下載和體驗。

2月20日晚間,阿里巴巴集團公布新季度業績,該季度營收2801.5億元,預估2773.7億元,同比增長8%。阿里雲季度營收317.42億元,同比增長13%,公共雲收入持續兩位數增長,ai相關收入連續六個季度三位數增長,調整後ebita增長33%至31.38億元。

阿里巴巴集團ceo吳泳銘在財報會上表示,面向未來,阿里巴巴將繼續專註三大業務類型:國內外電商業務、ai+雲計算的科技業務、互聯網平台產品。未來三年,阿里將圍繞ai這個戰略核心,在ai基礎設施、基礎模型平台及ai原生應用、現有業務的ai轉型等三方面加大投入。其中,集團未來三年在雲和ai的基礎設施投入預計將超越過去十年的總和。

科技分類資訊推薦

闊步向「新」行 奮力「打頭陣」 - 天天要聞

闊步向「新」行 奮力「打頭陣」

為更好貫徹落實省委全會精神,本報今起推出「堅決扛好經濟大省挑大樑責任·評論員連線」欄目,緊扣「四個着力點」,由新華日報評論員連線13個設區市黨報評論員,以「對話+解析」形式立體展現全省各地牢記囑託、感恩奮進、走在前列的最新實踐。
小米MIX Flip真機暴擊:外屏香到想秒下單 內屏摺痕把我勸退了 - 天天要聞

小米MIX Flip真機暴擊:外屏香到想秒下單 內屏摺痕把我勸退了

小米老用戶第一次摸MIX Flip,當場被外屏種草,但仔細盤了盤細節又冷靜下來…咱今兒不扯虛的,用「想沖」和「想退」兩面嘮明白。先聊優點,摸過真機才敢這麼說:外屏是真·剛需設計,4.01英寸外屏刷抖音不用展開,折成支架放桌上追劇特方便,比拿直板機省勁兒,後置鏡頭自拍時外屏能當預覽屏,拍人清楚,徠卡影調顏色不誇張...
新能源車產能過剩的時代提前到來,特斯拉能避免頹勢嗎? - 天天要聞

新能源車產能過剩的時代提前到來,特斯拉能避免頹勢嗎?

目前的消息是,為加快補齊鄉村地區新能源汽車消費使用短板,工信部、國家發改委、農業農村部、商務部、國家能源局組織開展2025年新能源汽車下鄉活動。這背後,就是新能源車產能過剩的時代提前到來,需要開拓新的市場。在這次「下鄉」活動中,特斯拉也參與
榮耀400系列今日開售:國補售價2124元起 全系2億主攝 - 天天要聞

榮耀400系列今日開售:國補售價2124元起 全系2億主攝

站長之家(ChinaZ.com)6月6日 消息:今日,榮耀400系列正式開啟銷售,該系列包含榮耀400和榮耀400Pro兩款機型,起售價為2499元,在享受國家補貼後,到手價低至2124元起,這一價格在市場上頗具競爭力。在外觀設計上,榮耀400系列提供了海風藍、流沙粉、攬月銀、幻夜黑4款配色供消費者選擇。其中,海風藍和流沙粉兩款配色採用...
特朗普政府將「AI安全研究所」去「安全化」 - 天天要聞

特朗普政府將「AI安全研究所」去「安全化」

特朗普政府將「AI安全研究所」去「安全化」,更名為「人工智能標準與創新中心」……特朗普政府宣布對聯邦政府主要人工智能監管機構進行重大改組,標誌着華盛頓在 AI 監管和安全方面的政策方向發生了劇烈轉變。商務部長霍華德·勒特尼克(Howard Lutnick)周二表示,由前總統喬·拜登於 2023 年 11 月設立的美國人工智能安全...
打印店用微信傳輸要留意個人隱私引熱議:務必記得刪除 - 天天要聞

打印店用微信傳輸要留意個人隱私引熱議:務必記得刪除

站長之家(ChinaZ.com)6月6日 消息:日前,微博上一則關於打印店使用微信傳輸文件時需留意個人隱私的話題引髮網友廣泛討論。騰訊員工「客村小蔣」發文指出,在打印店等公共場所的電腦上登錄微信傳輸文件存在隱私風險,不過這一問題有相應的解決方法。「客村小蔣」介紹,當需要在打印店電腦或其他公共電腦上登錄微信時,用戶...
華為MateBook Pro鴻蒙筆記本今日開售:7999元起 - 天天要聞

華為MateBook Pro鴻蒙筆記本今日開售:7999元起

站長之家(ChinaZ.com)6月6日 消息:今日10:08,全球首款搭載鴻蒙操作系統的PC產品——華為MateBook Pro鴻蒙筆記本正式開啟銷售。華為MateBook Pro鴻蒙筆記本在原有MateBook X Pro的基礎上進行了全面優化升級,核心亮點在於搭載了全新的HarmonyOS5鴻蒙電腦操作系統。該筆記本配備了一塊14.2英寸的觸控屏,分辨