阿里通義實驗室黃斐:開源進入千問時代,即將發布的推理模型會更好用

2025年02月21日23:00:18 科技 3269

阿里通義實驗室黃斐:開源進入千問時代,即將發布的推理模型會更好用 - 天天要聞

阿里通義千問已成全球第一大開源模型系列,將「很快」放出基於最新模型qwen2.5-max的推理模型。

2月21日,全球開發者大會(gdc)在上海開幕,在阿里雲魔搭社區主辦的論壇上,據阿里巴巴通義實驗室科學家黃斐介紹,到目前為止,整個通義千問(qwen)系列模型的下載量達到了1.8億,累計衍生模型總數達到9萬個,衍生模型數已經超越meta的llama系列,成為了全球第一大開源模型系列,並在hugging face等第三方榜單和用戶反饋上也取得了不錯的成績:「所以現在開始,我們就是一個千問的時代,而不是之前llama的時代了。」

今年1月底,阿里發布了ai基礎大模型千問旗艦版qwen2.5-max,在多項權威基準評測中處於業界領先水平。黃斐表示,qwen2.5-max的性能已經超越了deepseek-v3,不過沒有超越作為推理模型的deepseek-r1,正如阿里巴巴集團ceo吳泳銘此前所透露的那樣,通義千問正在qwen2.5-max的基礎上建立推理模型,「很快就會把這個模型放出來」。

據黃斐介紹,qwen2.5已經開放了7個不同規模的dense(稠密)模型,基於傳統的transformer架構,從規模最小的0.5b到最大的72b,不同大小的模型會有不同的能力和速度,以適配不同場景的需求。同時,在千問系列的迭代中,預訓練數據的大小已經從qwen1.5-72b時的3t迅速增長到了qwen2.5-72b的18t,通過規模化法則(scaling law)達到了很好的效果。

此外,qwen2.5還包括3個採用moe(混合專家模型)架構的api(應用程序編程介面)模型,在dense模型的基礎上「加寬加大」以減少訓練代價,用戶可以通過api去調用,包括turbo、plus和max這三個版本。

除了為用戶提供充分的選擇以外,黃斐還揭露了另一個讓千問系列如此受歡迎的「秘訣」,即其支持包括中英文、日語、韓語、西歐各國語言在內的超過29種語言:「千問現在在東南亞國家也用得非常多,在多語言支持上會比其他模型好很多。」

對於未來的發展方向,黃斐談到推理模型、「smarter models(更智慧的模型)」和全能模型(omni models)。黃斐解釋道,接下來放出的千問推理模型「會比大家現在能用到的更好一些」,而「更智慧的模型」不僅會更聰明,還包括了更快的響應和更低的成本。全能模型則是指能將多模態混合的模型,在輸入輸出方面更加自由。

黃斐認為,在模型之外,ai agent(智能體)也是一個需要重點關注的領域:「未來的一段時間內,ai agent一定也是一個比較火熱的話題。它能夠幫助我們解決比較複雜的任務,尤其是結合近期推理模型的發展,我相信最終很多行業都可以運用到這個模型的能力,去完成現在只能由人完成的任務。」

據魔搭社區技術負責人陳穎達在該論壇上的介紹,自2022年11月創建以來,目前,魔搭社區的模型總量已超過4.5萬個,涵蓋llm、對話、語音、文生圖、圖生視頻、ai作曲等多個領域,魔搭社區已經服務超過1100萬開發者。

在21日的gdc大會上,阿里雲魔搭社區首發階躍星辰最新開源的兩款多模態模型,包括全球參數量最大的開源視頻生成模型step-video-t2v,以及業界首款產品級開源語音交互模型step-audio。其中,step-video-t2v是基於300億參數的文本轉視頻預訓練模型,能夠生成高達 204 幀的視頻;step-audio則是業界首個產品級開源語音模型,參數規模達1300多億。目前,這兩款模型均可在魔搭社區下載和體驗。

2月20日晚間,阿里巴巴集團公布新季度業績,該季度營收2801.5億元,預估2773.7億元,同比增長8%。阿里雲季度營收317.42億元,同比增長13%,公共雲收入持續兩位數增長,ai相關收入連續六個季度三位數增長,調整後ebita增長33%至31.38億元。

阿里巴巴集團ceo吳泳銘在財報會上表示,面向未來,阿里巴巴將繼續專註三大業務類型:國內外電商業務、ai+雲計算的科技業務、互聯網平台產品。未來三年,阿里將圍繞ai這個戰略核心,在ai基礎設施、基礎模型平台及ai原生應用、現有業務的ai轉型等三方面加大投入。其中,集團未來三年在雲和ai的基礎設施投入預計將超越過去十年的總和。

科技分類資訊推薦

11家創新公司亮相金隅智薈中心,共探智能製造新機遇 - 天天要聞

11家創新公司亮相金隅智薈中心,共探智能製造新機遇

當前,全球製造業正邁向一個全新的階段。人工智慧、物聯網、數字孿生以及生成式 AI 等技術的飛速發展,為製造業帶來了前所未有的變革機遇。從智能工廠到 Industry 5.0 的人機協同模式,智能製造正在重新定義生產效率、創新能力與可持續發展路徑。為了深度發掘智能製造領域的新銳力量,助力優秀企業加速成長,2025 年 6 月 ...
香港首條無人機配送航線運營,跨海送餐僅5分鐘 - 天天要聞

香港首條無人機配送航線運營,跨海送餐僅5分鐘

昨日(6日)香港首條常態化無人機配送航線正式投入運營香港警方首次開展無人機巡邏香港「低空經濟」發展更進一步無人機送餐迎首飛美食5分鐘「從天而降」記者在現場看到,香港首條常態化無人機配送航線選擇「跨海+公園」場景,從香港科學園起飛,降落在馬鞍山海濱長廊,跨海飛行需約5分鐘,對比傳統騎行配送方式效率提升近7...
美團無人機開通香港首條常態化航線,麥當勞必勝客等接入服務 - 天天要聞

美團無人機開通香港首條常態化航線,麥當勞必勝客等接入服務

近日,美團無人機宣布,在香港低空經濟監管沙盒框架下,公司首條常態化航線正式投入運營。新航線設在「跨海+公園」場景,無人機會由香港科學園起飛,降落在馬鞍山海濱長廊,目前已有香港麥當勞、必勝客等商戶接入服務。美團副總裁、無人機業務負責人毛一年表示:「我們首條航線選擇『跨海+公園』場景,是因為這一場景在香港...
聚信傳媒助力萬人就業,龍哥:用直播經濟賦能普通人逆襲 - 天天要聞

聚信傳媒助力萬人就業,龍哥:用直播經濟賦能普通人逆襲

近日,曾創造「9個月開店1200家、營收48億」商業傳奇的企業家龍哥再度出山,公開力挺聚信傳媒。他表示,聚信不僅是一家直播機構,更是一個幫助普通人實現逆襲的平台。 據龍哥透露,他加入聚信後已幫助1.5萬人解決就業問題,其中不乏負債者、失業人員甚至「黑戶」。通過聚信的免費培訓體系,許多人在3-5天內就能在抖音實現變...
工號02494429京東外賣全職騎手程小沖:急送合肥高考學生取證,助其順利開考 - 天天要聞

工號02494429京東外賣全職騎手程小沖:急送合肥高考學生取證,助其順利開考

6月7日高考首日,全國各地考點外出現一抹靚麗的京東紅!高考期間,京東外賣在全國近50城數百個考點組建全職騎手助考應急小隊,為送考途中忘帶證件、文具,或因交通原因影響考生和家長,在確保配送安全的前提下,免費提供幫助。合肥三中考點外,一位考生忘帶身份證,向京東外賣全職騎手小隊求助,騎手程師傅第一時間載他回去...
手機內存多大採購,128GB還能買嗎?還是直接沖1TB? - 天天要聞

手機內存多大採購,128GB還能買嗎?還是直接沖1TB?

多大才夠?這首先取決於你的預算和應用場景。當年在某輕奢消費類社區裡面,二手區賣得最多的就是16GB內存的iphone。這就是典型的丐版買回來不夠用,逼著出掉的問題。現在iphone的大內存版本還是挺貴的,但安卓陣營的門檻倒是低不少。那麼,我
【市場】618國內高端手機賣的咋樣?銷量排行 - 天天要聞

【市場】618國內高端手機賣的咋樣?銷量排行

昨天分析機構公布了2025年Q1全球手機800美元+暢銷機型TOP20,蘋果上榜五款,華為上榜八款,三星/谷歌上榜三款。那麼今天讓我們來看看國內市場京東618活動期間,高端市場的銷量如何吧:4000~5999元,累計榜TOP1~5:iPhone16,小米15,iPhone15,華為Mate70 Pro,一加13TOP6~10:華為Pura70,iPhone1
天璣8400+7620mAh大電池,vivo這款新機挺能打,1529能到手! - 天天要聞

天璣8400+7620mAh大電池,vivo這款新機挺能打,1529能到手!

藍廠這幾年可謂是風生水起了!各個產品線都有優秀的產品的同時,也徹底擺脫了「低配高價」的廠妹機頭銜,比如,咱們今天要給大家種草的這款vivo Y系列機型--vivo Y300 GT就是這樣一款性價比還不錯的產品。從廠家的命名大家應該也能看出端倪了吧?「GT」的意思就是偏電競的意思,Y系列要做入門電競產品這你敢信?先來看設計...