3月6日凌晨,阿里發布並開源全新的推理模型通義千問qwq-32b。
據了解,這是一款擁有320億參數的模型,其性能可與具備6710億參數(其中370億被激活)的deepseek-r1媲美,但二者在參數量上相差將近20倍。
據介紹,通過大規模強化學習,千問qwq-32b在數學、代碼及通用能力上實現質的飛躍,整體性能比肩deepseek-r1,同時大幅降低了部署使用成本,在消費級顯卡上也能實現本地部署。
目前,阿里已採用寬鬆的apache2.0協議,將千問qwq-32b模型向全球開源,所有人都可免費下載及商用。同時,用戶也將可通過通義app免費體驗最新的千問qwq-32b模型。
阿里通義團隊表示,未來將繼續探索將智能體與強化學習的集成,以實現長時推理,探索更高智能進而最終實現agi的目標。
3月6日晚間,全球最大的ai開源社區hugging face更新了大模型榜單,阿里通義千問推理模型qwq-32b成功登頂。
同一天,騰訊混元發布圖生視頻模型並對外開源,同時上線對口型與動作驅動等玩法,並支持生成背景音效及2k高質量視頻。
基於圖生視頻的能力,用戶只需上傳一張圖片,並簡短描述希望畫面如何運動、鏡頭如何調度等,混元即可按要求讓圖片動起來,變成5秒的短視頻,還能自動配上背景音效。此外,上傳一張人物圖片,並輸入希望「對口型」的文字或音頻,圖片中的人物即可「說話」或「唱歌」;使用「動作驅動」能力,還能一鍵生成同款跳舞視頻。
此次開源的圖生視頻模型,是混元文生視頻模型開源工作的延續,模型總參數量保持 130 億,模型適用於多種類型的角色和場景,包括寫實視頻製作、動漫角色甚至cgi角色製作的生成。
開源內容包含權重、推理代碼和lora訓練代碼,支持開發者基於混元訓練專屬lora等衍生模型。目前在github、huggingface等主流開發者社區均可下載體驗。
值得一提的是,以上兩款均為國產開源大模型。
3月4日,十四屆全國人大三次會議大會發言人婁勤儉表示,開源共享推動了人工智慧技術在全球的普遍應用,為世界貢獻了「中國智慧」。
編輯|金冥羽 杜波
校對|陳柯名
封面圖片來源:視覺中國
每日經濟新聞綜合自公開資料
每日經濟新聞