阿里萬相視頻大模型宣布開源:8.2GB 顯存就能跑,測試超越 Sora

2025年02月25日23:10:15 科技 3710

it之家 2 月 25 日消息,阿里雲今日宣布旗下視覺生成基座模型萬相 2.1(wan)開源

此次開源採用最寬鬆的 apache2.0 協議,14b 和 1.3b 兩個參數規格的全部推理代碼和權重全部開源,同時支持文生視頻和圖生視頻任務,全球開發者可在 github、huggingface 和魔搭社區下載體驗。

阿里萬相視頻大模型宣布開源:8.2GB 顯存就能跑,測試超越 Sora - 天天要聞

據介紹,14b 萬相模型在指令遵循、複雜運動生成、物理建模、文字視頻生成等方面表現突出,在評測集 vbench 中,萬相 2.1 以總分 86.22% 的成績超越 sora、luma、pika 等國內外模型,位列榜首。1.3b 版本測試結果不僅超過了更大尺寸的開源模型,甚至還接近部分閉源模型,同時能在消費級顯卡運行,號稱「僅需 8.2gb 顯存就可以生成 480p 視頻」,適用於二次模型開發和學術研究。

阿里萬相視頻大模型宣布開源:8.2GB 顯存就能跑,測試超越 Sora - 天天要聞

阿里萬相視頻大模型宣布開源:8.2GB 顯存就能跑,測試超越 Sora - 天天要聞

萬相視頻模型架構圖

在演算法設計上,萬相基於主流 dit 架構和線性雜訊軌跡 flow matching 範式,研發了高效的因果 3d vae、可擴展的預訓練策略等。以 3d vae 為例,為了高效支持任意長度視頻的編碼和解碼,萬相在 3d vae 的因果卷積模塊中實現了特徵緩存機制,從而代替直接對長視頻端到端的編解碼過程,實現了無限長 1080p 視頻的高效編解碼。此外,通過將空間降採樣壓縮提前,在不損失性能的情況下進一步減少了 29% 的推理時內存佔用。

阿里萬相視頻大模型宣布開源:8.2GB 顯存就能跑,測試超越 Sora - 天天要聞

萬相團隊的實驗結果顯示,在運動質量、視覺質量、風格和多目標等 14 個主要維度和 26 個子維度測試中,均達到了業界領先表現,並且斬獲 5 項第一

阿里萬相視頻大模型宣布開源:8.2GB 顯存就能跑,測試超越 Sora - 天天要聞

it之家附開源地址:

  • github:https://github.com/wan-video

  • huggingface:https://huggingface.co/wan-ai

  • 魔搭社區:https://modelscope.cn/organization/wan-ai

科技分類資訊推薦

京東高薪挖人搶灘酒旅市場 - 天天要聞

京東高薪挖人搶灘酒旅市場

京東高薪挖人搶灘酒旅市場:戰略意圖、行業影響與未來挑戰萬億級市場潛力中國在線旅遊市場2023年規模超1.5萬億元,年增長率超15%(艾瑞諮詢數據)。後疫情時代,本地游、周邊游需求爆發,高端度假、主題旅遊(如露營、研學)成為新增長點。
Meta有意向人工智慧初創公司Scale AI投資超過100億美元 雙方已在洽談 - 天天要聞

Meta有意向人工智慧初創公司Scale AI投資超過100億美元 雙方已在洽談

【TechWeb】6月9日消息,據外媒報道,在生成式人工智慧的熱潮中,OpenAI、Anthropic、xAI等廠商也受到了資本市場的熱捧,相繼獲得了多筆高額的投資,也在持續進行新的融資,其中由馬斯克在2023年7月12日創立的xAI,在去年5月份融資60億美元、11月份融資50億美元後,又在進行50億美元的債務融資。而從外媒最新的報道來看,人...
iGame M15 Origo評測:顏值與性能並存 搭載長江存儲PC41Q 表現超預期 - 天天要聞

iGame M15 Origo評測:顏值與性能並存 搭載長江存儲PC41Q 表現超預期

【ZOL中關村在線原創評測】前不久,七彩虹發布了旗下首款iGame遊戲筆記本產品,我們也第一時間拿到了iGame M15 Origo輕薄全能遊戲本。其搭載酷睿Ultra 9 285H處理器,顯卡為RTX 5070 Laotop,內存為32GB DDR5 6400MHz,硬碟則是長江存儲的PC41Q。單純從硬體上看,iGame M15 Origo的性能非常強勁
智越山海!東風猛士M817搭載全棧華為,開啟豪華電動智野新賽道 - 天天要聞

智越山海!東風猛士M817搭載全棧華為,開啟豪華電動智野新賽道

近日,東風汽車集團有限公司與華為技術有限公司在武漢正式簽署全面深化戰略合作協議,雙方將充分發揮在產業資源與技術領域的互補優勢,圍繞汽車智能化、企業數字化和智能化升級、生態共建等領域開展全方位深度合作。同時,雙方還將協同東風汽車旗下東風嵐圖、東風猛士等品牌,共同