阿里萬相視頻大模型宣布開源:8.2GB 顯存就能跑,測試超越 Sora

2025年02月25日23:10:15 科技 3710

it之家 2 月 25 日消息,阿里雲今日宣布旗下視覺生成基座模型萬相 2.1(wan)開源

此次開源採用最寬鬆的 apache2.0 協議,14b 和 1.3b 兩個參數規格的全部推理代碼和權重全部開源,同時支持文生視頻和圖生視頻任務,全球開發者可在 github、huggingface 和魔搭社區下載體驗。

阿里萬相視頻大模型宣布開源:8.2GB 顯存就能跑,測試超越 Sora - 天天要聞

據介紹,14b 萬相模型在指令遵循、複雜運動生成、物理建模、文字視頻生成等方面表現突出,在評測集 vbench 中,萬相 2.1 以總分 86.22% 的成績超越 sora、luma、pika 等國內外模型,位列榜首。1.3b 版本測試結果不僅超過了更大尺寸的開源模型,甚至還接近部分閉源模型,同時能在消費級顯卡運行,號稱「僅需 8.2gb 顯存就可以生成 480p 視頻」,適用於二次模型開發和學術研究。

阿里萬相視頻大模型宣布開源:8.2GB 顯存就能跑,測試超越 Sora - 天天要聞

阿里萬相視頻大模型宣布開源:8.2GB 顯存就能跑,測試超越 Sora - 天天要聞

萬相視頻模型架構圖

在算法設計上,萬相基於主流 dit 架構和線性噪聲軌跡 flow matching 範式,研發了高效的因果 3d vae、可擴展的預訓練策略等。以 3d vae 為例,為了高效支持任意長度視頻的編碼和解碼,萬相在 3d vae 的因果卷積模塊中實現了特徵緩存機制,從而代替直接對長視頻端到端的編解碼過程,實現了無限長 1080p 視頻的高效編解碼。此外,通過將空間降採樣壓縮提前,在不損失性能的情況下進一步減少了 29% 的推理時內存佔用。

阿里萬相視頻大模型宣布開源:8.2GB 顯存就能跑,測試超越 Sora - 天天要聞

萬相團隊的實驗結果顯示,在運動質量、視覺質量、風格和多目標等 14 個主要維度和 26 個子維度測試中,均達到了業界領先表現,並且斬獲 5 項第一

阿里萬相視頻大模型宣布開源:8.2GB 顯存就能跑,測試超越 Sora - 天天要聞

it之家附開源地址:

  • github:https://github.com/wan-video

  • huggingface:https://huggingface.co/wan-ai

  • 魔搭社區:https://modelscope.cn/organization/wan-ai

科技分類資訊推薦

長安與東風重組新進展:朱華榮稱不會改變長安既定戰略 - 天天要聞

長安與東風重組新進展:朱華榮稱不會改變長安既定戰略

2月9日,長安汽車和東風集團股份(00489.HK)同步發佈了控股股東「正在與其他國資央企集團籌劃重組事項」的信息。長安汽車的控股股東是兵裝集團,而東風集團股份的控股股東是東風公司。隨即,長安汽車和東風集團這兩家汽車央企將合併重組,成為業內關注的焦點。
公安部出手了!年齡限制放寬10年、送考下鄉,2025年考駕照不難了 - 天天要聞

公安部出手了!年齡限制放寬10年、送考下鄉,2025年考駕照不難了

電動車加強管理以後,要求機動車類型的車輛需要持證上路,但是老年人考駕照卻受阻,一方面有年齡的限制,另一方面偏遠山區考駕照不方便,所以在2025年公安部出手了,年齡限制放寬10年,同時推出送考下鄉服務,還進一步的降低考駕照的費用,2025年起考摩托車駕照不難了。
從「星靈安全守護體系」到昊鉑HL,看懂廣汽科技日 - 天天要聞

從「星靈安全守護體系」到昊鉑HL,看懂廣汽科技日

發佈會以技術切入,並全程圍繞安全展開。廣汽集團董事長、總經理馮興亞率先登場,宣布2025年四季度將正式上市支持L3級智能駕駛的車型,他同時強調面向自動駕駛時代對智能駕駛技術、整車安全架構以及突發風險處理能力的要求更高。如何才能滿足更高的要求?馮興亞提到了「廣汽
關稅大棒下,最受傷的車企出現了 - 天天要聞

關稅大棒下,最受傷的車企出現了

特朗普的關稅大棒剛揮出,尚未嚇退「外敵」,卻先刺痛了自己。近日,擁有瑪莎拉蒂、Jeep等14個品牌的全球第四大車企斯泰蘭蒂斯突然宣布裁撤900名美國工人,關閉加拿大和墨西哥兩家工廠,北美生產線陷入癱瘓。幾乎同一時間,積架路虎宣布暫停對美出口一個月,奧迪更是直接