阿里萬相視頻大模型宣布開源:8.2GB 顯存就能跑,測試超越 Sora

2025年02月25日23:10:15 科技 3710

it之家 2 月 25 日消息,阿里雲今日宣布旗下視覺生成基座模型萬相 2.1(wan)開源

此次開源採用最寬鬆的 apache2.0 協議,14b 和 1.3b 兩個參數規格的全部推理代碼和權重全部開源,同時支持文生視頻和圖生視頻任務,全球開發者可在 github、huggingface 和魔搭社區下載體驗。

阿里萬相視頻大模型宣布開源:8.2GB 顯存就能跑,測試超越 Sora - 天天要聞

據介紹,14b 萬相模型在指令遵循、複雜運動生成、物理建模、文字視頻生成等方面表現突出,在評測集 vbench 中,萬相 2.1 以總分 86.22% 的成績超越 sora、luma、pika 等國內外模型,位列榜首。1.3b 版本測試結果不僅超過了更大尺寸的開源模型,甚至還接近部分閉源模型,同時能在消費級顯卡運行,號稱「僅需 8.2gb 顯存就可以生成 480p 視頻」,適用於二次模型開發和學術研究。

阿里萬相視頻大模型宣布開源:8.2GB 顯存就能跑,測試超越 Sora - 天天要聞

阿里萬相視頻大模型宣布開源:8.2GB 顯存就能跑,測試超越 Sora - 天天要聞

萬相視頻模型架構圖

在算法設計上,萬相基於主流 dit 架構和線性噪聲軌跡 flow matching 範式,研發了高效的因果 3d vae、可擴展的預訓練策略等。以 3d vae 為例,為了高效支持任意長度視頻的編碼和解碼,萬相在 3d vae 的因果卷積模塊中實現了特徵緩存機制,從而代替直接對長視頻端到端的編解碼過程,實現了無限長 1080p 視頻的高效編解碼。此外,通過將空間降採樣壓縮提前,在不損失性能的情況下進一步減少了 29% 的推理時內存佔用。

阿里萬相視頻大模型宣布開源:8.2GB 顯存就能跑,測試超越 Sora - 天天要聞

萬相團隊的實驗結果顯示,在運動質量、視覺質量、風格和多目標等 14 個主要維度和 26 個子維度測試中,均達到了業界領先表現,並且斬獲 5 項第一

阿里萬相視頻大模型宣布開源:8.2GB 顯存就能跑,測試超越 Sora - 天天要聞

it之家附開源地址:

  • github:https://github.com/wan-video

  • huggingface:https://huggingface.co/wan-ai

  • 魔搭社區:https://modelscope.cn/organization/wan-ai

科技分類資訊推薦

重要成果發佈|工業領域具身智能機械人訓練數據集 - 天天要聞

重要成果發佈|工業領域具身智能機械人訓練數據集

2025工業互聯網大會5月21日-23日,以「數智創新 深化賦能 高質量推進新型工業化」為主題的2025工業互聯網大會在江蘇省蘇州市召開。江蘇省委副書記、蘇州市委書記劉小濤,江蘇省副省長李忠軍,工業和信息化部總工程師謝少鋒共同為大會開幕。
未上市即遭山寨!小米YU7「老頭樂版」已上路 - 天天要聞

未上市即遭山寨!小米YU7「老頭樂版」已上路

近日博主韓路偶遇一輛老頭樂版小米YU7,從他曝光的視頻可見,這台低速電動車堪稱「像素級復刻」。車頭輪廓與小米SU7如出一轍,流暢的弧線與標誌性前臉造型被生硬照搬,只是衝壓工藝的粗糙痕迹在陽光下無所遁形。最引人發笑的細節當屬引擎蓋上的「M七」標識,廠商生怕旁人看不出模仿對象,索性將小米logo倒置後稍作變形,堂...
榮耀王班回應友商「干翻榮耀」傳言 - 天天要聞

榮耀王班回應友商「干翻榮耀」傳言

來源:環球網 【環球網科技綜合報道】6月9日消息,近日,榮耀公司銷售與服務總裁王班在社交平台回應稱,「400首銷之際,我聽說有友商內部發通知,要乾死榮耀,不讓榮耀翻身。我們是否翻身不取決於任何其他人,而是取決於我們是否做對事情。
古爾曼:蘋果可能不會在 WWDC 2025上發佈新硬件 - 天天要聞

古爾曼:蘋果可能不會在 WWDC 2025上發佈新硬件

來源:環球網 【環球網科技綜合報道】6月9日消息,據外媒報道,蘋果可能不會在WWDC主題演講中推出新硬件,而是僅涉及軟件。彭博社馬克·古爾曼 (Mark Gurman) 撰文稱,蘋果沒有準備在 WWDC 期間發佈任何新硬件。
京東高薪挖人搶灘酒旅市場 - 天天要聞

京東高薪挖人搶灘酒旅市場

京東高薪挖人搶灘酒旅市場:戰略意圖、行業影響與未來挑戰萬億級市場潛力中國在線旅遊市場2023年規模超1.5萬億元,年增長率超15%(艾瑞諮詢數據)。後疫情時代,本地游、周邊游需求爆發,高端度假、主題旅遊(如露營、研學)成為新增長點。