騰訊混元發佈開源圖生視頻模型,掀起AI創作熱潮

騰訊會員發佈並開源圖生視頻模型,引發AI視頻創作熱潮。

2025年3月6日,騰訊會員發佈圖生視頻模型並對外開源,支持生成背景音效及2K高質量視頻。用戶只需上傳一張圖片,並簡短描述希望畫面如何運動、鏡頭如何調度等,會員即可按要求讓圖片動起來,變成5秒的短視頻。

此外,該模型還支持對口型與動作驅動玩法,上傳人物圖片並輸入希望"對口型"的文字或音頻,圖片中的人物即可"說話"或"唱歌",選擇動作模版還能一鍵生成同款跳舞視頻。

此次開源的圖生視頻模型是混元文生視頻模型開源工作的延續,模型總參數量保持130億,適用於多種類型的角色和場景。目前,該模型已在Github、HuggingFace等主流開發者社區開放下載體驗,受到廣泛關注。