清華人工智慧研究院副院長朱軍:視頻生成邁入精準可控新時代

2025年03月29日23:10:27 國際 1836

朱軍:發布多模態的可控生成|未來人工智慧先鋒論壇

騰訊科技特約作者 涵清

編輯 鄭可君

近年來,以生成式人工智慧(aigc)為代表的技術浪潮席捲全球。然而,許多用戶在實際應用中經常遇到ai「不聽話」的問題,比如生成的視頻或圖像與創作者的想法存在較大偏差,缺乏足夠的精準控制。這種內容生成的隨機性,已成為阻礙生成式ai進一步應用的瓶頸之一。如何提高內容生成的可控性與精準性,正逐漸成為業界的重要議題。

在2025年中關村論壇上,清華大學人工智慧研究院副院長、生數科技創始人兼首席科學家朱軍教授,就視頻大模型的最新進展、突破性技術及未來發展方向進行了深入分享。

清華人工智慧研究院副院長朱軍:視頻生成邁入精準可控新時代 - 天天要聞

以下內容為朱軍教授演講實錄的編輯整理版本。

一、視頻大模型vidu的誕生與進化歷程

2024年4月,生數科技在中關村論壇首次推出了視頻大模型vidu。作為國內首個與谷歌sora直接對標的視頻大模型,vidu從誕生起便具備長時長、高一致性和高動態性的技術特點,迅速引起了行業內外的廣泛關注。最初發布時,vidu模型可實現16秒的視頻生成,隨後迅速迭代。

同年6月,生數科技將模型性能顯著提升,實現了一鍵生成32秒視頻的能力,推出動態3d視頻生成版本vidu 4d,使生成內容更加立體豐富。7月,vidu模型正式全球上線,強調角色一致性的精準控制,讓用戶能夠明確地指定和控制特定角色的動作和行為。

到2024年9月,vidu再次實現重大突破,將單主體的可控生成從人物角色擴展到虛擬形象、物品等更廣泛的內容。這種技術升級進一步增強了內容創作的自由度,滿足了創作者多元化的表達需求。2024年11月,vidu 1.5版本的發布再次掀起關注,實現了多主體與環境場景的同步精準控制,使用戶能夠更自如地掌控複雜場景的視頻內容生成。

二、技術迭代下的用戶體驗躍升

進入2025年,生數科技發布了vidu 2.0版本。在這一階段,模型在生成效率、生成成本方面都實現了質的飛躍。vidu 2.0版本能夠在短短10秒內生成4秒高質量的視頻內容,每秒生成成本最低降至4分錢,大幅提升了經濟性與生產效率。同時,為進一步便利創作者使用,主題庫、模板庫等功能陸續上線,極大提升了用戶的創作體驗。

截至目前,vidu平台已服務全球超過200個國家和地區,用戶數量超過千萬級,涵蓋動漫、廣告、影視劇、遊戲等多個行業,顯著擴大了生成式ai技術的應用領域。

三、vidu q1:內容生成精準可控的新里程碑

儘管vidu視頻大模型不斷迭代和進步,但朱軍教授坦言,內容生成的隨機性仍然是業界普遍面臨的難題。尤其是視頻內容生成過程中,主體位置難以精準控制、運動軌跡經常隨機化,嚴重限制了創作者的精準表達。

為解決這些痛點,生數科技推出vidu q1版本。新版本首次實現了視頻內容生成的高度精準可控,例如用戶通過簡單的圖示即可明確視頻中主體的位置關係,徹底避免主體位置隨機出現偏差的問題。此外,視頻主體的運動軌跡也可被嚴格按照用戶的需求精準執行,確保視頻內容始終符合創作者預期。

在多主體控制方面,vidu q1實現了同時精準控制多個主體與環境的一致性。無論場景多麼複雜,用戶均可通過簡單的指令與圖示精確定義,確保生成的視頻內容始終精準穩定。此外,q1版本還首次實現音頻內容的精準控制,創作者可以自由定義音頻的不同時間段場景,確保音視頻的轉場與內容表達精確一致。

展望未來,朱軍教授表示,vidu模型不僅僅局限於視頻內容的精準生成,其技術發展潛力巨大。視頻大模型在多模態融合與空間、時間智能領域的能力,將為未來通用人工智慧的發展奠定堅實基礎,助推人工智慧技術真正實現虛擬世界與現實物理世界的融合。

據悉,vidu q1將在2025年4月正式上線,作為又一次迭代升級,其實際效果與用戶反饋也將在未來的應用中接受檢驗。隨著生成式ai在創意、內容生產等場景中的不斷滲透,如何實現真正可控、可靠的多模態生成,仍將是整個行業持續探索的課題。

視頻大模型vidu q1 宣傳視頻

國際分類資訊推薦

中國單方面免簽「朋友圈」增至47國 - 天天要聞

中國單方面免簽「朋友圈」增至47國

6月9日起,中方對沙特、阿曼、科威特、巴林持普通護照人員試行免簽政策。至此,適用單方面免簽政策來華國家已擴展至47個。自2025年6月9日至2026年6月8日,沙特、阿曼、科威特、巴林持普通護照人員來華經商、旅遊觀光、探親訪友、交流訪問、過
海內外人士香港共商科技治理與可持續發展「博鰲方案」 - 天天要聞

海內外人士香港共商科技治理與可持續發展「博鰲方案」

中新網香港6月8日電 (記者 劉大煒)以「科技引領未來,創新驅動轉型」為主題的博鰲亞洲論壇國際科技與創新論壇2025年香港會議7日在香港會議展覽中心閉幕。兩天時間內,來自20多個國家和地區的800多位政府官員、國際組織代表、企業家和專家學者
洛杉磯抗議升級!三彈齊發射向抗議人群,高速公路遭阻斷!特朗普強硬表態,加州州長:撤回國民警衛隊 - 天天要聞

洛杉磯抗議升級!三彈齊發射向抗議人群,高速公路遭阻斷!特朗普強硬表態,加州州長:撤回國民警衛隊

每經編輯:畢陸名據央視新聞9日消息,記者當地時間8日從NBC獲悉,洛杉磯警方在市中心向抗議人群發射催淚彈和橡皮子彈驅散人群,期間有抗議者向警方投擲水瓶、石塊。8日下午,抗議者從聯邦大樓附近進入匝道,導致101號高速公路交通中斷。警方控制局勢時,抗議者沿匝道湧入車道,並包圍出警人員,同時在該區域三個主要路口聚...
國民警衛隊進駐洛杉磯 新華社記者直擊衝突現場 - 天天要聞

國民警衛隊進駐洛杉磯 新華社記者直擊衝突現場

這是6月7日在美國加州洛杉磯縣拍攝的示威者與警方對峙現場。新華社發(邱晨攝)當地時間6月8日中午,美國加利福尼亞州洛杉磯市中心聯邦執法機構門前的抗議者與部署在該地的國民警衛隊人員發生衝突。美國軍方說,當天共有300名國民警衛隊人員依照指令進
「大米危機」撼動日本政壇 - 天天要聞

「大米危機」撼動日本政壇

自去年夏天至今,日本大米價格持續大幅走高。如今,很多日本人要麼被迫縮減大米消費量,要麼乾脆放棄將大米作為長期以來的第一主食。米價飛漲不僅暴露出日本農業政策的弊端,更是直接影響著將於7月舉行的日本國會參議院選舉。而這場選舉,被日本媒體普遍稱作
俄稱向烏工業中心推進 烏方稱俄散布謊言 - 天天要聞

俄稱向烏工業中心推進 烏方稱俄散布謊言

俄羅斯國防部當地時間8日通報稱,俄軍部隊正在第聶伯羅彼得羅夫斯克州境內推進。烏克蘭武裝部隊總參謀部則否認了俄軍的說法,表示俄軍在傳播虛假信息。 俄羅斯國防部8日通報稱,過去一天,俄軍在多地打擊了烏軍無人機生產和儲存設施、彈藥庫、臨時部署點等目標。其中,俄軍「中央」作戰集群下屬的第90坦克師部隊已抵達頓涅...
洛杉磯警方與抗議者對峙後撤退 全市進入戰術警戒狀態 - 天天要聞

洛杉磯警方與抗議者對峙後撤退 全市進入戰術警戒狀態

央視記者獲悉,當地時間6月8日下午,美國加州洛杉磯警察局身著防暴裝備的警察在愛德華·羅伊巴爾(Edward Roybal)聯邦大樓附近與抗議者對峙後撤退。大約在同一時間,洛杉磯警察局宣布全市進入戰術警戒狀態,允許主管人員在發生緊急情況或重大事件時讓警員繼續值班,並保持高水平的人員配備。據悉,此類警報旨在授權警員加...
爆料:馬斯克與美財長曾大打出手 | 新聞早班車來了 - 天天要聞

爆料:馬斯克與美財長曾大打出手 | 新聞早班車來了

今天是6月9日 農曆五月十四 星期一要聞習近平同緬甸領導人敏昂萊就中緬建交75周年互致賀電。許其亮同志遺體在京火化,習近平等到八寶山革命公墓送別。交通運輸部對河北省邯港高速公路工程南運河特大橋「4·23」橋樑支架垮塌事故掛牌督辦。美國南加州展開大搜捕:執法人員發射催淚瓦斯、震爆彈,抗議者投擲石塊、水瓶。特朗...