百人初創公司Runway發佈AI視頻模型 生成質量超谷歌OpenAI競品

財聯社12月2日訊(編輯 趙昊)當地時間周一(12月1日),美國人工智能初創公司runway推出gen-4.5——一款新視頻模型,該模型在獨立基準測試中表現優於谷歌和openai同類產品。

gen-4.5能根據用戶提供的文字提示,通過描述其中的運動與動作,生成高清的視頻內容。runway 表示,這款模型在理解物理規律、人體動作、鏡頭運動以及因果關係方面表現突出。

該模型在獨立ai基準測試與分析公司artificial analysis的video arena排行榜上位居第一,而谷歌的veo 3位列榜單第二,openai的sora 2 pro則排在第七。

該排行榜的文本生成視頻模型排名是通過盲選方式得出:人們比較兩個模型的輸出視頻,並投票選擇更好的一個,投票時不會知道對應的是哪家公司。

runway ceo cristóbal valenzuela在接受採訪時表示,「我們僅靠一百人的團隊,就擊敗了萬億美元規模的公司。只要極度專註、勤奮,就能觸及技術前沿。」

runway成立於2018年,公司從事ai研究,打造視頻模型和世界模型,即在視頻與觀測數據上訓練、以更真實反映物理世界運行方式的模型。

目前,runway的客戶包括媒體機構、影視工作室、品牌方、設計師、創作者和學生,但公司的員工規模只有120人。

根據pitchbook數據,其估值已膨脹至35.5億美元。投資者包括 general atlantic、baillie gifford、英偉達、salesforce ventures等。

valenzuela表示,gen-4.5的內部代號是 「david(大衛)」,象徵著聖經中「大衛戰歌利亞」(以弱勝強)的典故。他說,這個模型「是一個可以一夜成名、卻花了七年時間打造的產品」。

「現在確實是一個非常有趣的時間節點,一個講究效率和研究的時代正在到來。」valenzuela說,「我們非常興奮能確保ai不會被兩三家公司壟斷。」

runway表示,gen-4.5正在逐步上線,本周內將向所有客戶開放。valenzuela表示,這是公司接下來發佈的一系列重大更新中的第一個。

「它將通過runway的平台、其應用程序接口(api)以及公司的一些合作夥伴渠道提供。」

(財聯社 趙昊)