奥特曼再放大招!OpenAI公布首个文生视频模型Sora,质量如何?

2024年03月02日10:31:34 动漫 4603

财联社2月16日讯(编辑 唐叶天)北京时间今日凌晨,全球人工智能模型领跑者openai推出了一款能根据文字指令即时生成短视频的模型,命名为sora。此前在2023年轰轰烈烈的多模态ai模型竞赛中,谷歌、meta和初创公司runway、pika labs都发布过类似的模型。但本次openai展示的视频仍然以高质量获得关注。目前openai官网上sora相关的信息有限,openai没有给出训练模型的素材来源,仅表示:“我们正在教ai理解和模拟运动中的物理世界,目的是训练模型,帮助人们解决需要真实世界交互的问题。”并称sora能够从文本说明中生成长达60秒的视频,并能够提供具有多个角色,特定类型的动作和详细的背景细节的场景。sora还能在一个生成的视频中创建多个镜头,体现人物和视觉风格。此外,sora可以一次性生成整个视频,也可以扩展生成的视频,使其更长。openai表示:通过让模型一次生成多帧画面,我们解决了一个具有挑战性的问题,即:即使生成的主体暂时离开视线内,也能确保主体不变

奥特曼再放大招!OpenAI公布首个文生视频模型Sora,质量如何? - 天天要闻

openai同时提示:当前的sora模型也有弱点。它可能难以准确模拟复杂场景中的物理现象,也可能无法理解具体的因果关系。例如,一个人可能会咬一口饼干,但咬过之后,饼干上可能就没有咬痕了。该模型还可能混淆提示的空间细节,例如混淆左和右,并可能难以准确描述随时间发生的事件,例如跟随特定的摄像机轨迹。关于openai的ceo山姆·奥特曼一直呼吁的ai安全问题,openai表示“目前,sora已经开放向‘红队人员’(对ai大模型潜在的有害输出进行“红队测试”)以评估关键领域的危害或风险。我们还允许一些视觉艺术家、设计师和电影制作人访问,以获得关于如何改进模型的反馈意见,使其对创意专业人士最有帮助。”

sora生成视频效果如何?

openai表示,sora建立在过去对dall-e和gpt模型的研究基础之上。它采用了dall·e 3的技术,能够在生成的视频中更忠实地遵循用户的文字说明。除了能够文生视频外,该模型还能根据现有的静态图像生成视频,并能准确、细致地对图像内容进行动画处理。该模型还能提取现有视频,并对其进行扩展或填充缺失的帧。目前openai官网上已经更新了48个sora生成的视频demo,色彩艳丽,效果逼真。

奥特曼再放大招!OpenAI公布首个文生视频模型Sora,质量如何? - 天天要闻

来自openai sora的ai生成视频图像:猛犸象在雪地中行走

以上截图的视频文字提示如下:几头巨大的长毛猛犸象踏着雪地走来,它们长长的毛发随风轻扬,远处是白雪覆盖的树木和壮观的雪山,午后的光线伴着飘渺的云朵和远处高悬的太阳,营造出温暖的光晕,低机位拍摄的景象令人惊叹,捕捉到了大型毛茸茸的哺乳动物,摄影和景深都非常漂亮。动态的光影表现也有印象深刻的案例,如一位女性在东京路灯的霓虹灯下行走的视频,以及阿马尔菲海岸教堂的鸟瞰图,以及一个卡通怪物好奇地跪在融化的蜡烛前等。

奥特曼再放大招!OpenAI公布首个文生视频模型Sora,质量如何? - 天天要闻

来自openai sora的ai生成视频图像:一位女性在东京路灯的霓虹灯下行走

以上截图的视频文字提示如下:一位时尚女性走在东京的街道上,街道上到处都是温暖的霓虹灯和动画城市标志。她身穿黑色皮夹克、红色长裙和黑色靴子,手拿黑色钱包。她戴着太阳镜,涂着红色唇膏。她走起路来自信而随意。街道潮湿而反光,与五颜六色的灯光形成镜面效果。许多行人走来走去。

奥特曼在线接单

sora公布后,openaiceo山姆-奥特曼请社交媒体用户在线发送文字提示的创意内容。如一位来自新罕布什尔州的自由摄影师在x上给出的提示:“由一位祖母级社交媒体博主进行的自制意式团子烹饪指导课,场景设置在乡村风格的托斯卡纳乡下厨房,并配有电影级灯光。”altman在约一小时后回复了一个逼真的视频。

奥特曼再放大招!OpenAI公布首个文生视频模型Sora,质量如何? - 天天要闻

奥特曼此举,对外展示了sora模型即时生成视频的能力。

东吴证券观点此前表示,近年视觉算法在泛化性、可提示性、生成质量和稳定性等方面突破将推动技术拐点到来以及爆款应用出现。3d资产生成、视频生成等领域受益于扩散算法成熟,但数据与算法难点多于图像生成,考虑到llm对ai各领域的加速作用以及已出现较好的开源模型,2024年行业或取得更大的发展。

2023年末至2024年初,pika、heygen等ai文生视频应用陆续出圈,验证了多模态技术的不断进步与成熟。刚刚公布的的sora模型无疑加剧了这一赛道的激烈竞争。

(财联社 唐叶天)

动漫分类资讯推荐

幻化大赛,机械侏儒也可以幻化的很帅! - 天天要闻

幻化大赛,机械侏儒也可以幻化的很帅!

来看看本期选手的发挥,没想到机械侏儒可以弄的那么帅。友情提醒:因为微信公众号平台改变了规则,请在阅读后点击“在看”并加星标,这样才能在下一次推送时及时收到本号文章。- 更多内容,点击上方 -关注“魔兽世界研究所”公众号关注魔兽世界研究所,在后台回复抽奖二字,可参与魔兽世界蛋蛋手办的抽奖活动,每月都有,永...
火山引擎引爆大模型市场首场价格战 - 天天要闻

火山引擎引爆大模型市场首场价格战

万模大战现在难言胜者,但价格战已经开始,它无疑大大降低了用户使用的成本,火山引擎一面降价一面成立了手机、汽车两个生态联盟。汽车领域的合作伙伴包括吉利汽车、长城汽车、捷途汽车、赛力斯、智己汽车等20余家厂商。文丨智驾网  王欣编辑丨浪浪山与明知山字节系的火山引擎又搅起了大模型领域的一场激战,划出了一个从...
夜读丨50条微信个性签名(第二拨),来了! - 天天要闻

夜读丨50条微信个性签名(第二拨),来了!

昨晚《夜读》发布《50条微信个性签名,喜欢自取!》后,不到半天就收到了超过3000条评论,大家除了分享自己的微信签名外,还有很多这样的留言:一约既定,小编又带着图文来啦!  50条微信个性签名(第二拨来啦)01.欢迎光临我的快乐02.阅己,悦己,越己03.云边有个小卖部,货架堆着岁月和夕阳04.趁我还鲜活,不允许...
谁“辜负”了2024年这轮大涨? - 天天要闻

谁“辜负”了2024年这轮大涨?

2024年,A股市场迎来暌违多年的系统性筑底上涨表现,由此带动主动权益类金融产品整体有较强表现。初步统计有85%左右的新基金(权益为主方向)实现了净收益。而就在偏股混合基金年内“走出来”之时,年内依然有几只新发的偏股基金出现了明显的回撤。初始仓位很轻,偏股指数又系统性上涨,这些基金是如何在这样的有利环境下亏...
粗心爷爷接孙子放学结果走散 好心人“送娃” - 天天要闻

粗心爷爷接孙子放学结果走散 好心人“送娃”

新民晚报讯(记者 徐驰)昨天晚高峰5时20分左右,热心市民刘先生向轨交3号线虹桥路值班站长王欢欢反映,站台上孤零零地站着一个男孩子,身边没有家长陪同,疑似走失。  王欢欢前往现场后发现,男孩大约7岁,背着一只书包,正在不断地观察着四周的情况,看上去十分紧张。“小朋友,你要去哪里呀?是不是在等家长?”面对询...
漫漫评 | “幽灵枪”追凶 - 天天要闻

漫漫评 | “幽灵枪”追凶

枪声在校园和街道真切响起,执法部门却束手无策。枪支暴力带来的伤痛真实存在,悲剧接连不断。旧痕未愈,再添新伤。在此起彼伏的枪声中,没有枪支序号,无法被执法部门追踪的“幽灵枪”,无疑再次加深了美国社会问题的疮疤,为此埋单的是那些无辜逝去的生命和一个个破碎的家庭。监制:孟祥麟策划:刘慧漫画:刘俊文字:岳秋...
耕海牧渔,向海洋要食物 | 现场评论 - 天天要闻

耕海牧渔,向海洋要食物 | 现场评论

耕海牧渔,向海洋要食物——树立并践行大食物观悠悠万事,吃饭为大。解决吃饭问题,不能光盯着有限的耕地,要把思路打开,树立大食物观。在福建工作期间,习近平同志在《摆脱贫困》一书中就提出:“现在讲的粮食即食物,大粮食观念替代了以粮为纲的旧观念。”本版今起推出系列评论,聚焦福建树立并践行大食物观的实践探索...
市内四区明起禁飞“低慢小” - 天天要闻

市内四区明起禁飞“低慢小”

为确保我市近期举办的多项大型活动顺利举行,切实维护公共安全,杜绝各类违法违规飞行活动,5 月 15 日,市政府发布了《关于对无人机等"低慢小"航空器及空飘物实施临时管控的通告》。■管控对象"低慢小"航空器和空飘物,主要包括无人机、飞艇、航空模型、三角翼、滑翔伞、动力伞、热气球、无人驾驶自由气球、孔明灯等。■管...