奥特曼再放大招!OpenAI公布首个文生视频模型Sora,质量如何?

2024年03月02日10:31:34 动漫 4603

财联社2月16日讯(编辑 唐叶天)北京时间今日凌晨,全球人工智能模型领跑者openai推出了一款能根据文字指令即时生成短视频的模型,命名为sora。此前在2023年轰轰烈烈的多模态ai模型竞赛中,谷歌、meta和初创公司runway、pika labs都发布过类似的模型。但本次openai展示的视频仍然以高质量获得关注。目前openai官网上sora相关的信息有限,openai没有给出训练模型的素材来源,仅表示:“我们正在教ai理解和模拟运动中的物理世界,目的是训练模型,帮助人们解决需要真实世界交互的问题。”并称sora能够从文本说明中生成长达60秒的视频,并能够提供具有多个角色,特定类型的动作和详细的背景细节的场景。sora还能在一个生成的视频中创建多个镜头,体现人物和视觉风格。此外,sora可以一次性生成整个视频,也可以扩展生成的视频,使其更长。openai表示:通过让模型一次生成多帧画面,我们解决了一个具有挑战性的问题,即:即使生成的主体暂时离开视线内,也能确保主体不变

奥特曼再放大招!OpenAI公布首个文生视频模型Sora,质量如何? - 天天要闻

openai同时提示:当前的sora模型也有弱点。它可能难以准确模拟复杂场景中的物理现象,也可能无法理解具体的因果关系。例如,一个人可能会咬一口饼干,但咬过之后,饼干上可能就没有咬痕了。该模型还可能混淆提示的空间细节,例如混淆左和右,并可能难以准确描述随时间发生的事件,例如跟随特定的摄像机轨迹。关于openai的ceo山姆·奥特曼一直呼吁的ai安全问题,openai表示“目前,sora已经开放向‘红队人员’(对ai大模型潜在的有害输出进行“红队测试”)以评估关键领域的危害或风险。我们还允许一些视觉艺术家、设计师和电影制作人访问,以获得关于如何改进模型的反馈意见,使其对创意专业人士最有帮助。”

sora生成视频效果如何?

openai表示,sora建立在过去对dall-e和gpt模型的研究基础之上。它采用了dall·e 3的技术,能够在生成的视频中更忠实地遵循用户的文字说明。除了能够文生视频外,该模型还能根据现有的静态图像生成视频,并能准确、细致地对图像内容进行动画处理。该模型还能提取现有视频,并对其进行扩展或填充缺失的帧。目前openai官网上已经更新了48个sora生成的视频demo,色彩艳丽,效果逼真。

奥特曼再放大招!OpenAI公布首个文生视频模型Sora,质量如何? - 天天要闻

来自openai sora的ai生成视频图像:猛犸象在雪地中行走

以上截图的视频文字提示如下:几头巨大的长毛猛犸象踏着雪地走来,它们长长的毛发随风轻扬,远处是白雪覆盖的树木和壮观的雪山,午后的光线伴着飘渺的云朵和远处高悬的太阳,营造出温暖的光晕,低机位拍摄的景象令人惊叹,捕捉到了大型毛茸茸的哺乳动物,摄影和景深都非常漂亮。动态的光影表现也有印象深刻的案例,如一位女性在东京路灯的霓虹灯下行走的视频,以及阿马尔菲海岸教堂的鸟瞰图,以及一个卡通怪物好奇地跪在融化的蜡烛前等。

奥特曼再放大招!OpenAI公布首个文生视频模型Sora,质量如何? - 天天要闻

来自openai sora的ai生成视频图像:一位女性在东京路灯的霓虹灯下行走

以上截图的视频文字提示如下:一位时尚女性走在东京的街道上,街道上到处都是温暖的霓虹灯和动画城市标志。她身穿黑色皮夹克、红色长裙和黑色靴子,手拿黑色钱包。她戴着太阳镜,涂着红色唇膏。她走起路来自信而随意。街道潮湿而反光,与五颜六色的灯光形成镜面效果。许多行人走来走去。

奥特曼在线接单

sora公布后,openaiceo山姆-奥特曼请社交媒体用户在线发送文字提示的创意内容。如一位来自新罕布什尔州的自由摄影师在x上给出的提示:“由一位祖母级社交媒体博主进行的自制意式团子烹饪指导课,场景设置在乡村风格的托斯卡纳乡下厨房,并配有电影级灯光。”altman在约一小时后回复了一个逼真的视频。

奥特曼再放大招!OpenAI公布首个文生视频模型Sora,质量如何? - 天天要闻

奥特曼此举,对外展示了sora模型即时生成视频的能力。

东吴证券观点此前表示,近年视觉算法在泛化性、可提示性、生成质量和稳定性等方面突破将推动技术拐点到来以及爆款应用出现。3d资产生成、视频生成等领域受益于扩散算法成熟,但数据与算法难点多于图像生成,考虑到llm对ai各领域的加速作用以及已出现较好的开源模型,2024年行业或取得更大的发展。

2023年末至2024年初,pika、heygen等ai文生视频应用陆续出圈,验证了多模态技术的不断进步与成熟。刚刚公布的的sora模型无疑加剧了这一赛道的激烈竞争。

(财联社 唐叶天)

动漫分类资讯推荐

粗心爷爷接孙子放学结果走散 好心人“送娃” - 天天要闻

粗心爷爷接孙子放学结果走散 好心人“送娃”

新民晚报讯(记者 徐驰)昨天晚高峰5时20分左右,热心市民刘先生向轨交3号线虹桥路值班站长王欢欢反映,站台上孤零零地站着一个男孩子,身边没有家长陪同,疑似走失。  王欢欢前往现场后发现,男孩大约7岁,背着一只书包,正在不断地观察着四周的情况,看上去十分紧张。“小朋友,你要去哪里呀?是不是在等家长?”面对询...
漫漫评 | “幽灵枪”追凶 - 天天要闻

漫漫评 | “幽灵枪”追凶

枪声在校园和街道真切响起,执法部门却束手无策。枪支暴力带来的伤痛真实存在,悲剧接连不断。旧痕未愈,再添新伤。在此起彼伏的枪声中,没有枪支序号,无法被执法部门追踪的“幽灵枪”,无疑再次加深了美国社会问题的疮疤,为此埋单的是那些无辜逝去的生命和一个个破碎的家庭。监制:孟祥麟策划:刘慧漫画:刘俊文字:岳秋...
耕海牧渔,向海洋要食物 | 现场评论 - 天天要闻

耕海牧渔,向海洋要食物 | 现场评论

耕海牧渔,向海洋要食物——树立并践行大食物观悠悠万事,吃饭为大。解决吃饭问题,不能光盯着有限的耕地,要把思路打开,树立大食物观。在福建工作期间,习近平同志在《摆脱贫困》一书中就提出:“现在讲的粮食即食物,大粮食观念替代了以粮为纲的旧观念。”本版今起推出系列评论,聚焦福建树立并践行大食物观的实践探索...
市内四区明起禁飞“低慢小” - 天天要闻

市内四区明起禁飞“低慢小”

为确保我市近期举办的多项大型活动顺利举行,切实维护公共安全,杜绝各类违法违规飞行活动,5 月 15 日,市政府发布了《关于对无人机等"低慢小"航空器及空飘物实施临时管控的通告》。■管控对象"低慢小"航空器和空飘物,主要包括无人机、飞艇、航空模型、三角翼、滑翔伞、动力伞、热气球、无人驾驶自由气球、孔明灯等。■管...
5月16日停机维护更新公告 - 天天要闻

5月16日停机维护更新公告

亲爱的石灰们:感谢大家对《石器时代:觉醒》的热情关注和支持,为了给您带来更好的游戏体验,我们计划将2024年5月16日星期四10:00-14:00对全服进行停机更新,更新期间无法登录游戏。实际开服时间可能会稍有延迟或提前,对于因停机给大家带来的不便,我们深表歉意!更新完毕后将为您送上补偿。更新时间:2024年5月16日星期...
小村“邻里话坊”播下文明之花 - 天天要闻

小村“邻里话坊”播下文明之花

□淄博日报/淄博晚报/博览新闻 记者 侯林 管家、志愿者与居民共话家常,帮助解决邻里纠纷;村民一起阅读、健身、娱乐,共享休闲时光;组织健康讲座、亲子读书会,开展丰富多彩的文明实践....
《新生》大结局:唯独何珊视角的谎言没被戳穿,费可舍命相救是假 - 天天要闻

《新生》大结局:唯独何珊视角的谎言没被戳穿,费可舍命相救是假

《新生》大结局播出,第十集看完,不免失望。可惜了前六集迷人的气质,与最近蹭蹭上来的热度。在前期铺垫得如此精彩紧凑的悬疑剧中,最后一集承担得重大的解密与收尾的功能。可以说是本剧成败之关键了,每一分钟都不能有闲笔,每一段戏都对整部剧集完成完整的逻辑闭环,起着重要的作用。在这么“寸土寸金”的时段,还要来一...
火影忍者:柱间细胞能够抵消万花筒的副作用吗? - 天天要闻

火影忍者:柱间细胞能够抵消万花筒的副作用吗?

带土体内拥有一定程度的柱间细胞,设定上除去永恒万花筒写轮眼不会失明,就只有柱间细胞的力量能够减少万花筒带来的消耗,毕竟柱间细胞代表的是仙人体的力量,其中蕴含强大的生命力(蕴含较强的阳遁属性查克拉)应该可以抵消部分万花筒带来的瞳力消耗,写轮眼中则是蕴含较强的阴遁属性查克拉,阴阳遁之