OpenAI CTO穆拉蒂:Sora将于年底发布,未来会增加语音功能

2024年03月29日00:22:34 科技 5522

划重点

OpenAI CTO穆拉蒂:Sora将于年底发布,未来会增加语音功能 - 天天要闻

腾讯科技讯 据国外媒体报道,美国当地时间周三,人工智能初创公司openai的cto米拉·穆拉蒂(mira murati)接受外媒专访。在访谈中,穆拉蒂详细介绍了openai文本转视频人工智能工具sora以及其发布计划,还谈了训练数据、红队测试以及与电影业合作等话题。以下为外媒报道摘要:

人工智能正在迎来下一个“魔法时刻”,在这个时代,你的话语将不再仅仅是文字,它们将被赋予生命,转化为生动逼真的视频。这正是openai最新研发的sora所带来的革命性变革,它让视频制作变得更加简单、高效。

sora或许将在今年晚些时候与我们正式见面。然而,在此之前,openai已向公众展示了其惊人之处:利用精心编写的提示和强大的处理能力,许多原本需要人工参与的视频制作环节变得轻而易举。想象一下,许多充满创意的提示,如美人鱼与她的螃蟹伙伴一同点评智能手机,或是一头牛悠然自得地漫步在瓷器店中,这些场景在sora的魔力下都将成为可能。

当openai上个月开始预览其利用生成人工智能工具制作的视频时,互联网瞬间沸腾了。此前的人工智能视频技术已经可以呈现出断断续续、分辨率较低的片段,而sora所生成的视频却如同自然纪录片或大片级别的作品,令人叹为观止。

sora不仅为我们所熟悉的人工智能感觉循环注入了新的活力,更引发了人们对其能力的惊叹和社会的深深忧虑。穆拉蒂在采访中保证,openai在发布这一强大工具时将采取极为慎重的态度。然而,即便如此,我们也不能保证一切都会朝着好的方向发展。

穆拉蒂透露,一段20秒时长、720p分辨率的无声视频,仅仅几分钟就能制作完成。但她表示,他们计划在未来为视频增加语音功能,让内容更加完整。

sora究竟是如何工作的?穆拉蒂解释称,sora的人工智能模型通过大量视频数据的学习,学会了识别和理解各种物体与动作。当你给它一个文本提示时,它能够迅速勾勒出整个场景,并逐帧填充细节,从而生成出令人惊艳的视频内容。

人工智能就像黑盒子

业内观察人士和竞争对手们(包括runway的首席执行官)纷纷将openai在视频生成技术方面取得的成就归功于其庞大的计算能力和丰富的训练数据。然而,近期openai却陷入了版权侵权诉讼的漩涡,被指控未经许可抓取内容以训练chatgpt。

openai在训练sora时使用了哪些数据?穆拉蒂回答称:“我们使用了公开可用的数据和授权数据。”当被进一步问及是否包括youtube、instagram和facebook等平台上的视频时,她表示并不清楚具体情况。不过,穆拉蒂后来证实,授权材料确实包括了来自一些摄影图片网站的内容。

对于普通用户来说,人工智能模型就像是一个黑盒子,我们只知道输入提示和输出内容,却无法窥探其中的工作机制。因此,我们永远无法确切知道为什么某些事物在生成时会呈现出特定的样子。

穆拉蒂还透露,目前利用sora生成视频的成本远高于使用该公司图像生成器dall-e生成图像。然而,她表示在sora于今年年末向公众发布时,他们将努力优化算法,以降低所需的计算能力,从而使更多人能够享受到这项技术带来的便利。

在当前的早期阶段,我们如何能够识别出视频是由人工智能生成的而不是真实拍摄的呢?仔细观察sora的作品,你会发现一些明显的痕迹。比如,有的视频中,人手上长出十根手指,穆拉蒂对此解释道:“要准确地描绘手部运动真的很难。”

在另一段视频中,创作者要求sora展示一个机器人从电影制片人手中抢走摄像机的场景。然而,生成的视频中,原本的人类电影制片人突然变成了一个动作不自然的电影制作机器人,而且背景中的车辆也在不经意间发生了颜色的变化,从黄色出租车变成了银色轿车。穆拉蒂对此解释说,尽管该模型在保持场景连续性方面已经做得相当好,但仍有待完善。

如何识别ai生成视频?

那么,当这些技术故障被解决后,我们该如何区分真实视频和人工智能生成的视频呢?穆拉蒂提到了可能的解决方案:在视频的底部添加水印。她表示,这些视频最终将包含元数据,用以标明其来源,这有助于我们识别和追溯其生成方式。

除了技术问题,openai还在致力于通过红队测试来确保sora的安全性和可靠性。红队成员尝试使用各种提示来挑战sora,以发现可能存在的漏洞、偏见和其他有害结果。穆拉蒂称:“这就是为什么我们实际上还没有部署这些系统的原因。我们需要先弄清楚这些问题,然后才能广泛部署它们。”

穆拉蒂透露,sora的提示词政策可能会借鉴其图像生成器dall-e的先例。比如,sora将不允许生成公众人物的图像。

而关于可能涉及裸体的内容,穆拉蒂表示,公司正在与艺术家们紧密合作,探讨如何在不限制创造力的前提下,为这类内容设置适当的“护栏和限制”。

与好莱坞合作

随着像sora这样的工具不断进步和完善,我们不禁要问:人类将如何适应这样的变革?在一个仅需文字提示就能取代无人机操作员或角色插画师的世界里,人类将扮演怎样的角色?对于好莱坞等行业来说,这种变革既带来了担忧,也带来了兴奋。

泰勒·佩里(tyler perry)在亲眼目睹sora的出色表现后,决定暂停他原本计划耗资8亿美元的工作室扩建计划。他意识到,这项技术有可能大幅度减少在布景和外景拍摄上的费用,但同时也引发了人们对未来职业前景的担忧。美国动画协会主席珍妮特·莫雷诺·金(jeanette moreno king)认为,虽然艺术决策仍然需要人类的参与和判断,但“未来是模糊的”,充满了不确定性。

与此同时,爱德华·萨奇(edward saatchi)和他的人工智能视频工作室fable正在构想着一个更加前卫的概念——一个人工智能版的netflix。用户只需输入一个提示,系统便能生成出完整的剧集,满足观众的观看需求。

当被问及sora对视频制作工作可能带来的影响时,穆拉蒂再次强调了openai在发布这项技术时的谨慎态度。她表示,openai已经让一些行业内部人士提前进入测试阶段,以便更好地了解并应对可能出现的挑战。她说:“我们希望电影界人士和世界各地的创作者都能参与进来,与我们共同探索如何进一步推动这些行业发展。”

尽管openai在推进这项技术时表现得像瓷器店里的一头公牛,那么它需要小心翼翼地避免破坏现有的秩序。但不可避免的是,随着技术的不断进步和应用,它终将开始“撞碎瓷盘”,进而引发视频制作行业的深刻变革。(编译/金鹿)

科技分类资讯推荐

科技成为视障人士的“眼睛” 曾经的不可思议变得容易 - 天天要闻

科技成为视障人士的“眼睛” 曾经的不可思议变得容易

目前全国约有1700万视障人士,越来越多的数字技术也正化身视障人士的“眼睛”。广州视障女孩诺子就在科技的助力下,完成了一个人乘坐交通工具、参加漫展、外出旅游等原来视障人士难以想象的尝试。在广州生活的诺子,六年前因患神经系统罕见病,导致视力一级和肢体三级障碍。她刚刚使用的这款软件,可以通过视频电话的方式,...
消除隐患!电动自行车电池有了新标准 还需要做这些工作 - 天天要闻

消除隐患!电动自行车电池有了新标准 还需要做这些工作

本周,北京、上海、浙江等多地开展了涉及电动自行车的消防安全排查,主要围绕电动自行车“改装”这一问题进行查处。当越来越多人享受着电动车带来的出行便利时,越来越大的消防安全风险也在累积。相关事故一次次提醒我们注意:电动自行车究竟是哪些部件、哪些环节出了问题,才会给我们带来如此巨大的隐患?我们又该如何消除...
智能新纪元:vivo Watch GT的日常革命 - 天天要闻

智能新纪元:vivo Watch GT的日常革命

个人故事与科技的邂逅在一个阳光明媚的周末,我走进了一家闻名遐迩的电子产品商店,心中满怀着对未知的好奇和对新奇事物的渴望。那是我第一次接触到智能手表——一个小巧精致的装置,它的光滑屏幕和精密的传感器让我感到惊讶。
AI原创新闻制造者:择优选用关键因素及技术要求 - 天天要闻

AI原创新闻制造者:择优选用关键因素及技术要求

身为对撰写饱含热忱的研究人员,本人深深关注AI原创新闻制造者领域。当今社会,信息激增,用户对文章的需求水涨船高,AI原创新闻制造者正成为新的便捷工具,助用户高效产出优质文章。择优选用此类工具时,我会关注它的创意原创性、文章品质及操作简易程度等关键因素。
雷军直播开车2000万人围观!突然遭别车,雷军:太过分了,真的想举报他 - 天天要闻

雷军直播开车2000万人围观!突然遭别车,雷军:太过分了,真的想举报他

5月18日上午,雷军直播自己从上海驾驶小米 SU7 Pro到杭州,并且为杭州SU7车主交付车辆。 期间雷军不仅回应了《歌手》摇人事件,还遭遇了恶意别车,全程三个半小时的直播透露出诸多信息。 直播间截图 上一次直播时雷军并未开启打赏功能,被粉丝吐槽浪费流量。彼时雷军回应:“我不是排斥,只是担心大家刷的太多,直播间...
强大的pytest框架先做个整体认识 - 天天要闻

强大的pytest框架先做个整体认识

pytest是一个Python语言的自动化测试框架,类似unitest框架,不仅仅适合做单元测试,也适合系统测试,集成测试等。它以其简洁、灵活和强大的功能而受到广泛认可,可通过丰富的插件和特性帮助开发者编写高效、可维护的测试代码。
上海市第十九届青少年科技节启动 市区两级将推出百余项科普活动 - 天天要闻

上海市第十九届青少年科技节启动 市区两级将推出百余项科普活动

图说:上海市第十九届青少年科技节启动 新民晚报记者 陆梓华 摄新民晚报讯(记者 陆梓华)由上海市教委主办,上海市科技艺术教育中心承办的上海市第十九届青少年科技节今天下午张江科学会堂启动。本届青少年科技节以“科技让生活更美好”为主题,将持续至10月,通过开展科技创新实践活动、科普基地体验活动、科学普及传播活...
湖南信息学院与华为达成校企合作框架协议 - 天天要闻

湖南信息学院与华为达成校企合作框架协议

5月16日,湖南信息学院与华为技术有限公司(以下简称“华为”)在深圳华为总部签署合作协议。华为全球公共事业部副总裁赵祎鑫,华为湖南政企教育医疗行业总经理陈君,企业培训与认证部院校业务大客户部长李丹,数通产品线校企合作总监赵亮,企业培训与认证部湖南院校客户经理吴猛;湖南信息学院董事长陈登斌,党委副书记、...