视频大模型竞争关键点是什么?美图吴欣鸿最新判断!

2024年04月28日18:42:16 科技 2988

  光明网讯 在4月17日举办的中国aigc产业峰会上,美图公司创始人吴欣鸿表示,国内视频大模型竞争的关键点有三个,分别是创意超越现实、工作流整合和垂直场景

  今年年初,sora的亮相让视频大模型迈出新的一步,也刺激科技公司们加大技术攻关力度,加大对视频大模型的资源投入,预计不少“国产sora”或将在下半年扎堆上线。

视频大模型竞争关键点是什么?美图吴欣鸿最新判断! - 天天要闻

  在吴欣鸿看来,第一,视频大模型需要生成超越现实的画面,与实拍互补,成为一种新的特效实现方式。第二,视频生成应用场景有限,需与现有ai能力和传统视频技术结合,形成工作流。第三,视频在电商、广告、游戏、动漫、影视等垂直场景的“可用性”极为关键。

视频大模型竞争关键点是什么?美图吴欣鸿最新判断! - 天天要闻

  “以sora为代表的视频大模型只是开始。”吴欣鸿表示,未来视频大模型能与视频制作工作流实现更紧密的结合,后续可生成1-5分钟视频,值得用户和行业期待。

  活动现场,吴欣鸿向到场嘉宾展示了一支60秒时长的视频,该视频由美图产品全家桶中的wink、whee、开拍等产品协作完成,通过优化故事脚本、视频生成、视频编辑等流程,展示了美图奇想大模型miraclevision的视频生成能力。

  吴欣鸿透露,美图视频大模型正在进行1.0到2.0的技术升级。在今年6月的美图影像节,全新的视频大模型及生产力工具新品将亮相。(战钊)

来源:光明网

科技分类资讯推荐

谷歌将推出第六代TPU芯片Trillium 算力表现提升4.7倍 - 天天要闻

谷歌将推出第六代TPU芯片Trillium 算力表现提升4.7倍

【CNMO科技消息】5月15日凌晨,谷歌召开2024年I/O开发者大。据CNMO了解,在大会上,谷歌公司首席执行官桑达尔·皮查伊(Sundar Pichai)正式宣布了其全新的第六代TPU芯片——Trillium。这款芯片被谷歌誉为“迄今为止性能最强、能效最高的TPU”,相较于前代产品TPU v5e,Trillium在峰值计算性能上实现了惊人的4.7倍提升。
谷歌开始反击 推出AI助手ProjectAstra 正面硬刚GPT-4o - 天天要闻

谷歌开始反击 推出AI助手ProjectAstra 正面硬刚GPT-4o

【CNMO科技消息】在备受瞩目的谷歌I/O大会上,谷歌揭幕了一款名为Project Astra的通用人工智能系统,旨在与OpenAI的GPT-4o展开竞争。Project Astra不仅支持实时对话,还能通过视频聊天的方式与用户进行交互。
谷歌宣布Gemini AI融入Android 15系统 手机变得更聪明 - 天天要闻

谷歌宣布Gemini AI融入Android 15系统 手机变得更聪明

【CNMO科技消息】5月15日凌晨,谷歌在I/O大会上宣布,Android 15将深度整合其Gemini大模型,为用户带来一系列前沿的AI功能。其中,备受瞩目的即圈即搜功能将不仅限于搜索物体,更增加了截图与题目解答的智能化处理。
人形机器人概念,哪家企业利润最强? - 天天要闻

人形机器人概念,哪家企业利润最强?

消息:宇树科技发布新款人形机器人。5月13日,宇树科技发布了一款名为Unitree G1的新型人形机器人,售价9.9万元(约1.5w美金,远低于特斯拉的目标价2w美金)。宇树科技宇树科技成立于2016年,位于浙江省杭州市。
谷歌搜索引擎问世 25 年最大更新,“AI Overviews”体验正式上线 - 天天要闻

谷歌搜索引擎问世 25 年最大更新,“AI Overviews”体验正式上线

IT之家 5 月 15 日消息,谷歌公司在今天召开的 2024 年 I / O 开发者大会上,正式推出了“AI Overviews”搜索体验,将于本周开始向美国地区开放,后续会推广到更多国家和地区。谷歌首席执行官桑达尔・皮查伊(Sundar Pichai)出席本次活动,表示:“我很高兴地宣布,我们将于本周开始向美国的所有人推出这一全面革新的体验...
苹果 iOS 17.5 安全修复补丁导致欧洲第三方应用商店运行出现 BUG - 天天要闻

苹果 iOS 17.5 安全修复补丁导致欧洲第三方应用商店运行出现 BUG

IT之家 5 月 15 日消息,根据官方支持文档,苹果公司近日发布的 iOS / iPadOS 17.5 更新中,包含了 15 个针对 iPhone 和 iPad 的安全补丁,不过其中一项补丁导致第三方应用商城运行出现 BUG。开发者 Mysk 表示,苹果在 iOS / iPadOS 17.5 更新中发布了与 MarketplaceKit 框架相关的安全补丁
翻倍:谷歌将 Gemini 1.5 Pro 上下文窗口增加至 200 万个 tokens - 天天要闻

翻倍:谷歌将 Gemini 1.5 Pro 上下文窗口增加至 200 万个 tokens

IT之家 5 月 15 日消息,谷歌公司在今天召开的 2024 年 I / O 开发者大会上,宣布升级 Gemini 1.5 Pro 模型,将上下文窗口(AI 模型可理解的信息量)从当前 100 万 tokens 增加到 200 万。谷歌表示升级之后,Gemini 1.5 Pro 能够同时处理 2 小时的视频、22 小时的音频、6 万多行代码或 140 多万
谷歌 Gemini 家族添 Flash 新成员:平衡规模和能力、支持多模态 - 天天要闻

谷歌 Gemini 家族添 Flash 新成员:平衡规模和能力、支持多模态

IT之家 5 月 15 日消息,谷歌公司今天扩充 Gemini 家族成员,推出了全新的 Gemini 1.5 Flash 模型,重点优化了该模型的速度和效率。谷歌 DeepMind 首席执行官德米斯・哈萨比斯(Demis Hassabis)在一篇博客文章中写道:Gemini 1.5 Flash 擅长摘要、聊天应用、图像和视频字幕、从长文档和表格中提取数据等。