当地时间6月11日,facebook母公司meta宣布推出开源“世界模型”v-jepa 2。世界模型通过内部表征和模拟器来理解和预测环境的动态,让ai能够以更接近人类的方式进行学习、规划和决策。
v-jepa 2拥有12亿参数,经过了超过100万小时的视频训练,在物理世界中实现了最先进的视觉理解和预测性能。
meta表示,v-jepa 2可以帮助机器人和其他人工智能主体理解物理世界,并预测物理世界将如何对它们的行动做出反应。举例来说,v-jepa 2可以识别从桌面上滚动的球会掉下来,或者在视野之外的物体不会消失。
与传统依赖海量标注数据或视频素材的ai模型不同,meta研发的v-jepa 2创新性地采用“潜在空间”压缩推理技术。该技术通过构建高维特征的抽象表征,使系统能够高效理解物体运动规律、交互机制及环境响应特性。这种架构特别适用于自动驾驶和物流机器人等需要实时环境认知的领域——这些应用场景要求ai系统在动态变化的物理环境中做出毫秒级的安全决策。
性能测试显示,v-jepa 2的推理速度达到英伟达cosmos模型的30倍,这标志着物理世界建模领域的重大进步。值得注意的是,两家公司可能采用差异化的评估标准,meta更强调模型在复杂场景下的认知泛化能力。
meta首席人工智能科学家杨立昆对此解释称:“物理世界的理解与语言处理存在本质差异。我们的世界模型构建了现实的数字抽象框架,使ai能像人类一样预判行为后果,并自主规划任务执行路径。这项技术将重塑机器人产业格局,使ai助手能在有限训练数据条件下,可靠完成从家居服务到工业操作等多样化物理任务。”
随着研究人员将目光投向支撑生成式人工智能应用的大语言模型之外,世界模型近来在ai界引起了广泛关注。
去年9月,ai“教母”李飞飞为其新创立的world labs公司筹集了2.3亿美元,该公司旨在创建"大型世界模型",以更好地理解物理世界的结构。与此同时,谷歌旗下的deepmind部门一直在开发自己的世界模型,名为genie。该部门称genie可以实时模拟游戏和3d环境。
随着公司面临来自openai、微软和谷歌等对手的竞争,人工智能已成为meta首席执行官马克·扎克伯格关注的关键领域。据悉,扎克伯格正亲自组建一支名为“超级智能”ai团队,目标是实现人工通用智能。为此,meta计划向人工智能初创公司scale ai投资近150亿美元,获取该公司51%股权,并聘请后者首席执行官汪滔(alexandr wang)和多位研究人员加入该团队。
此外,meta还在包括谷歌内的多家科技公司重金挖角顶尖工程师,其中包括谷歌deepmind的首席研究员杰克·雷(jack rae),以及ai语音初创公司sesame ai的机器学习负责人约翰·沙尔克维克(johan schalkwyk)。上述二人都将会加入meta等“超级智能”团队。
不过,并非所有人都对扎克伯格的招募行动趋之若鹜。据悉,meta曾试图挖角谷歌顶级ai研究员之一科拉伊·卡武克奥卢(koray kavukcuoglu)以及openai的杰出研究员诺姆·布朗(noam brown),但均未成功。
当前ai人才争夺战已进入白热化阶段,科技巨头与初创企业展开激烈竞争。meta虽为ai人才开出超过200万美元(超过1400万元人民币)的年薪,却仍难以阻止核心员工流向openai和anthropic等竞争对手,每周至少流失3名核心员工。
数据显示,anthropic展现出强大的人才吸引力,其两年员工留存率高达80%,远超行业平均水平,这主要得益于其独特的企业文化、高度自主权以及灵活的工作模式。 (文/腾讯科技特约编译 无忌)