财联社3月31日讯(编辑 史正丞)美国科技巨头亚马逊周一宣布,推出一款能够执行网页浏览器操作的ai智能体nova act,并同步推出nova act sdk工具包,供开发者构建智能体原型。
(nova act通过据火车站的骑行距离检索,来源:亚马逊)
亚马逊也成为openai、谷歌、anthropic,以及中国初创公司蝴蝶效应(manus ai)后,又一家试图在ai智能体领域打开局面的科技公司。
与这些竞品类似,nova act也是一款让“ai代理用户执行基本上网操作”的应用,例如去外卖平台订餐、餐厅订位等。
亚马逊宣称,nova act在多项基准测试中优于openai和anthropic的竞品。例如,在衡量ai代理与屏幕文本交互能力的screenspot web text测试中,nova act得分为94%,超过openai的计算机代理模型cua(88%)和anthropic的claude 3.7 sonnet(90%)。
由于ai智能体仍处于发展初期,这些“跑分”结果只能作为产品实际效用的参考。同时亚马逊也没有公布nova act在更常见的代理评估标准(如webvoyager)的测试成绩。
当然对于亚马逊这样拥有全球数亿用户的电商巨头而言,进入智能体赛道本身的意义已经足够重要。根据过往对openai、谷歌的产品测试,现在的ai智能体仍存在反应迟缓、难以长时间独立运作、常犯低级错误等严重影响使用的缺陷。
作为互联网巨头,亚马逊切入ai赛道的时间点相当晚。去年6月,亚马逊与ai初创公司adept达成了一项类似于收购的协议——亚马逊获得技术授权,同时adept联合创始人、前openai工程副总裁david luan带着团队加盟亚马逊。
去年12月,公司宣布成立旧金山agi研发实验室,由david luan和加利福尼亚大学伯克利分校ai和机器人教授pieter abbeel共同领导。亚马逊也在去年12月发布nova系列大模型,全面加入ai竞争。所以nova act也是旧金山实验室首个公开推出的产品。
对于“agi实验室为何要做ai智能体”的提问,david luan回应称,他认为智能体是创建超级智能系统的关键步骤。同时他也把agi定义为“能协助完成人类在计算机上所有操作的ai系统”。
david luan同时表示,旧金山团队设计的nova act sdk,旨在可靠地处理简单、简短的任务,并为开发者提供工具来精确定义何时需要人工介入智能体工作流程,从而创建更可靠的智能体应用。