財聯社3月31日訊(編輯 史正丞)美國科技巨頭亞馬遜周一宣布,推出一款能夠執行網頁瀏覽器操作的ai智能體nova act,並同步推出nova act sdk工具包,供開發者構建智能體原型。
(nova act通過據火車站的騎行距離檢索,來源:亞馬遜)
亞馬遜也成為openai、谷歌、anthropic,以及中國初創公司蝴蝶效應(manus ai)後,又一家試圖在ai智能體領域打開局面的科技公司。
與這些競品類似,nova act也是一款讓「ai代理用戶執行基本上網操作」的應用,例如去外賣平台訂餐、餐廳訂位等。
亞馬遜宣稱,nova act在多項基準測試中優於openai和anthropic的競品。例如,在衡量ai代理與屏幕文本交互能力的screenspot web text測試中,nova act得分為94%,超過openai的計算機代理模型cua(88%)和anthropic的claude 3.7 sonnet(90%)。
由於ai智能體仍處於發展初期,這些「跑分」結果只能作為產品實際效用的參考。同時亞馬遜也沒有公布nova act在更常見的代理評估標準(如webvoyager)的測試成績。
當然對於亞馬遜這樣擁有全球數億用戶的電商巨頭而言,進入智能體賽道本身的意義已經足夠重要。根據過往對openai、谷歌的產品測試,現在的ai智能體仍存在反應遲緩、難以長時間獨立運作、常犯低級錯誤等嚴重影響使用的缺陷。
作為互聯網巨頭,亞馬遜切入ai賽道的時間點相當晚。去年6月,亞馬遜與ai初創公司adept達成了一項類似於收購的協議——亞馬遜獲得技術授權,同時adept聯合創始人、前openai工程副總裁david luan帶著團隊加盟亞馬遜。
去年12月,公司宣布成立舊金山agi研發實驗室,由david luan和加利福尼亞大學伯克利分校ai和機器人教授pieter abbeel共同領導。亞馬遜也在去年12月發布nova系列大模型,全面加入ai競爭。所以nova act也是舊金山實驗室首個公開推出的產品。
對於「agi實驗室為何要做ai智能體」的提問,david luan回應稱,他認為智能體是創建超級智能系統的關鍵步驟。同時他也把agi定義為「能協助完成人類在計算機上所有操作的ai系統」。
david luan同時表示,舊金山團隊設計的nova act sdk,旨在可靠地處理簡單、簡短的任務,並為開發者提供工具來精確定義何時需要人工介入智能體工作流程,從而創建更可靠的智能體應用。