內容來源:新新小心(微信公眾號id:luxa_zzz)
3月6日晚,一個名為 manus 的 ai agent 產品 demo 視頻悄然刷屏 ai 媒體圈。
在看完視頻後,不得不深夜發博批判自己"過度依賴人工設計",工程思維的固化 & 對模型能力邊界的反應遲鈍是罪過。這段時間項目上有個困擾我蠻久的問題,manus 簡單的一個 demo 視頻就讓我茅塞頓開,找到了解法。

次日醒來發現 manus 已然點爆了國內圈子,一碼難求到某魚上甚至有人花 5 萬求一個邀請碼——這個讓大模型擁有"整台電腦"的通用 agent,顛覆了人們對'套殼'的認知。
當然一個爆火的產品少不了媒體的吹噓也少不了沒拿到邀請碼者的'吃不到葡萄說葡萄酸'。
其實從我的角度來說,manus 是不是第一個通用 agent 及其能力如何不是很重要,manus 團隊的 agent 設計理念 『less structure more intelligence』 反而對我很有啟發。
manus 做了什麼
manus 名字取自於拉丁語 'mens et manus'(即'知行合一',麻省理工的校訓)
與市面上需要人工編排 workflow 的 coze、dify 等產品不同,manus 的核心在於:
給模型一台'虛擬機':將 computer use 與 tool use 深度融合,讓模型能獨立於人類去工作,不跟人搶電腦;
自主任務規劃:模型根據目標自動拆解、規劃 todo 並執行, 而非靠人為搭建 workflow;
全流程無人值守:從'生成 ppt 大綱'到'輸出完整 .pptx 文件',無需人類中途干預;(實測下來某些 case 其實還是需要的,比如碰到驗證碼的時候)
相當於給 ai 配置了完整的工作台,讓它像真人一樣操作電腦完成任務,不僅有普通大學生的水平還能任勞任怨地干臟活。
為什麼說改變了人們對「套殼」的認知
除開 computer use、mcp、自主規劃...這些早已有的概念,有個問題在看到 demo 視頻的當晚我思考了一晚上:
為什麼要給模型一台 pc?這跟我直接通過 function call 在輸出結果上會有什麼區別嗎?
直到 manus 放出邀請碼,實測了幾個 case 後才有了答案:
首先最大的區別在於,manus 通過操作瀏覽器+視覺獲取到了更多 api 未能提供的信息,搜索的廣度、深度都要多出了不少,在 deep research 的工作上不輸於普通校招生、實習生。
這點目前能看到最具代表性的 case 就是海辛老師讓 manus 教她拍恐怖片,manus 打開了 b 站現學了 20 多分鐘,甚至在看了搜狐上相關的文章後還點了舉報...(manus:順手的事兒~)

眾所周知,小紅書中擁有著大量優質筆記內容,日均搜索量大約 6 億次,近三分之一用戶打開小紅書的第一件事就是搜索。可惜並沒有一個開放的搜索介面讓模型能直接獲取其中的優質內容。
而模型有了 pc 後,社區便真正沒有了圍牆。
其次,可以看見的是模型對工具的使用產生了質變,完成了從"顧問"到"高級牛馬"的角色進化。
想必大多數人都嘗試過讓 ai 生成 ppt,結果就是 ai 只會給你輸出一通大綱與些許內容,更好點的能調用 aippt 套個固定的模版或者直接用 html 畫一個給你,還得找到『導出』才能拿到 .pptx 文件。
確實這樣能解決一些簡單的 ppt 需求,但我真的覺得太反 ai 了。
manus 把 pc 交給模型,經過其自主地搜集信息、學習,能設計出更符合目標場景的 ppt,並把 .pptx 文件直接交到你手上。
當模型真正開始『使用』而不僅是『調用』工具時,人們確實瞥見了一絲通用 agent 的光。
以下為同樣將一份教案交給 aippt 以及 manus 並讓他們製作英語教學課件的結果,顯而易見的是老師根本不會拿著前者去上課,不然就是教學事故...
無 pc 產出物(gamma)
帶 pc 產出物(manus)
故 manus 能爆火、能被媒體吹捧是因為它確實讓人們看見了其中一種 agent 新範式,也改變了人們對產品層『套殼』所能產生的化學反應的認知。不只是因為邀請碼。
誠然,同勸冷靜者所說一般,manus 只是把 claude、computer use、mcp、自主規劃等等這些早已在各種 agent 概念產品實現過的功能進行了一番套殼縫合,沒什麼技術突破。
但這產品應用上的實現落地,硬要扯到技術上就是對牛彈琴。有的是公司能開發出第二個『抖音』,但沒見有公司能做出第二個『抖音』。
從結果上來看,manus 團隊能將這些零散的概念深度融合併先行落地,爆火的同時也讓更多人了解到 ai agent,就足夠證明優秀。
套殼不撈,撈的是套不好殼、有殼不套。
大家總是會從一個極端走向另一個極端。我們的態度是不要過於捧殺或 diss,甚至還出來了很多陰謀論...過猶不及。能夠以足夠的包容和理性去看待 manus,去對待華人創業團隊。現在的爆火也是出乎 manus 團隊意料之外的,之所以設置邀請碼也是因為 multi-agent 很消耗算力資源,很難讓這樣一個創業團隊完全把產品開放給所有用戶。
《一些關於 manus 的獨家信息和慢思考》特工宇宙
回歸開頭主題,個人真真實實地從 manus 的理念上得到了啟發:less structure,more intelligence ——儘可能地去屏蔽人類的認知框架對模型的限制,多探索模型的能力邊界,智能湧現。
受限於對模型能力邊界的認知局限,以往在項目中為了滿足複雜的 case,我設計了不計其數的 prompt、workflow,最終過多地依賴設計框架來約束模型產出的結果就是『人工智慧、人工智慧,人工多於智能』。
在一些場景下給到足夠工具後,放手讓模型自由創造或許會得到更好的結果。
上頭後的冷水
實話實說,manus 雖然給 agent 設計上帶來了新的範式,但離真正的通用還有些距離。看了那麼多實測 case 後,卡死率還是蠻高的,有這麼幾個問題:
效率:簡單的 case 也要耗時2-4小時,例如電商商品比價,有殺雞用牛刀的感覺;
資源:沒理解錯的話,每個任務需獨立 docker 容器,伺服器壓力巨大;
視覺:模型對 ui 的理解能力顯然還不夠,除開上下文限制外,大多數任務卡死都是因為界面理解問題;
細分領域:在強依賴細分領域內數據的場景上,即使通過瀏覽器也無法搜集到有用信息。
算力消耗的問題就不提了,畢竟算力價格一直在『骨折』。
對agent賽道兩極分化的思考
我們能看見 agent 創業的兩條路徑:
通用派:追求 『less structure, more intelligent』 的通用智能;
垂直派:深耕細分領域,用專業知識與不開源的業內數據來構築護城河。
在 manus 的閉門分享會上有一頁 ppt 內容是這麼寫的:
『agent killer』 大致解讀是現階段以 manus 為代表的通用派已殺死細分派 agent。
作為身處教育細分賽道的 agent 設計者,個人是不認同的。
跪拜 coding 領域有 github 這麼一個強大的開源社區,使得 devin、metagpt 成為最先成熟落地且商業化的 agent。但在金融、醫藥等其他領域,多的是藏冰山角下的私有數據,數據是最大的護城河。
當大模型尚未內化行業 know-how 時,細分領域專家設計的 structure 仍是剛需,業內私有數據訓練的專家模型仍不可或缺——不過這扇窗口期可能比想像中更短。
在硅基與碳基的十字路口,人機協作的範式正在被不斷改寫。變革中沒有永恆的贏家,只有持續進化者。感謝 manus 『弱框架,強智能』架構帶來的啟發,或許就是我當前項目的破局點。