2025年3月5日,一款名為manus的ai agent產品橫空出世,其內測邀請碼在48小時內被炒至10萬元天價,帶動150餘只ai概念股漲停,更催生了加密貨幣市場的同名代幣投機浪潮。這場由華人團隊引發的技術風暴,不僅讓ai agent從實驗室概念走向大眾視野,更標誌著該領域正式進入"去中心化競爭"時代——曾經的科技巨頭壟斷格局,正在被中小型創業團隊的創新實踐打破。
1 ai agent的進化史:從工具到智能體的蛻變
ai agent的概念可以追溯到上世紀60年代。1966年,麻省理工學院開發的eliza程序通過模式匹配技術模擬心理醫生對話,雖然只是簡單的規則引擎,卻首次展現了人機交互的可能性。1970年代,斯坦福研究院的shakey機器人通過攝像頭和感測器實現了簡單的環境感知與行動規劃,這被視為物理agent的雛形。
eliza界面
2010年後,隨著智能手機的普及,siri、alexa等語音助手開啟了agent的商業化進程。這些早期產品主要依賴預定義規則和有限知識庫,只能完成查詢天氣、設置鬧鐘等單一任務。直到2016年,google assistant引入深度學習技術,通過端到端模型提升了自然語言理解能力,但依然受限於封閉的生態系統。
真正的轉折點出現在2023年。openai推出的gpt-4模型在語言理解、邏輯推理和創造力方面實現質的飛躍,為agent賦予了核心智能。隨後,anthropic的claude、google的gemini等大模型相繼問世,形成了"基礎模型+插件生態"的新架構。2024年,微軟發布的copilot系統通過整合office全家桶api,首次實現了辦公場景下的多任務協同。
manus的核心突破在於重新定義了"通用型ai agent"的產品形態。與傳統生成式ai不同,它實現了從"思考"到"行動"的跨越式進化:當用戶提出"規劃日本深度游"需求時,系統會自主分解任務、調用機票比價api、分析簽證政策、生成行程文檔,甚至完成酒店預訂的全流程操作24。這種端到端的執行閉環,使其在gaia基準測試中準確率超越openai同類產品,創造了智能體領域的sota(當前最佳技術指標)。
值得關注的是,manus團隊選擇了一條與巨頭截然不同的技術路徑。通過整合claude、阿里千問等第三方大模型,結合自研任務規劃引擎和29個外部工具鏈,他們構建起一個"工程化編排優先"的開放架構。這種策略雖被質疑為"套殼",卻成功將ai agent的開發門檻降低到創業團隊可承受範圍。
2 基礎模型的普惠化:技術平權運動的開端
manus的成功揭示了一個重要趨勢:ai agent的核心競爭力正在從"自建模型"轉向"模型應用能力"。根據crunchbase數據,2024年全球ai初創公司融資中,72%流向了基於開源模型的應用開發,而直接投資基礎模型研發的比例降至18%。
基礎模型的開源化浪潮始於2022年meta開源的llama系列。通過apache 2.0協議,開發者可以自由使用、修改和商業化llama-2模型。這引發了一場"模型民主化"運動:中國團隊開發的moss模型通過gplv3協議開放訓練代碼,stability ai推出的stablelm採用creative commons協議,允許非商業用途免費使用。
這些開源模型的性能已逼近商業產品。根據hugging face的評測數據,微調後的llama-3-70b在數學推理任務上達到gpt-4的92%水平,而訓練成本僅為後者的1/15。初創公司可以通過hugging face hub直接調用預訓練模型,結合自身場景數據進行微調,將產品開發周期從18個月縮短至6個月。
這種技術普惠正在重塑行業格局。傳統巨頭的"數據壁壘"逐漸瓦解,初創公司通過垂直領域的數據積累形成差異化優勢。例如,教育類agentmathmaster利用10萬道數學題訓練專有知識庫,在解題速度上超越通用模型30%;醫療類agentmedgpt通過整合200萬份病例報告,在診斷準確率上達到專科醫生水平。
3 開源協議的蝴蝶效應:重構產業生態
開源協議的創新正在催生全新的商業模式。2024年,github copilot推出的"模型即服務"(model-as-a-service)平台,允許開發者按調用量付費使用微調後的模型。這種模式使小團隊能夠以每月200美元的成本啟動ai agent項目,而傳統自建模型的伺服器成本每月超過5萬美元。
不同開源協議的選擇直接影響產業分工。採用agplv3協議的模型要求二次開發者公開修改代碼,這推動了"模型開源社區+應用開發公司"的協作模式。例如,redpajama社區負責基礎模型迭代,第三方公司基於其代碼開發金融、法律等專業領域的agent。而採用商業許可的模型則催生了"模型供應商+解決方案商"的生態,如anthropic與salesforce合作開發crm專用agent。
插件生態的繁榮是開源協議帶來的另一變化。截至2025年2月,hugging face的插件市場已有超過1200個第三方工具,涵蓋電商比價、法律文書生成等垂直領域。初創公司可以通過組合不同插件快速構建複雜功能,而無需從頭開發api介面。這種模塊化開發模式將產品迭代周期從季度級縮短至周級。
4 新競爭格局下的生存法則
在這場技術民主化浪潮中,無論是巨頭還是初創公司都面臨著新的挑戰。對於傳統科技公司而言,其優勢正從"技術先發"轉向"場景滲透",微軟在manus發布一周內緊急推出2款ai agent,亞馬遜組建專項團隊應對自動化競爭。
初創公司的突圍之道在於"垂直領域深耕"。2024年成立的agentedu通過分析2000萬份學習數據,開發出個性化學習規劃系統,在k12教育市場獲得30萬付費用戶。其創始人李浩然表示:"我們不追求通用智能,而是專註解決具體場景的痛點。"這種"小而美"的策略正在成為行業主流。
開發者社區的作用被提升到前所未有的高度。manus的成功很大程度上得益於其開源的對話插件框架,吸引了超過1.2萬名開發者貢獻代碼。這種"用戶即開發者"的模式正在重塑產品開發邏輯,用戶不僅是消費者,更是產品進化的參與者。
5 寫在最後
隨著基礎模型性能的持續提升和開源生態的完善,ai agent的應用場景正在呈現指數級擴展。在教育領域,虛擬教師可以根據學生的認知風格提供個性化輔導;在醫療領域,健康管家能夠實時監測體征數據並提供預警;在工業領域,智能助手可以協助工程師完成複雜的設計任務。
技術倫理問題也成為行業關注焦點。歐盟《人工智慧法案》要求所有商用agent必須通過可解釋性認證,而美國nist正在制定ai agent的安全標準。這些法規將推動行業建立透明的模型訓練和使用機制,確保技術發展與人類價值觀一致。
manus的爆火只是這場革命的序曲。當基礎模型的普惠性與開源創新形成合力,人工智慧將真正走出實驗室,成為每個人觸手可及的智能夥伴。這個過程不會一帆風順,但可以確定的是:未來的ai agent戰場,屬於所有敢於創新的參與者。