從聊天機器人到協作夥伴:AI智能體如何重塑企業工作

Scott White至今仍對人工智慧從新奇技術轉變為真正工作夥伴的速度感到驚嘆。僅僅一年多前,這位Anthropic公司Claude AI產品負責人目睹了早期AI編程工具甚至無法完成一行代碼的窘境。如今,儘管並非專業程序員,他卻能親自構建生產級軟體功能。

"我不再把我的工作看作是寫PRD(產品需求文檔)並試圖說服別人做某事,"White在VentureBeat年度企業AI峰會VB Transform 2025的爐邊談話中說道,"我現在首先考慮的是,能否在我們的測試伺服器上構建一個可行的原型,然後分享一個實際運行的演示。"

這一轉變代表著企業AI應用的更廣泛變革,從回答問題的簡單聊天機器人發展為能夠自主工作的複雜"智能體"系統。White的經歷為數百萬其他知識工作者可能面臨的未來提供了一個預覽。

從代碼補全到自主編程:AI的飛速演進

這種演進速度驚人。當White加入Anthropic時,公司的Claude 2模型只能處理基本的文本補全。Claude 3.5 Sonnet的發布使得創建完整應用程序成為可能,催生了Artifacts等功能,讓用戶能夠生成自定義界面。如今,Claude 4在SWE-bench編程基準測試中取得72.5%的分數,該模型已能充當White所說的"完全遠程的智能體軟體工程師"。

Anthropic最新的編程工具Claude Code能夠分析整個代碼庫、搜索互聯網API文檔、發起拉取請求、回應代碼審查評論并迭代解決方案——所有這些都能非同步工作數小時。White指出,Claude Code本身90%的代碼都是由AI系統編寫的。

"這是一個完整的後台智能體流程,六個月前這是不可能實現的,"White解釋道。

企業巨頭藉助AI智能體將工作時間從數周縮短至幾分鐘

這種影響遠遠超出了軟體開發領域。丹麥製藥巨頭諾和諾德將Claude集成到工作流程中,將原本需要10周才能完成的臨床報告縮短至10分鐘。GitLab將該技術用於從銷售提案到技術文檔的各個方面。Intuit部署Claude直接為消費者提供稅務建議。

White區分了AI集成的不同層次:回答問題的簡單語言模型、增強了網路搜索等工具的模型、將AI納入業務流程的結構化工作流,以及能夠使用多種工具和迭代推理自主追求目標的完整智能體。

"我認為智能體是有目標的系統,然後它可以做很多事情來實現那個目標,"White說道。關鍵推動因素是他所說的模型智能與新產品能力之間"不可阻擋"的關係。

基礎設施革命:構建AI協作者網路

一個關鍵的基礎設施發展是Anthropic的模型上下文協議(MCP),White將其描述為"集成的USB-C"。企業不再需要為每個數據源或工具建立單獨連接,MCP為AI系統訪問企業軟體(從Salesforce到內部知識庫)提供了標準化方式。

"這真正實現了數據訪問的民主化,"White說道,他指出一家公司構建的集成可以通過開源協議被其他公司共享和重用。

對於希望實施AI智能體的組織,White建議從小處著手,逐步構建。"不要試圖從零開始構建整個智能體系統,"他建議道,"構建其中的一個組件,確保該組件有效,然後構建下一個組件。"

他還強調了評估系統的重要性,以確保AI智能體按預期執行。"評估是新的PRD,"White說道,指的是產品需求文檔,強調了公司必須開發新方法來評估AI在特定業務任務上的表現。

從AI助手到AI組織:下一個勞動力前沿

展望未來,White設想AI開發將對非技術工作者變得可及,類似於編程能力的進步。他想像著一個未來,個人不僅管理一個AI智能體,而是管理整個專業化AI系統組織。

"每個人如何成為自己的迷你CPO(首席產品官)或CEO?"White問道,"我不確定這會是什麼樣子,但這就是我醒來後想要達到的目標。"

White描述的轉變反映了更廣泛的行業趨勢,企業正在努力應對AI不斷擴展的能力。雖然早期採用專註於實驗性用例,但企業正越來越多地將AI集成到核心業務流程中,從根本上改變了工作方式。

隨著AI智能體變得更加自主和強大,挑戰從教機器執行任務轉向管理能夠長時間獨立工作的AI協作者。對White而言,這個未來已經到來——一個生產功能接一個地實現著。