
曾被視作AI安全標杆的Anthropic,最近悄悄改寫了自己的核心承諾。
當地時間2月24日,Anthropic發布《負責任擴展政策》第三版(RSP 3.0),那條“模型觸及危險閾值就暫停訓練”的硬性紅線,從文件中徹底消失,取而代之的是“透明披露”的柔性框架。無獨有偶,OpenAI也在2024年度IRS表格中,刪掉了使命陳述里的“safely(安全地)”一詞。
兩家全球頂尖AI公司的默契動作,讓“AI安全”這個嚴肅話題,蒙上了一層商業博弈的陰影。
曾經高舉“安全優先”大旗的領航者,為何在此時集體鬆綁?這背後,是資本壓力、行業競爭與監管真空共同作用的結果,更折射出AI行業發展的深層困境。
Anthropic的轉變最具戲劇性。這家由前OpenAI核心成員創立的公司,成立初衷就是擔心AI失控,“安全”是它區別於其他玩家的核心招牌。2023年版RSP政策中,明確寫入“if-then”約束機制:若無法部署對應安全措施,就必須暫停訓練更強模型,相當於給自己上了一道不可逾越的安全鎖。
但在RSP 3.0中,這道鎖被換成了旋轉門。新框架以安全路線圖、風險報告和外部評審為核心,從“做不到就不許動”變成了“邊做邊說”。Anthropic給出的解釋是,AI安全級別越高,預設具體防護措施就越困難,模型能力是連續增長的,不存在清晰的紅線。
這個說法看似合理,卻無法解答外界的疑問:如果邊界本就模糊,為何當初要將其作為核心承諾?又為何偏偏在完成300億美元融資、估值升至3800億美元的節點修改?
答案,或許藏在商業競爭的現實里。
Anthropic首席科學家Jared Kaplan的一句話道破天機:“如果競爭對手飛速前進,我們單方面承諾暫停訓練沒有意義。”
如今的AI競賽早已不是幾家公司的博弈,開源社區、各國企業都在加速推進,沒有哪家願意為了安全主動放慢腳步。Anthropic曾設想由自己設立安全標準、帶動行業跟進,但現實是,多數公司的安全框架只是形式對標,而非實質約束。
OpenAI的動作同樣耐人尋味。其舊使命“構建安全的、造福全人類的通用人工智能”中,“safely”一詞是說服外界的最後防線——即便從非營利轉型為“封頂利潤公司”,仍堅守安全底線。但如今這個詞的消失,讓不少人擔憂:當估值沖向8300億美元,商業利益是否已凌駕於安全之上?
有人認為刪改一個副詞是小題大做,但在AI行業,這種表述變化絕非偶然。兩家公司的默契調整,本質上是在資本壓力下的理性選擇:暫停訓練意味着暫停產品迭代、商業落地和估值增長,這對於背負巨大市值預期的商業實體而言,代價過於沉重。
更現實的是,當前政治氣候對AI監管不友好,政府行動遲緩,企業不願單方面承擔安全成本,這種監管真空進一步放大了行業的焦慮。
Anthropic反覆強調,RSP 3.0不是放棄安全,而是換了更成熟的方式。確實,新版本保留了不少實質性安全機制,比如針對生化武器風險的ASL-3級別防護標準,通過輸入輸出分類器攔截濫用內容,這些都不是空洞的口號。但問題的核心在於,透明披露能否替代硬性約束?
答案顯然是否定的。
硬性約束是“鎖死選項”,無論壓力多大都無路可退;而透明披露依賴外部輿論和內部自律,當資本焦慮足夠強烈,這種約束很可能形同虛設。
2026年的AI行業,“安全”正逐漸變成一種公關語言——幾乎所有主流公司都有安全框架和負責任政策,但這些文件究竟是用來約束自己,還是用來安撫監管和公眾?
更令人擔憂的是,企業有權自行修改安全框架,安全承諾的邊界正在不斷移動。Anthropic最初的設想是,企業率先設立標準,推動行業自律,最終形成政府多邊協調機制。但這條路並未走通:監管跟不上技術和商業的變化,安全共識逐漸散開,競爭卻在持續加速,形成了“沒人願意踩剎車”的行業現狀。
在這個監管真空期,一個關鍵問題浮出水面:如果企業不再為自己設紅線,誰來設?AI技術的發展速度遠超想象,其潛在風險也在不斷升級,從協助生物武器研發到引發就業危機,都可能成為現實。僅靠企業自律和透明披露,顯然無法應對這些系統性風險。
我們不能簡單否定Anthropic和OpenAI的努力,它們內部仍有大量工程師在推進安全研究,RSP 3.0也保留了諸多實質性機制。但必須清醒地認識到,AI安全不能依賴企業的道德自覺,更需要制度性保障。
當行業競爭進入白熱化,資本回報的誘惑越來越大,只有建立統一的行業標準、完善的監管體系和有效的多邊協調機制,才能為AI發展劃定真正的紅線。
Anthropic和OpenAI的安全承諾調整,給整個行業敲響了警鐘。AI的終極目標是造福人類,而安全是實現這一目標的前提。如果為了追求速度和商業利益不斷後退安全底線,最終可能讓整個行業陷入信任危機。
當下最需要的,是政府、企業、科研機構的協同行動:儘快建立清晰的AI安全標準,完善監管政策,讓安全成本由全行業共同承擔,而非單個企業獨自扛下。
只有這樣,才能避免AI行業在“比誰更快”的競賽中失控,讓技術發展真正走上可持續的軌道。否則,當所有玩家都在加速,沒有剎車的賽道終將通向未知的危險。