AI安全的紅線在後退？Anthropic與OpenAI的安全承諾變味了

2026年02月27日21:00:27 財經 2721

曾被視作AI安全標杆的Anthropic，最近悄悄改寫了自己的核心承諾。

當地時間2月24日，Anthropic發布《負責任擴展政策》第三版（RSP 3.0），那條“模型觸及危險閾值就暫停訓練”的硬性紅線，從文件中徹底消失，取而代之的是“透明披露”的柔性框架。無獨有偶，OpenAI也在2024年度IRS表格中，刪掉了使命陳述里的“safely（安全地）”一詞。

兩家全球頂尖AI公司的默契動作，讓“AI安全”這個嚴肅話題，蒙上了一層商業博弈的陰影。

曾經高舉“安全優先”大旗的領航者，為何在此時集體鬆綁？這背後，是資本壓力、行業競爭與監管真空共同作用的結果，更折射出AI行業發展的深層困境。

Anthropic的轉變最具戲劇性。這家由前OpenAI核心成員創立的公司，成立初衷就是擔心AI失控，“安全”是它區別於其他玩家的核心招牌。2023年版RSP政策中，明確寫入“if-then”約束機制：若無法部署對應安全措施，就必須暫停訓練更強模型，相當於給自己上了一道不可逾越的安全鎖。

但在RSP 3.0中，這道鎖被換成了旋轉門。新框架以安全路線圖、風險報告和外部評審為核心，從“做不到就不許動”變成了“邊做邊說”。Anthropic給出的解釋是，AI安全級別越高，預設具體防護措施就越困難，模型能力是連續增長的，不存在清晰的紅線。

這個說法看似合理，卻無法解答外界的疑問：如果邊界本就模糊，為何當初要將其作為核心承諾？又為何偏偏在完成300億美元融資、估值升至3800億美元的節點修改？

答案，或許藏在商業競爭的現實里。

Anthropic首席科學家Jared Kaplan的一句話道破天機：“如果競爭對手飛速前進，我們單方面承諾暫停訓練沒有意義。”

如今的AI競賽早已不是幾家公司的博弈，開源社區、各國企業都在加速推進，沒有哪家願意為了安全主動放慢腳步。Anthropic曾設想由自己設立安全標準、帶動行業跟進，但現實是，多數公司的安全框架只是形式對標，而非實質約束。

OpenAI的動作同樣耐人尋味。其舊使命“構建安全的、造福全人類的通用人工智能”中，“safely”一詞是說服外界的最後防線——即便從非營利轉型為“封頂利潤公司”，仍堅守安全底線。但如今這個詞的消失，讓不少人擔憂：當估值沖向8300億美元，商業利益是否已凌駕於安全之上？

有人認為刪改一個副詞是小題大做，但在AI行業，這種表述變化絕非偶然。兩家公司的默契調整，本質上是在資本壓力下的理性選擇：暫停訓練意味着暫停產品迭代、商業落地和估值增長，這對於背負巨大市值預期的商業實體而言，代價過於沉重。

更現實的是，當前政治氣候對AI監管不友好，政府行動遲緩，企業不願單方面承擔安全成本，這種監管真空進一步放大了行業的焦慮。

Anthropic反覆強調，RSP 3.0不是放棄安全，而是換了更成熟的方式。確實，新版本保留了不少實質性安全機制，比如針對生化武器風險的ASL-3級別防護標準，通過輸入輸出分類器攔截濫用內容，這些都不是空洞的口號。但問題的核心在於，透明披露能否替代硬性約束？

答案顯然是否定的。

硬性約束是“鎖死選項”，無論壓力多大都無路可退；而透明披露依賴外部輿論和內部自律，當資本焦慮足夠強烈，這種約束很可能形同虛設。

2026年的AI行業，“安全”正逐漸變成一種公關語言——幾乎所有主流公司都有安全框架和負責任政策，但這些文件究竟是用來約束自己，還是用來安撫監管和公眾？

更令人擔憂的是，企業有權自行修改安全框架，安全承諾的邊界正在不斷移動。Anthropic最初的設想是，企業率先設立標準，推動行業自律，最終形成政府多邊協調機制。但這條路並未走通：監管跟不上技術和商業的變化，安全共識逐漸散開，競爭卻在持續加速，形成了“沒人願意踩剎車”的行業現狀。

在這個監管真空期，一個關鍵問題浮出水面：如果企業不再為自己設紅線，誰來設？AI技術的發展速度遠超想象，其潛在風險也在不斷升級，從協助生物武器研發到引發就業危機，都可能成為現實。僅靠企業自律和透明披露，顯然無法應對這些系統性風險。

我們不能簡單否定Anthropic和OpenAI的努力，它們內部仍有大量工程師在推進安全研究，RSP 3.0也保留了諸多實質性機制。但必須清醒地認識到，AI安全不能依賴企業的道德自覺，更需要制度性保障。

當行業競爭進入白熱化，資本回報的誘惑越來越大，只有建立統一的行業標準、完善的監管體系和有效的多邊協調機制，才能為AI發展劃定真正的紅線。

Anthropic和OpenAI的安全承諾調整，給整個行業敲響了警鐘。AI的終極目標是造福人類，而安全是實現這一目標的前提。如果為了追求速度和商業利益不斷後退安全底線，最終可能讓整個行業陷入信任危機。

當下最需要的，是政府、企業、科研機構的協同行動：儘快建立清晰的AI安全標準，完善監管政策，讓安全成本由全行業共同承擔，而非單個企業獨自扛下。

只有這樣，才能避免AI行業在“比誰更快”的競賽中失控，讓技術發展真正走上可持續的軌道。否則，當所有玩家都在加速，沒有剎車的賽道終將通向未知的危險。

【每日必看】陸A股開盤35分鐘成交額破兆 創史上最紀錄｜石破茂將成日首相 日經指數開盤一度暴跌180...