告別算力浪費！MIT新技術讓AI自己「調預算」，小模型逆襲大模型

2025年12月11日23:33:09 科技 1443

文 | 錢錢

編輯 | 阿景

在人工智慧領域，算力即是貨幣。

12月4日，NeurIPS會議現場，MIT團隊扔出個「炸彈」他們研發的「實例自適應擴展」技術，讓AI處理任務時算力消耗直接砍半，準確率還沒降。

這事兒在AI圈炸了鍋，畢竟現在算力這東西，比咱們錢包里的票子還金貴。

為啥這技術這麼讓人激動？得先說說以前AI是咋「花錢」的。

就像咱們上學時做數學題，不管題目難易，老師都給固定時間，簡單的題半小時做完乾等著，難的題時間到了還沒思路。

AI處理任務也一樣，不管是小學生都會的「1+1」，還是數學家都頭疼的哥德巴赫猜想，分配的算力都差不多，這不純純浪費嘛。

傳統算力分配的「自助餐困境」

以前AI處理任務就像咱們吃自助餐，不管餓不餓先把盤子堆滿。

簡單任務用了太多算力，就像胃小的人硬塞一大盤烤肉，撐得難受還浪費，複雜任務算力不夠，又像大胃王只分到一小碗米飯，根本不夠塞牙縫。

去年OpenAI搞GPT-5.1測試時，就因為推理成本太高，伺服器天天「加班」，實時響應速度慢得像蝸牛爬，這就是算力分配不合理鬧的。

行業里管這叫「算力剛性陷阱」。

你想啊，企業為了保證AI響應速度，只能多買伺服器、多租算力，成本蹭蹭漲。

IBM的AI總監阿卡什·斯里瓦斯塔瓦之前就吐槽，「現在生成式AI像個吞金獸，算力成本佔了運營支出的三成還多」，這話道出了多少企業的心聲。

為了破這個局，以前也不是沒人想辦法。

過程獎勵模型，也就是PRM，本來是想當「任務導航儀」，告訴AI「這步該用多少算力」。

但早期的PRM有點像剛拿到駕照的新手，自信心爆棚，不管路況多複雜都敢踩油門，結果經常「翻車」明明算錯了還覺得自己對得很，這就是所謂的「過度自信」。

朴永進團隊之前研究就發現，傳統PRM對答案的正確率預估，誤差能差出30%，相當於說「這次考試能考90分」，結果只考了60分，你說坑不坑。

讓AI學會「量體裁衣」的校準魔法

MIT團隊這次就抓著「過度自信」這個毛病下手。

他們給PRM加了個「誠實校準器」，就像給導航儀裝了個「路況雷達」。

以前PRM說「這條路100%能到」，現在會說「這條路有60%-80%的可能到，旁邊那條路有50%-70%，要不咱都看看？」。

這麼一來，AI就不會死磕一條錯路，而是根據實際情況調整算力分配，該省的省，該花的花。

這個「誠實校準器」到底咋工作的？打個比方，以前AI做選擇題，看完A選項就說「選A，肯定對」，根本不看BCD。

現在它會說「A有可能對（概率40%），C也有可能（概率50%），我再花點算力看看C的細節」。

通過給每個選項標上概率區間，AI就能動態調整注意力，避免在錯誤選項上浪費算力，也不會漏掉正確選項。

效果咋樣？他們拿數學推理題做實驗，結果嚇一跳。

以前需要100單位算力的題，現在50單位就搞定了，答案正確率還跟原來一樣。

更絕的是，有些小模型用上這技術，居然比那些頂配大模型表現還好。

這就像開經濟型轎車，裝了個頂級導航，愣是跑贏了跑車，你說氣人不？有個教授看完實驗數據說，「這相當於讓AI從『閉著眼睛花錢』變成了『拿著算盤花錢』，每一分算力都花在刀刃上」。

這技術要是鋪開，AI圈怕是要變天。

現在OpenAI搞GPT-5.1，算力成本高得嚇人，伺服器天天累得「喘粗氣」。

要是用上「實例自適應擴展」，相當於給伺服器「減了半個人的工作量」，既能省錢又能提速。

那些以前用不起大模型的中小企業，現在用小模型配這技術，也能享受到高質量AI服務，這不就是「算力民主化」嘛。

往具體場景說，代碼生成領域最先受益。

寫代碼時，簡單的「列印HelloWorld」和複雜的「分散式系統架構」，算力需求差著十萬八千里。

有了這技術，AI寫簡單代碼時飛快出結果，寫複雜代碼時多花點算力琢磨，程序員再也不用等AI「磨洋工」了。

自主智能體規劃也一樣，比如機器人送餐，遇到空桌子和遇到擠滿人的桌子，需要的算力肯定不同，動態分配就能避免「空桌子時算力過剩，擠桌子時算力不足」的尷尬。

往遠了說，這技術不光是省算力，更重要的是讓AI開始「認識自己」。

以前AI就是個執行命令的機器，現在學會了「我哪行哪不行」，遇到不會的題知道「多想想辦法」，遇到簡單的題知道「快點做完省點勁兒」。

這種「自省」能力，說不定就是AI從「工具」變成「夥伴」的第一步。

搞不清大家發現沒有，這幾年AI發展老是被算力「卡脖子」。

不是模型不夠聰明，是算力不夠用，就像給博爾特綁著沙袋跑步，再厲害也跑不快。

MIT這技術相當於解開了沙袋，讓AI能根據自己的「體力」分配能量，跑得又快又省力。

如此看來，「實例自適應擴展」技術不光是省了點算力，更可能是AI發展的一個「拐彎點」。

以前咱們總說「算力即是貨幣」，現在AI學會了「精打細算」，這「貨幣」的購買力自然就上去了。

未來會不會出現「算力銀行」，AI自己管理「算力賬戶」，該存的存，該花的花？誰知道呢，但至少現在，咱們看到了讓AI更聰明、更省錢的希望。

畢竟，在人工智慧領域，算力就是貨幣，能讓每一分算力都花在刀刃上的技術，才是真的「會賺錢」的技術。

MIT這次的突破，說不定就是AI從「月光族」變成「理財高手」的開始，你覺得呢？

科技

漲價壓不住、補貼夠不著，這個五一6000元以上機型難住手機經銷商

圖源：藍鯨科技記者拍攝藍鯨新聞5月3日訊(記者翟智超)按照往年慣例，五一勞動節是手機廠商集中促銷、衝量的關鍵節點，但今年這場例行的「節前大促」卻未能點燃消費熱情。 5月2日下....

05月03日 7401

AI能否超越人類？中南大學院士，走進武鋼三中，開講「硬核」AI課

4月29日，在武漢市武鋼三中的報告廳里，一場關於人工智慧的科普報告正在進行。台上，中國工程院院士、中南大學教授桂衛華以「大模型與工業應用」為題，為高一學生揭開AI大模型的神秘面紗。桂衛華，中國工程院院士，中南大學教授、博士生導師。

05月03日 1895

引領科技豪華MPV新風尚第二代騰勢D9西安車展亮相

兼具宜商氣度與家用溫情的科技豪華旗艦MPV，第二代騰勢D9迎來西安地區正式亮相。新車依託全球新能源MPV冠軍底蘊，以第二代刀片電池、雙閥雲輦-C、天神之眼5.0智駕等核心技術全面升級，兼顧商務體面與家庭舒適，為西北高端用戶帶來一站式全能出行解決方案。

05月03日 2042

採購禁入！科華數據材料造假被拒門外

本報（chinatimes.net.cn）記者胡雅文北京報道這家趕上AI算力風口的公司，因投標材料造假，被相關採購方列入禁入名單兩年，其此前提出的複議申請也被正式駁回。相關採購平台近日發布公告，明確駁回科華數據股份有限公司（下稱「科華數據」，002335.SZ）此前提交的複議申請。早在一年前，科華數據已被認定在「信息通信樞紐...

05月03日 9437