告別算力浪費!MIT新技術讓AI自己「調預算」,小模型逆襲大模型

2025年12月11日23:33:09 科技 1443

告別算力浪費!MIT新技術讓AI自己「調預算」,小模型逆襲大模型 - 天天要聞

文 | 錢錢

編輯 | 阿景


在人工智慧領域,算力即是貨幣。

告別算力浪費!MIT新技術讓AI自己「調預算」,小模型逆襲大模型 - 天天要聞

12月4日,NeurIPS會議現場,MIT團隊扔出個「炸彈」他們研發的「實例自適應擴展」技術,讓AI處理任務時算力消耗直接砍半,準確率還沒降。

這事兒在AI圈炸了鍋,畢竟現在算力這東西,比咱們錢包里的票子還金貴。

為啥這技術這麼讓人激動?得先說說以前AI是咋「花錢」的。

就像咱們上學時做數學題,不管題目難易,老師都給固定時間,簡單的題半小時做完乾等著,難的題時間到了還沒思路。

告別算力浪費!MIT新技術讓AI自己「調預算」,小模型逆襲大模型 - 天天要聞

AI處理任務也一樣,不管是小學生都會的「1+1」,還是數學家都頭疼的哥德巴赫猜想,分配的算力都差不多,這不純純浪費嘛。

傳統算力分配的「自助餐困境」

以前AI處理任務就像咱們吃自助餐,不管餓不餓先把盤子堆滿。

告別算力浪費!MIT新技術讓AI自己「調預算」,小模型逆襲大模型 - 天天要聞

簡單任務用了太多算力,就像胃小的人硬塞一大盤烤肉,撐得難受還浪費,複雜任務算力不夠,又像大胃王只分到一小碗米飯,根本不夠塞牙縫。

去年OpenAI搞GPT-5.1測試時,就因為推理成本太高,伺服器天天「加班」,實時響應速度慢得像蝸牛爬,這就是算力分配不合理鬧的。

行業里管這叫「算力剛性陷阱」。

告別算力浪費!MIT新技術讓AI自己「調預算」,小模型逆襲大模型 - 天天要聞

你想啊,企業為了保證AI響應速度,只能多買伺服器、多租算力,成本蹭蹭漲。

IBM的AI總監阿卡什·斯里瓦斯塔瓦之前就吐槽,「現在生成式AI像個吞金獸,算力成本佔了運營支出的三成還多」,這話道出了多少企業的心聲。

為了破這個局,以前也不是沒人想辦法。

告別算力浪費!MIT新技術讓AI自己「調預算」,小模型逆襲大模型 - 天天要聞

過程獎勵模型,也就是PRM,本來是想當「任務導航儀」,告訴AI「這步該用多少算力」。

但早期的PRM有點像剛拿到駕照的新手,自信心爆棚,不管路況多複雜都敢踩油門,結果經常「翻車」明明算錯了還覺得自己對得很,這就是所謂的「過度自信」。

告別算力浪費!MIT新技術讓AI自己「調預算」,小模型逆襲大模型 - 天天要聞

朴永進團隊之前研究就發現,傳統PRM對答案的正確率預估,誤差能差出30%,相當於說「這次考試能考90分」,結果只考了60分,你說坑不坑。

讓AI學會「量體裁衣」的校準魔法

MIT團隊這次就抓著「過度自信」這個毛病下手。

他們給PRM加了個「誠實校準器」,就像給導航儀裝了個「路況雷達」。

告別算力浪費!MIT新技術讓AI自己「調預算」,小模型逆襲大模型 - 天天要聞

以前PRM說「這條路100%能到」,現在會說「這條路有60%-80%的可能到,旁邊那條路有50%-70%,要不咱都看看?」。

這麼一來,AI就不會死磕一條錯路,而是根據實際情況調整算力分配,該省的省,該花的花。

這個「誠實校準器」到底咋工作的?打個比方,以前AI做選擇題,看完A選項就說「選A,肯定對」,根本不看BCD。

現在它會說「A有可能對(概率40%),C也有可能(概率50%),我再花點算力看看C的細節」。

告別算力浪費!MIT新技術讓AI自己「調預算」,小模型逆襲大模型 - 天天要聞

通過給每個選項標上概率區間,AI就能動態調整注意力,避免在錯誤選項上浪費算力,也不會漏掉正確選項。

效果咋樣?他們拿數學推理題做實驗,結果嚇一跳。

以前需要100單位算力的題,現在50單位就搞定了,答案正確率還跟原來一樣。

告別算力浪費!MIT新技術讓AI自己「調預算」,小模型逆襲大模型 - 天天要聞

更絕的是,有些小模型用上這技術,居然比那些頂配大模型表現還好。

這就像開經濟型轎車,裝了個頂級導航,愣是跑贏了跑車,你說氣人不?有個教授看完實驗數據說,「這相當於讓AI從『閉著眼睛花錢』變成了『拿著算盤花錢』,每一分算力都花在刀刃上」。

這技術要是鋪開,AI圈怕是要變天。

告別算力浪費!MIT新技術讓AI自己「調預算」,小模型逆襲大模型 - 天天要聞

現在OpenAI搞GPT-5.1,算力成本高得嚇人,伺服器天天累得「喘粗氣」。

要是用上「實例自適應擴展」,相當於給伺服器「減了半個人的工作量」,既能省錢又能提速。

那些以前用不起大模型的中小企業,現在用小模型配這技術,也能享受到高質量AI服務,這不就是「算力民主化」嘛。

往具體場景說,代碼生成領域最先受益。

告別算力浪費!MIT新技術讓AI自己「調預算」,小模型逆襲大模型 - 天天要聞

寫代碼時,簡單的「列印HelloWorld」和複雜的「分散式系統架構」,算力需求差著十萬八千里。

有了這技術,AI寫簡單代碼時飛快出結果,寫複雜代碼時多花點算力琢磨,程序員再也不用等AI「磨洋工」了。

自主智能體規劃也一樣,比如機器人送餐,遇到空桌子和遇到擠滿人的桌子,需要的算力肯定不同,動態分配就能避免「空桌子時算力過剩,擠桌子時算力不足」的尷尬。

告別算力浪費!MIT新技術讓AI自己「調預算」,小模型逆襲大模型 - 天天要聞

往遠了說,這技術不光是省算力,更重要的是讓AI開始「認識自己」。

以前AI就是個執行命令的機器,現在學會了「我哪行哪不行」,遇到不會的題知道「多想想辦法」,遇到簡單的題知道「快點做完省點勁兒」。

這種「自省」能力,說不定就是AI從「工具」變成「夥伴」的第一步。

搞不清大家發現沒有,這幾年AI發展老是被算力「卡脖子」。

告別算力浪費!MIT新技術讓AI自己「調預算」,小模型逆襲大模型 - 天天要聞

不是模型不夠聰明,是算力不夠用,就像給博爾特綁著沙袋跑步,再厲害也跑不快。

MIT這技術相當於解開了沙袋,讓AI能根據自己的「體力」分配能量,跑得又快又省力。

如此看來,「實例自適應擴展」技術不光是省了點算力,更可能是AI發展的一個「拐彎點」。

以前咱們總說「算力即是貨幣」,現在AI學會了「精打細算」,這「貨幣」的購買力自然就上去了。

告別算力浪費!MIT新技術讓AI自己「調預算」,小模型逆襲大模型 - 天天要聞

未來會不會出現「算力銀行」,AI自己管理「算力賬戶」,該存的存,該花的花?誰知道呢,但至少現在,咱們看到了讓AI更聰明、更省錢的希望。

畢竟,在人工智慧領域,算力就是貨幣,能讓每一分算力都花在刀刃上的技術,才是真的「會賺錢」的技術。

MIT這次的突破,說不定就是AI從「月光族」變成「理財高手」的開始,你覺得呢?

科技分類資訊推薦

引領科技豪華MPV新風尚 第二代騰勢D9西安車展亮相 - 天天要聞

引領科技豪華MPV新風尚 第二代騰勢D9西安車展亮相

兼具宜商氣度與家用溫情的科技豪華旗艦MPV,第二代騰勢D9迎來西安地區正式亮相。新車依託全球新能源MPV冠軍底蘊,以第二代刀片電池、雙閥雲輦-C、天神之眼5.0智駕等核心技術全面升級,兼顧商務體面與家庭舒適,為西北高端用戶帶來一站式全能出行解決方案。
採購禁入!科華數據材料造假被拒門外 - 天天要聞

採購禁入!科華數據材料造假被拒門外

本報(chinatimes.net.cn)記者胡雅文 北京報道這家趕上AI算力風口的公司,因投標材料造假,被相關採購方列入禁入名單兩年,其此前提出的複議申請也被正式駁回。相關採購平台近日發布公告,明確駁回科華數據股份有限公司(下稱「科華數據」,002335.SZ)此前提交的複議申請。早在一年前,科華數據已被認定在「信息通信樞紐...
快評樂道L80:15萬元級買大五座,這波值得沖? - 天天要聞

快評樂道L80:15萬元級買大五座,這波值得沖?

日前,樂道L80正式發布並開啟預售,其整車購買預售價為24.58萬元起,租電購買預售價則低至15.98萬元起。面對大型SUV市場「細分再細分」之競爭趨勢,這款樂道年度重磅新車都有哪些優勢?又能否成為「大五座SUV革新之作」?下面,圈哥就帶大家全方位感受。
成都直擊凱威德:純電全尺寸SUV的張揚與大氣 - 天天要聞

成都直擊凱威德:純電全尺寸SUV的張揚與大氣

4月22日,凱迪拉克以奧斯卡級盛典規格,將上海保利大劇院點亮為璀璨舞台,在品牌代言人倪妮與全場嘉賓的共同見證下,凱迪拉克全尺寸純電公路旗艦——凱威德耀然上市。新車共推出長續航四驅Pro、高性能四驅Ultra兩款配置,官方售價區間為46.88萬-50.88萬元。