告别算力浪费！MIT新技术让AI自己“调预算”，小模型逆袭大模型

2025年12月11日23:33:09 科技 1443

文 | 钱钱

编辑 | 阿景

在人工智能领域，算力即是货币。

12月4日，NeurIPS会议现场，MIT团队扔出个“炸弹”他们研发的“实例自适应扩展”技术，让AI处理任务时算力消耗直接砍半，准确率还没降。

这事儿在AI圈炸了锅，毕竟现在算力这东西，比咱们钱包里的票子还金贵。

为啥这技术这么让人激动？得先说说以前AI是咋“花钱”的。

就像咱们上学时做数学题，不管题目难易，老师都给固定时间，简单的题半小时做完干等着，难的题时间到了还没思路。

AI处理任务也一样，不管是小学生都会的“1+1”，还是数学家都头疼的哥德巴赫猜想，分配的算力都差不多，这不纯纯浪费嘛。

传统算力分配的“自助餐困境”

以前AI处理任务就像咱们吃自助餐，不管饿不饿先把盘子堆满。

简单任务用了太多算力，就像胃小的人硬塞一大盘烤肉，撑得难受还浪费，复杂任务算力不够，又像大胃王只分到一小碗米饭，根本不够塞牙缝。

去年OpenAI搞GPT-5.1测试时，就因为推理成本太高，服务器天天“加班”，实时响应速度慢得像蜗牛爬，这就是算力分配不合理闹的。

行业里管这叫“算力刚性陷阱”。

你想啊，企业为了保证AI响应速度，只能多买服务器、多租算力，成本蹭蹭涨。

IBM的AI总监阿卡什·斯里瓦斯塔瓦之前就吐槽，“现在生成式AI像个吞金兽，算力成本占了运营支出的三成还多”，这话道出了多少企业的心声。

为了破这个局，以前也不是没人想办法。

过程奖励模型，也就是PRM，本来是想当“任务导航仪”，告诉AI“这步该用多少算力”。

但早期的PRM有点像刚拿到驾照的新手，自信心爆棚，不管路况多复杂都敢踩油门，结果经常“翻车”明明算错了还觉得自己对得很，这就是所谓的“过度自信”。

朴永进团队之前研究就发现，传统PRM对答案的正确率预估，误差能差出30%，相当于说“这次考试能考90分”，结果只考了60分，你说坑不坑。

让AI学会“量体裁衣”的校准魔法

MIT团队这次就抓着“过度自信”这个毛病下手。

他们给PRM加了个“诚实校准器”，就像给导航仪装了个“路况雷达”。

以前PRM说“这条路100%能到”，现在会说“这条路有60%-80%的可能到，旁边那条路有50%-70%，要不咱都看看？”。

这么一来，AI就不会死磕一条错路，而是根据实际情况调整算力分配，该省的省，该花的花。

这个“诚实校准器”到底咋工作的？打个比方，以前AI做选择题，看完A选项就说“选A，肯定对”，根本不看BCD。

现在它会说“A有可能对（概率40%），C也有可能（概率50%），我再花点算力看看C的细节”。

通过给每个选项标上概率区间，AI就能动态调整注意力，避免在错误选项上浪费算力，也不会漏掉正确选项。

效果咋样？他们拿数学推理题做实验，结果吓一跳。

以前需要100单位算力的题，现在50单位就搞定了，答案正确率还跟原来一样。

更绝的是，有些小模型用上这技术，居然比那些顶配大模型表现还好。

这就像开经济型轿车，装了个顶级导航，愣是跑赢了跑车，你说气人不？有个教授看完实验数据说，“这相当于让AI从‘闭着眼睛花钱’变成了‘拿着算盘花钱’，每一分算力都花在刀刃上”。

这技术要是铺开，AI圈怕是要变天。

现在OpenAI搞GPT-5.1，算力成本高得吓人，服务器天天累得“喘粗气”。

要是用上“实例自适应扩展”，相当于给服务器“减了半个人的工作量”，既能省钱又能提速。

那些以前用不起大模型的中小企业，现在用小模型配这技术，也能享受到高质量AI服务，这不就是“算力民主化”嘛。

往具体场景说，代码生成领域最先受益。

写代码时，简单的“打印HelloWorld”和复杂的“分布式系统架构”，算力需求差着十万八千里。

有了这技术，AI写简单代码时飞快出结果，写复杂代码时多花点算力琢磨，程序员再也不用等AI“磨洋工”了。

自主智能体规划也一样，比如机器人送餐，遇到空桌子和遇到挤满人的桌子，需要的算力肯定不同，动态分配就能避免“空桌子时算力过剩，挤桌子时算力不足”的尴尬。

往远了说，这技术不光是省算力，更重要的是让AI开始“认识自己”。

以前AI就是个执行命令的机器，现在学会了“我哪行哪不行”，遇到不会的题知道“多想想办法”，遇到简单的题知道“快点做完省点劲儿”。

这种“自省”能力，说不定就是AI从“工具”变成“伙伴”的第一步。

搞不清大家发现没有，这几年AI发展老是被算力“卡脖子”。

不是模型不够聪明，是算力不够用，就像给博尔特绑着沙袋跑步，再厉害也跑不快。

MIT这技术相当于解开了沙袋，让AI能根据自己的“体力”分配能量，跑得又快又省力。

如此看来，“实例自适应扩展”技术不光是省了点算力，更可能是AI发展的一个“拐弯点”。

以前咱们总说“算力即是货币”，现在AI学会了“精打细算”，这“货币”的购买力自然就上去了。

未来会不会出现“算力银行”，AI自己管理“算力账户”，该存的存，该花的花？谁知道呢，但至少现在，咱们看到了让AI更聪明、更省钱的希望。

毕竟，在人工智能领域，算力就是货币，能让每一分算力都花在刀刃上的技术，才是真的“会赚钱”的技术。

MIT这次的突破，说不定就是AI从“月光族”变成“理财高手”的开始，你觉得呢？

科技

涨价压不住、补贴够不着，这个五一6000元以上机型难住手机经销商

图源：蓝鲸科技记者拍摄蓝鲸新闻5月3日讯(记者翟智超)按照往年惯例，五一劳动节是手机厂商集中促销、冲量的关键节点，但今年这场例行的“节前大促”却未能点燃消费热情。 5月2日下....

05月03日 7401

AI能否超越人类？中南大学院士，走进武钢三中，开讲“硬核”AI课

4月29日，在武汉市武钢三中的报告厅里，一场关于人工智能的科普报告正在进行。台上，中国工程院院士、中南大学教授桂卫华以“大模型与工业应用”为题，为高一学生揭开AI大模型的神秘面纱。桂卫华，中国工程院院士，中南大学教授、博士生导师。

05月03日 1895

引领科技豪华MPV新风尚第二代腾势D9西安车展亮相

兼具宜商气度与家用温情的科技豪华旗舰MPV，第二代腾势D9迎来西安地区正式亮相。新车依托全球新能源MPV冠军底蕴，以第二代刀片电池、双阀云辇-C、天神之眼5.0智驾等核心技术全面升级，兼顾商务体面与家庭舒适，为西北高端用户带来一站式全能出行解决方案。

05月03日 2042

采购禁入！科华数据材料造假被拒门外

本报（chinatimes.net.cn）记者胡雅文北京报道这家赶上AI算力风口的公司，因投标材料造假，被相关采购方列入禁入名单两年，其此前提出的复议申请也被正式驳回。相关采购平台近日发布公告，明确驳回科华数据股份有限公司（下称“科华数据”，002335.SZ）此前提交的复议申请。早在一年前，科华数据已被认定在“信息通信枢纽...

05月03日 9437