告别算力浪费!MIT新技术让AI自己“调预算”,小模型逆袭大模型

2025年12月11日23:33:09 科技 1443

告别算力浪费!MIT新技术让AI自己“调预算”,小模型逆袭大模型 - 天天要闻

文 | 钱钱

编辑 | 阿景


在人工智能领域,算力即是货币。

告别算力浪费!MIT新技术让AI自己“调预算”,小模型逆袭大模型 - 天天要闻

12月4日,NeurIPS会议现场,MIT团队扔出个“炸弹”他们研发的“实例自适应扩展”技术,让AI处理任务时算力消耗直接砍半,准确率还没降。

这事儿在AI圈炸了锅,毕竟现在算力这东西,比咱们钱包里的票子还金贵。

为啥这技术这么让人激动?得先说说以前AI是咋“花钱”的。

就像咱们上学时做数学题,不管题目难易,老师都给固定时间,简单的题半小时做完干等着,难的题时间到了还没思路。

告别算力浪费!MIT新技术让AI自己“调预算”,小模型逆袭大模型 - 天天要闻

AI处理任务也一样,不管是小学生都会的“1+1”,还是数学家都头疼的哥德巴赫猜想,分配的算力都差不多,这不纯纯浪费嘛。

传统算力分配的“自助餐困境”

以前AI处理任务就像咱们吃自助餐,不管饿不饿先把盘子堆满。

告别算力浪费!MIT新技术让AI自己“调预算”,小模型逆袭大模型 - 天天要闻

简单任务用了太多算力,就像胃小的人硬塞一大盘烤肉,撑得难受还浪费,复杂任务算力不够,又像大胃王只分到一小碗米饭,根本不够塞牙缝。

去年OpenAI搞GPT-5.1测试时,就因为推理成本太高,服务器天天“加班”,实时响应速度慢得像蜗牛爬,这就是算力分配不合理闹的。

行业里管这叫“算力刚性陷阱”。

告别算力浪费!MIT新技术让AI自己“调预算”,小模型逆袭大模型 - 天天要闻

你想啊,企业为了保证AI响应速度,只能多买服务器、多租算力,成本蹭蹭涨。

IBM的AI总监阿卡什·斯里瓦斯塔瓦之前就吐槽,“现在生成式AI像个吞金兽,算力成本占了运营支出的三成还多”,这话道出了多少企业的心声。

为了破这个局,以前也不是没人想办法。

告别算力浪费!MIT新技术让AI自己“调预算”,小模型逆袭大模型 - 天天要闻

过程奖励模型,也就是PRM,本来是想当“任务导航仪”,告诉AI“这步该用多少算力”。

但早期的PRM有点像刚拿到驾照的新手,自信心爆棚,不管路况多复杂都敢踩油门,结果经常“翻车”明明算错了还觉得自己对得很,这就是所谓的“过度自信”。

告别算力浪费!MIT新技术让AI自己“调预算”,小模型逆袭大模型 - 天天要闻

朴永进团队之前研究就发现,传统PRM对答案的正确率预估,误差能差出30%,相当于说“这次考试能考90分”,结果只考了60分,你说坑不坑。

让AI学会“量体裁衣”的校准魔法

MIT团队这次就抓着“过度自信”这个毛病下手。

他们给PRM加了个“诚实校准器”,就像给导航仪装了个“路况雷达”。

告别算力浪费!MIT新技术让AI自己“调预算”,小模型逆袭大模型 - 天天要闻

以前PRM说“这条路100%能到”,现在会说“这条路有60%-80%的可能到,旁边那条路有50%-70%,要不咱都看看?”。

这么一来,AI就不会死磕一条错路,而是根据实际情况调整算力分配,该省的省,该花的花。

这个“诚实校准器”到底咋工作的?打个比方,以前AI做选择题,看完A选项就说“选A,肯定对”,根本不看BCD。

现在它会说“A有可能对(概率40%),C也有可能(概率50%),我再花点算力看看C的细节”。

告别算力浪费!MIT新技术让AI自己“调预算”,小模型逆袭大模型 - 天天要闻

通过给每个选项标上概率区间,AI就能动态调整注意力,避免在错误选项上浪费算力,也不会漏掉正确选项。

效果咋样?他们拿数学推理题做实验,结果吓一跳。

以前需要100单位算力的题,现在50单位就搞定了,答案正确率还跟原来一样。

告别算力浪费!MIT新技术让AI自己“调预算”,小模型逆袭大模型 - 天天要闻

更绝的是,有些小模型用上这技术,居然比那些顶配大模型表现还好。

这就像开经济型轿车,装了个顶级导航,愣是跑赢了跑车,你说气人不?有个教授看完实验数据说,“这相当于让AI从‘闭着眼睛花钱’变成了‘拿着算盘花钱’,每一分算力都花在刀刃上”。

这技术要是铺开,AI圈怕是要变天。

告别算力浪费!MIT新技术让AI自己“调预算”,小模型逆袭大模型 - 天天要闻

现在OpenAI搞GPT-5.1,算力成本高得吓人,服务器天天累得“喘粗气”。

要是用上“实例自适应扩展”,相当于给服务器“减了半个人的工作量”,既能省钱又能提速。

那些以前用不起大模型的中小企业,现在用小模型配这技术,也能享受到高质量AI服务,这不就是“算力民主化”嘛。

往具体场景说,代码生成领域最先受益。

告别算力浪费!MIT新技术让AI自己“调预算”,小模型逆袭大模型 - 天天要闻

写代码时,简单的“打印HelloWorld”和复杂的“分布式系统架构”,算力需求差着十万八千里。

有了这技术,AI写简单代码时飞快出结果,写复杂代码时多花点算力琢磨,程序员再也不用等AI“磨洋工”了。

自主智能体规划也一样,比如机器人送餐,遇到空桌子和遇到挤满人的桌子,需要的算力肯定不同,动态分配就能避免“空桌子时算力过剩,挤桌子时算力不足”的尴尬。

告别算力浪费!MIT新技术让AI自己“调预算”,小模型逆袭大模型 - 天天要闻

往远了说,这技术不光是省算力,更重要的是让AI开始“认识自己”。

以前AI就是个执行命令的机器,现在学会了“我哪行哪不行”,遇到不会的题知道“多想想办法”,遇到简单的题知道“快点做完省点劲儿”。

这种“自省”能力,说不定就是AI从“工具”变成“伙伴”的第一步。

搞不清大家发现没有,这几年AI发展老是被算力“卡脖子”。

告别算力浪费!MIT新技术让AI自己“调预算”,小模型逆袭大模型 - 天天要闻

不是模型不够聪明,是算力不够用,就像给博尔特绑着沙袋跑步,再厉害也跑不快。

MIT这技术相当于解开了沙袋,让AI能根据自己的“体力”分配能量,跑得又快又省力。

如此看来,“实例自适应扩展”技术不光是省了点算力,更可能是AI发展的一个“拐弯点”。

以前咱们总说“算力即是货币”,现在AI学会了“精打细算”,这“货币”的购买力自然就上去了。

告别算力浪费!MIT新技术让AI自己“调预算”,小模型逆袭大模型 - 天天要闻

未来会不会出现“算力银行”,AI自己管理“算力账户”,该存的存,该花的花?谁知道呢,但至少现在,咱们看到了让AI更聪明、更省钱的希望。

毕竟,在人工智能领域,算力就是货币,能让每一分算力都花在刀刃上的技术,才是真的“会赚钱”的技术。

MIT这次的突破,说不定就是AI从“月光族”变成“理财高手”的开始,你觉得呢?

科技分类资讯推荐

引领科技豪华MPV新风尚 第二代腾势D9西安车展亮相 - 天天要闻

引领科技豪华MPV新风尚 第二代腾势D9西安车展亮相

兼具宜商气度与家用温情的科技豪华旗舰MPV,第二代腾势D9迎来西安地区正式亮相。新车依托全球新能源MPV冠军底蕴,以第二代刀片电池、双阀云辇-C、天神之眼5.0智驾等核心技术全面升级,兼顾商务体面与家庭舒适,为西北高端用户带来一站式全能出行解决方案。
采购禁入!科华数据材料造假被拒门外 - 天天要闻

采购禁入!科华数据材料造假被拒门外

本报(chinatimes.net.cn)记者胡雅文 北京报道这家赶上AI算力风口的公司,因投标材料造假,被相关采购方列入禁入名单两年,其此前提出的复议申请也被正式驳回。相关采购平台近日发布公告,明确驳回科华数据股份有限公司(下称“科华数据”,002335.SZ)此前提交的复议申请。早在一年前,科华数据已被认定在“信息通信枢纽...
快评乐道L80:15万元级买大五座,这波值得冲? - 天天要闻

快评乐道L80:15万元级买大五座,这波值得冲?

日前,乐道L80正式发布并开启预售,其整车购买预售价为24.58万元起,租电购买预售价则低至15.98万元起。面对大型SUV市场“细分再细分”之竞争趋势,这款乐道年度重磅新车都有哪些优势?又能否成为“大五座SUV革新之作”?下面,圈哥就带大家全方位感受。
成都直击凯威德:纯电全尺寸SUV的张扬与大气 - 天天要闻

成都直击凯威德:纯电全尺寸SUV的张扬与大气

4月22日,凯迪拉克以奥斯卡级盛典规格,将上海保利大剧院点亮为璀璨舞台,在品牌代言人倪妮与全场嘉宾的共同见证下,凯迪拉克全尺寸纯电公路旗舰——凯威德耀然上市。新车共推出长续航四驱Pro、高性能四驱Ultra两款配置,官方售价区间为46.88万-50.88万元。