大模型棋力飞涨,还会解说围棋,这条AGI之路可行!

2025年05月31日06:12:05 科学 1910
大模型棋力飞涨,还会解说围棋,这条AGI之路可行! - 天天要闻大模型棋力飞涨,还会解说围棋,这条AGI之路可行! - 天天要闻

棋类运动往往是人们了解人工智能突破的窗口,比如近30年前的“深蓝”计算机和近10年前的阿尔法狗AlphaGO)。最近,上海人工智能实验室的科研团队利用强化学习的方法,让大模型从不会下棋到突破专业围棋水平。据职业选手估算,目前这一名为“书生·思客”的大模型棋力在职业3-5段之间。

“大模型还首次打破了围棋思维‘黑盒’。”上海人工智能实验室青年科学家陈恺说。围棋是公认的复杂任务,一般来说任务越复杂,通过语料习得的可能性越低,这一突破为大模型处理复杂推理任务,进而解决科学发现等难题奠定了基础。

去年的世界人工智能大会上,上海人工智能实验室主任、首席科学家周伯文提出“通专融合”的大模型发展技术路线。那时,人们还很难理解其中深意,如今“通专融合”的里程碑已经到来——大模型可通过与环境的交互反馈,在专业任务上获得能力提升。

打破“黑盒”,像人脑一样下围棋

2016年,阿尔法狗击败围棋世界冠军李世石,刷新了公众对AI的认知。但以现在的眼光看,阿尔法狗更像是一个为围棋而生的专业模型,它眼中只有19乘19的棋盘,将所有算力用于思考下一步该落子在361个点位的哪一处,且整个思考过程完全处于“黑盒”。“阿尔法狗是以人不太能理解的方式在下棋,有时会下出‘天外飞仙’的棋步,但为何会出如此高招,当时难以解释。”陈恺说。

大模型棋力飞涨,还会解说围棋,这条AGI之路可行! - 天天要闻

大模型棋力飞涨,还会解说围棋,这条AGI之路可行! - 天天要闻

书生·思客应对李世石“神之一手”,语言风格风趣幽默。受访者提供

如果大模型能打破这个“黑盒”,就证明其推理能力又上一个新台阶。为持续提升大模型的推理能力,上海人工智能实验室青年研究员李林阳及团队以强化学习算法为大模型构造了一个“加速训练营”,让大模型像初学者一样探索如何下围棋。通过对评价建模,与大模型进行交互并提供反馈,从而使模型持续进化。

随着一次次训练,大模型棋力飞涨。“有一天,我们发现大模型的下棋成功率从30%提升到70%,由此我们观察到了‘智能涌现’,也就是人们常说的‘啊哈时刻’。”李林阳说。

经“加速训练营”强化后的大模型不仅棋力显著增强,还成功打破了围棋思维“黑盒”——在对弈时,它能科学、直观地“讲解”下棋思路,真正“像人脑一样下围棋”。大模型的“语言”风格还十分多样,当用户下了一步好棋,它会加油鼓励:“这步棋相当有力,可以说是‘以攻代守’的好手。”当用户局势不利时,它会化身“鸡汤大师”:“只要应对得当,胜负尚在未定之天。”

探索大模型推理能力提升新范式

围棋中有个术语叫做“试应手”,是指通过一步棋试探对方反应,为后续变化做准备。从某种意义来说,上海人工智能实验室的此次突破相当于提升大模型推理能力的“试应手”。在李林阳看来,这步“试应手”不在于研发一个会下棋的大模型,而在于让大模型通过与环境的交互获得能力提升,从而获得处理复杂事物的能力。

“这对解决其他领域的复杂问题非常有用,比如科学任务。”陈恺说,科学任务中的语料不仅数量稀少,而且收集困难,这也制约了科学垂类大模型的迭代。除下围棋外,“书生·思客”已在奥赛级数学、科学对象理解与推理、算法编程、棋类游戏、智力谜题等多个专业任务实现同步学习演进,并在多任务混合强化学习过程中出现智能“涌现时刻”。

当大模型具备了解决复杂问题的方法论,提出有价值的问题更显重要。下月,上海人工智能实验室将发起首届明珠湖会议,以“寻找定义AI未来的提问者”为目标,锁定一批影响科学与未来的前沿课题。

“有组织科研”推动“通专融合”落地

“当初步探索取得实质性进展后,我马上向实验室申请了人员和算力,在充足的人手和算力保障下,项目准确率很快达到90%以上。”李阳林说,2023年,他以实习生的身份加入实验室,如今已开始带领团队开展“通专融合”技术路径可行性的相关研究。

在上海人工智能实验室的技术愿景中,“通专融合”是通往通用人工智能(AGI)的战略路径。这一路径的关键在于同步提升深度推理与专业泛化能力,使模型不仅在广泛的复杂任务上表现出色,还能在特定领域中达到专业水平。

陈恺表示,上海人工智能实验室正以“有组织的科研”推动“通专融合”:一方面各团队有主线研究方向,可形成规模效应;另一方面,团队成员的专业研判有助于迅速把握技术趋势,快速形成创新成果。

在带队攻关书生·思客的项目中,李阳林感受到实验室的人才密度之高和科研资源之丰富。2022年以来,上海人工智能实验室携手十余所国内顶尖高校开展博士生联合培养项目,目前已有近800名本科生和研究生通过联培博士项目入选实验室,其中不乏AI细分专业领域的佼佼者。年轻人的不断加入和快速成长,正在推动更多“啊哈时刻”。

原标题:《大模型棋力飞涨,还会解说围棋,这条AGI之路可行!》

栏目主编:任荃 题图来源:本报资料图片

来源:作者:文汇报 沈湫莎

科学分类资讯推荐

热议 | 今年很罕见!又“卷”起来了? - 天天要闻

热议 | 今年很罕见!又“卷”起来了?

2025年6月1日,儿童节罕见“撞上”端午节假期(5月31日-6月2日),形成连续三天黄金档期,不少成年人在微博热搜榜单上欢呼“#端午遇六一四舍五入我儿童节放假#”,映衬着“谁还不是个宝宝”的潮流心态。#儿童节终于不用请假了##正大光明过六一#等词条也登上了微博词条。每年此时,围绕“六一”的话题,总像一场精准切割的“...
又一3D打印技术突破:多波长DLP光固化,实现可溶解支撑 - 天天要闻

又一3D打印技术突破:多波长DLP光固化,实现可溶解支撑

2025年5月31日,南极熊获悉,来自德克萨斯大学奥斯汀分校的研究人员开发了一种用于多波长数字光处理 (DLP) 3D 打印的新型树脂系统,能够使用可溶解支撑快速制造独立式和非组装式结构。多色 DLP系统结合了紫外光和可见光响应化学反应,可生产出具有不同溶解度特征的材料,从而显著简化了后处理流程。相关研究以题为“Multic...
今早读 | 多地网友看到不明飞行物,天文博主回应 - 天天要闻

今早读 | 多地网友看到不明飞行物,天文博主回应

■ 今日天气多云转阴微风,29到21℃■ 限行尾号不限行地铁6号线南翠屏站变身“童趣王国”为迎接第75个“六一”国际儿童节,天津轨道交通集团对地铁6号线南翠屏站进行全面升级改造,在延续“职业体验”“礼物互换”“宝贝信箱”等经典儿童友好服务的基础上,精心打造了“童趣”主题车站。该主题车站将于6月1日正式与公众见面...
江西仙女湖蛇岛有多可怕?科考队不顾反对勘探,被眼前一幕震撼 - 天天要闻

江西仙女湖蛇岛有多可怕?科考队不顾反对勘探,被眼前一幕震撼

“你说蛇岛?那地方不能去,真不能去。”王启文这话一出口,会议室里的空气就像顿了一下。坐在主位上的徐国超,五十出头,戴着一副老花镜,原本正低头翻着实验报告,听到“蛇岛”两个字,眉头皱了一下,但眼神却亮了。“哪儿?你再说一遍?”他抬起头。“江西
太阳系边缘惊现“流浪行星”,第九行星谜题添新证 - 天天要闻

太阳系边缘惊现“流浪行星”,第九行星谜题添新证

普林斯顿大学的科学家团队在太阳系边缘发现了一个特殊天体,它奇特的运行轨迹可能为神秘的“第九行星”理论提供关键证据。这个编号2017OF201的天体位于柯伊伯带外侧,其巨大的体积和极端的轨道特征在天文学界引起广泛关注。程思浩、李佳轩与杨毅达(音译)组成的普林斯顿研究小组,通过先进计算模型在浩渺星空中锁定了这个...
牛津科学家预警,蛞蝓状外星生命,可能来地球殖民掠夺 - 天天要闻

牛津科学家预警,蛞蝓状外星生命,可能来地球殖民掠夺

牛津大学著名生物学家蒂姆·库尔森教授发出警示:宇宙中可能存在形似《星球大战》中赫特人贾巴、臃肿迟缓的蛞蝓状外星生命,它们若造访地球,极可能怀有殖民掠夺的恶意。这位为多国政府提供过外星生命咨询的权威学者认为,人类必须严肃看待外星文明可能带来的生存威胁。库尔森教授在《欧洲杂志》撰文指出,基于宇宙物质构成...
实现“可穿戴”监测肿瘤患者“心”问题,中山医院牵头又一人工智能体落地转化 - 天天要闻

实现“可穿戴”监测肿瘤患者“心”问题,中山医院牵头又一人工智能体落地转化

生了肿瘤死于心脏,这样的临床病例并不少见。近日,复旦大学附属中山医院、上海中医药大学附属曙光医院、复旦大学附属肿瘤医院联合主办的第四期“免疫检查点抑制剂相关心血管不良反应临床诊疗学习班”传出消息:“肿瘤心脏病人工智能联合体”正式签约转化,未来将可实现可穿戴(如手环等),高危患者配戴后进行实时监测,第...
我国科研人员揭开钙钛矿光伏电池的“衰老密码” - 天天要闻

我国科研人员揭开钙钛矿光伏电池的“衰老密码”

记者从南京航空航天大学了解到,该校郭万林、赵晓明教授团队近日成功揭示钙钛矿光伏电池的老化机制,提出一套低成本延长电池寿命的解决方案,有望加快推动下一代光伏技术产业化。相关论文5月30日由国际主流学术期刊《科学》在线发表。
将消失76%!“拿什么拯救你,我们的冰川” - 天天要闻

将消失76%!“拿什么拯救你,我们的冰川”

据法新社报道,根据一项国际最新研究,如果全球变暖持续不受控制,全球四分之三以上的冰川将消失,这将加剧全球海平面上升,并危及数十亿人的水资源供应。△新加坡《联合早报》报道:5月28日,阿尔卑斯山脉位于瑞士境内的伯奇冰川发生崩塌,数以吨计的岩石