“智序”电力智能体测评体系发布 服务人工智能有序落地电网

近日,冀北电科院发布“智序”电力智能体测评体系,为人工智能在电力行业的有序落地筑牢根基,推动新型电力系统与智能电网建设迈向新高度。

电力智能体测评现场

随着国家“人工智能 +”行动推进,新型电力系统加速建设,智能体作为人工智能重要应用形态,正从实验探索迈向电网核心业务场景。然而,电力行业对安全性和可靠性要求极高,智能体参与运维、检修和辅助决策时,其行为可控性、决策稳定性及结果可信度成为关键问题。在此背景下,冀北电科院立足行业实际,打造“智序”电力智能体测评体系,面向智能体全生命周期构建系统化、工程化的测评方法,致力于以“可度量、可解释、可复现”的专业评估手段,为电力智能体实现“可用、好用、放心用”提供支撑。

“智序”测评体系聚焦智能体在真实业务流程中的整体表现,围绕感知理解、规划决策、执行控制、运行效率和安全可靠等关键能力,构建覆盖个测评大类,25个测评维度,62项典型测评任务的测评框架,避免仅凭模型性能或单点能力判断应用风险,更真实反映智能体在复杂电力场景下的运行状态和能力边界。

在体系构建过程中,“智序”严格对标国家及国际人工智能相关标准和技术规范,并结合电力行业高安全、高可靠运行的业务特性进行系统化设计,兼顾通用技术视角与行业适配需求。依托测评实践,电科院同步参与人工智能领域标准化工作,2025年参编多项国家标准,并牵头推进《电力智能体测评指标与方法》国家标准提案进入立项审查阶段,为“智序”测评体系的持续完善和推广应用提供了坚实的标准化支撑。

目前,“智序”已逐步在实际业务中接受检验。电科院围绕变电运维辅助决策等典型场景,对多类智能体开展测评工作,形成了完整的测评分析结果。此外,在第三方组织机构下,通过了“求索2.0”国家人工智能评测基准体系验证,成为国网公司内部首家通过该项测评的单位,充分体现了“智序”体系在技术先进性和行业引领方面的价值。

从行业视角看,“智序”电力智能体测评体系为智能体应用提供了一套可复用、可推广的测评范式,有助于统一能力认知、降低应用风险、提升人工智能应用的可控性和规范性,为后续开展规模化应用和行业协同奠定基础。

面向未来,冀北电科院将持续深化“智序”测评体系建设,推动其在更多电力业务场景中的实践应用,并加强与国家人工智能测评与标准体系的协同衔接,不断提升电力智能体应用的安全性、可靠性和工程成熟度,为新型电力系统和智能电网建设提供长期支撑。