智能化运维(AIOps):人工智能技术(如机器学习等)和数据科学在IT运营问题上的应用,用于增强和部分替代主要的IT运营功能。根据 Gartner 阐释,AIOps通过松耦合、可扩展方式去提取和分析数据量、种类和速度这三个维度不断增长的IT数据,进而为IT运维管理产品提供支撑。在新技术的促进下,AIOps成为未来运维发展的趋势,是企业级 DevOps 在运维(技术运营)侧的高阶实现。
2022年10月28日,中国信息通信研究院隆重公布了 DevOps 系列标准及 AIOps 系列标准最新批次评估结果。
中国移动云能力中心(以下简称“移动云”)本次参评的项目为移动云智维平台,该项目顺利通过由中国信息通信研究院(以下简称”信通院“)开展的《云计算智能化运维(AIOps)能力成熟度 第2部分:系统和工具技术要求》评估,其异常检测模块顺利通过全面级评估。代表着移动云的智能化运维水平达到行业AIOPS L2级,达到了国内领先水平。
评估单位:中国信息通信研究院
中国信息通信研究院云计算与大数据研究所副所长魏凯公布评估结果:

此次,我们采访了中国移动云能力中心SRE部/安全部朱文鹏副总经理(主持工作),一同深聊团队在项目参与评估时的细节和故事,分享中国移动云能力中心 AIOps 实践的经验。
- Q&A -

中国移动云能力中心SRE部
安全部朱文鹏副总经理
Q:老师您好,请介绍一下您和您的企业,以及此次参与评估的项目。
朱文鹏:中国移动云能力中心(注册名称:中移(苏州)软件技术有限公司)是中国移动旗下全资子公司,立足苏州,业务范围辐射全国,聚焦移动云业务发展,承担起移动云的研发、运营、支撑一体化职责,以“云设施构建者、云服务提供者、云生态汇聚者”为定位,抢抓云业务发展的巨大市场空间,业务覆盖云计算行业全产业链,为政务、医疗、教育、交通、制造、金融等行业提供云主机、云服务器、云空间、CDN、云硬盘、云数据库等云计算服务,专注于场景制定行业解决方案。
本次参与评估的项目是关于“移动云智维平台”在智能化运维(AIOps)能力成熟度模型第2部分:系统和工具技术要求中的异常检测场景的评估,依托运维数据及AI算法,推进移动云运维数字化转型,保障业务连续性,提升整体效能。
Q:恭喜您通过信通院智能化运维(AIOps)能力成熟度标准的评估,您的感受是怎样的?
朱文鹏:AIOPS是运维发展的趋势,“智能化运维能力成熟度标准”提出了关于企业建设智能化运维能力的标准实施路径,规范并促进了国内智能运维的发展和应用,能有效加快我们企业在运维领域的数字化转型步伐。
此次通过 AIOps 能力成熟度标准的正式评估,对于中国移动云能力中心本身智能化运维能力的建设是一种肯定:一方面,加强了我们同行业内专家的技术交流;另一方面,也为我们在智能化运维方面能力的提升提供了指引。
Q:贵单位参与本次AIOps能力成熟度标准的评估,请问企业有哪些考量?
朱文鹏:我们希望通过对移动云智维平台AIOps能力的评估,找出我们与“标准”的差异,了解自身AIOps的发展现状,发现问题和不足,查漏补缺,实现“以评促建、以评促改、以评促管、以评促发展”。同时,通过评估,能够对比行业内在AIOps领域的优秀实践,向标杆学习,取长补短,共同进步。
Q:通过AIOps能力成熟度标准的评估带给企业和团队哪些变化?
朱文鹏:通过此次系统化、全面化的评估:一方面,有效验证了我们当前的设计理念是契合业界发展方向的,项目团队沉淀了打造符合业界标准的智能化运维平台的经验实践,为移动云智维平台的下一步演进提供了参考和指引。同时相关经验可以推广复制到公司内的其他项目团队。另一方面,通过本次的评估,也让我们团队成员的能力获得了较大提升,让团队人员对智能化运维有了更量化、更清晰的认识,团队成员的信心更足了。
Q:对于AIOps工作的开展,下一步计划有几方面?
朱文鹏:此次评估通过的“异常检测”场景,属于智能化运维L2级的单场景能力应用,依托于AIOps能力成熟度的标准,我们同步还建设了动态基线、容量预测、根因分析等场景能力,下一步我们将持续夯实几个智能运维场景在现网的应用,同时探索高级智能化能力,不断挖掘AIOps在移动云日常运维的应用场景,并推进运维场景之间的串联应用,以用促建,探索运维智能化L3级能力,提升移动云运行维护能力及效率。
Q:对于AIOps的未来发展方向,您有何看法?
朱文鹏:目前大部分应用场景处在传统云服务的故障诊断和资源运营领域,对于未来算力网络的发展和运维体系暂时没有通用的解决方案,移动云SRE团队希望和业界友商、研究机构加强合作,共同探讨和实践,形成能够支撑算力网络未来发展的AIOps运维体系。
AIOps 智能运维平台项目评估现场图:


AIOps 智维平台项目介绍:


智能化运维(AIOps)能力成熟度模型介绍:
《智能化运维AIOps能力成熟度模型》系列标准由中国信息通信研究院牵头,云计算开源产业联盟、高效运维社区、BATJ等顶级互联网公司以及各大金融、通信企业共同制定的国内外首个智能运维(AIOps)国际标准,并在国际电信联盟第十三研究组 ITU-T SG13 成功立项!
目前,基于《云计算智能化运维(AIOps)能力成熟度模型第2部分:系统和工具技术要求》首批试评估已开放质量部分的4个模块:异常检测、故障预测、告警收敛、根因分析。企业可根据自身情况任选一项或多项进行参与。



AIOps 标准评估相关事宜,请联系:
中国信息通信研究院@尚梦宸
电话:132 6108 1232
高效运维社区@魏焕新
电话:18500255645(同微信)
本文转自中国信通院CAICT数字化治理公众号:
燃!中国移动云能力中心通过 AIOps 系统和工具技术要求全面级评估,相关能力达到国内领先水平!