智能化運維(AIOps):人工智慧技術(如機器學習等)和數據科學在IT運營問題上的應用,用於增強和部分替代主要的IT運營功能。根據 Gartner 闡釋,AIOps 通過松耦合、可擴展方式去提取和分析數據量、種類和速度這三個維度不斷增長的IT數據,進而為IT運維管理產品提供支撐。在新技術的促進下,AIOps 成為未來運維發展的趨勢,是企業級 DevOps 在運維(技術運營)側的高階實現。2022年12月26日,中國信息通信研究院隆重公布了智能化運維 AIOps 系列標準最新批次評估結果。
中國農業銀行股份有限公司(簡稱「中國農業銀行」)本次參評的項目為「一體化生產運維平台-數據分析平台(孔明)」項目,該項目順利通過中國信息通信研究院(以下簡稱「信通院」)開展的《雲計算智能化運維(AIOps)能力成熟度模型 第2部分:系統和工具技術要求》標準根因分析模塊優秀級評估。代表著中國農業銀行的 AIOps 相關能力達到國內領先水平。
本批次評估將於2023年1月6日中國信通院主辦的 「2022 GOLF+ IT新治理領導力論壇」上正式舉行授牌儀式。
此次,我們採訪了中國農業銀行研發中心副總經理蔡仕志先生和研發中心北研技術保障部處長賈磊先生,一同深聊團隊在項目參與評估時的細節和故事,分享中國農業銀行 AIOps 實踐的經驗。
- Q&A -

中國農業銀行
研發中心副總經理 蔡仕志
Q:老師您好,請介紹一下您和您的企業,以及此次參與評估的項目。
蔡仕志:農業銀行研發中心作為承載農業銀行信息化建設和金融科技創新重任的總行直屬部門,為農行各境內外分支機構及控股子公司,在零售銀行、公司銀行、投資銀行、基金管理、金融租賃、資產管理、人壽保險等多業務領域提供完善、可靠的金融交易支撐,為全球逾8億客戶提供高效穩健的金融交易服務。
AIOps運維數據分析平台是農行一體化生產運維體系的重要組成部分,是基於「以數據為基礎,以演算法為支撐,以場景為驅動」的AIOps智能運維理念,面向全行用戶打造的企業級運維數據分析平台。針對業務數字化轉型及架構分散式轉型背景下對運維工作帶來的挑戰和壓力,平台通過打造運維數據集市、構建運維分析引擎、推動智能運維場景落地等方式,以實際運維痛點問題為切入點,深挖運維數據價值,積極開展創新實踐,切實推動我行運維體系的智能化轉型。
Q:恭喜您通過信通院AIOps標準根因分析模塊評估,您的感受是怎樣的?
蔡仕志:智能運維是我們近2年運維工作轉型的一個重點方向,本次順利通過評估,既是對項目組工作成果的一個肯定,也為我們後續的優化和提升指明了方向,後續我們會繼續加大智能運維方面的支持和投入,推進 AIOps 能力在農行的進一步推廣和應用。
Q:貴單位參與本次AIOps標準根因分析模塊評估,請問企業有哪些考量?
蔡仕志:快速定位故障根因是保障業務連續性的關鍵,也是數據分析平台建設的重要目標之一。前期農行針對故障根因定位面臨的難點問題,通過構建系統運行健康度實時評估體系、構建AI智能根因定位模型等方式,完成智能根因分析功能建設,實現了對系統運行情況的快速定位。本次參與該模塊評估,一方面是驗證建設成果是否符合業界標準,另一方面也是想找找不足和差距,為下一步優化提升做準備。

中國農業銀行
研發中心北研技術保障部處長 賈磊
Q:通過 AIOps 標準根因分析模塊評估帶給企業和團隊哪些變化?
賈磊:本次順利通過 AIOps 能力成熟度標準的正式評估,一方面,是對農行智能運維建設成果的肯定,另一方面,通過與標準的對比,明確了平台當前存在的不足及後續可以提升的方向。同時,在這次評估過程中,通過對 AIOps 標準的學習以及與行業內專家的交流,我們的運維分析團隊也受益良多,吸收了很多先進理念,為團隊後續的優化方向提供了指引。
Q:對於 AIOps 工作的開展,下一步計劃有幾方面?
賈磊:農行將持續推動 AIOps 運維能力建設,一方面將 AIOps 能力向新技術棧推廣,全面提高雲平台、微服務等複雜分散式架構下的全鏈路監控、分析、定位、處置能力,另一方面將更加關注 AIOps 在業務連續性領域的應用,從業務視角進一步加強「監管控處析」能力建設,深入分析、全面聯動前後台各類運維運營數據,提前識別業務波動風險,實現早發現、早介入、早評估、早處理,保障系統穩定運行。
Q:對於 AIOps 的未來發展方向,您有何看法?
賈磊:主要有三個方面,首先,AIOps 逐漸在從單一化向體系化發展,從利用機器學習演算法實現特定場景向平台化、體系化發展,通過平台提供的數據服務能力、演算法服務能力及場景建設能力提供體系化智能運維服務;其次,AIOps 逐漸從被動響應到主動預防發展,在依然關注故障告警、異常檢測等傳統場景的同時,開始逐漸注重故障預測、風險發現等事前場景,注重提升風險的發現、溯源、管理及處置能力建設;最後,AIOps 的賦能領域將更加豐富,除了傳統的質量、效率類場景,為運維管理、安全管控等領域進行賦能也是 AIOps 的下一個重點方向。
項目評估現場圖:

項目展示


智能化運維(AIOps)能力成熟度模型介紹
《智能化運維AIOps能力成熟度模型》系列標準由中國信息通信研究院牽頭,雲計算開源產業聯盟、dbaplus社群、BATJ等頂級互聯網公司以及各大金融、通信企業共同制定的國內外首個智能運維(AIOps)國際標準,並在國際電信聯盟第十三研究組 ITU-T SG13 成功立項!
目前,基於《雲計算智能化運維(AIOps)能力成熟度模型第2部分:系統和工具技術要求》評估已開放8個模塊:異常檢測、故障預測、告警收斂、根因分析、故障自愈、故障預防、容量預測、知識庫構建。




dbaplus社群攜手中國信通院
驅動行業數字化升級
dbaplus社群作為中國信通院雲大所的戰略合作夥伴,將共同推動「智能化運維(AIOps)能力成熟度模型」系列標準的推廣與落地。此外,在《數據安全治理能力評估(DSG)》《分散式系統穩定性保障能力評估》《金融大數據能力模型(DataOps)》《數據管理能力成熟度評估模型(DCMM)》等標準的研製與落地上,dbaplus社群也將持續與中國信通院展開深入合作,攜手推動中國企業夯實數字化支撐能力,加速各行業數字化轉型。
關於「智能化運維(AIOps)能力成熟度模型」系列標準、智能化運維(AIOps)系統和工具評估等相關事宜,可聯繫:

本文部分內容源自:CAICT數字化治理
關於我們
dbaplus社群是圍繞Database、BigData、AIOps的企業級專業社群。資深大咖、技術乾貨,每天精品原創文章推送,每周線上技術分享,每月線下技術沙龍,每季度Gdevops&DAMS行業大會。
關注公眾號【dbaplus社群】,獲取更多原創技術文章和精選工具下載