發布日期:2025-03-04 10:06:16
隨著數字化轉型的快速推進,廣發銀行深入落實創新驅動發展戰略,打造高效智能的行業云運維體系。本文介紹了廣發銀行如何通過技術創新與管理優化,構建高效、智能的行業云運維體系,并展示廣發銀行行業云在運維業務一體化、技術架構平臺化方面的建設成果,包括對象數字化、狀態數字化、服務行為數字化、操作行為自動化以及運營數字化等多項前沿實踐。
黨的二十大報告提出,要加快發展數字經濟,促進數字經濟和實體經濟深度融合。中國人民銀行《金融科技發展規劃(2022—2025年)》提出要健全金融科技治理體系,完善數字基礎設施,促進金融與科技更進一步的深度融合、持續發展。廣發銀行深入落實創新驅動發展戰略,以“轉型數字企業、構建數字生態、融入數字世界”為方向,打造“廣發銀行行業云”,賦能各類行業客戶融入新發展格局。
廣發銀行行業云是承載廣發行業賦能數字產品和生態合作應用的專有云平臺,已入駐數企通、數字工會、數字破產、數字幼兒園等多個數字產品,向行業客戶提供精準的金融服務、專業的行業服務、便捷的技術和數據服務。隨著行業創新業務的高速發展,對IT運維提出了新的挑戰。
隨著IT技術變革及數字化轉型快速推進,應用系統數量和規模大幅增長,傳統以項目或IT技術棧為劃分邏輯的IT運維方式,既無法適應業務快速發展要求,線性增長的運維成本在復雜云化環境和應用交互場景中也難以為繼,IT運維逐步向專業化、規范化、集約化管理發展。
金融業尤其是銀行業作為風險厭惡型企業,業務時效性、穩定性要求極高。同時作為國家數字化戰略的排頭兵行業,近年政策頻出,監管對于數字業務高度關注。同時,IT技術架構的發展與變化也是日新月異,開發運維一體化、敏捷交付、統一運維、智能運維等技術的成熟,對行業云運維未來發展也指明了方向。
為認真落實廣發銀行金融和行業云雙云驅動戰略部署安排,努力提升行業云一體化運維管理水平,構建“統一運維監控+集中配置管理+服務流程線上化+作業自動化+監控大屏統一展示”的廣發銀行行業云統一運維監控管理平臺,建設基于通用運維服務能力及通用運維服務場景的基礎技術支撐平臺,行業云將依托平臺能力,快捷、方便的搭建各類運維場景,快速提升行業云整體運維能力。
自動化運維、一體化運維、平臺+場景運維、數據化運維、運維智能化等技術的發展與成熟,能給運維質量和水平帶來飛躍的提升,適應金融信息化發展要求,迫切需要運維服務支撐系統向自動化、智能化方向邁進和發展。
01.運維業務一體化、技術架構平臺化
行業云運維以我行整體運維規劃建設方向為指導,對IT對象數據建模、對象狀態、對象操作、管理流程圍繞運維業務本身的需求及行業云當前的現狀。通過建設一體化運維技術平臺,實現對行業云應用、行業云數據、云運行狀態的一體化管控。一方面,建設智能告警中心、監控中心,進一步強化故障發現、處理能力,提升系統穩定性。另一方面,圍繞IT服務中心、運維自動化中心,加強IT服務流程化、自動化,屏蔽變更風險收斂運維人員操作權限的同時提升效率,快速響應業務需求,提升運維服務體驗。
運維平臺的整體技術架構上以PaaS平臺為一體化運維平臺底座,集中管理異構IT對象,抽象運維工作場景中通用的用戶管理、權限管理、配置管理、作業執行、API管理、低代碼開發等通用能力并入整體的平臺能力層,并通過統一的Agent代理建立與資源管控層的通信通道。針對具體的運維監、管、控場景依托平臺運行環境托管及開發環境管理能力,最大化復用中層PaaS能力縮短開發成本,告別煙囪式建設,兼顧業務穩定性的需求。
02.建設成果:技術平臺化驅動運維數字化
參考行業運維數字化發展路徑,行業云運維監控平臺圍繞對象數字化、行為數字化、運營數字化三個主要階段構建運維平臺發展和能力完善路線。
1)對象數字化能力:以應用為核心的CMDB構建IT數字鏡像
作為IT運維的數據基石,一套準確、穩定、能力強大的配置管理庫對企業運維管理起著至關重要的作用。但過往的CMDB多以IT資源對象為核心,對當前微服務、分布式應用的支撐能力不足。通過運維平臺的配置采集、模型管理、數據接口集成、應用拓撲可視化構建等能力。
運維團隊以應用為核心,消費場景為目的重構配置管理體系。在此過程中重新設計開發了10大類,“160+”模型,“20+”消費場景。結合配置管理平臺的配置審計、屬性核查,可視化報表等功能,做好后期數據的運營和校驗。一方面,實現了配置數據的客觀可信可消費;另一方面,配置平臺作為平臺的數據底座為運維自動化、狀態監控、流程管理等提供基礎數據支撐,真正實現了企業的IT數字鏡像。
2)狀態數字化能力:閉環告警生命周期管理
利用平臺探針的插件集成能力,數據采集上將異構監控工具的采集探針以插件的形式集成在平臺Agent上。一方面,減小性能開銷;另一方面,只需登錄一套平臺即可查看所有插件運行狀態,降低管理成本。
監控數據呈現上,通過開放API,將各類監控工具以API對接的方式統一將監控數據推送到監控平臺,進行監控數據的集中查看、統一告警。
同時,由于平臺采用統一的CMDB,數據來源和對象統一可結合CMDB中的實例對象和進程信息實現對象和進程監控的兼顧。平臺提供的采集器擴展,也為異構化對象監控的兼容提供了更好的解決方案。
告警管理上通過集中告警中心閉環告警生命周期,覆蓋告警的發現、產生、響應、定位、處理、復盤,改進全生命周期。
3)服務行為數字化:抽象運維服務,提升“消費”體驗
行業云在過往的運維建設中設計落地了大量的運維管理流程和管理規范,涉及云運營、基礎架構、應用管理多個運維業務域。但由于缺少專業化的運維流程及IT服務過程管理工具,存在流程執行難、協同效率低等問題。
一體化運維平臺落地后也一同建設了IT服務管理中心,通過流程引擎、服務目錄、SLA管理、自動化操作融合等能力,一方面,將運維管理過程由“線下”遷移到“線上”。另一方面,結合SLA管理、聯動自動化操作執行,在保證合規性的同時提升了流程運轉效率。
在服務體驗層面,設計并構建了行業云IT服務門戶,業務、研發人員只需提交服務申請,流程工單在各個相關團隊內完成審批、操作、執行的線上化流轉,一站式服務。流轉過程中預設了服務級別協議引擎,可對流程時效性進行數據化分析,可視化呈現流轉效率。
4)操作行為自動化:集中管理運維操作,有效管控操作風險
建設自動化運維中心,集中管控分散在運維人員手中的各類腳本、自動化運維工具,形成自動化腳本的統一管理,統一下發、集中授權;搭建可視化自動化編排平臺,降低運維自動化對于運維人員的要求,同時通過平臺本身具備的周期任務、自動化任務管理等能力,規范腳本管理和場景。結合IT配置管理中心的資產數據,打通數據鏈路。提升自動化作業目標的選擇,提升自動化作業執行準確性,降低運維操作導致生產風險的可能性。
過往使用開源自動化工具存在管理流程與操作流程的割裂、關聯性差的問題。運維平臺建設后依托平臺自身的APIgateway將自動化操作作為整體運維流程的一個節點在IT服務中心串聯,打通了管理流與操作執行流,實現了運維操作有依據、任務結果有憑據的業務閉環。
5)運營數字化:應用資產可視化,一屏覽全局
通過可視化數字化運營中心,構建運維數據運營看板,通過可視化看板設計器,實現自定義接入應用系統的配置數據、監控告警數據,流程數據等運維關鍵指標。管理員可自定義設計看板樣式,關聯后臺數據以餅形圖、柱狀圖、折線圖、直方圖等多樣化方式進行可視化呈現和動態數據展示。實現一張屏動態呈現行業云負載情況、重要告警、應用拓撲等關鍵信息,運維人員只需查看數據、報表、拓撲變化,就可直觀掌握應用狀態、資產容量。
03.未來展望:積跬步,至千里
截至2024年10月,行業云一體化運維平臺已完成全部上云應用的監控覆蓋,云資源的集中管控和自動化操作執行。初步實現了流程可管、操作可控、狀態可視的項目目標。
未來,將繼續發揮平臺價值深化建設,一方面,整合運維數據,輔以在線及離線計算技術通過數據建模、數據開發、模型訓練,拓展智能化運維業務場景,由自動化向智能化邁進。另一方面,深化運維業務場景建設,圍繞行業云運維特有場景,發揮平臺運維開發能力,構建智能決策、根因定位、告警知識推薦等應用。
「行業云一體化運維平臺已完成全部上云應用的監控覆蓋,云資源的集中管控和自動化操作執行。初步實現了流程可管、操作可控、狀態可視的項目目標。未來,將繼續發揮平臺價值深化建設,一方面,整合運維數據,輔以在線及離線計算技術通過數據建模、數據開發、模型訓練,拓展智能化運維業務場景,由自動化向智能化邁進。另一方面,深化運維業務場景建設,圍繞行業云運維特有場景,發揮平臺運維開發能力,構建智能決策、根因定位、告警知識推薦等應用。」
廣發銀行行業云為了解決運維團隊在數字化轉型過程中遇到的各類難題,鵬華基金以工具建設為抓手,依托理念先進的運維PaaS平臺,以點帶面,對運維管理體系進行全面優化升級,主要涉及工具支撐體系、流程管理體系、指標度量體系及人員組織體系的優化建設。
隨著數字化時代的來臨,企業發展離不開數字化轉型。南京證券在實踐企業數字化轉型中的IT服務管理新實踐,利用運維數據治理模型,構建業務消費的一體化場景,通過精細化管理提升IT服務質量和效率。截至2022年末,南京證券已擁有幾千臺物理服務器、近千臺網絡安全設備、近百條光纖專線,IT 基礎設施初具規模。公司IT服務管理主要圍繞日常業務運營來開展,確保IT服務整體運作既滿足業務需求又符合制度規范。
為快速推進敏捷方法在民生證券的進一步落地推廣和成熟應用,日前民生證券攜手嘉為藍鯨開展了敏捷實踐培訓項目。近日,咨詢培訓項目圓滿落幕并于現場進行頒獎儀式,這標志著民生證券的組織敏捷轉型正式邁出新的步伐,為后續實現通過組織敏捷帶動金融科技創新,提高工程技術能力,進一步強化企業敏捷實踐能力打下了堅實的基礎。
作為全國排名前列的省級農信,四川農信很早就意識到信息化支撐的重要性,并建設了眾多自動化運維工具。然而隨著業務的高歌猛進,IT規模成倍數增長。原有運維工具分散帶來的問題日益凸顯,部分運維能力不足,限制了運維管理工作效率的進一步提升,難以滿足新業務環境運維需求。如何進行多數據中心統一運維建設?如何整合原有零散工具進行體系化發展建設?如何釋放技術人員創新活力?如何滿足個性化定制與自主可控要求?等等問題擺在了四川農信運維部門面前。
隨著數字化轉型的深入,基于中臺和PaaS架構的一體化運維建設也在各行各業快速展開,但是如何將運維平臺本身的能力與企業已有的工具能力進行中臺化整合、工具場景如何聯動,是個復雜而龐大的工程......
申請演示