發布日期:2024-03-04 16:49:32
為應對新的國際競爭環境與新的國內監管形勢,行業數字化轉型方興未艾。云計算、大數據、AI等技術手段已逐步從后臺應用走向前端業務,滲透至投研、營銷、風控、運營的各個環節。在數字化轉型的浪潮下,支撐業務運行的應用系統和基礎設施變得愈發復雜,維護成本及風險也越來越高,給運維管理帶來很大的挑戰。如何建設更加安全、高效、智能的運維管理體系,已成為行業IT建設的重點議題。
鵬華基金把數字化轉型納入到公司發展戰略,踐行“系統+流程+數據”三位一體的方式,將系統建設與業務流程緊密結合。在此過程中,由于涉及新系統的建設及存量系統的升級改造,團隊需要管理的運維對象及場景都在發生變化。受限于“煙囪式”的運維工具體系,運維管理面臨“工具孤立效率低”“管理規范難落地”“組織提升遇瓶頸”三大難題。
01. 運維一體化平臺建設
為了解決運維團隊在數字化轉型過程中遇到的各類難題,鵬華基金以工具建設為抓手,依托理念先進的運維PaaS平臺,以點帶面,對運維管理體系進行全面優化升級,主要涉及工具支撐體系、流程管理體系、指標度量體系及人員組織體系的優化建設。
1)工具支撐體系:建設自主可控、聯動一體的運維平臺
將運維支撐工具的建設思路由“煙囪式”變為“平臺化”,基于PaaS底座,建設以“管控一體、平臺一體、聯動一體”理念為核心的運維工具體系。
① 建設以消費為核心的CMDB
梳理整體配置信息,完成模型設計和定標以及對云平臺、操作系統、數據庫、中間件的配置自動化發現及采集,支撐監控、巡檢等消費場景,并實現配置變更自動化管理,集成自動化運維場景,實現從審批流到自動化執行再到配置數據回寫的閉環,如資源申請場景。申請人提單-管理員審批后實現資源的自動化注冊至CMDB中。通過聯動流程管理平臺,實現配置數據錄入及變更的流程化、規范化、自動化,保障配置數據的統一和準確性。
② 建設以事件和數據雙核驅動的一體化監控體系
一體化監控體系以數據和事件雙核驅動,旨在解決監控及告警信息分散管理的問題。監控中心按照硬件設施層、操作系統層、組件服務層應用性能層等維度梳理監控對象,所有監控對象都源自于CMDB,并在接入來自Zabbix、Prometheus等監控源的性能數據時,打上CMDB中的模型及實例標簽,進而實現面向對象的監控指標統一管理體系,包含指標內容定義、指標自定義啟停等。同時,監控中心匯總的監控數據也可作為運維大數據分析的數據源,消費于統一可視化展示、Web視圖展示、報表統計展示等場景。告警中心實現告警事件的統一匯總,并通過和CMDB、自動化、ITSM等運維工具的無縫聯動,在告警收斂、分派、轉工單、自愈等層面實現了提質增效。
③ 建設敏捷IT服務管理工具
落地IT需求、變更、事件等管控流程以及IT內部服務流程,與監控、CMDB、運維自動化工具集成,實現管理流程和運維工具的聯動,并結合飛書移動端應用落地,提升流程管理的敏捷性,顯著提升部門流程處理效率及關單率。
④ 建設自主可控的自動化運維工具
結合實際運維場景需求,基于運維平臺所提供的前后端開發框架,通過對平臺服務的靈活調用和組裝,快速構建支撐工具和運營系統。
⑤ 建設運營可視化
發布一系列大屏展示IT資產、流程、監控、安全等工程和管理視角的數據,包括IT流程駕駛艙+CMDB資源大屏+監控大屏+通過平臺大屏設計器,自主設計和對接數據源開發的信息安全大屏。
2)流程管理體系:服務目錄規劃
按服務類型的區分規劃服務目錄,將服務目錄劃分為IT內部服務、IT管控服務以及內置審批目錄三個大類。對于用戶而言,便于理解和選擇,可通過Web端、IM端快速提單;對于流程管理者而言,有助于針對服務的技術特點進行管理和優化。
3)人員組織體系:運維開發轉型探索
運維開發轉型起源于互聯網行業,為應對殘酷的競爭,互聯網公司需要從各個維度提升經營效率、降低成本。開展運維開發轉型,實現工具自主掌控,便是降本增效的路徑之一。鵬華基金在引入運維PaaS體系之后,積極開展運維開發轉型的培訓及學習活動,鼓勵團隊轉型升級。在這個過程中,具備一定工具開發能力,同時有更高成長追求的人率先由運維轉型為運維開發,自主研發自動化巡檢中心SaaS,改變原先離散型巡檢方式,有效支撐部門日常巡檢統一管理,整個工具構建過程可以分為三大步驟。
第一步,梳理原子能力。巡檢場景可劃分為獲取巡檢對象、執行巡檢命令等操作。其中,獲取巡檢對象需要用到CMDB原子能力,基于CMDB批量獲取巡檢對象,如主機、數據庫等;執行巡檢命令需要用到作業執行原子能力,基于Agent在受控機器上執行作業命令,完成巡檢操作。第二步,編排原子能力。將上述原子能力按串行、并行、判斷、循環等邏輯判斷串聯起來,構建運維自動化流程。第三步,SaaS能力封裝。基于PaaS平臺提供的前后端開發框架及免運維托管環境,將巡檢自動化流程封裝為SaaS工具,提升易用性。
有了自動化巡檢的成功案例,“工具文化”正逐步滲透到團隊的每一個角落,不斷加速運維組織轉型的進程。巡檢中心:利用平臺開發框架,自研巡檢中心,統一各業務巡檢任務,并實現飛書移動端開發,有效支撐部門日常巡檢統一管理
績效看板:自研績效門戶,結合工單數據,展示研發效能看板。運維管理通知中心:對接飛書群機器人,分時段通知IT管控流程相關節點。
4)指標度量體系:持續運營、持續完善
CMDB的建設是一個逐步完善的過程。在建設過程中通過數據運營的方式可以很好地輔助配置經理“監控”CMDB的狀態,數據運營的手段包含:數據孤島、關聯完整性、屬性完整性及屬性規范性。
統計事件總數、SLA、滿意度調查等IT服務管理指標,持續分析和改進IT服務質量。通過ITSM工單沉淀價值數據,對需求、事件、變更的統計分析,建立效能指標數據體系,有效幫助IT內部管理。
監控管理的指標主要是監控覆蓋率、告警分級、故障管理三個方面。
02. 收益及展望
為滿足業務數字化轉型訴求,鵬華基金基于“平臺一體、管控一體、聯動一體”的先進理念,組合多種技術手段和管理工具,實現了數據、資源、人員的統一管理和協調,解決了過往“煙囪式”工具建設帶來的難題,并通過PaaS平臺的運維開發能力,開啟了運維團隊SRE轉型之路。展望未來,面臨云原生轉型趨勢,可建設融合Trace、Metric、Log的全棧可觀測體系,解決復雜分布式架構應用的故障管理問題;面臨AI技術的沖擊,可嘗試在運維場景中利用深度學習、自然語言處理等技術,如監控場景下的智能閾值、告警管理中的告警智能聚類等。
「為滿足業務數字化轉型訴求,鵬華基金基于“平臺一體、管控一體、聯動一體”的先進理念,組合多種技術手段和管理工具,實現了數據、資源、人員的統一管理和協調,解決了過往“煙囪式”工具建設帶來的難題,并通過PaaS平臺的運維開發能力,開啟了運維團隊SRE轉型之路。」
鵬華基金隨著數字化時代的來臨,企業發展離不開數字化轉型。南京證券在實踐企業數字化轉型中的IT服務管理新實踐,利用運維數據治理模型,構建業務消費的一體化場景,通過精細化管理提升IT服務質量和效率。截至2022年末,南京證券已擁有幾千臺物理服務器、近千臺網絡安全設備、近百條光纖專線,IT 基礎設施初具規模。公司IT服務管理主要圍繞日常業務運營來開展,確保IT服務整體運作既滿足業務需求又符合制度規范。
民生證券通過提升組織成員敏捷意識及能力成熟度,配套構建平臺工程能力來持續規范研發過程,促進聚焦核心能力構建,提升研發交付效率,降低運維運營風險,并最終實現業務價值的快速構建,保持企業核心競爭力。
銀聯商務股份有限公司是首批獲得人民銀行頒發《中華人民共和國支付業務許可證》的支付機構,經過20多年的精耕細作,取得了國內收單機構第一、亞太地區第二的排名以及46.3%的市場份額的不俗的業績,作為銀聯商務子公司的北京銀聯商務有限公司(以下簡稱“北京銀聯商務”)正加快推進各項數字基礎設施建設,不斷夯實“科技銀商”基座,為客戶的發展助力,也為實體經濟注入支付與科技的動能
為快速推進敏捷方法在民生證券的進一步落地推廣和成熟應用,日前民生證券攜手嘉為藍鯨開展了敏捷實踐培訓項目。近日,咨詢培訓項目圓滿落幕并于現場進行頒獎儀式,這標志著民生證券的組織敏捷轉型正式邁出新的步伐,為后續實現通過組織敏捷帶動金融科技創新,提高工程技術能力,進一步強化企業敏捷實踐能力打下了堅實的基礎。
廣州銀行股份有限公司信用卡中心成立于2011年,隸屬于廣州銀行,是廣州銀行的分行級機構、戰略部門。業務范圍涵蓋信用卡、消費分期等板塊,擁有從金融產品研發至銷售及后期風險控制、客戶服務完整業務鏈條......
申請演示