在數(shù)字化轉(zhuǎn)型驅(qū)動下,企業(yè)IT架構向云原生演進的過程中,技術棧的碎片化與組件的微服務化使得IT技術架構復雜性指數(shù)級攀升。運維人員不僅需要應對云原生、微服務等新型架構帶來的海量告警,還需掌握多云環(huán)境協(xié)同、國產(chǎn)化替代等領域技術,經(jīng)常需要花費大量時間在告警分析和告警處理中,難以釋放更多時間創(chuàng)造更多價值。
近幾年,隨著生成式AI技術的突破性發(fā)展,從ChatGPT展現(xiàn)的通用智能到DeepSeek的火爆,無疑都彰顯出大模型在企業(yè)IT運維中的巨大潛力。通過將大模型與企業(yè)告警治理的深度應用,構建基于自然語言交互的告警分析、告警處理、根因定位等能力,助力運維模式從“人工經(jīng)驗驅(qū)動”向“AI主動治理”升級。
作為企業(yè)運維團隊的得力助手,小鯨觀測助手結合內(nèi)置運維知識庫與業(yè)界領先的大模型技術,集成對接 DeepSeek、ChatGPT、通義千問等大模型,不僅可以協(xié)助處理日常運維難題,還能夠幫助團隊在告警治理過程中減輕負擔。以下是小鯨觀測助手在企業(yè)告警全生命周期管理中覆蓋的核心業(yè)務場景:
場景一:知識智能推薦,精準解決告警難題
當告警產(chǎn)生后,小鯨觀測助手依托告警中心的輔助分析能力,解析告警對象、告警名稱、告警內(nèi)容等關鍵信息。借助大模型、內(nèi)置運維知識庫、RAG技術,推薦告警產(chǎn)生的原因及可能的解決方案。不僅如此,它還支持混合檢索,通過靈活調(diào)整向量檢索和文本檢索的權重,提高知識推薦的準確率。
場景二: 智能聊天問答,即時響應運維需求
在日常運維工作中,您在頁面就能隨時喚醒小鯨觀測助手,與小鯨觀測助手進行互動交流。當您在故障排查過程中,遇到看不懂的錯誤日志時,可利用“劃詞問答功能”選中日志中的關鍵內(nèi)容向小鯨觀測助手提問。小鯨觀測助手即時提供專業(yè)解答,大幅提升故障排查效率。
場景三: 智能排障引導,全方位協(xié)助問題排查
若推薦的知識未能解決問題,小鯨觀測助手還能提供“智能引導式排查”。不僅能夠快速識別用戶操作意圖,而且能夠利用編排好的劇本、無縫鏈接CMDB、歷史變更記錄、歷史告警記錄、指標數(shù)據(jù)、日志數(shù)據(jù)、調(diào)用鏈數(shù)據(jù)等多維度信息,引導運維人員進行復雜問題的排查和處理,真正做到手把手教您排查問題。
場景四: 智能告警治理,輕松應對海量告警
在面對海量告警時,運維人員常會陷入兩難,要么不知如何開展告警治理,要么需投入大量人力進行告警梳理和分析。小鯨觀測助手通過對告警數(shù)據(jù)的統(tǒng)計分析,幫助找出那些高頻出現(xiàn)的告警,結合內(nèi)置運維知識庫中的最佳實踐經(jīng)驗,為運維人員提供針對性的原因分析及優(yōu)化建議,讓原本棘手的告警治理工作變得輕松高效。
場景五:告警策略優(yōu)化,實現(xiàn)告警壓縮降噪
在告警治理過程中,面對高頻告警、誤報以及漏報等難題。小鯨觀測助手可對各類告警事件展開分析。以磁盤 I/O 使用率告警這一高頻出現(xiàn)的告警為例,能夠快速識別出告警數(shù)量過多的問題和產(chǎn)生原因,并依托內(nèi)置的運維知識庫的經(jīng)驗,給出告警閾值配置的最佳實踐以及相關優(yōu)化建議。
以上場景僅僅是告警治理中的一部分助力,借助大模型能力,實現(xiàn)場景不斷挖掘,可持續(xù)賦能整個告警全生命周期管理過程。
申請演示