01.引言
在之前的一系列文章中,我們已經(jīng)深入地探討了研發(fā)效能洞察的重要性,并介紹了幾種常用的度量分析方法。然而在度量實(shí)踐的過程中,僅僅依靠理論框架是不夠的,我們還需要將這些理論與企業(yè)的實(shí)際情況相結(jié)合。在這個過程中,企業(yè)常常面臨著各種問題:比如,難以采集分散在多個系統(tǒng)中的關(guān)鍵數(shù)據(jù);難以滿足業(yè)務(wù)發(fā)展中頻繁調(diào)整指標(biāo)的需求以及難以對不同部門的數(shù)據(jù)權(quán)限進(jìn)行隔離等。
因此,我們需要一個度量平臺,它能夠自動采集多個系統(tǒng)的數(shù)據(jù),可以通過配置的方式快速修改指標(biāo),并且能夠?qū)崿F(xiàn)精細(xì)化的權(quán)限控制等。在本章中,我們將詳細(xì)地描述效能洞察的建設(shè)過程,并進(jìn)一步討論在實(shí)施效能度量中常見的問題,以幫助大家更好地了解一個良好的度量平臺所需具備的關(guān)鍵能力及其背后的原因,為企業(yè)提供一個全面了解和合理運(yùn)用效能度量平臺的指南。
02.度量建設(shè)的常見步驟
首先,我們來詳細(xì)了解一下度量建設(shè)的常見步驟。
1)需求調(diào)研階段
在這一階段,我們需要了解用戶的原始度量訴求以及度量目標(biāo),并與客戶溝通是否已有所需度量的指標(biāo)清單。若客戶對度量需求的概念較為模糊,暫不清楚如何開始度量體系的建設(shè),我們可以按照指標(biāo)拆解方法進(jìn)行梳理和引導(dǎo)。最終,需要輸出一份詳細(xì)的指標(biāo)清單文檔。該指標(biāo)清單通常應(yīng)包含以下關(guān)鍵內(nèi)容:
2)數(shù)據(jù)處理階段
在需求調(diào)研階段輸出的指標(biāo)清單中,已明確說明了每個指標(biāo)的數(shù)據(jù)來源系統(tǒng)、取數(shù)邏輯以及必要字段等。我們將根據(jù)這些信息,對需要度量的相關(guān)數(shù)據(jù)進(jìn)行清洗和加工,最終形成數(shù)據(jù)模型,并將這些模型統(tǒng)一存放在數(shù)據(jù)倉庫中。
3)數(shù)據(jù)展示階段
不同圖表類型有著不同的表達(dá)側(cè)重點(diǎn),選擇合適的圖表類型能夠更為精確地傳達(dá)數(shù)據(jù)信息。我們需要確定每個指標(biāo)的展示方式,并最終將這些指標(biāo)分組展示在儀表盤中。
4)權(quán)限控制階段
數(shù)據(jù)是重要的資產(chǎn),對其進(jìn)行權(quán)限控制可以防止敏感數(shù)據(jù)泄露或?yàn)E用。此外,通過權(quán)限控制,可以對數(shù)據(jù)進(jìn)行分組管理,讓不同用戶聚焦自己關(guān)注的數(shù)據(jù)。
03.企業(yè)度量建設(shè)可能會遇到的痛點(diǎn)和解決方案
下面介紹度量建設(shè)步驟中,企業(yè)可能會遇到的痛點(diǎn)以及解決辦法。
1)數(shù)據(jù)獲取階段的痛點(diǎn)
例子:某企業(yè)設(shè)有大數(shù)據(jù)部門,該部門主要負(fù)責(zé)存儲和處理數(shù)據(jù),數(shù)據(jù)存放在Hive大數(shù)據(jù)倉庫中。隨后,該企業(yè)建立了DevOps平臺來支持研發(fā)過程。由于DevOps平臺產(chǎn)生的數(shù)據(jù)業(yè)務(wù)特性較強(qiáng),因此由專門的業(yè)務(wù)部門自行存放,并將此部分研發(fā)過程數(shù)據(jù)存放在了Doris大數(shù)據(jù)倉庫中。同時,該企業(yè)還使用了多個自建的第三方系統(tǒng),如測試管理平臺和代碼倉庫等,數(shù)據(jù)分散存儲在不同系統(tǒng)中。
該企業(yè)面臨的痛點(diǎn):
對度量系統(tǒng)提出的需求:
為解決企業(yè)在度量數(shù)據(jù)獲取方面的潛在痛點(diǎn),度量系統(tǒng)需要具備以下能力:
2)數(shù)據(jù)處理階段的痛點(diǎn)
例子:某企業(yè)基于原始業(yè)務(wù)數(shù)據(jù)庫數(shù)據(jù)(MySQL)進(jìn)行取數(shù)和建模,由于缺乏建模思維,僅僅對原始庫表數(shù)據(jù)進(jìn)行原樣存儲。這導(dǎo)致一旦新功能上線并改動庫表結(jié)構(gòu),就容易引發(fā)指標(biāo)展示異常。同時,由于數(shù)據(jù)存儲在MySQL中,受限于其數(shù)據(jù)讀取性能,指標(biāo)展示速度緩慢。當(dāng)有多個用戶同時訪問指標(biāo)時,頁面經(jīng)常卡頓,導(dǎo)致無法正常打開。此外,使用原始庫表提供數(shù)據(jù),受限于業(yè)務(wù),模型的通用性很差,大部分指標(biāo)都需要生成新的數(shù)據(jù)表再提供數(shù)據(jù)。
該企業(yè)面臨的痛點(diǎn):
對度量系統(tǒng)提出的要求:
為解決企業(yè)在度量數(shù)據(jù)處理方面的潛在痛點(diǎn),度量系統(tǒng)需要具備以下能力:
3)權(quán)限管控階段的痛點(diǎn)
例子:某大型擁有眾多企業(yè)部門和人員,其中包括部分外包人。集團(tuán)希望對部分敏感數(shù)據(jù)進(jìn)行權(quán)限管控,確保這些數(shù)據(jù)僅對關(guān)鍵崗位開放。然而,受限于當(dāng)前系統(tǒng)的功能,權(quán)限只能控制到菜單級別。這導(dǎo)致不同部門間數(shù)據(jù)可以互通,A部門能夠看到B部門的關(guān)鍵數(shù)據(jù)。此外,由于部門人員眾多,每次發(fā)生人員部門變更,都需要重新調(diào)整權(quán)限設(shè)置,這不僅耗時費(fèi)力,而且配置的權(quán)限還容易出錯。
該企業(yè)面臨的痛點(diǎn):
對度量系統(tǒng)提出的要求:
為解決企業(yè)在度量數(shù)據(jù)處理方面的潛在痛點(diǎn),度量系統(tǒng)需要具備以下能力:
4)數(shù)據(jù)呈現(xiàn)階段的痛點(diǎn)
例子:某企業(yè)通過定開方式產(chǎn)出指標(biāo),需要耗費(fèi)大量的研發(fā)資源做定開,大量度量需求堆積,業(yè)務(wù)數(shù)據(jù)得不到及時驗(yàn)證,導(dǎo)致業(yè)務(wù)部門對長交付周期感到不滿,而研發(fā)則常感排期緊張,時間不夠用。此外,業(yè)務(wù)需求頻繁調(diào)整,每次調(diào)整后都需要重新處理數(shù)據(jù)處理并修改接口。代碼修改完成后,還需等待發(fā)布窗口進(jìn)行部署,無法實(shí)現(xiàn)無感更新,導(dǎo)致上線出錯率高,且錯誤內(nèi)容難以及時修正。
該企業(yè)面臨的痛點(diǎn):
對度量系統(tǒng)提出的要求:
為解決企業(yè)在度量數(shù)據(jù)處理方面的潛在痛點(diǎn),度量系統(tǒng)需要具備以下能力:
04.總結(jié)
通過上述說明,我們了解到優(yōu)秀的度量平臺需要具備以下核心能力,這些能力也可作為企業(yè)在選擇度量平臺時的參考依據(jù)。
SRE轉(zhuǎn)型:銀行SRE模式推廣策略
查看詳細(xì)
從設(shè)備到數(shù)據(jù):存儲監(jiān)控的關(guān)鍵與實(shí)踐
查看詳細(xì)
AI破圈爆火!殊不知運(yùn)維才是幕后“定海神針”!
查看詳細(xì)
AI賦能DevOps:智能排錯、代碼修復(fù)與需求生成,打造高效開發(fā)新范式!
查看詳細(xì)
LLMOps+DeepSeek:大模型升級一體化運(yùn)維
查看詳細(xì)
DeepSeek賦能企業(yè)研發(fā):DevOps+AI 新時代再升級!
查看詳細(xì)
申請演示