譯者 | 晶顏
審校 | 重樓
數據可觀察性是一種變革性的解決方案,它使組織能夠通過實時識別、故障排除和解決數據問題來充分利用其數據的潛力。然而,量化這種新技術的投資回報率(ROI)可能極具挑戰性。
然而,以下五個關鍵領域可以將數據可觀察性的投資回報率集成到一個引人注目的業務案例中,使您能夠衡量切實的收益并做出令人信服的投資案例。
1. 降低本土解決方案的成本
數據工程團隊經常投入大量時間開發、維護和驗證數據質量規則。數據管道的復雜性以及對來自多個源的驗證需求使該過程進一步復雜化,特別是在數據結構不一致的情況下。本土解決方案(Homegrown solutions)缺乏機器學習能力,難以進行異常檢測。
衡量影響:要計算ROI,請考慮以下成本驅動因素:
- 負責開發和維護的工程師人數。
- 每名工程師每年的全職等量(FTE)成本。
必須認識到,構建數據可觀察性系統,就像操作任何軟件一樣,需要工程(在本例中是數據工程)資源、用于建模和構建異常檢測的數據科學專業知識、專門的質量保證團隊和負責部署解決方案并確保其無縫運行的DevOps工程師。
盡管這些專業角色的工資范圍可能會有所不同,但為了簡化,我們可以計算所有團隊成員的平均值。
公式:ROI =(負責開發的工程師總數+負責維護的工程師總數)* FTE ($)
2. 減少間接基礎設施成本
通過查詢驗證數據庫或數據倉庫中的數據(這是許多團隊的常見做法)可能會顯著增加成本,特別是當這些系統根據使用情況收費時。這包括與查詢數量增加、歷史數據質量指標存儲以及云管理和托管相關的成本。由于這些成本考慮,許多組織選擇只驗證和監視樣本,導致數據質量改進有限,結果不完整。
特定的數據可觀察性解決方案會將綜合的數據質量分析、存儲和托管功能集成在一個平臺中。這種方法消除了將這些服務卸載到被監視系統的需要,有效地減少了相關的費用。此外,這種方法還提供了可擴展性,能夠在整個數據中檢測數據質量問題,而不是僅僅依賴于樣本。
衡量影響:將這些成本分解為:
- 與驗證查詢相關的數據庫超額費用%。
- 用于保留歷史數據質量指標的額外存儲成本%。
- 用于支持大規模數據質量的超額云托管費用%。
公式:ROI =(年度數據倉庫成本*與數據驗證查詢相關的超額成本%)+(年度存儲成本*存儲歷史數據質量指標的超額成本%)+(年度云基礎設施成本*用于大規模托管數據質量的超額成本%)。
在許多組織中,基礎設施成本通常與提供全面服務(包括數據倉庫、存儲和云托管)的單一供應商合并。在這種情況下,計算ROI需要將總基礎設施成本*一定百分比(通常在10%到20%之間),以顯示數據質量監控增加的影響。例如,如果一個組織每年的云數據倉庫費用為100萬美元,那么實施數據質量和可觀察性可能會產生10%的間接影響,相當于每年10萬美元。
3.減少事件管理案例
事件管理通常是對數據質量問題的被動性響應。通過數據可觀察性轉向主動預防是理想的方案,但卻并非總是可行的。當數據質量問題導致下游系統不準確,影響業務應用程序甚至波及到客戶時,業務團隊通常會參與識別、調查和解決問題。這會影響到更廣泛的組織,應該在數據可觀察性解決方案的ROI分析中考慮到這一點。
衡量影響:數據團隊通常根據嚴重程度對事件管理進行分類。例如,一家公司將其數據事件分類如下:
小型事件:
- 數量:每sprint(開發周期) 0-1個;
- 解決時間:2-3天;
- 參與人數:1人;
中型事件:
- 數量:3-4個/季度;
- 解決時間:3-4天;
- 參與人數:2人;
關鍵事件:
- 數量:1-2個/年;
- 解決時間:5-10天;
- 參與人數:10人;
為了簡化,您可以將事件分組并計算所有成本驅動因素的平均值。
- 每年平均事故數。
- 解決事件的平均時間(以小時為單位)。
- 正確檢測和修復這些問題的平均每小時成本。
公式:ROI =(每年平均事件數量)*(發現和解決事件的平均時間,以小時為單位)*(平均每小時成本)
4. 為更好的決策創建可信數據
雖然上述三個ROI收益主要集中在成本節約上,但后兩個則深入研究了實現數據可觀察性所帶來的潛在收入增長。
確定數據可觀察性帶來多少直接收益可能很復雜。例如,如果數據可觀察性提高了客戶數據質量并提高了留存率,這并不僅僅是因為可觀察性;其他因素,如員工的能力或最近的產品改進也可能起作用。
為了計算ROI,需要定義問題范圍并衡量數據可觀察性對改進的潛在影響。
測量影響:定義問題陳述、問題的基線值,以及可歸因于數據可觀察性的改進部分。舉個例子:
問題陳述:“不準確的數據阻礙了我們的業務目標,例如客戶保留率。”
基線值:“不準確的數據導致組織的年成本高達X美元。”
目標范圍:“考慮到由于數據質量以外的因素,一些收入損失是我們業務固有的,我們預計將改進Y%。”
來自數據可觀察性的預期改進:“我們預期Z%的改進可以歸功于數據可觀察性解決方案。”
公式:ROI =基線值(X美元)*目標范圍(Y%) *預期改進(Z%)
值得注意的是,雖然數據可觀察性有助于這種改進,但它只是影響數據質量的幾個因素中的一個。其他因素還包括提高團隊技能、精簡流程、進行徹底的研究,以及在數據可觀察性之外集成補充工具。
5. 加快數據產品實現價值的時間
數據產品越來越受歡迎,但它們的成功依賴于高質量的數據。數據可觀察性保證了一種及時發現和識別數據問題的系統方法。這種方法不僅加快了數據產品的上市時間,而且還建立了實時分析和補救流程,以確保消費者訪問這些產品時的可靠性。
衡量影響:為了計算對數據產品的影響,評估由數據質量和一致性問題導致的上市時間延遲是必不可少的。一些數據可觀察性工具提供低代碼、無代碼的接口,促進業務用戶和技術用戶之間的協作。這加快了數據質量的開發和測試,幫助您更快地實現收入目標。這些工具使用機器學習(ML)來評估數據質量,識別異常值和異常情況,簡化了耗時且依賴猜測的流程。
此外,這些可觀察性平臺利用歷史數據趨勢實時檢測意外數據問題。這種實時監控功能使產品和工程團隊能夠確保數據產品的持續健康和可靠性,從而促進收入增長。
公式:ROI =數據產品每年的年收入*因數據不良導致的延遲上市時間
結語
以上僅僅是數據可觀察性能夠帶來巨大業務利益的五個領域。雖然并非所有情況都適用于每個組織,但每種情況在實現數據可觀察性的潛在價值方面都起著至關重要的作用。在開發業務案例時,請與執行團隊一起審查此框架,并考慮所有成本驅動因素和產生收入的機會。將總投資回報率記錄和分解為一個明確的實施時間表。數據可觀察性不僅僅是一項支出,更是一項投資。它減少了用于故障排除和糾正數據問題的時間和資源,降低了基礎設施成本,加速了數據產品的生產,并最終幫助組織增加收益。
原文標題:Data Observability ROI: 5 Key Areas to Construct a Compelling Business Case,作者:Farnaz Erfan