一、數據治理的定義
關于數據治理,國際數據治理研究所(DGI)給出的定義是:“數據治理是一個通過一系列信息相關的過程來實現決策權和職責分工的系統,這些過程按照達成共識的模型來執行,該模型描述了誰(Who)能根據什么信息,在什么時間(When)和情況(Where)下,用什么方法(How),采取什么行動(What)。”
百度百科的解釋:“數據治理是組織中涉及數據使用的一整套管理行為。由企業數據治理部門發起并推行,關于如何制定和實施針對整個企業內部數據的商業應用和技術管理的一系列政策和流程。”簡單地來說,數據治理就是企業對數據的來源、質量和使用進行規范化的一整套流程。
二、數據治理的目的
確保企業數據的質量,可用性,可集成性,安全性和易用性。數據是公司的資產,組織必須從中獲取業務價值,最大程度地降低風險并尋求方法進一步開發和利用數據,而這一切就是數據治理需要完成的工作,數據治理一般來說主要包括以下三部分工作:
定義數據資產的具體職責和決策權,應用角色分配決策需要執行的確切任務的決策和規范活動。
為數據管理實踐制定企業范圍的原則,標準,規則和策略。數據的一致性,可信性和準確性對于確保增值決策至關重要。
建立必要的流程,以提供對數據的連續監視和控制實踐并幫助在不同組織職能部門之間執行與數據相關的決策,以及業務用戶類別。
三、數據治理的驅動力
企業做數據治理的驅動力一般包括如下部分:
提升業務敏捷
通過建立一致的企業數據模型,統一的組織數據的展示和利用,從而讓業務人員能夠更快的獲取用戶及產品相關數據,獲得最快的市場信息和洞察,從而能夠提升業務對于市場的響應力,讓業務更敏捷。
降低運營成本
眾多案例證明,可以通過精細化和自動化所有可能的數據降低運營成本。這些流程大部分都流經多個系統,組織的多個業務部門的數據庫和應用程序,例如:財務,人力資源資源,銷售和市場營銷等。提供統一而清晰的數據視圖和擁有的信息可以幫助消除許多手動任務并解決幾個冗余問題使成本和復雜性保持在較高水平。
管理風險和合規
企業合規和風險管理很重要,尤其是受到嚴格監管的金融服務行業中,風險管理以及遵守外部法規和內部政策會引入其他要求數據使用的透明性以及基于這些數據的報告操作。通過定義所有必要的數據標準,政策和流程并形成具有明確角色和職責的框架,可控制這些策略應用的風險。
數據治理的目的與意義中琛魔方大數據平臺表示數據治理中最重要的因素之一是與所有負責收集、管理和使用數據的團隊和個人保持一致。數據治理對企業非常重要。對于企業來說,數據治理策略的第一步是選擇合適的數據治理工具。
四、數據治理項目的關鍵點
1、識別數據和維護數據目錄
由于各種數據的爆炸式增長,對數據進行編目并使該目錄可供用戶使用至關重要。組織需要一個可以輕松擴充和更新的業務術語表,因為新數據和現有數據的新用途將發揮作用。此外,環境能夠跟蹤與數據相關的各種資產至關重要。它的使用和加工,諸如MapReduce作業,用戶方法(如可視化)和數據分析對象(如模型,子模型和源數據集)等技術組件都必須能夠在數據字典中輕松表示。
2、探索該數據以識別機會
獲得數據目錄后,您需要一種很好的方法來查找該目錄中的內容。組織內的不同角色需要以不同的方式看待事物。這應該與基于角色的視圖和模板相結合,以及按角色定制導航,以使業務用戶盡可能簡單地找到他或她需要的內容。可以使用先進的機器學習和人工智能來幫助找到適當的數據。
3、確保系統可靠性和可用性
雖然高可用性和災難恢復等概念通常不被歸類為數據治理策略的組件,但這些功能對于數據是有價值資產的任何環境都至關重要。因此,數據治理策略必須包含高可用性和災難恢復策略。畢竟,如果系統無法可靠地保持運行,那么數據將與相關的數據治理策略一起貶值。
4、保持數據的有效性
保持數據的有效性首先要建立圍繞數據的系統政策和控制,并確保測量的數據準確性適合其用途。工作流和策略管理功能使了解數據的業務用戶可以輕松地協作,協商和批準策略和過程。與IT服務管理系統集成后,可以將策略信息一旦最終確定,即可轉移到IT部門進行實施,而不會丟失上下文以及策略及其要求的細節。
5、保護敏感數據
保護敏感數據需要幾個步驟。首先,必須確定數據及其敏感性。其次,必須有一種方法可以明確說明圍繞數據做什么以及由誰做的政策。第三,必須有一種系統的方法來收集這些信息并將其傳播給數據的消費者和能夠對信息實施物理控制的技術人員。這三個步驟通常是由實現合規性的需要驅動的,但也與您自己的內部政策相關聯。
五、數據治理該怎么做?
1、做好長遠計劃,把所涉及的數據規劃好
數據治理是一項耗時冗長的系統的工程,不僅要在組織方面有好的計劃策略,更要在機制和制定標準等方面統籌謀劃。在治理期間,要及時不斷地結合當下情況調整組織結構,明確數據管理的關鍵職責,自上而下的推動數據治理工作。
2、健全相關體系,力爭把數據管理好。
做好數據分級管理。綜合考慮個人、社會、國家等多方面的因素,將數據按照一定的標準進行分級,基于相關目錄將數據進行分級。對于不同的數據等級,理應采取不同的措施,實現精細化管理。
3、加強安全管控,保護好數據。
在數據治理過程中,一定要分析潛在的風險,對突發情況做好應對措施,加強安全管理控制,一定要防止非法操作竊取用戶的信息,嚴防用戶數據的泄露、篡改和濫用。