近年來,隨著信息化、數字化、智能化的快速發展,數據從資源逐漸轉變為資產。金融行業具有海量數據資源和豐富應用場景優勢,在企業經營管理、產品研發、技術創新等關鍵環節中發揮著重要作用。數據治理作為釋放數據價值的基礎,在推動銀行數字化轉型的過程中扮演了“承上啟下”的關鍵角色。
袋鼠云通過數據治理咨詢,結合數據平臺建設和數據應用實施,構建科學的組織架構體系,完善數據治理流程制度與規范,建立數字化協同機制,整合并打通銀行內多源、零散的異構數據體系,構建全行業數據資產體系,完善數據權限、數據血緣、數據質量、分級分類等管理體系,借助數據產品對數據資產進行深度加工挖掘價值,面向零售、風險、財務等輸出更加全面的數據及統計指標,推動銀行業務數字化轉型。(了解袋鼠云https://www.dtstack.com/?src=meiti)
銀行機構數據治理解決方案
| 基于數據盤點構建全行級數據資源目錄
數據資產盤點有實體盤點,第一點是設計分類框架,為了方便對數據資產進行管理,需要對數據資產進行分類,按照業內慣例,一般分為三級分類。分類依據可參考企業的流程框架,按照業務分類進行分類。
第二點是明確盤點范圍,對人力、財務、營銷業務系統中的業務對象進行盤點,需要系統開發人員、業務人員共同參與,解決梳理過程中遇到的業務和技術問題。
第三點要注意盤點的內容,也就是盤點業務實體對象。
除了實體盤點外還有數據項盤點。數據項的盤點依賴于實體的盤點,每個實體有若干個數據項,數據項是業務開展的基礎屬性,這些屬性可以從業務系統界面獲取,也可以從后臺獲取。
銀行數據資源目錄
l 基于數據標準的規范化ETL數據建模體系
數據標準是進行數據標準化、消除數據業務歧義的主要參考和依據。對數據標準進行分類,將有利于數據標準的編制、查詢、落地和維護。數據標準有多種分類方式,對于不同的分類方式,均可采用以數據元為數據標準制定的基本單元構建數據標準體系。
數據可以分為基礎類數據和指標類數據?;A類數據指業務流程中直接產生的,未經過加工和處理的基礎業務信息。指標類數據是指具備統計意義的基礎類數據,通常由一個或以上的基礎數據根據一定的統計規則計算而得到。
相應地,數據標準也可以分為基礎類數據標準或指標類數據標準。基礎類數據標準是為了統一企業所有業務活動相關數據的一致性和準確性,解決業務間數據一致性和數據整合,按照數據標準管理過程制定的數據標準。指標類數據標準一般分為基礎指標標準和計算指標(又稱組合指標)標準。
基礎類數據標準和指標類數據標準通過分別建立基礎類數據元和指標類數據元,并將基礎類數據元和指標類數據元與數據映射,實現基礎類數據標準和指標類數據標準的落地。
具體來說,對于結構化數據中的任意一個字段,當其不具備指標特征時,可直接將其與某一業務類別下的基礎類數據元(如包含命名規則、數據類型和值域等屬性)映射,實現該字段的標準化(符合命名規則、數據類型和值域的規定);當其具備指標特征時,可直接將其與某一業務類別下的指標類數據元(如命名規則、約束規則、數據類型和值域等)映射,實現該字段的標準化(符合命名規則、約束規則、數據類型和值域的規定)。
銀行數據模型體系
l 基于法律法規構建數據分級分類體系
根據《個人金融信息保護技術規范》(JR/T 0171-2020)及《某銀行數據安全管理辦法》要求,個人客戶C3、C2類別信息在后臺管理與業務支撐系統展示時,除銀行卡有效期外,C3 類別信息不應明文展示;C2類中支付賬號、客戶法定名稱、支付預留手機號碼、證件類或其他類識別標識信息應當做遮蔽處理,且不提供批量查詢和批量下載功能。
如特殊情況C2類上述敏感字段仍需完整展示或明文下載,則必須有如下管控措施:
1)需求提出部門必須限定最小用戶使用范圍,并經過本部門總經理(如果是分行,則為分行主要負責人)審批授權。審批單參照《某銀行個人分類分級數據授權審批單》,并在OA項目需求發起時必須含有該審批單附件。
2)系統內應當做好相關角色權限的設置和管控。
3)C2類中支付賬號、客戶法定名稱、支付預留手機號碼、證件類或其他類識別標識信息前臺頁面展現需增加水印處理,禁止復制粘貼;且批量下載時文件必須通過DRM加密,并經過審批授權流程,審批授權至少至分管部門總經理或分行主要負責人。
4)個人客戶C2類敏感信息在做批量查詢或者下載必須有審計日志功能,必須明確誰在什么時間,什么場景使用,使用權限范圍,審批流程等,日志支持前臺頁面查詢。
5)所有數據使用均遵循“誰使用誰負責”的原則。
6)以上管控措施涉及應用系統開發的,應該在開發全流程中形成閉環管控機制(包含相關業務需求的提出到業務驗收測試環節)。對于涉及上述敏感信息展示但沒有提供經領導審批的《某銀行個人分類分級數據授權審批單》,一律不予啟動開發。
7)涉及業務部門授權審批的管理環節,需求提出部門需要做好相關審批授權文檔的存檔,以備后續審查。
銀行數據分級分類體系
銀行機構數據治理交付內容
l 數據治理咨詢
協助完善數據治理組織架構(涵蓋數據治理決策層、管理層和執 行層)及數據治理相關的制度、流程和評估標準。完善數據標準,完成10個系統的數據對標,并完成主數據和元數據的梳理。建立數據質量的檢核、整改、評價等工作流程,提升數據質量。制定數據資產盤點、評估與管理工作機制,完成10個系統的數據資產盤點。構建指標管理體系,協助梳理全行基礎指標。
l 數據平臺建設
數據平臺包含數據治理平臺和數據應用平臺,實現數據的“管、 治、用”。數據治理平臺提供離線開發、數據標準、數據建模、數據質量、主數據、元數據、指標管理、數據資產和數據安全等功能,實現數據開發與治理一體化。數據應用平臺包括數據智能分析模塊,提供有效的數據分析工具,滿足靈活性、安全性和便利性。
l 數據應用實施
完成面向大數據平臺的數據血緣關系梳理。重構大數據平臺中間層(200 張表)數據模型,并進行落標實施。根據數據質量檢核規則,在數據平臺上對源頭數據和結果數據進 行規則稽核。
結合營銷與風控應用場景,完成至少200個基礎指標加工。提供不少于 5 個建模場景要求的數據支持和不少5個應用場景的功能支持(開展數據自主分析、開發報表和管理駕駛艙等)。
銀行機構數據治理建設成果
l 數據治理成果
一是數據治理戰略目標,治理頂層設計、治理目標、治理運營、治理成果等數據治理相關的戰略規劃設計材料。
二是治理組織及規章,設計某銀行數據治理組織架構,并根據數據治理目標定制相關的規章制度來保障治理落地。
三是治理實現路徑,明確某銀行數據治理工作的實施路徑,細化數據治理工作的關鍵步驟并交付相關文件給某銀行。
四是治理考核及運營,結合某銀行數字化考核目標制定數據治理考核方案,并提供數據治理支持運營及優化的方法論材料。
五是數據資產目錄,梳理某銀行業務系統、數據倉庫的數據資源,完善數據各項屬性元數據,構建全行級數據資產目錄。
六是數據標準體系,梳理某銀行現有的數據內容,搭建圍繞基礎類數據和指標類數據兩大標準體系,并完成歷史數據落標工作。
七是分級分類體系,按照人行數據分級分類指南相關規劃構建某銀行數據分級體系,并完成歷史數據的分級分類工作。
八是數據治理體系,圍繞人行、銀保監數據報送校驗規則結合某銀行數據加工過程校驗規則,構建全行級數據質量監控規則體系。
l 平臺實施成果
一是大數據平臺血緣解析,某銀行ImpalaSQL的ETL任務進行數據血緣解析,包括表血緣、字段血緣等信息,同時借助袋鼠云數據平臺實現跨系統數據交換的血緣關系。
二是數據質量規則體系搭建,圍繞銀保監East4.0/5.0數據質量規范,構建監管數據檢核規則,包括監管報表單體校驗、跨系統數據校驗(1104與East)、溯源數據質量檢驗等信息。同時,根據人行反洗錢監管要求構建交易對手信息檢核滿足人行反洗錢檢查要求。
三是大數據模型重構,根據某銀行項目要求重構大數據平臺中間層(近200 張表)數據模型,通過數據模型平臺進行模型設計、模型建標和模型落標,并通過行內現有數據進行模型驗證。
四是指標體系設計及搭建,結合某銀行在信貸營銷與風控領域的應用場景調研指標體系,并針對業務實際需求完成至少200個基礎指標加工及復雜衍生指標搭建;梳理數據資產(包括核心、信貸、 網貸等至少10個系統)并搭建數據資產目錄;根據監管及內部管理需求梳理數據標準體系并通過平臺落地;圍繞人行金融數據分級分類規范搭建某銀行數據分級體系并結合銀保監數據加密規范實現數據安全保障體系。
五是數據分析場景服務,根據某銀行應用需求提供不少于 5個建模場景要求的數據支持和不少于 5 個應用場景的功能支持開展數據自主分析、開發報表和管理駕駛艙等。