正文
數據治理是企業數據建設必不可少的一個環節。
好的數據治理體系可以盤活整條數據鏈路,最大化保障企業數據的採集、存儲、計算和使用過程的可控和可追溯。
如何構建企業數據治理體系?企業數據治理過程需要注意哪些問題?總體而言,不能一口一個胖子,路要一步一步地走。
下面我將結合企業級數據治理經驗,詳細介紹從0到1搭建數據治理體系全流程,幫你梳理數據治理的主要內容以及過程中會遇到的哪些坑。
如有遺漏之處,歡迎留言評論區探討。

在正文之前,我先介紹一個小故事。
年底了,企業財務管理員小張需要統計公司的金融財務情況。忙碌了一年,公司老闆亟需知道公司目前的運營狀況。
小張需要考慮哪幾個點呢:
「幸好小張年初已經制定了一套管理標準。每筆財產的出入都有記錄且嚴格把控使用情況,過程可追溯可審查。
最後,小張得到了領導們的一致好評。
1.2 數據治理做的事情故事中的小張監管着公司所有金融財產活動,確保財產使用的有序高效。這也是數據治理角色的類似功能。
「數據治理的核心工作: 在企業的數據建設進程中,保障企業的數據資產得到正確有效地管理。
」一般來說,數據從外部或者內部產生後,經過大數據手段處理,流轉到不同的業務端,為企業的上層應用提供數據賦能。

整個過程,如圖所示。
整體流程數據治理體系將全程監管。要確認進出系統的數據質量怎麼樣?是否可轉化數據資產?數據血緣是否可追溯、數據安全等問題。
「髒亂差的數據是無法使用的,甚至嚴重埋雷。
」2 為什麼要做數據治理有一些企業對這個問題的概念很模糊,認為目前的數據規模很小,人為可控,暫時不需要做數據治理。
但是在實際使用中還是會遇到很多問題:
無論企業的數據規模如何,我認為還是提起做好數據治理的規劃。考慮到成本的問題,可以分階段進行。
「為什麼要進行數據治理:
有劍在手不用和無劍可用是兩回事。提前做好數據治理規劃,會節省後續的改造成本,避免過程冗餘重構或者推倒重來等情況的發生。

數據治理可以有效保障數據建設過程在一個合理高效的監管體系下進行,最終提供高質量、安全、流程可追溯的業務數據。
3 數據治理體系企業數據治理體系包括數據質量管理、元數據管理、主數據管理、數據資產管理、數據安全及數據標準等內容。

1)數據質量
一般採用業內常用的標準來衡量數據質量的好壞:完整性、準確性、一致性和及時性。

2)元數據管理
元數據是關於數據的組織、數據域及其關係的信息,通俗理解,元數據就是描述數據的數據。

元數據包含技術元數據和業務元數據。可以幫助數據分析人員清楚了解企業擁有什麼數據,它們存儲在哪裡,如何抽取、清理、維護z這類數據,也即數據血緣。
3)主數據管理
企業主數據指企業內一致並共享的業務主體,大白話理解就是各專業公司和業務系統間共享的數據。
常見的主數據比如公司的員工、客戶數據、機構信息、供應商信息等。這些數據具有權威性和全局性,可歸約至公司的企業資產。
一般主數據管理需要遵循如下幾點:
4)數據資產管理
一般企業在數字化轉型時都會考慮數據資產梳理。你的數據有沒有被合理利用?如何產生最大價值?這是數據資產管理關心的核心工作。
在構建企業資產時一般會考慮不同角度,即業務角度和技術角度,最後進行合併,輸出統一的數據資產分析,並向外提供統一的數據資產查詢服務。

如何盤活數據,形成數據資產,提供完整的數據資產全景視圖,可方便運營者全局、宏觀地掌控企業資產動態。
5)數據安全
數據安全是企業數據建設必不可少的一環,我們的數據都存儲在大大小小的磁盤中,對外提供不同程度的查詢和計算服務。
需要定時對數據進行核查、敏感字段加密、訪問權限控制,確保數據能夠被安全地使用。
6)數據標準
大白話理解,我們需要在組織內定義一套關於數據的規範,好讓我們都能理解這些數據的含義。
今天張三說這個客戶號是辦理銀行卡的客戶,明天李四又說是借貸過的客戶。對比一看,兩者的字段類型和長度一致,到底要採納哪個意見呢?
數據標準是保障數據的內外部使用和交換的一致性和準確性的規範性約束,通過統一規範,消除二義性。
4 企業數據治理實施過程4.1 數據治理實施框架數據治理體系是為了規範業務數據規範、數據標準、數據質量和數據安全中的各類管理任務活動而建立的組織、流程與工具。
通過一個常態化的數據治理組織,建立數據集中管理長效機制,規範數據管控流程,提升數據質量,促進數據標準一致,保障數據共享與使用安全,從而提高企業運營效率和管理水平。

企業數據治理體系除了在技術方面的實施架構,還需要管理方面的組織架構支撐。
一般在數據治理建設初期,集團會先成立數據治理管理委員會。從上至下由決策層、管理層、執行層構成。決策層決策、管理層制定方案、執行層實施。層級管理、統一協調。
4.2.1 組織架構1)決策層
提供數據標準管理的決策職能,通俗理解即拍板定方案。
2)管理層
3)執行層

1)項目經理
2)專家評審組
評審項目方案,確定方案的合理性
3)PMO
3)數據治理專項組
執行各項目的落地實施和運營推廣,推動執行層的實施數據治理技術落地和項目進展。

數據架構師、數據治理專家和業務專員形成數據治理"鐵三角",緊密協作,推進數據治理與數據架構落地。

1)業務專員
業務專員作為業務部門數據治理的接口人,在標準、質量、應用等領域組織業務人員開展工作
2)數據治理專家
數據治理專家作為數據治理組成員,負責設計數據架構,運營數據資產;牽頭組織業務、IT達成數據治理目標。
3)數據架構師
數據架構師作為IT開發部門的專家,承擔數據標準落地、模型落地的重任,協助解決數據質量問題。
在確定了技術實施方案和組織管理架構,下面需要進行數據治理體系的落地實施。
在大型企業中一般會開發一個完整的數據治理平台,囊括所有數據治理功能,對外提供平台服務。
1)核心功能
數據治理平台作為數據治理的產品體系,旨在保障數據平台的數據是安全、可靠的、標準的、有價值的。

2)元數據管理
元數據管理系統作為數據治理平台的前端展示門戶,幫助實現對數據資產的快速檢索能力,提高數據使用有效性和效率。
通過建立完整且一致的元數據管理策略,提供集中、統一、規範的元數據信息訪問、查詢和調用功能。

3)數據質量

4)數據標準
支持定製統一的數據標準平台,包括字段標準管理,碼值標準管理以及字典管理,業務源數據和中台數據統一標準。

5)數據安全
基於集團數據資產實現數據安全分級管理,自動識別安全信息;提供數據訪問安全行為監測,及時識別訪問風險。

數據治理平台開發完成並運行,需要對整體數據治理體系的效果進行驗證和評估。
「1)數據是否可以消除"髒、亂、差"的現象2)數據資產是否最大價值化3)所有數據的血緣是否完整可追溯。。。
」1)數據資產
通過構建數據資產管理體系,實現資產全覆蓋,並支持全局搜索和精準定位目標資產。

2)數據標準
新舊數據標準沉澱,打通了數據建模工具、數據標準庫和詞根標準庫,落地數據標準和詞根。

3)數據安全
保持事前制度建設、事中技術管控、事後監控審計的原則建立全流程數據安全管控體系。
基於以上數據安全管控體系,支持數據安全定級,構建靈活的數據安全共享流程。

4)數據質量
通過數據質量雷達圖,定期進行數據和任務質量打分,綜合考察數據質量效果。

1)數據治理是否要做得大而全
「這是一個經典問題,一般對於不同階段和規模的企業,數據治理的實施程度會有所不同。一般建議先根據自身的數據狀況分階段進行,避免盲目鋪開規模,過程中可調整。
」2)數據治理只是技術考慮的事情
「正如文中所說,數據治理不僅僅是技術團隊的事情,而是整個集團一起協作完成。其中就包括各業務線以及其他管理組織,沒有一個好的實施方案和協作機制,往往事倍功半。
」3)數據治理可以短期見效
「數據治理是個長期過程,會跟隨着企業數據的規模和數倉規劃的變更同步調整,部分功能可能會在短期內卓有成效,完整體系搭建短期很難實現。
」4)必須得有工具平台,才能開展數據治理
「俗話說工欲善其事必先利其器,有好的工具當然是更好,前提是已經有了成熟的數據治理體系規劃和策略。工具和技術手段目前市面上很成熟,先把理論給鋪墊好。
」5)數據治理感覺很模糊?不知道最後的落地結果
「數據治理是一個長期工作,需要相關從業者根據企業的數據現狀和管理模式去構建和調整,建議邊做實踐邊總結歸納,小步慢跑是一個很好的方式。
」