三、模型驅動的標準落標方案
1.落標關鍵點剖析
根據(jù)筆者的經驗與實踐,數(shù)據(jù)標準的落標需要重點考慮三大問題:
問題1:什么數(shù)據(jù)需要制定哪些標準
問題2:什么系統(tǒng)落什么標準
問題3:什么人與什么時間執(zhí)行
如果這三個問題沒有想清楚,基本數(shù)據(jù)標準的梳理會停留在Excel層面,標準的政策會停留在墻上,無法走入每個設計者的頭腦和每個系統(tǒng)的每個字段。
我們先來說第一個問題,什么數(shù)據(jù)需要制定標準,首先我們回到數(shù)據(jù)標準所要解決問題的初衷,數(shù)據(jù)標準主要解決數(shù)據(jù)在共享,融合,匯集應用中的不一致問題。好的,那么我們看哪些數(shù)據(jù)會出現(xiàn)在這個這三個環(huán)節(jié)中,以及哪些容易出現(xiàn)問題。對于與一個企事業(yè)組織來說,按照價值鏈,一般關注三大要素:客戶,產品,大運營。IBM和TD將銀行業(yè)劃分為九大概念數(shù)據(jù),也是圍繞客戶與產品的大運營活動細分。那么有如下幾類數(shù)據(jù)會在數(shù)據(jù)應用過程中,會更多出現(xiàn)融合和匯總的機會,需要格外注意。
第二個問題和第三個問題是實際工作中非常困擾的,落標的大多數(shù)困難與此有關,因此我將其放在一起來說明。一般我將系統(tǒng)與數(shù)據(jù)分列如下列表:
總結
通過這個表格的內容,我們發(fā)現(xiàn)數(shù)據(jù)標準從源頭落地,會減少數(shù)據(jù)的處理成本,提高數(shù)據(jù)應用的效益,缺點是對于存量系統(tǒng)和外購系統(tǒng)存在較大改動風險和成本。如果從數(shù)據(jù)的倉庫層進行落標,比較容易著手處理,落標后的下游數(shù)據(jù)系統(tǒng)則自動統(tǒng)一數(shù)據(jù)標準,然而數(shù)倉層的報表應用與業(yè)務系統(tǒng)的報表存在口徑不一致性在所難免,仍然需要源數(shù)據(jù)層進行必要調整。
無論從哪一層入手,模型的優(yōu)良設計環(huán)節(jié)都是必要條件,否則整個落標過程會沒有抓手,流程也不順暢。
2.落標整體方案
無論是原系統(tǒng)數(shù)據(jù)還是數(shù)倉數(shù)據(jù),都是不同的開發(fā)團隊負責,遵循軟件開發(fā)標準的流程包括設計,開發(fā),測試,上線,維護等環(huán)節(jié),因此我們需要在這個過程中,將數(shù)據(jù)標準這個優(yōu)良的炮彈,送到最前線,同時,管理團隊需要參與這個過程的關鍵節(jié)點中,這需要企業(yè)在數(shù)據(jù)管理上提高管理和執(zhí)行水平。
鑒于普通銀行當前的數(shù)據(jù)基礎水平,數(shù)據(jù)的落標同樣受到人力和財力的制約。所以一個自動化水平非常高的落標方案是非常切合我國普通銀行的發(fā)展階段的。因此,本落標方案的關鍵思想是在開發(fā)階段由模型設計人員進行落標,標準管理和架構管理人員進行評審和核準,同時,自動檢測能力來提高執(zhí)行水平和激勵環(huán)節(jié)的落地。
《自動化落標方案》
2.1 標準的定位
這里主要是在系統(tǒng)的需求設計和準備過程中,我們對數(shù)據(jù)標準需要準備好一些前提條件:
標準的技術規(guī)范已經準備好
數(shù)據(jù)標準已經具有詳細的技術規(guī)范,包括物理數(shù)據(jù)類型,可以直接應用的物理層上,并已經準備好邏輯數(shù)據(jù)類型到不同數(shù)據(jù)庫的類型映射。這里數(shù)據(jù)類型在DDM中是邏輯數(shù)據(jù)類型,具備自動類型轉換能力。
標準的主題已經準備好
標準的主題其實是標準的應用范圍和檢索目錄,對于具備條件的銀行應該設計出邏輯模型,對數(shù)據(jù)標準進行業(yè)務組織。這樣在落標過程中,這是重要的選擇依據(jù)。
標準已經權威發(fā)布
標準已經經過討論,進行了公開發(fā)布,具有流程上的正式性和權威性。
2.2 模型設計中的落標
數(shù)據(jù)模型是一個更好的數(shù)據(jù)字典,其向上承接業(yè)務語義,向下實現(xiàn)物理數(shù)據(jù),它不但包含了數(shù)據(jù)字典,更重要的是包含了業(yè)務的主題,業(yè)務主對象,數(shù)據(jù)關系,以及數(shù)據(jù)標準的映射。所以模型及其工具的運用不但是企業(yè)數(shù)據(jù)管理是否成熟的重要標志,也是數(shù)據(jù)標準落標的重要依托。不進行模型設計和管理,落標操作則事倍功半,因為失去了管理的最佳時機。
通過創(chuàng)新一個模型工具,在開發(fā)階段,自動管理數(shù)據(jù)字典和模型,實現(xiàn)下面三個落標操作。
建立標準和數(shù)據(jù)的映射
標準落地的屬性繼承:
一般情況下,數(shù)據(jù)字段落地標準時要引用標準中上述內容,另還包含數(shù)據(jù)的標準代碼,其中強制性一致的是標準中的技術規(guī)范。
物理字段的落地衍生:
對于一個標準落地的物理字段,如果語義本質是相同的,并且業(yè)務規(guī)則沒有變化,不過滿足系統(tǒng)環(huán)境,而加上特定限定環(huán)境。比如“電話”在供應商的表里叫“供應商電話”,這是一種落地衍生情況,并不需要創(chuàng)建一個新的標準。如前一節(jié)所示有一些則需要新的標準或新的子類標準。
建立代碼的標準引用 :
對字段中的數(shù)據(jù)類型的引用進行標準化,堅決杜絕Comment里手工寫枚舉代碼的情況。
標準化命名
2.3 模型的評審
在模型的開發(fā)基本完成后,在系統(tǒng)的測試階段,我們加入模型的評審環(huán)節(jié),這個作為系統(tǒng)上線的前奏,避免上線前的修改造成時間緊張等情況。
模型評審前需要創(chuàng)建模型基線,評審包含以下幾個內容:
標準的落標引用
模型工具應該自動提供報告,重點檢查是否有重要的標準沒有引用和落地,通過自動化的工具,智能發(fā)現(xiàn)落標的潛在問題。
自定義標準與詞典的評審和轉化
DDM模型工具具備自定義數(shù)據(jù)標準和詞典等能力,通過與開發(fā)團隊評審,提高自定義標準的轉化率,完善標準庫。
元數(shù)據(jù)的充足率
模型工具應該自動提供報告,列出中文名稱沒有填寫的字段。
其他模型質量
比如檢查模型主題覆蓋率等。
2.4 上線的核準
一般情況下,系統(tǒng)的上線過程需要一個更加標準的流程,提交設計,文檔,測試報告,升級步驟等內容,有專業(yè)的團隊和流程工具來審核。在這個過程中,我們并不主張此環(huán)節(jié)進行落標的核準,因為此環(huán)節(jié)已經太晚,我推薦在評審環(huán)節(jié)完成落標工作,在此環(huán)節(jié)中,只需要提交落標和模型報告作為過審文檔。模型核準環(huán)節(jié)包含以下幾個工作要做:
模型生產庫基線與封板
根據(jù)評審時建立的模型分支,建立模型的生產庫基線,并進行封板操作。
模型基線報告
提供模型標準數(shù)據(jù)字典,標準落標報告,模型質量報告。
2.5 自動監(jiān)測變化
對于已經發(fā)布的模型,隨著進入維護期,某些升級的情況下,可能會有徒手修改庫表結構的情況發(fā)生,為了保證模型與生產庫的一致,在自動檢測階段,主要負責定期發(fā)現(xiàn)不一致的情況,并發(fā)出預警郵件,過程如下。
3.新增和變更流程
在實際落標過程中,需要新增或修改標準的情況是必然出現(xiàn)的。因此在設計階段或者模型評審階段,進行變更流程。
4.角色與人力安排
根據(jù)銀行當前的組織結構,需要有建立“標準和架構組”,至少2人編制,可以是虛擬組織結構和兼職角色。
數(shù)據(jù)架構師(1人):由企業(yè)資深(10+年數(shù)據(jù)開發(fā)經驗)數(shù)據(jù)設計人員或管理人員擔任,熟悉行業(yè)數(shù)據(jù)模型和企業(yè)主流業(yè)務邏輯模型,比較熟悉各系統(tǒng)模型情況。主要負責模型管控,落標評審,模型質量等工作。
標準管理員(1人):由高級(5+年數(shù)據(jù)管理經驗)數(shù)據(jù)標準設計和管理人員擔任,比較熟悉標準和企業(yè)業(yè)務邏輯模型。 主要負責標準維護,標準評審,模型質量提高等工作。
5.存量數(shù)據(jù)如何落標
存量系統(tǒng)的落標是很多企業(yè)進行標準化第一障礙,前面也進行了痛點分析,那么如何解決落標問題呢?我建議遵循下面方法。
存量系統(tǒng)先管理好數(shù)據(jù)模型和字典,這作為未來統(tǒng)一數(shù)據(jù)標準的基礎。
摸清模型存量系統(tǒng)不符標準的情況,尤其是那些標準代碼,編碼規(guī)則,存儲格式等嚴重影響數(shù)據(jù)指標和拉通匯集的情況。
根據(jù)非標問題的影響程度,制定未來的落標計劃,選擇合適的升級版本時機,進行逐項的落標。
未落標前,可以先落標ODS層或API層,這樣可以糾正后期應用的標準化問題。
6.標準代碼的多標準處理
企業(yè)里存在多套標準是非常有可能的,比如一個客戶類型的代碼,原系統(tǒng)一套標準,數(shù)倉一套標準,報送EAST模型可能又是一套標準,那么怎么管理這多套標準呢?
建議對標準進行有效范圍的定義,以明確每套標準的用途,比如原系統(tǒng)的標準作為地方標準,數(shù)倉的作為中央標準,EAST模型的標準作為對外標準。
建立標準之間的映射管理,做好數(shù)據(jù)拉通的依據(jù)解決。這樣設計標準的維護和變更就可以重點選擇哪里進行新增,以及如何進行統(tǒng)一等。
四、Datablau簡介
1.公司簡介
公司全稱:北京數(shù)語科技有限公司
注冊資本:2703.6萬元
注冊地: 北京海淀區(qū)海淀北二街8號10層
注冊時間:2016年11月24日
法定代表人:王琤
北京數(shù)語科技有限公司(以下簡稱“數(shù)語科技”)成立于2016年11月,是專注于數(shù)據(jù)治理領域的國內自主知識產權的專業(yè)軟件產品提供商,主要業(yè)務是數(shù)據(jù)治理軟件產品的研發(fā)與銷售。數(shù)語科技的創(chuàng)始團隊全部來自CA erwin,天然具有世界級水準的軟件產品開發(fā)能力。創(chuàng)始人兼CEO王琤曾任職erwin全球研發(fā)總監(jiān),擁有超過十年以上數(shù)據(jù)建模和數(shù)據(jù)管理的從業(yè)經驗。CTO朱金寶曾任職erwin首席架構師,先后服務多家全球知名企業(yè),并曾全程參與中國建設銀行數(shù)據(jù)治理項目,目前全面負責Datablau軟件平臺的研發(fā)工作和關鍵項目的實施工作。
數(shù)語科技根據(jù)DAMA理論和中國國情獨立研發(fā)Datablau新一代數(shù)據(jù)治理平臺,平臺由Datablau DDM數(shù)據(jù)建模產品和Datablau DAM數(shù)據(jù)資產管理平臺兩大部分組成,全部擁有軟件著作權和知識產權,一站式全面滿足中國企業(yè)的數(shù)據(jù)治理需求。其中數(shù)據(jù)建模產品DDM是Datablau填補國內空白的重量級產品,幫助中國客戶擺脫國外產品的壟斷現(xiàn)狀。
2018年,Datablau數(shù)據(jù)治理平臺通過了中國信息通信研究院嚴格苛刻的產品評測并獲得的“最佳大數(shù)據(jù)產品”獎。
2.Datablau Data Modeler簡介
DDM(Datablau Data Modeler)是國內首創(chuàng)的專業(yè)建模工具,是數(shù)據(jù)治理體系的重要組成部分。數(shù)據(jù)模型是“所有系統(tǒng)、文檔和流程中包含的所有數(shù)據(jù)的語境。是生數(shù)據(jù)的知識?!睋Q句話說,如果沒有數(shù)據(jù)模型,組織IT系統(tǒng)中收集和存儲的所有數(shù)據(jù)都會失去意義,也就沒有業(yè)務價值。
3.聯(lián)系我們
產品網站: www.datablau.cn
E-mail:sale@datablau.com
聯(lián)系電話:136-5120-3330
地址:北京市朝陽區(qū)光華路SOHO3q
———— / END / ————
感謝閱讀本文章,歡迎留下評論及個人見解!
朱金寶 CTO
目前供職于北京數(shù)語科技有限公司,實施了多家大型企事業(yè)單位的數(shù)據(jù)治理項目,有豐富的企業(yè)數(shù)據(jù)管理工具開發(fā)經驗。前ERwin總架構師,10年ERwin研發(fā)經驗,負責產品全生命周期的發(fā)布,豐富產品發(fā)布和架構設計經驗,多個大數(shù)據(jù)建模專利所有者和技術文章作者。