國內(nèi)80%以上的大中企業(yè)已經(jīng)實現(xiàn)財務電算化,但企業(yè)數(shù)據(jù)的有效利用率卻不足7%。
美國好萊塢的警匪片中經(jīng)常出現(xiàn)這樣的鏡頭:警察往電腦中輸入嫌犯的社會保險號(Social Security Number,SSN),就能立即調(diào)取出此人的相關信息,身高、血型、駕照號這些基本資料一應俱全,就連他最近的信用卡記錄和納稅記錄等也能立即被調(diào)取出來。
從浩瀚的數(shù)據(jù)庫和錯綜復雜的信息系統(tǒng)中如此迅速地找出這些數(shù)據(jù)似乎對于擁有世界上最先進信息手段的美國政府來說,并不是什么難事。但細想下來,各種數(shù)據(jù)來自不同的系統(tǒng)、不同的地區(qū),甚至同一數(shù)據(jù)的源頭也可能不同,存在海量的干擾數(shù)據(jù),如何分析、篩選、合并數(shù)據(jù),并在很短的時間內(nèi)找到所需的準確數(shù)據(jù)并非人們看到的那么容易,這背后需要強大的數(shù)據(jù)管理系統(tǒng)提供支持。
除了美國政府,還有很多美國企業(yè)也正在領會到數(shù)據(jù)管理的重要意義。一些美國企業(yè)的信息化歷程已經(jīng)超過五六十年,各種信息系統(tǒng)更迭換代、技術覆蓋面很廣、數(shù)據(jù)龐雜且來源復雜,積累到一定量后不僅對信息系統(tǒng)運行的貢獻力不大,甚至可能對其造成干擾。所以,許多企業(yè)開始針對數(shù)據(jù)進行治理,分析、合并各種歷史數(shù)據(jù),再從質(zhì)量上佳的數(shù)據(jù)中尋求最有價值的數(shù)據(jù),以供企業(yè)分析、決策使用。
相對于美國企業(yè),中國大部分企業(yè)的信息化歷程不過10多年,信息系統(tǒng)采集、沉淀的數(shù)據(jù)看似還不至于對企業(yè)造成困擾。但事實并非如此,中國企業(yè)信息化時間雖然不長,但歷程卻同樣復雜,尤其近幾年,國內(nèi)企業(yè)的信息化程度逐步加深,企業(yè)并行上線了ERP、CRM、SCM等管理信息系統(tǒng)。伴隨而來的是“信息化的手段越高,積累的速度越快,數(shù)據(jù)膨脹的速度也越快”,數(shù)據(jù)質(zhì)量問題日益困擾著中國企業(yè)。
根據(jù)國家財政部的統(tǒng)計,國內(nèi)80%以上的大中企業(yè)已經(jīng)實現(xiàn)財務電算化,但企業(yè)數(shù)據(jù)的有效利用率卻不足7%。這使得企業(yè)在信息化建設方面的巨大投入只能獲得部分回報,IT資源浪費巨大。
質(zhì)量決定數(shù)據(jù)
最近,北京天壇醫(yī)院的信息中心主任王韜正在考慮建立一個“醫(yī)療鑒別診斷知識庫”,供臨床經(jīng)驗還不是很豐富的新醫(yī)生診斷病人病情時參考使用。之所以有這樣的計劃是因為天壇醫(yī)院此前在國內(nèi)醫(yī)療行業(yè)率先使用了PACS系統(tǒng)(醫(yī)學影像存檔和通信系統(tǒng)),以取代傳統(tǒng)的膠片把病人的病歷影像資料用數(shù)字化圖像的形式保存下來。“短短幾年,我們醫(yī)院積累的影像數(shù)據(jù)量已經(jīng)超過6個T。”王韜說。
這些影像數(shù)據(jù)資料除了供當時接受診斷的病人使用外,對其他醫(yī)生診斷別的病人也是很珍貴的參考資料。于是,王韜想通過建立“知識庫”,從這些海量數(shù)據(jù)中篩選出有價值的影像數(shù)據(jù)資料,以實現(xiàn)醫(yī)生知識共享。此外,他還打算建立天壇醫(yī)院的輔助決策系統(tǒng),讓醫(yī)生能方便地訪問篩選出的有效數(shù)據(jù),從中自動選取對他們有價值的資料,幫助醫(yī)生診斷病人病情、制訂治療方案。王韜的這個設想與新興的數(shù)據(jù)治理的提法不謀而合。
“數(shù)據(jù)治理的意義就是發(fā)揮出數(shù)據(jù)的最大價值。”Informatica公司大中華區(qū)總經(jīng)理田哲夫說。10多年的信息化建設已經(jīng)讓中國企業(yè)發(fā)現(xiàn),數(shù)據(jù)是企業(yè)管理的“命脈”。如何讓積存已久的數(shù)據(jù)“重見天日”,將數(shù)據(jù)的價值真正發(fā)揮出來成為數(shù)據(jù)治理的重點。
企業(yè)運行需要依賴各種信息系統(tǒng),不同系統(tǒng)具有不同的數(shù)據(jù)結構;此外,同一企業(yè)跨地區(qū)、跨領域獲取的數(shù)據(jù)也需要歸類,這些都涉及到對數(shù)據(jù)的提煉和管理。
此外,信息產(chǎn)業(yè)層出不窮的新技術一方面在產(chǎn)生大量數(shù)據(jù),另一方面對數(shù)據(jù)質(zhì)量有著更高的要求。時下很熱門的RFID技術可以對養(yǎng)殖場里的任何一只雞的生長過程進行跟蹤,記錄每只雞從出生到運走的每天飲食和活動數(shù)據(jù)。這些數(shù)據(jù)可以為防范禽類疫病傳播提供參考依據(jù)。這些必然要求企業(yè)建立一個強大的數(shù)據(jù)平臺對各種信息系統(tǒng)采集的海量數(shù)據(jù)進行提煉、歸納和選取,才能在最短的時間配合相應的信息系統(tǒng)分析處理數(shù)據(jù),讓企業(yè)的IT投入快速、高效地產(chǎn)出。
去偽存真
數(shù)據(jù)治理的根本途徑就是要對數(shù)據(jù)進行分析和保護。在田哲夫看來,數(shù)據(jù)治理包括數(shù)據(jù)的移植、合并、質(zhì)量管理及同步使用等。
對于數(shù)據(jù)移植,CIO們并不陌生。當信息系統(tǒng)擴容、更新?lián)Q代或應用發(fā)生轉變都會涉及數(shù)據(jù)移植。在這個過程中,CIO只要充分考慮數(shù)據(jù)移植前后,數(shù)據(jù)的完整性、一致性、可靠性,難度并不大。
在數(shù)據(jù)治理過程中,CIO經(jīng)常會碰到數(shù)據(jù)合并的問題。最近,澳大利亞標準協(xié)會準備變更一個標準——馬桶的承重量標準。這是因為隨著現(xiàn)代人飲食結構和體質(zhì)的改變,人們的平均體重增加,舊的馬桶負荷標準已越來越不適用現(xiàn)代人的需求??墒切聵藴嗜绾未_立,就要依靠統(tǒng)計數(shù)據(jù)決定。然而統(tǒng)計數(shù)據(jù)來源復雜,可能來自于不同地域、不同系統(tǒng),這就涉及到對不同源頭的各種格式的數(shù)據(jù)進行縱向合并。
另外,在企業(yè)內(nèi)部數(shù)據(jù)庫中也存在大量的數(shù)據(jù),盡管它們是以不同屬性、不同結構散落在不同的系統(tǒng)中,多數(shù)也是準確的,但也有一部分數(shù)據(jù)是相互矛盾或不準確的,使用這樣的數(shù)據(jù)肯定會造成誤差。因此,對數(shù)據(jù)的質(zhì)量管理就變得十分重要。對此,田哲夫建議企業(yè)可以通過統(tǒng)一的平臺對數(shù)據(jù)源進行管理,建立一個指標體系,對數(shù)據(jù)的采集路徑進行跟蹤,以確保數(shù)據(jù)的正確性和有效性。“數(shù)據(jù)可以自下而上、由點到面匯總上來。當發(fā)現(xiàn)與事實不符時,也可以由上而下找出問題,進行追蹤。”
不同信息系統(tǒng)中的數(shù)據(jù)保持同步對于處在激烈競爭環(huán)境中、對變化要求快速響應的企業(yè)十分重要。博士倫公司在中國有300多個銷售網(wǎng)點,這些網(wǎng)點的銷售員每天都要用PDA將銷售數(shù)據(jù)和競爭對手的信息記錄下來,并通過公司的移動訪銷系統(tǒng)將數(shù)據(jù)上傳至總部。對于遠在北京的博士倫中國總部來說,這些數(shù)據(jù)非常重要,它們是企業(yè)BI系統(tǒng)分析的基礎和關鍵。“這些數(shù)據(jù)通常每小時更新一次,公司決策層可以在任何時候都能掌握最新的銷售數(shù)據(jù),這對公司很重要。”博士倫中國區(qū)信息管理和技術高級經(jīng)理陳其偉說。
如今,越來越多的組織開始意識到數(shù)據(jù)質(zhì)量的重要性,尤其是電信、金融行業(yè)對數(shù)據(jù)質(zhì)量的要求十分嚴格,因此有效治理數(shù)據(jù)對于它們的意義不僅是合理利用IT資源,而是直接反應在經(jīng)濟效益上,所以數(shù)據(jù)治理已成為這些企業(yè)搭建信息系統(tǒng)的重點。
其實,無論是數(shù)據(jù)的移植、合并、質(zhì)量管理及同步,從技術角度來看,處理起來并不復雜,既可以通過建立統(tǒng)一的平臺集中來進行數(shù)據(jù)治理,也可以針對其重要性分段處理。如今,一些企業(yè)已經(jīng)意識到數(shù)據(jù)質(zhì)量對企業(yè)的重要意義,有些企業(yè)也會對其進行定期維護和管理,但就目前而言,通過手工進行數(shù)據(jù)治理的國內(nèi)企業(yè)居多。隨著企業(yè)規(guī)模擴大、市場競爭加劇、人力資源成本越來越昂貴,單純依靠人工提升數(shù)據(jù)質(zhì)量勢必會影響企業(yè)IT投入回報,進而甚至可能影響企業(yè)的發(fā)展。因此從長遠看,通過統(tǒng)一的數(shù)據(jù)管理平臺對數(shù)據(jù)進行規(guī)范化處理無疑是更為高效、快捷的辦法。
對于那些還未建立信息系統(tǒng)或信息化尚不完善的企業(yè),數(shù)據(jù)治理理念同樣可以幫助這些企業(yè)的CIO規(guī)劃如何搭建、重組系統(tǒng),爭取將未來系統(tǒng)中積累的數(shù)據(jù)價值挖掘到最大。“在系統(tǒng)設計時,就開始思索如何標準化、規(guī)范化你的數(shù)據(jù),你將會獲得更有價值的數(shù)據(jù)。”田哲夫建議道,“那樣,你在選擇應用系統(tǒng)或開發(fā)環(huán)境的同時,就能避免浪費投資和資源。”