數(shù)據(jù)倉庫是為了有效地將操作型數(shù)據(jù)集成到統(tǒng)一的環(huán)境中,以提供決策型數(shù)據(jù)訪問的各種技術(shù)和模塊的總稱。數(shù)據(jù)倉庫作為一種將數(shù)據(jù)轉(zhuǎn)換為信息、知識的技術(shù)手段,能夠?yàn)橛脩籼峁┯糜跊Q策支持的當(dāng)前和歷史數(shù)據(jù),被認(rèn)為是商業(yè)智能的核心組件。
數(shù)據(jù)倉庫具有四個(gè)顯著特點(diǎn)。①主題性。主題是一個(gè)在較高層次將數(shù)據(jù)歸類的標(biāo)準(zhǔn),數(shù)據(jù)倉庫中每一個(gè)主題對應(yīng)一個(gè)宏觀的分析領(lǐng)域。②集成性。在數(shù)據(jù)進(jìn)入數(shù)據(jù)倉庫之前,必須進(jìn)行數(shù)據(jù)加工和集成,這是建立數(shù)據(jù)倉庫的關(guān)鍵步驟,首先要統(tǒng)一原始數(shù)據(jù)中的矛盾之處,還要將原始數(shù)據(jù)結(jié)構(gòu)作出從面向應(yīng)用向面向主題的轉(zhuǎn)變。③穩(wěn)定性。數(shù)據(jù)倉庫反映的是歷史數(shù)據(jù)的內(nèi)容,而不是日常事務(wù)處理產(chǎn)生的數(shù)據(jù),數(shù)據(jù)經(jīng)加工和集成進(jìn)入數(shù)據(jù)倉庫后是很少修改或根本不修改的。④歷史性。數(shù)據(jù)倉庫是不同時(shí)間的數(shù)據(jù)集合,它要求數(shù)據(jù)倉庫中的數(shù)據(jù)保存時(shí)限能滿足進(jìn)行決策分析的需要,而且數(shù)據(jù)倉庫中的數(shù)據(jù)都要標(biāo)明該數(shù)據(jù)的歷史時(shí)期。
數(shù)據(jù)倉庫與傳統(tǒng)數(shù)據(jù)庫不同,它并非一個(gè)僅僅存儲數(shù)據(jù)的簡單數(shù)據(jù)庫,它實(shí)際上是一個(gè)以大型數(shù)據(jù)管理信息系統(tǒng)為基礎(chǔ),存儲企業(yè)所有業(yè)務(wù)數(shù)據(jù)庫中獲取的綜合數(shù)據(jù),并能夠利用這些綜合數(shù)據(jù)為用戶提供經(jīng)過處理后的有用信息的應(yīng)用系統(tǒng)。數(shù)據(jù)倉庫的要求是能夠準(zhǔn)確、安全、可靠地從數(shù)據(jù)庫中取出數(shù)據(jù),經(jīng)過加工轉(zhuǎn)換成有規(guī)律信息之后,再供管理人員進(jìn)行分析。
組織機(jī)構(gòu)的聯(lián)機(jī)事務(wù)處理系統(tǒng)所累積的大量資料,通過數(shù)據(jù)倉庫理論所特有的資料儲存架構(gòu),可以進(jìn)行系統(tǒng)地分析整理,以利于各種分析方法如聯(lián)機(jī)分析處理、數(shù)據(jù)挖掘的進(jìn)行,進(jìn)而支持如決策支持系統(tǒng)、主管資訊系統(tǒng)的創(chuàng)建,幫助決策者快速有效地從大量資料中,分析出有價(jià)值的資訊,以利于決策擬定及快速回應(yīng)外在環(huán)境變動,幫助建構(gòu)商業(yè)智能。
為了更好地為前端應(yīng)用服務(wù),數(shù)據(jù)倉庫最根本的特點(diǎn)是物理地存放數(shù)據(jù),而且這些數(shù)據(jù)并不是最新的、專有的,而是來源于其他數(shù)據(jù)庫,它要建立在一個(gè)較全面和完善的信息應(yīng)用的基礎(chǔ)上,用于支持高層決策分析,而事務(wù)處理數(shù)據(jù)庫在企業(yè)的信息環(huán)境中承擔(dān)的是日常操作性的任務(wù)。數(shù)據(jù)倉庫是數(shù)據(jù)庫技術(shù)的一種新的應(yīng)用,21世紀(jì)初期的數(shù)據(jù)倉庫用數(shù)據(jù)庫管理系統(tǒng)來管理其中的數(shù)據(jù)。