免费视频淫片aa毛片_日韩高清在线亚洲专区vr_日韩大片免费观看视频播放_亚洲欧美国产精品完整版

打開APP
userphoto
未登錄

開通VIP,暢享免費(fèi)電子書等14項(xiàng)超值服

開通VIP
數(shù)據(jù)倉庫模型設(shè)計(jì)

數(shù)據(jù)倉庫的設(shè)計(jì)是建立面向企業(yè)決策者的分析環(huán)境和系統(tǒng)。

數(shù)據(jù)倉庫設(shè)計(jì) vs 數(shù)據(jù)庫設(shè)計(jì)

數(shù)據(jù)倉庫中的數(shù)據(jù)具有面向主題、數(shù)據(jù)集成、不易更新、隨時(shí)間變化的特點(diǎn),這些特點(diǎn)是數(shù)據(jù)庫系統(tǒng)沒有的,因此數(shù)據(jù)倉庫的設(shè)計(jì)將有別于數(shù)據(jù)庫系統(tǒng)的設(shè)計(jì),兩者的區(qū)別主要包括:面向的需求不同、系統(tǒng)目標(biāo)不同、設(shè)計(jì)方法不同。

1 ) 系統(tǒng)的設(shè)計(jì)目標(biāo)不同。數(shù)據(jù)庫系統(tǒng)的設(shè)計(jì)是為了進(jìn)行OLTP事務(wù)處理,因而進(jìn)行事務(wù)處理的并發(fā)性、安全性是系統(tǒng)的主要目標(biāo)。而數(shù)據(jù)倉庫的目標(biāo)是為企業(yè)提供一個(gè)數(shù)據(jù)一致的分析型環(huán)境,進(jìn)而在數(shù)據(jù)倉庫的基礎(chǔ)上建立決策支持系統(tǒng)。要到達(dá)這個(gè)目的,數(shù)據(jù)倉庫中的數(shù)據(jù)必須具備面向主題、數(shù)據(jù)集成、不易更新、隨時(shí)間變化的特點(diǎn)。

2)面向需求不同。操作型系統(tǒng)的數(shù)據(jù)來源主要是業(yè)務(wù)操作員的輸入,因此數(shù)據(jù)庫系統(tǒng)的設(shè)計(jì)就是要描述如何通過操作人員交互獲取數(shù)據(jù)、如何將獲取的數(shù)據(jù)按照OLTP的需求合理的存放、如何使得OLTP的性能能夠更加優(yōu)化、如何保證事務(wù)處理的安全性等等。數(shù)據(jù)倉庫系統(tǒng)的數(shù)據(jù)來源于業(yè)務(wù)系統(tǒng),主要解決如何對(duì)數(shù)據(jù)按照主題進(jìn)行組織、如何保證進(jìn)入數(shù)據(jù)倉庫系統(tǒng)的數(shù)據(jù)的一致性、如何對(duì)數(shù)據(jù)顆粒度進(jìn)行合理劃分、如何優(yōu)化存儲(chǔ)方式使得OLAP的性能得到優(yōu)化等問題。

3)系統(tǒng)設(shè)計(jì)方法不同。由于系統(tǒng)的目標(biāo)和面向的問題不同,導(dǎo)致設(shè)計(jì)方法不同。傳統(tǒng)的系統(tǒng)開發(fā)生命周期,“需求驅(qū)動(dòng)”,先收集需求、分析需求,再進(jìn)行設(shè)計(jì)和開發(fā);系統(tǒng)的需求在收集和分析需求階段之后就定下來了,一旦進(jìn)入構(gòu)建數(shù)據(jù)庫階段,系統(tǒng)的需求就基本不變了。所以系統(tǒng)設(shè)計(jì)一般采用系統(tǒng)生命周期法(Systems Development Life Cycle ,SDLC).數(shù)據(jù)倉庫運(yùn)行于一個(gè)與之完全不同的生命周期下,有時(shí)稱為CLDS(與SDLC順序相反)。

數(shù)據(jù)倉庫構(gòu)建模式

1)先整體后局部的模式,是由W.H.Inmon提出。先構(gòu)建一個(gè)完整的數(shù)據(jù)倉庫,提供全局視圖,再從數(shù)據(jù)倉庫中分離業(yè)務(wù)部門業(yè)務(wù)集市,逐步建立各個(gè)主題的數(shù)據(jù)集市。優(yōu)點(diǎn):數(shù)據(jù)規(guī)范化高。

2)先局部后整體的模式,有Kimball提出。先建立數(shù)據(jù)集市,然后在此基礎(chǔ)上逐步形成數(shù)據(jù)倉庫。

數(shù)據(jù)倉庫設(shè)計(jì)實(shí)施過程

業(yè)界常用的幾種數(shù)據(jù)倉庫設(shè)計(jì)實(shí)施過程:Kimball模型實(shí)施過程,Inmon模型實(shí)施過程,

以及如下其他常用模型實(shí)踐實(shí)施過程。后面我們專門介紹下。

數(shù)據(jù)倉庫的設(shè)計(jì)步驟

一個(gè)數(shù)據(jù)倉庫系統(tǒng)的設(shè)計(jì)可以分成數(shù)據(jù)倉庫模型設(shè)計(jì)部分和數(shù)據(jù)裝載接口設(shè)計(jì)部分,其設(shè)計(jì)的基本過程如下圖所示。

數(shù)據(jù)模型:什么是模型?模型是對(duì)客觀現(xiàn)實(shí)的事物的某些特征與內(nèi)在聯(lián)系,所作的一種模擬或抽象。

什么是數(shù)據(jù)模型?數(shù)據(jù)模型是對(duì)現(xiàn)實(shí)世界數(shù)據(jù)的特征抽象,用于描訴數(shù)據(jù)的定義概念,邏輯結(jié)構(gòu),物理組織存儲(chǔ)。

(1)分析建立企業(yè)模型(業(yè)務(wù)模型)

企業(yè)模型是從企業(yè)用戶的角度對(duì)企業(yè)所需數(shù)據(jù)的內(nèi)容以及數(shù)據(jù)間的關(guān)系的抽象。在構(gòu)建企業(yè)模型的時(shí)候,并不需要考慮操作型系統(tǒng)和數(shù)據(jù)倉庫之間的差異,它只反映企業(yè)各個(gè)階層人員對(duì)數(shù)據(jù)的需求情況。構(gòu)建企業(yè)模型,需要進(jìn)行各個(gè)部分之間業(yè)務(wù)工作的界定,理清各業(yè)務(wù)部門之間的關(guān)系,深入了解各個(gè)業(yè)務(wù)部門的內(nèi)具體業(yè)務(wù)流程并將其程序化。

企業(yè)模型反映了各個(gè)部門的各個(gè)視角。

通過面向?qū)ο蠓治龇ɡL畫出超市的企業(yè)模型。

在構(gòu)建企業(yè)模型時(shí),我們可以使用ER模型,或者面向?qū)ο蠓治龇椒ā?/p>

備注:面向?qū)ο蠓椒ê虴R模型關(guān)鍵的區(qū)別在于:

面向?qū)ο蠓椒ㄔ诿枋鲱愔g的關(guān)系上比ER模型復(fù)雜。在ER模型中,實(shí)體之間的關(guān)系只包括一對(duì)多和多對(duì)多,這在某些錯(cuò)綜復(fù)雜的關(guān)系面前就顯得表達(dá)能力不足。而面向?qū)ο蟮姆椒ǘx了繼承、包容、關(guān)聯(lián)關(guān)系,這3種關(guān)系能夠?qū)?fù)雜的關(guān)系描述得更加清晰;面向?qū)ο罄碚撨€有動(dòng)態(tài)模型分析方法,通過動(dòng)態(tài)模型分析,使得設(shè)計(jì)者能夠利用動(dòng)態(tài)模型來刻系統(tǒng)對(duì)數(shù)據(jù)的處理過程。ER模型只是對(duì)企業(yè)進(jìn)行靜態(tài)的描述,對(duì)于企業(yè)動(dòng)態(tài)運(yùn)作處理的描述無能為力。

通過將企業(yè)模型映射到(對(duì)應(yīng)到)數(shù)據(jù)庫系統(tǒng),可以很快地了解現(xiàn)有數(shù)據(jù)庫系統(tǒng)完成了企業(yè)模型中的哪些部分,還缺少哪些部分。我們可以將ER模型中的實(shí)體以及實(shí)體間的關(guān)系(類和類間關(guān)系)映射到數(shù)據(jù)庫系統(tǒng)中的一張關(guān)系表。

(2)概念模型設(shè)計(jì)

雖然數(shù)據(jù)倉庫設(shè)計(jì)同數(shù)據(jù)庫設(shè)計(jì)有許多不同點(diǎn),但是從理解問題和解決問題的方法上看,數(shù)據(jù)倉庫的設(shè)計(jì)也存在這3個(gè)層次。概念模型、邏輯模型和物理模型之間的關(guān)系如下圖所示。

概念模型描述的是從客觀世界到主觀認(rèn)識(shí)的映射,通過概念模型,我們用適合計(jì)算機(jī)世界的模型和語言對(duì)客觀世界中的具體問題進(jìn)行了描述。數(shù)據(jù)倉庫是按照主題來組織數(shù)據(jù)的,將企業(yè)模型映射到概念模型上,首先要確定主題并根據(jù)主題確定邊界。在概念模型中,抽取關(guān)鍵業(yè)務(wù)概念,并將之抽象化。將業(yè)務(wù)概念分組,按照業(yè)務(wù)主線聚合類似的分組概念。細(xì)化分組概念,理清分組概念內(nèi)的業(yè)務(wù)流程并抽象化。

在概念模型中,常用的表示方法是ER圖,另一種很好的方法是面向?qū)ο蟮姆治龇椒?。ER模型形式簡(jiǎn)單直觀易于理解,便于同客戶交流,同時(shí)可以對(duì)問題進(jìn)行更為深入細(xì)致的描述。

(3)邏輯模型設(shè)計(jì)

邏輯模型設(shè)計(jì)需要對(duì)概念模型中的每一個(gè)主題進(jìn)行設(shè)計(jì)。

邏輯模型實(shí)際上就是關(guān)系模型,它具有嚴(yán)格的數(shù)學(xué)基礎(chǔ)—關(guān)系數(shù)據(jù)理論,概念簡(jiǎn)單、清晰,需要完成的任務(wù)就是將概念模型映射到關(guān)系模型。在關(guān)系模型中,基本的概念包括關(guān)系表、元組(關(guān)系表的一行)、屬性(關(guān)系表的一列)、域(屬性的取值范圍)、主鍵(能夠惟一標(biāo)識(shí)一個(gè)數(shù)據(jù)行的鍵或者鍵的組合)等。

數(shù)據(jù)倉庫的邏輯模型設(shè)計(jì)包括如下幾點(diǎn),數(shù)據(jù)粒度選擇(在數(shù)據(jù)量較小的時(shí)候可以采取單一的數(shù)據(jù)粒度,即直接存儲(chǔ)。當(dāng)數(shù)據(jù)量大時(shí),對(duì)歷史數(shù)據(jù)進(jìn)行匯總,保留近期明細(xì)數(shù)據(jù))、表分割()、去除操作型數(shù)據(jù)、表劃分、增加計(jì)算字段(方便后續(xù)使用)。

(4)物理模型設(shè)計(jì)

物理模型設(shè)計(jì)結(jié)局的是邏輯模型的實(shí)現(xiàn)細(xì)節(jié),確定數(shù)據(jù)倉庫的存儲(chǔ)結(jié)構(gòu)、數(shù)據(jù)的存儲(chǔ)位置和索引策略。例如合并涉及的表存儲(chǔ)時(shí)放到一起,可大大減少磁頭定位時(shí)間,提高I/O效率、按列存儲(chǔ)。

確定數(shù)據(jù)的存儲(chǔ)結(jié)構(gòu)。不同的存儲(chǔ)結(jié)構(gòu)有不同的實(shí)現(xiàn)方式,應(yīng)綜合考慮存取時(shí)間、存取空間利用率和維護(hù)代價(jià)等因素,根據(jù)各種存儲(chǔ)結(jié)構(gòu)的優(yōu)缺點(diǎn)和適用范圍選擇合適的存儲(chǔ)結(jié)構(gòu)。

確定數(shù)據(jù)的存儲(chǔ)位置。對(duì)數(shù)據(jù)按照其重要程度、使用頻率和對(duì)響應(yīng)時(shí)間的要求等進(jìn)行分類,并將不同類別的數(shù)據(jù)存儲(chǔ)在不同的存儲(chǔ)設(shè)備中。設(shè)置存儲(chǔ)分配參數(shù),對(duì)塊的大小、緩沖區(qū)的大小和個(gè)數(shù)等進(jìn)行物理優(yōu)化處理。

確定索引策略。通過對(duì)數(shù)據(jù)存取路徑的分析,為各個(gè)數(shù)據(jù)存儲(chǔ)建立專用的索引,以獲得存取的高效率。

數(shù)據(jù)倉庫建模方法

  1. 3NF范式建模方法
  2. 維度建模法
  3. 實(shí)體建模法
  4. Data vault 建模法
  5. Anchor 模型
本站僅提供存儲(chǔ)服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊舉報(bào)。
打開APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
數(shù)據(jù)倉庫構(gòu)建實(shí)施方法及步驟
數(shù)據(jù)倉庫的前世今生
一個(gè)數(shù)據(jù)分析師的自述:數(shù)據(jù)建模
數(shù)據(jù)倉庫建模全解
數(shù)字孿生:數(shù)字孿生所用到的關(guān)鍵技術(shù)
【案例】恒豐銀行——基于大數(shù)據(jù)技術(shù)的數(shù)據(jù)倉庫應(yīng)用建設(shè)
更多類似文章 >>
生活服務(wù)
分享 收藏 導(dǎo)長(zhǎng)圖 關(guān)注 下載文章
綁定賬號(hào)成功
后續(xù)可登錄賬號(hào)暢享VIP特權(quán)!
如果VIP功能使用有故障,
可點(diǎn)擊這里聯(lián)系客服!

聯(lián)系客服