免费视频淫片aa毛片_日韩高清在线亚洲专区vr_日韩大片免费观看视频播放_亚洲欧美国产精品完整版

打開APP
userphoto
未登錄

開通VIP,暢享免費電子書等14項超值服

開通VIP
商業(yè)智能的性能 CIO俱樂部
商業(yè)智能的性能
2007-06-01 10:44:43
數(shù)據(jù)倉庫引擎是BI中的核心,它的性能高低直接決定了BI的表現(xiàn)。
一個完整的BI(BusinessIntelligence)應用通常涉及數(shù)據(jù)倉庫引擎及其相關的設計建模工具、ET
L工具、前端展現(xiàn)工具等。這里的數(shù)據(jù)展現(xiàn)主要作用是以圖表、Dashboard等形式將結果呈現(xiàn)給用戶;ETL負責將原始數(shù)據(jù)進行抽取、轉化、清洗、裝載進數(shù)據(jù)倉庫;數(shù)據(jù)倉庫負責執(zhí)行數(shù)據(jù)的存儲和管理,并執(zhí)行前端展現(xiàn)工具提交的各種查詢分析任務。在BI應用中,數(shù)據(jù)倉庫類似于汽車的引擎,居于核心地位,它的性能高低直接決定了BI應用的響應速度。而在大型BI應用中,性能是一個非常關鍵的問題,特別是那些有著海量數(shù)據(jù)、需要完成復雜查詢任務的系統(tǒng),數(shù)據(jù)倉庫引擎的選擇就更為關鍵。
不同的技術路線
綜觀目前的數(shù)據(jù)倉庫市場,能提供這一個工具的供應商并不多,一線的廠商主要有Teradata、IBM、Oracle、Sybase、Microsoft等。盡管同為數(shù)據(jù)倉庫引擎,但是這些供應商各自所走的技術路線并不同,不同的技術也導致了它們的產(chǎn)品具有完全不同的特點。
Teradata應該算最為特立獨行的一個。Teradata數(shù)據(jù)倉庫主要運行在NCR WorldMark SMP硬件的Unix操作系統(tǒng)平臺上(該公司也提供基于Windows NT的Teradata),它的高性能主要通過Teradata與NCR硬件平臺海量并行處理服務器(Massively ParallelProcessing, MPP)結合,以及采用特有BYNET協(xié)議和查詢優(yōu)化等技術實現(xiàn)并行等機制來實現(xiàn)。由于采用一些專有的硬件和技術,因此,價格較高,是數(shù)據(jù)倉庫中的貴族。
IBM、Oracle和Microsoft的數(shù)據(jù)倉庫引擎屬于同一類,它們都提供數(shù)據(jù)庫產(chǎn)品,其數(shù)據(jù)倉庫引擎和數(shù)據(jù)庫引擎從技術上說有很多相似之處。這種技術路線給它們帶來的好處是,其數(shù)據(jù)倉庫解決方案很自然地從數(shù)據(jù)庫技術拓展和延伸而來,集成性、延續(xù)性比較突出。
與IBM、Oracle等相比,雖然Sybase也同時提供數(shù)據(jù)庫和數(shù)據(jù)倉庫產(chǎn)品,但是,其Sybase的數(shù)據(jù)倉庫引擎卻走了一條與其數(shù)據(jù)庫、也與Oracle、IBM完全不同的技術路線。其中最大的不同就是在Sybase數(shù)據(jù)倉庫引擎(即Sybase IQ)中采用列存儲架構,而所有關系型數(shù)據(jù)庫引擎廣泛采用的則是行式存儲。
列存儲技術
在關系型數(shù)據(jù)庫內核中,數(shù)據(jù)庫是按行來存儲數(shù)據(jù)記錄的,也就是說數(shù)據(jù)庫表最典型的表示為一條數(shù)據(jù)頁鏈,每一數(shù)據(jù)頁中有一行或者多行數(shù)據(jù)記錄。而在數(shù)據(jù)倉庫應用中,從查詢性能的觀點出發(fā),這種存儲方式并不可取。因為在OLTP(在線事務處理,即傳統(tǒng)數(shù)據(jù)庫應用)環(huán)境中,一個事務處理是與一行(或多行)數(shù)據(jù)有效對應的,而在OLAP(在線分析處理,即BI應用)環(huán)境中,以查詢處理最多,而查詢是基于特定的列來選擇的。Sybase IQ是按列來組織數(shù)據(jù)的,每張表是一組相互獨立的頁鏈,每個頁鏈代表表中的一列。
基于列存儲所帶來的一個直接好處是,在壓縮方面比傳統(tǒng)的關系型數(shù)據(jù)更加有效。這是因為同一列的所有數(shù)據(jù)域有相同的類型,因而每一列都可以為優(yōu)化的效率和檢索進行壓縮。而基于行的存儲,各個不同的域擁有各不相同的數(shù)據(jù)類型,盡管這非常適合交易進程,但并不適合壓縮,因為壓縮很可能只能采用一種最低通用原則。
事實上,在壓縮效果上,Sybase非常自信。Sybase中國公司CTO盧東明對記者表示,Sybase IQ能保證至少3倍以上的壓縮比。高的壓縮能力能帶來存儲成本的節(jié)約,有人曾經(jīng)對數(shù)據(jù)的存儲成本進行過估算,目前每管理1TB數(shù)據(jù)的軟硬件加人力成本大約為5萬美元左右。
列存儲的另一個好處是性能上的提高。在行存儲方式的情況下,如果需要訪問數(shù)據(jù)必須讀出完整的一行,而不管你實際感興趣的是其中哪一個或幾個域。因此,這可能形成只需要50K的數(shù)據(jù)卻需要讀出500k的情況。而在采用列存儲方式時,可以只讀出所需要的列數(shù)據(jù)。讀出數(shù)據(jù)量的減少直接后果就是性能的提高。特別是在處理大數(shù)據(jù)量、復雜的跨多表查詢時,列存儲在性能上的提升非常明顯。
除此之外,Sybase IQ還采用了其他的一些專有技術,如位圖索引和BitWise索引技術等。“由于這些技術的采用,最終保證了Sybase IQ查詢速度的極大改進,這種速度的提高能達到10倍以上。因此,我們認為Sybase IQ的技術是革命性的。”Sybase的盧東明在接受記者采訪時表示。
目前,上述三種不同的數(shù)據(jù)倉庫技術到底哪種更好,各家都有自己的說法。因此,對用戶而言,具體選擇時還需多了解同類型的BI應用。不過,用戶倒是樂觀其成,畢竟競爭可以帶給用戶更好的技術和產(chǎn)品。(ccw)
本站僅提供存儲服務,所有內容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權內容,請點擊舉報。
打開APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
大數(shù)據(jù)已成紅海?!全球十四個大數(shù)據(jù)公司全面盤點!
列式數(shù)據(jù)庫在大型機上前景如何?
盤點大數(shù)據(jù)分析的十二大殺手锏[組圖]
七大熱門商業(yè)智能產(chǎn)品
暢談商業(yè)智能未來
如何認識“Big Data 3.0”
更多類似文章 >>
生活服務
分享 收藏 導長圖 關注 下載文章
綁定賬號成功
后續(xù)可登錄賬號暢享VIP特權!
如果VIP功能使用有故障,
可點擊這里聯(lián)系客服!

聯(lián)系客服