目錄
- 數(shù)據(jù)庫分類維度:關(guān)系型/非關(guān)系型、交易型/分析型
- NoSQL數(shù)據(jù)庫的進(jìn)一步分類
- OLTP市場規(guī)模:關(guān)系型數(shù)據(jù)庫仍占營收大頭
- 數(shù)據(jù)庫市場份額:云服務(wù)和新興廠商主導(dǎo)NoSQL
- 開源數(shù)據(jù)庫 vs. 商業(yè)數(shù)據(jù)庫
- 數(shù)據(jù)庫三大陣營:傳統(tǒng)廠商和云服務(wù)提供商
最近由于時(shí)間原因我寫東西少了,在公眾號上也轉(zhuǎn)載過幾篇搞數(shù)據(jù)庫朋友的大作。按說我算是外行,沒資格在這個(gè)領(lǐng)域品頭論足,而當(dāng)我看到下面這份報(bào)告時(shí)立即產(chǎn)生了學(xué)習(xí)的興趣,同時(shí)也想就能看懂的部分寫點(diǎn)心得體會分享給大家。
可能本文比較適合普及性閱讀,讓數(shù)據(jù)庫領(lǐng)域資深的朋友見笑了:)
來自Willian Blair的《Database Software Market:The Long-Awaited Shake-up》,文末我會提供原報(bào)告出處。或者關(guān)注本公眾號,從后臺留言“database”獲取下載鏈接。
數(shù)據(jù)庫分類維度:關(guān)系型/非關(guān)系型、交易型/分析型
首先是分類維度,上圖中的縱軸分類為Relational Database(關(guān)系型數(shù)據(jù)庫,RDBMS)和Nonrelational Database (非關(guān)系型數(shù)據(jù)庫,NoSQL),橫軸的分類為Operational(交易型,即OLTP)和Analytical(分析型,即OLAP)。
按照習(xí)慣我們先看關(guān)系型數(shù)據(jù)庫,左上角的交易型類別中包括大家熟悉的商業(yè)數(shù)據(jù)庫Oracle、MS SQL Server、DB2、Infomix,也包括開源領(lǐng)域流行的MySQL(MariaDB是它的一個(gè)分支)、PostgreSQL,還有云上面比較常見的SQL Azure和Amazon Aurora等。
比較有意思的是,SAP HANA正好位于交易型和分析型的中間分界處,不要忘了SAP還收購了Sybase,盡管后者今天不夠風(fēng)光了,而早年微軟的SQL Server都是來源于Sybase。Sybase的ASE數(shù)據(jù)庫和分析型Sybase IQ還是存在的。
右上角的分析型產(chǎn)品中包括幾款知名的列式數(shù)據(jù)倉庫Pivotal Greenplum、Teradata和IBM Netezza(已宣布停止支持),來自互聯(lián)網(wǎng)巨頭的Google Big Query和Amazon RedShift。至于Oracle Exadata一體機(jī),它上面運(yùn)行的也是Oracle數(shù)據(jù)庫,其最初設(shè)計(jì)用途是OLAP,而在后來發(fā)展中也可以良好兼顧OLTP,算是一個(gè)跨界產(chǎn)品吧。
再來看非關(guān)系型數(shù)據(jù)庫,左下角的交易型產(chǎn)品中,有幾個(gè)我看著熟悉的MongoDB、Redis、Amazon DynamoDB和DocumentDB等;右下角的分析型產(chǎn)品包括著名的Hadoop分支Cloudera、Hortonworks(這2家已并購),Bigtable(來自Google,Hadoop中的HBase是它的開源實(shí)現(xiàn))、Elasticsearch等。
顯然非關(guān)系型數(shù)據(jù)庫的分類要更加復(fù)雜,產(chǎn)品在應(yīng)用中的差異化也比傳統(tǒng)關(guān)系型數(shù)據(jù)庫更大。Willian Blair很負(fù)責(zé)任地對它們給出了進(jìn)一步的分類。
NoSQL數(shù)據(jù)庫的進(jìn)一步分類
上面這個(gè)圖表應(yīng)該說很清晰了。非關(guān)系型數(shù)據(jù)庫可以分為Document-based Store(基于文檔的存儲)、Key-Value Store(鍵值存儲)、Graph-based(圖數(shù)據(jù)庫)、Time Series(時(shí)序數(shù)據(jù)庫),以及Wide Cloumn-based Store(寬列式存儲)。
我們再來看下每個(gè)細(xì)分類別中的產(chǎn)品:
文檔存儲:MongoDB、Amazon DocumentDB、Azure Cosmos DB等
Key-Value存儲:Redis Labs、Oracle Berkeley DB、Amazon DynamoDB、Aerospike等
圖數(shù)據(jù)庫:Neo4j等
時(shí)序數(shù)據(jù)庫:InfluxDB等
WideCloumn:DataStax、Cassandra、Apache HBase和Bigtable等
多模型數(shù)據(jù)庫:支持上面不只一種類別特性的NoSQL,比如MongoDB、Redis Labs、Amazon DynamoDB和Azure Cosmos DB等。
OLTP市場規(guī)模:關(guān)系型數(shù)據(jù)庫仍占營收大頭
上面這個(gè)基于IDC數(shù)據(jù)的交易型數(shù)據(jù)庫市場份額共有3個(gè)分類,其中深藍(lán)色部分的關(guān)系型數(shù)據(jù)庫(RDBMS,在這里不統(tǒng)計(jì)數(shù)據(jù)挖掘/分析型數(shù)據(jù)庫)占據(jù)80%以上的市場。
Dynamic Database(DDMS,動態(tài)數(shù)據(jù)庫管理系統(tǒng),同樣不統(tǒng)計(jì)Hadoop)就是我們前面聊的非關(guān)系型數(shù)據(jù)庫。這部分市場顯得?。ǖl(fā)展勢頭看好),我覺得與互聯(lián)網(wǎng)等大公司多采用開源+自研,而不買商業(yè)產(chǎn)品有關(guān)。
而遵循IDC的統(tǒng)計(jì)分類,在上圖灰色部分的“非關(guān)系型數(shù)據(jù)庫市場”其實(shí)另有定義,參見下面這段文字:
數(shù)據(jù)庫市場份額:云服務(wù)和新興廠商主導(dǎo)NoSQL
請注意,這里的關(guān)系型數(shù)據(jù)庫統(tǒng)計(jì)又包含了分析型產(chǎn)品。Oracle營收份額42%仍居第一,隨后排名依次為微軟、IBM、SAP和Teradata。
代表非關(guān)系型數(shù)據(jù)庫的DDMS分類中(這里同樣加入Hadoop等),云服務(wù)和新興廠商成為了主導(dǎo),微軟應(yīng)該是因?yàn)樵芐QL Server的基礎(chǔ)而小幅領(lǐng)先于AWS,這2家一共占據(jù)超過50%的市場,接下來的排名是Google、Cloudera和Hortonworks(二者加起來13%)。
上面是IDC傳統(tǒng)分類中的“非關(guān)系型數(shù)據(jù)庫”,在這里IBM和CA等應(yīng)該主要是針對大型機(jī)的產(chǎn)品,InterSystems有一款在國內(nèi)醫(yī)療HIS系統(tǒng)中應(yīng)用的Caché數(shù)據(jù)庫(以前也是運(yùn)行在Power小機(jī)上比較多)。我就知道這些,余下的就不瞎寫了。
開源數(shù)據(jù)庫 vs. 商業(yè)數(shù)據(jù)庫
按照流行度來看,開源數(shù)據(jù)庫從2013年到現(xiàn)在一直呈現(xiàn)增長,已經(jīng)快要追上商業(yè)數(shù)據(jù)庫了。
商業(yè)產(chǎn)品在關(guān)系型數(shù)據(jù)庫的占比仍然高達(dá)60.5%,而上表中從這列往左的分類都是開源占優(yōu):
Wide Cloumn:開源占比81.8%;
時(shí)序數(shù)據(jù)庫:開源占比80.7%;
文檔存儲:開源占比80.0%;
Key-Value存儲:開源占比72.2%;
圖數(shù)據(jù)庫:開源占比68.4%;
搜索引擎:開源占比65.3%
按照開源License的授權(quán)模式,上面這個(gè)三角形越往下管的越寬松。比如MySQL屬于GPL,在互聯(lián)網(wǎng)行業(yè)用戶較多;而PostgreSQL屬于BSD授權(quán),國內(nèi)有不少數(shù)據(jù)庫公司的產(chǎn)品就是基于Postgre哦。
數(shù)據(jù)庫三大陣營:傳統(tǒng)廠商和云服務(wù)提供商
前面在討論市場份額時(shí),我提到過交易型數(shù)據(jù)庫的4個(gè)巨頭仍然是Oracle、微軟、IBM和SAP,在這里William Blair將他們歸為第一陣營。
隨著云平臺的不斷興起,AWS、Azure和GCP(Google Cloud Platform)組成了另一個(gè)陣營,在國外分析師的眼里還沒有BAT,就像有的朋友所說,國內(nèi)互聯(lián)網(wǎng)巨頭更多是自身業(yè)務(wù)導(dǎo)向的,在本土發(fā)展公有云還有些優(yōu)勢,短時(shí)間內(nèi)將技術(shù)輸出到國外的難度應(yīng)該還比較大。(當(dāng)然我并不認(rèn)為國內(nèi)缺優(yōu)秀的DBA和研發(fā)人才)
第三個(gè)陣容就是規(guī)模小一些,但比較專注的數(shù)據(jù)庫玩家。
接下來我再帶大家簡單過一下這前兩個(gè)陣容,看看具體的數(shù)據(jù)庫產(chǎn)品都有哪些。
甲骨文的產(chǎn)品,我相對熟悉一些的有Oracle Database、MySQL以及Exadata一體機(jī)。
IBM DB2也是一個(gè)龐大的家族,除了傳統(tǒng)針對小型機(jī)、x86(好像用的人不多)、z/OS大型機(jī)和for i的版本之外,如今也有了針對云和數(shù)據(jù)挖掘的產(chǎn)品。記得抱枕大師對Informix的技術(shù)比較推崇,可惜這個(gè)產(chǎn)品發(fā)展似乎不太理想。
微軟除了看家的SQL Server之外,在Azure云上還能提供MySQL、PostgreSQL和MariaDB開源數(shù)據(jù)庫。應(yīng)該說他們是傳統(tǒng)軟件License+PaaS服務(wù)兩條腿走路的。
如今人們一提起SAP的數(shù)據(jù)庫就想起HANA,之前從Sybase收購來的ASE(Adaptive Server Enterprise)和IQ似乎沒有之前發(fā)展好了。
在云服務(wù)提供商數(shù)據(jù)庫的3巨頭中,微軟有SQL Server的先天優(yōu)勢,甚至把它移植到了Linux擁抱開源平臺。關(guān)系型數(shù)據(jù)庫的創(chuàng)新方面值得一提的是Amazon Aurora和Google Spanner(也有非關(guān)系型特性),至于它們具體好在哪里我就不裝內(nèi)行了:)
非關(guān)系型數(shù)據(jù)庫則是Amazon全面開花,這與其云計(jì)算業(yè)務(wù)發(fā)展早并且占據(jù)優(yōu)勢有關(guān)。Google當(dāng)年的三篇經(jīng)典論文對業(yè)界影響深遠(yuǎn),Yahoo基于此開源的Hadoop有一段時(shí)間幾乎是大數(shù)據(jù)的代名詞。HBase和Hive如今已不再是人們討論的熱點(diǎn),而Bigtable和BigQuery似乎仍然以服務(wù)Google自身業(yè)務(wù)為主,畢竟GCP的規(guī)模比AWS要小多了。
最后這張DB-Engines的排行榜,相信許多朋友都不陌生,今年3月已經(jīng)不是最新的數(shù)據(jù),在這里列出只是給大家一個(gè)參考。該排行榜幾乎在每次更新時(shí),都會有國內(nèi)數(shù)據(jù)庫專家撰寫點(diǎn)評。
以上是我周末的學(xué)習(xí)筆記,班門弄斧,希望對大家有幫助。
參考資料《Database Software Market:The Long-Awaited Shake-up》
https://blocksandfiles.com/wp-content/uploads/2019/03/Database-Software-Market-White-Paper.pdf