免费视频淫片aa毛片_日韩高清在线亚洲专区vr_日韩大片免费观看视频播放_亚洲欧美国产精品完整版

打開APP
userphoto
未登錄

開通VIP,暢享免費(fèi)電子書等14項(xiàng)超值服

開通VIP
spark真的要取代hadoop了么,還有阿里的flink未來會是一種趨勢么?

大家好,我是LakeShen

作為一個(gè)軟件開發(fā)工程師,我從事的方向主要是大數(shù)據(jù)方向,結(jié)合我的工作經(jīng)驗(yàn),我個(gè)人認(rèn)為,Spark不會完全取代Hadoop,Hadoop還有很多其他方面的大數(shù)據(jù)組件,這些組件是Spark所沒有的,同時(shí),F(xiàn)link在未來的發(fā)展,會作為實(shí)時(shí)計(jì)算方面的一種發(fā)展趨勢。下面來說一下我個(gè)人的看法:

Flink未來的發(fā)展

首先,F(xiàn)link是什么?Flink一種流式處理的實(shí)時(shí)計(jì)算引擎,它消費(fèi)的數(shù)據(jù)可以來自Kafka、MetaQ等消息中間件,旨在降低數(shù)據(jù)計(jì)算的延時(shí),使得我們可以實(shí)時(shí)監(jiān)控我們業(yè)務(wù)相關(guān)的指標(biāo)信息。Flink 目前作為國內(nèi)最火的一款實(shí)時(shí)計(jì)算引擎,國內(nèi)有很多互聯(lián)網(wǎng)大公司都使用Flink進(jìn)行實(shí)時(shí)計(jì)算,阿里的Blink(Flink 阿里內(nèi)部版本)、騰訊、今日頭條、美團(tuán)等。Flink 天然的狀態(tài)管理,使得其能夠應(yīng)用于公司的各種有狀態(tài)的實(shí)時(shí)計(jì)算。下面來看一下Flink Github上面的信息:

從上圖可以看到,關(guān)注Flink的人數(shù)達(dá)到了9929位人數(shù),同時(shí),每天都有很多用戶關(guān)注Flink。根據(jù)Apache 軟件基金會2019年的財(cái)報(bào),F(xiàn)link持續(xù)活躍,其社區(qū)郵件列表在所有開源項(xiàng)目活躍度第一。這也意味著,F(xiàn)link 目前在實(shí)時(shí)計(jì)算方面非常的火熱。在加上阿里在Flink 1.9版本開源了很多 Flink SQL方面的特性,我相信,在未來,F(xiàn)link在實(shí)時(shí)計(jì)算方面,是一種發(fā)展趨勢。

Spark相對于Hadoop的優(yōu)勢

Spark本質(zhì)也是一種大數(shù)據(jù)計(jì)算框架,它相對于Hadoop最重要的優(yōu)勢,我個(gè)人認(rèn)為是Spark能夠?qū)⒅虚g計(jì)算的結(jié)果放在內(nèi)存中,而Hadoop的中間結(jié)果只能放在磁盤上。Spark充分的利用的計(jì)算機(jī)內(nèi)存的優(yōu)勢,在數(shù)據(jù)量非常大的情況下,訪問計(jì)算機(jī)內(nèi)存的速度肯定要比訪問磁盤快的多。一個(gè)離線任務(wù),使用Spark幾分鐘就能跑完,而使用Hadoop可能需要幾十分鐘。時(shí)間上面的延遲,業(yè)務(wù)同學(xué)是肯定不會容忍的。

同時(shí),用戶在開發(fā)Spark任務(wù)時(shí),由于Spark 代碼開發(fā)的便利性,用戶幾行代碼就可以開發(fā)出Spark任務(wù),但是Hadoop任務(wù)你需要編寫Mapper類、Reducer類。這極大的增加了開發(fā)同學(xué)開發(fā)任務(wù)的復(fù)雜度。所以,我個(gè)人認(rèn)為,在離線計(jì)算方面,Spark在未來必然會取代Hadoop。

Spark相對于Hadoop的不足

Hadoop主要由三方面構(gòu)成,MR計(jì)算模型、Yarn資源管理框架、HDFS分布式文件存儲。雖然Hadoop在離線計(jì)算方面相對于Spark較慢,但是其在資源管理和分布式文件存儲方面做得非常完善,很多公司不會為了計(jì)算快而完全放棄Hadoop,Spark只是一款大數(shù)據(jù)計(jì)算框架,它沒有自己的資源管理框架和存儲。Spark的資源管理使用的是Hadoop Yarn,底層的文件存儲,使用的Hadoop HDFS。Spark的優(yōu)勢只是其比Hadoop在離線計(jì)算方面速度快,但在其他方面,比如資源管理等,根本沒有任何優(yōu)勢。

總結(jié)

所以,我個(gè)人認(rèn)為,未來在離線計(jì)算方面,Spark必然會代替Hadoop作為很多大數(shù)據(jù)公司的首選。但是由于Hadoop其底層的資源管理框架Yarn和文件存儲HDFS已經(jīng)非常完善,所以互聯(lián)網(wǎng)公司還會使用Hadoop,但會使用Spark來進(jìn)行離線數(shù)據(jù)計(jì)算。同時(shí),F(xiàn)link未來在實(shí)時(shí)計(jì)算方面肯定是一種發(fā)展趨勢,在加上國內(nèi)阿里的大力推廣和運(yùn)營,我相信Flink以后發(fā)展會越來越好。

我是LakeShen,如果你覺得我的見解對你有幫助的話,其可以點(diǎn)個(gè)贊或者關(guān)注我吧,我會一直持續(xù)分享我在科技方面的見解,感謝。

本站僅提供存儲服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點(diǎn)擊舉報(bào)。
打開APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
40億條/秒!Flink流批一體在阿里雙11首次落地的背后
經(jīng)典|一文讀懂大數(shù)據(jù)處理框架
后 Hadoop 時(shí)代,字節(jié)跳動(dòng)如何打造云原生計(jì)算平臺 | 卓越技術(shù)團(tuán)隊(duì)訪談錄
Apache Flink介紹
阿里 7 億元收購 Apache Flink 商業(yè)公司 DataArtisans
阿里云重磅押注的實(shí)時(shí)計(jì)算到底是什么?
更多類似文章 >>
生活服務(wù)
分享 收藏 導(dǎo)長圖 關(guān)注 下載文章
綁定賬號成功
后續(xù)可登錄賬號暢享VIP特權(quán)!
如果VIP功能使用有故障,
可點(diǎn)擊這里聯(lián)系客服!

聯(lián)系客服