大數據迎來開源時代 開源熱點盤點
伴隨著交易型IT到交互型IT的過渡,過去幾年中企業(yè)數據呈現爆炸性增長。社交媒體的興起、智能終端的廣泛使用等導致各種海量數據的快速產生,同時為我們開啟了大數據時代。隨著大數據時代的到來,我們也迎來了開源時代,為什么這么說呢? 談及大數據,也不得不提云計算,在大數據+云計算時代里,開源變成了香餑餑,因為用戶想要的是更多的自由,于是乎廠商就開始在自己的產品上貼上開放的標簽,開始談開源的好處,因為它曾承諾能夠降低成本同時獲得企業(yè)級的IT自由度。所以我們看到了Hadoop人氣居高不下,這就是自由的號召力。 但是在開源風行的這幾年,又有幾家開源企業(yè)真的做的不錯呢?小編就帶大家盤點一下最近的開源熱點吧! Hadoop ![]() Hadoop Hadoop 無疑使目前最熱的開源技術,因為它曾承諾能夠降低成本同時獲得企業(yè)級的IT自由度。最終,只有幾個新興企業(yè)投資(MySQL, JBoss),但是對于大部分的企業(yè)而言,真正的價值來自IT供應商和內部的IT組織,利用開源為他們的軟件項目提供原材料。開源越來越不關于銷售,而是代碼,這也正是設計它的目的所在。 Hadoop 是最受歡迎的在 Internet 上對搜索關鍵字進行內容分類的工具,但它也可以解決許多要求極大伸縮性的問題。例如,如果您要 grep 一個 10TB 的巨型文件,會出現什么情況?在傳統(tǒng)的系統(tǒng)上,這將需要很長的時間。但是 Hadoop 在設計時就考慮到這些問題,采用并行執(zhí)行機制,因此能大大提高效率。 Hadoop如此受歡迎是由原因的,它帶來了諸多優(yōu)點。Hadoop 是一個能夠對大量數據進行分布式處理的軟件框架,而且Hadoop 是以一種可靠、高效、可伸縮的方式進行處理的??煽啃泽w現在它是假設計算元素和存儲會失敗,因此它維護多個工作數據副本,確保能夠針對失敗的節(jié)點重新分布處理。高效性則體現在它以并行的方式工作,通過并行處理加快處理速度。Hadoop 還是可伸縮的,能夠處理 PB 級數據。此外,Hadoop 依賴于社區(qū)服務器,因此它的成本比較低,任何人都可以使用。 OpenStack ![]() OpenStack OpenStack是一個美國國家航空航天局和Rackspace合作研發(fā)的云端運算?軟件,以Apache許可證授權,并且是一個自由軟件和開放源代碼項目。 自從2010年推出以來,OpenStack迅速贏得了惠普、英特爾和戴爾等云計算領域的IT公司的支持。OpenStack的貢獻者喜歡把自己的工作稱作增長速度最快的開源軟件項目,參加者包括144家公司和2100多人。戴爾推出一個名為戴爾OpenStack云解決方案的軟件包,把OpenStack與戴爾自己的服務器和軟件結合在了一起?;萜找餐瞥鲆粋€采用這個技術的測試版的公共云服務。 管理的托管提供商Rackspace的首席技術官約翰·安格斯(John Engates)說,為了幫助更廣泛地應用,OpenStack正在配置許多新的功能,使這個軟件更適合企業(yè)應用。一個名為“Keystone”的項目允許機構把OpenStack與自己的身份管理系統(tǒng)結合起來,或者與基于微軟主動目錄或者其它LDAP(輕型目錄訪問協(xié)議)的身份管理系統(tǒng)結合起來。此外,開發(fā)人員也正在為這個軟件開發(fā)一個前端門戶。Rackspace還將把這個項目剝離為一個完全獨立的實體,希望它成為更多的云提供商的一個誘人的選擇。 安格斯稱,2011年將是這個產品打基礎的一年。但是,我認為,2012年我們將真正開始利用這個基礎在許多私有云和公共云中使用。 Apache ![]() Apache Apache是世界使用排名第一的Web服務器軟件。它可以運行在幾乎所有廣泛使用的計算機平臺上。 Apache的誕生極富有戲劇性。當NCSAWWW服務器項目停頓后,那些使用NCSA WWW服務器的人們開始交換他們用于該服務器的補丁程序,他們也很快認識到成立管理這些補丁程序的論壇是必要的。就這樣,誕生了Apache Group,后來這個團體在NCSA的基礎上創(chuàng)建了Apache。 原本它只用于小型或試驗Internet網絡,后來逐步擴充到各種Unix系統(tǒng)中,尤其對Linux的支持相當完美。Apache有多種產品,可以支持SSL技術,支持多個虛擬主機。Apache是以進程為基礎的結構,進程要比線程消耗更多的系統(tǒng)開支,不太適合于多處理器環(huán)境,因此,在一個Apache Web站點擴容時,通常是增加服務器或擴充群集節(jié)點而不是增加處理器。到目前為止Apache仍然是世界上用的最多的Web服務器,市場占有率達60%左右。世界上很多著名的網站如Amazon、Yahoo!、W3 Consortium、Financial Times等都是Apache的產物,它的成功之處主要在于它的源代碼開放、有一支開放的開發(fā)隊伍、支持跨平臺的應用(可以運行在幾乎所有的Unix、Windows、Linux系統(tǒng)平臺上)以及它的可移植性等方面。 MySQL ![]() MySQL MySQL是一個小型關系型數據庫管理系統(tǒng),開發(fā)者為瑞典MySQL AB公司。在2008年被Sun公司收購,2009年,SUN又被Oracle收購。 MySQL是一種關聯(lián)數據庫管理系統(tǒng),關聯(lián)數據庫將數據保存在不同的表中,而不是將所有數據放在一個大倉庫內。這樣就增加了速度并提高了靈活性。MySQL的SQL“結構化查詢語言”。SQL是用于訪問數據庫的最常用標準化語言。MySQL軟件采用了GPL(GNU通用公共許可證)。由于其體積小、速度快、總體擁有成本低,尤其是開放源碼這一特點,許多中小型網站為了降低網站總體擁有成本而選擇了MySQL作為網站數據庫。 與其他的大型數據庫例如Oracle、DB2、SQL Server等相比,MySQL自有它的不足之處,如規(guī)模小、功能有限(MySQL Cluster的功能和效率都相對比較差)等,但是這絲毫也沒有減少它受歡迎的程度。對于一般的個人使用者和中小型企業(yè)來說,MySQL提供的功能已經綽綽有余,而且由于MySQL是開放源碼軟件,因此可以大大降低總體擁有成本。 目前Internet上流行的網站構架方式是LAMP(Linux+Apache+MySQL+PHP/Perl/Python)和LNMP(Linux+Nginx+MySQL+php/perl/Python),即使用Linux作為操作系統(tǒng),Apache和Nginx作為Web服務器,MySQL作為數據庫,PHP/Perl/Python作為服務器端腳本解釋器。由于這四個軟件都是免費或開放源碼軟件(FLOSS),因此使用這種方式不用花一分錢(除開人工成本)就可以建立起一個穩(wěn)定、免費的網站系統(tǒng)。 Asterisk ![]() Asterisk Asterisk是一個開放源代碼的軟件VoIP PBX系統(tǒng),它是一個運行在Linux環(huán)境下的純軟件實施方案。Asterisk是一種功能非常齊全的應用程序,提供了許多電信功能,能夠把你的x86機 器變成你自己的交換機,還能夠當作一臺企業(yè)級的商用交換機。Asterisk讓人激動的事情是它在小企業(yè)預算可承受的范圍內提供了商業(yè)交換機的功能和可伸 縮性。你可以使用一臺老式的奔騰3計算機,讓你的機構看起來就同世界上的大企業(yè)一樣。 事實上,Asterisk開源項目經過十多年的發(fā)展,已經不再單獨局限于IP-PBX的應用。實際上,按照,Digium在其asterisk論壇上給出的說法,Asterisk軟件已經是一個平臺,不僅可以用于IP-PBX的開發(fā),也可以用于中繼網關(TG),模擬電話適配器(ATA - Analog Telephone Adapter),甚至 IP Phone 產品的開發(fā)。 同時,Asterisk開源項目已經逐步發(fā)展稱為一個 “統(tǒng)一通信” (UC)的解決方案。 Asterisk開源項目應用的另一個變化是在嵌入式領域的發(fā)展。雖然最初Asterisk是基于X86主機加PCI擴展板卡運行的。但目前,一些基于MIPS或ARM的CPU也已經都可以運行Asterisk。其中比較著名的有OpenWRT,在OpenWRT的最新版本中已經包含了對Asterisk 1.6/1.8 版本的支持,簡單的編譯后既可在MIPS或ARM的硬件平臺上運行(參考Asterisk On MIPS論壇)。 (責任編輯:陳曲) |