最新
推薦
中國教育網(wǎng)訊,11月24日消息,由教育部科技發(fā)展中心主辦,《中國教育網(wǎng)絡(luò)》雜志承辦的“2009(第四屆)教育信息存儲大會(北京站)”今天在清華大學(xué)舉行。中國教育網(wǎng)做現(xiàn)場報道。 ![]() 圖為:EMC資深技術(shù)顧問 楊 捷 下面是EMC資深技術(shù)顧問楊捷演講實錄: 主持人:下面我們要介紹EMC公司的一個發(fā)言,本次大會得到一些業(yè)界的、企業(yè)的支持。此次大會由EMC、重慶雅閣、浪潮集團、戴爾公司、新科儲存有限公司、微軟有限公司等的支持,下面有請EMC資深技術(shù)顧問楊捷女士,她為我們講述EMC數(shù)字教育理念。大家掌聲歡迎! 楊捷:各位老師、各位專家大家上午好!今天很高興有機會在這里跟大家一起學(xué)習(xí)、一起探討怎么建立更高效的數(shù)字化校園。也是結(jié)合我們之前跟很多學(xué)校老師的交流,包括我們在過程中積累的經(jīng)驗,能夠跟大家做一些分享。我們其實也在過去幾年中看到,其實我們在信息化建設(shè)方面也經(jīng)歷這樣不同的發(fā)展階段。所以現(xiàn)在看到有這樣趨勢在我們校園網(wǎng)絡(luò)和信息化建設(shè)過程中,我看到很多學(xué)校都在提我們要建設(shè)新一代數(shù)字化大學(xué),這個過程中我們談到很多整合,包括應(yīng)用的整合、管理的整合,中間就會帶來數(shù)據(jù)整合、所有計算、資源的整合。 我這里提出來一個理念,就是我們在新一代數(shù)字化大學(xué)建設(shè)過程中,實際為整個校園建設(shè)資源中心,所以這個里邊就會包含各種各樣應(yīng)用,應(yīng)用產(chǎn)生各種各樣數(shù)據(jù)。在為大家提供應(yīng)用和數(shù)據(jù)的時候,我們需要各種各樣計算資源,包括剛才陳教授講的有云計算的平臺,除了普通的服務(wù)器之外,我們還有專用高清計算平臺。所以現(xiàn)在有一個趨勢,一個建設(shè)數(shù)據(jù)中心、還有一個建設(shè)計算中心。并且我們看到應(yīng)用越來越多,做了很多整合之后,實際上我們校園在管理這一塊也面臨越來越多壓力,怎么簡化我們管理,管理中心也是這樣趨勢。 針對這樣的需求,一個方向我們怎么構(gòu)建我們整個基礎(chǔ)架構(gòu)。在這個之前我們首先看一下在整個數(shù)字化校園里邊有什么樣應(yīng)用?根據(jù)不同應(yīng)用類型我們會分析各個方面有什么需求,根據(jù)這些需求我們制定什么樣策略、用什么手段和技術(shù)最適合的。所以我們先從應(yīng)用角度看。 我們學(xué)校都建立校園一卡通系統(tǒng)、包括數(shù)字化校園理念,有很多模塊,還有就是我們每一位老師、每一位學(xué)生都有校園電子郵件,我們看到一個趨勢我們?yōu)樗行S烟峁┙K身的電子油箱,在這一塊有不斷增長數(shù)據(jù)在里頭。 我們剛才提到傳統(tǒng)網(wǎng)絡(luò)中心的應(yīng)用,另外在數(shù)字化圖書館里頭,以前是外購一些圖書,現(xiàn)在看到趨勢我們學(xué)校建立自己的數(shù)據(jù)中心比如我們網(wǎng)絡(luò)教學(xué)音視頻資料。 以前我們建立高性能計算中心,很多學(xué)校都會自己建立高性能計算中心,實際沒有做到資源共享,未來趨勢我們怎么分散在每個院系、各個學(xué)校資源整合起來協(xié)同操作。在我們從教育科研環(huán)境里邊,實際上現(xiàn)在應(yīng)用模式也是在不斷轉(zhuǎn)變,隨之帶來就是我們數(shù)據(jù)量越來越大,在不同應(yīng)用系統(tǒng)里邊,不同類型數(shù)據(jù)量會越來越大,不同數(shù)據(jù)對于性能要求不一樣、對于數(shù)據(jù)安全不一樣,對數(shù)據(jù)連續(xù)性不一樣。 一卡通可能學(xué)生每天隨時隨地都要用,這個一卡通系統(tǒng)可能不能停機。相對于其他資源類應(yīng)用和數(shù)據(jù)停機大家可以接受。所以我們看到不同應(yīng)用、不同數(shù)據(jù)有不同要求。我們學(xué)校建設(shè)整個信息系統(tǒng)的時候,在信息化過程中面臨這樣的挑戰(zhàn),數(shù)據(jù)類型越來越多、數(shù)據(jù)量越來越大,應(yīng)用也越來越多。有一類應(yīng)用叫個性化門戶,有不同的老師、不同的院系、不同的教研組都有自己門戶的應(yīng)用,為校園或者為部門提供應(yīng)用服務(wù),所以這些應(yīng)用我們看到有一個趨勢,他會在校園網(wǎng)里邊在網(wǎng)絡(luò)中心進行托管。 針對不同的應(yīng)用系統(tǒng)其實關(guān)注點不一樣,可能對業(yè)務(wù)連續(xù)性要求非常高,另外在高峰期間對系統(tǒng)要求比較高。一些自建資源數(shù)據(jù)它是我們所有老師和同學(xué)智慧的結(jié)晶,所以它是對數(shù)據(jù)保護需求非常高的。我們看到針對不同類型的需求,我們要有不同的解決辦法。我們一直提到EMC提供信息技術(shù)架構(gòu)。 從我們理解來講分幾塊。這里邊主要分四大塊,儲存大家比較熟悉,我們怎么樣能夠以最有效的方式來保存我們的數(shù)據(jù)、來管理我們的數(shù)據(jù)是我們第一個考慮的,再有我們有數(shù)據(jù)之后怎么進行保護,保護分兩大塊,一塊是數(shù)據(jù)安全,每年我們都會這樣的研討會專門討論安全話題。比如網(wǎng)絡(luò)安全、加密、身份認證等等東西,保護我數(shù)據(jù)怎么保證不丟失、應(yīng)用怎么確保連續(xù)性,所以這一塊是保護討論的內(nèi)容。第三塊是我們提到對于數(shù)據(jù)中心來講,一個機房環(huán)境、包括空調(diào)等等,這些隨著應(yīng)用增加消耗增多的,怎么在現(xiàn)有基礎(chǔ)上還有管理、人力成本不增加的基礎(chǔ)上,能夠支撐越來越多應(yīng)用。在數(shù)據(jù)中心需要虛擬化架構(gòu)。第四塊更多跟應(yīng)用相關(guān)。這一塊可以跟企業(yè)應(yīng)用結(jié)合,在國外醫(yī)療行業(yè)里邊已經(jīng)做了很多數(shù)據(jù)的整合,它可以把各種各樣類型數(shù)據(jù),通過內(nèi)容管理平臺把它展現(xiàn)給所有使用者,這個是我們后續(xù)可以進行交流的地方。 從儲存角度我給大家介紹普遍使用的架構(gòu),EMC是技術(shù)型公司我們在市場里邊有什么樣新的技術(shù),可以解決我們目前面臨的問題。傳統(tǒng)的架構(gòu)我相信很多人都已經(jīng)了解,我們針對不同類型的數(shù)據(jù),我們需要不同形式、不同技術(shù)儲存訪問平臺,這里列出比較主流。有FC SAN、IP SAN、NAS,自建資源用NAS訪問,云計算高性能計算等等,以后有一個趨勢云計算里邊有新的儲存云儲存,在我們研發(fā)中心有專門有一些人研發(fā)新一代云儲存技術(shù),未來我們可以探討在云環(huán)境里邊是什么儲存技術(shù)更合適。 今天我們還是看應(yīng)用比較廣泛、比較成熟的架構(gòu)。對于現(xiàn)在網(wǎng)絡(luò)中心,我們看到過去幾年中已經(jīng)有非常明顯的趨勢,我們叫儲存整合,我們把原來每一個服務(wù)器、有一個統(tǒng)一的架構(gòu)統(tǒng)一管理起來。針對不同類型的數(shù)據(jù)有不同類型的訪問模式,比如一卡通可以通過SAN方式進行整合。對于邊緣化系統(tǒng),比如門戶等等通過IP SAN整合,再有的音視頻、語音文件通過NAS進行整合。我們通過光線SAN整合的時候,單個帶寬達到8個G,很多學(xué)校網(wǎng)絡(luò)中心都有萬兆網(wǎng)骨干,也看到這樣趨勢儲存這一塊萬兆網(wǎng)部署也漸漸通過,使原來帶寬不再成為一個瓶頸。這是非常標準的統(tǒng)一儲存的架構(gòu),能夠滿足我們目前網(wǎng)絡(luò)中心、數(shù)字化圖書館目前除了高性能計算以外,應(yīng)該所有數(shù)據(jù)儲存和訪問的需求。 在儲存介質(zhì)上邊,我們知道之前有兩大類,一個光線板、一個SAN板,對一些要求非常高性能苛刻的系統(tǒng),要求相應(yīng)時間非??欤瑢τ谶@些我們提供新的儲存介質(zhì),有閃盤。這種閃盤跟我們現(xiàn)在有在儲存里邊企業(yè)級閃盤不一樣,這種企業(yè)級閃盤比原來光線板提高30倍處理能力,并且它的相應(yīng)時間不到一毫秒,這里有一個數(shù)據(jù)可以給大家看一下。 閃盤我們建議大家在你應(yīng)用環(huán)境中,對于性能要求特別高、還有對延遲特別敏感的這類數(shù)據(jù)放在閃盤上,通過這樣我們再做分層儲存,一般性能放在光線板,不經(jīng)常用放在SAN板上,降低成本。對于數(shù)據(jù)庫來講我們有這樣建議,做數(shù)據(jù)查詢、頻繁訪問的表可以放在閃盤上,其實歷史表可以放在光線板,可以提高查詢速度。 這里我們有一個交易系統(tǒng)做一個測試,這個測試其實是我們平常股票的交易,每一天峰值有三段,一段早晨九點到中午11點半,然后下午一點到五點,每個人關(guān)心股市可能看行情,所有下單交易數(shù)據(jù)放在數(shù)據(jù)庫里邊,每天晚上六點到八點有清算時間,所有數(shù)據(jù)寫著占80%,讀占20%。這套系統(tǒng)我們只用了兩個閃盤,寫的時候只有一個盤真正工作。剩下一些歷史數(shù)據(jù)都放在光線板,做了分頭儲存。在絕大多數(shù)時間里邊,我們閃盤相應(yīng)時間是在0.25毫秒左右,只有個別時間段峰值的時候會到4毫秒左右。 光線盤同一個時間四十毫秒左右。這個系統(tǒng)遠遠沒有把閃盤壓力壓到極限,我們并沒有得到這兩個閃盤最大壓力是多少,但是可以看到峰值可以達到1200IO,其實并沒有到閃盤的極限。其實我們也看到在學(xué)校系統(tǒng)里邊,我們開始應(yīng)用閃盤。有一個學(xué)校在一卡通系統(tǒng)里邊,比如說中午時間段,一卡通交易很頻繁大家都在使用的時候,原來有性能瓶頸,用了閃盤提高數(shù)據(jù)庫查詢和訪問的時間。 另外有一個客戶也是學(xué)校,已經(jīng)把數(shù)字化校園數(shù)據(jù)庫部署我們閃盤架構(gòu)上邊,把最新的數(shù)據(jù)放在閃盤上,提高整個數(shù)據(jù)庫的查詢性能。 我們剛才提到有光線盤、閃盤我們現(xiàn)在做法手動部署數(shù)據(jù),必須事先分析出來那些數(shù)據(jù)頻繁訪問,對性能要求高的放在閃盤上,我們在今年推出新的理念和技術(shù),叫全自動分層儲存,在儲存系統(tǒng)里邊有這樣一個智能,根據(jù)你應(yīng)用對于數(shù)據(jù)頻繁訪問度、性能要求把你數(shù)據(jù)不同儲存介質(zhì)之間做動態(tài)的遷移,遷移過程中應(yīng)用不受影響,當(dāng)你要求性能高的時候把這個數(shù)據(jù)自動放到閃盤上去,我們看到性能要求下來就防到光線盤上。這就是全自動的分層儲存。 高性能計算除了對計算資源有很高要求之外,對于儲存系統(tǒng)也有非常高性能要求,并且我們看到高性能計算環(huán)境,在傳統(tǒng)高性能計算比如有一百個結(jié)點,可能有八十個、九十個計算結(jié)點,這些計算結(jié)點需要數(shù)據(jù)從我們儲存結(jié)點來,一般部署幾個結(jié)點過儲存結(jié)點,計算結(jié)點和儲存結(jié)點通常用網(wǎng)絡(luò)共享的,為了給這么多計算結(jié)點提供數(shù)據(jù)、提供高帶寬數(shù)據(jù)傳輸,本身高效能計算系統(tǒng)。有幾個網(wǎng)絡(luò)儲存結(jié)點給計算結(jié)點提供數(shù)據(jù),這中間有一個問題,在計算結(jié)點和儲存結(jié)點傳輸效率并不高,仍然走文件傳輸,在傳文件類型的數(shù)據(jù)所以效率不夠高。 我們在剛才架構(gòu)上邊,有三家SAN架構(gòu),我們還啟動多種文件系統(tǒng),可以使整個集群理念所有計算結(jié)點都變成儲存結(jié)點,所有計算結(jié)點都可以直接通過線速速度訪問數(shù)據(jù),看一下它的具體原理。當(dāng)需要訪問數(shù)據(jù)的時候向我提出申請,由我儲存通過NFS協(xié)議,將他訪問結(jié)點返回結(jié)點上,直接通過光線或者IP SAN拿數(shù)據(jù),這個時候不受NFS協(xié)議限制,所以速度可以接近連接速度。 你的計算對于數(shù)據(jù)流量的帶寬,我們說幾百個、上千個結(jié)點都部署光線可能受不了,可能有個別環(huán)境少數(shù)結(jié)點工作,需要高帶寬訪問可以用光線傳輸數(shù)據(jù)。這個架構(gòu)我們剛剛在上海超算中心系統(tǒng)里邊我們部署這個架構(gòu),是1500個結(jié)點,都采用MPFSI架構(gòu)部署的。這是給大家介紹一下,除了傳統(tǒng)架構(gòu)以外,因為我看到這樣趨勢,很多學(xué)校在網(wǎng)絡(luò)中心建立自己高層計算集群,借助現(xiàn)有架構(gòu)不僅僅支撐傳統(tǒng)應(yīng)用系統(tǒng),也可以支持新的高性能計算。 第二個塊我們看一下數(shù)據(jù)保護,并不是所有數(shù)據(jù)都需要保護,但是有些數(shù)據(jù)很關(guān)鍵需要備份,如果我們數(shù)據(jù)受到損壞或者丟失需要恢復(fù)。有一個老師校園網(wǎng)絡(luò)上有很多病毒、攻擊等等,應(yīng)用系統(tǒng)比如文件類型系統(tǒng)、操作系統(tǒng)可能被病毒感染,還有網(wǎng)絡(luò)門戶經(jīng)常被人黑掉了,怎么能夠很短時間內(nèi)把數(shù)據(jù)恢復(fù)正常的、好的狀態(tài),這是保護這一塊幫大家做的事情。 當(dāng)然針對不同類型的應(yīng)用、不同數(shù)據(jù)還有你保護需要級別不一樣。比如有的數(shù)據(jù)一天之前在就可以,比如一卡通數(shù)據(jù)盡量丟的越少越好,這樣不同保護需求我們選擇不同的技術(shù)實現(xiàn)。這里給大家介紹比較新的技術(shù)。 一種新的技術(shù)需求來源哪里?我看到在我們數(shù)字化校園里邊數(shù)據(jù)量增長太快了,幾年前可能在幾個T徘徊,今年或者明年可能幾百個T都有,怎么保護才能更有效?我們今天主題就是虛擬化,在虛擬化環(huán)境里邊我數(shù)據(jù)怎么保護,虛擬化之后會帶來很多問題,我們所有操作系統(tǒng)是不是都要保護,我們所有虛擬化數(shù)據(jù)怎么進行保護。 針對這樣環(huán)境有一個趨勢,我們有這樣新的技術(shù),叫做重復(fù)技術(shù)刪除技術(shù),這種技術(shù)為了應(yīng)對數(shù)據(jù)量越來越大、而備份、保護窗口不變,怎么有限時間保護更多數(shù)據(jù),再有怎么保護現(xiàn)有架構(gòu)以及未來虛擬化架構(gòu)。我們舉一個很簡單的例子,如果數(shù)據(jù)中心有10個T,如果有除存技術(shù),當(dāng)我做備份的時候只需要5個T備份空間,我們未來每一次做備份,或者第二天或者隔一周做備份多了5個T,因為有備份技術(shù),第二次只需要備份2.5個T,在我系統(tǒng)備份10個T,因為有備份技術(shù)只有10.5T空間。我們現(xiàn)在通過這樣技術(shù)可以幫助我們,首先減少備份對空間的占用,同時提高整個備份的效果。它的理念非常簡單,我們在我們數(shù)據(jù)里頭切成很塊,我們通過算法把數(shù)據(jù)塊算出唯一的地址,這個地址只要相同數(shù)據(jù)塊就一樣,只是把地址不同的數(shù)據(jù)塊備份起來。很簡單氫和氧,我們把氫和氧原子備份起來。 除存技術(shù)有兩種實現(xiàn)方式,一種源端除存、一個目標端,我備份窗口不夠或者有新的虛擬環(huán)境,我們建立用源端除存,對于網(wǎng)絡(luò)帶寬占用都能減少很多。通過這樣技術(shù)我們可以備份更多的數(shù)據(jù),可以將這些數(shù)據(jù)保留更長的時間。 比如我需要保護數(shù)據(jù)五分鐘之前,我們有時間點恢復(fù),有兩種方式,一種快照克隆,恢復(fù)某一個時間點,另外一個技術(shù)任意時間點恢復(fù)。最后一塊是虛擬化,因為時間關(guān)系,所以今天不花太多的時間。我們只是看一下虛擬化在數(shù)據(jù)中心幫助大家做什么,可以做資源整合、資源靈活調(diào)配、應(yīng)用快速部署、綠色IT、通過整合之后提高我們整個數(shù)據(jù)中心可用性。其實后邊專門有介紹虛擬化新一代技術(shù),明天分會場EMC針對新一代虛擬化中心有什么解決方案,所以這里不太多說了。 我們看到現(xiàn)在數(shù)字化校園、數(shù)字化大學(xué)建設(shè),我們要搭好比較完善的信息架構(gòu),依次支撐我們越來越多、各種各樣不同類型的應(yīng)用,以及由這些應(yīng)用產(chǎn)生的各種類型的數(shù)據(jù),同時幫助我們學(xué)校來進行數(shù)據(jù)保護、應(yīng)用的保護,還有我們整個數(shù)據(jù)中心運維的管理。今天我就先介紹到這里,謝謝大家! |