免费视频淫片aa毛片_日韩高清在线亚洲专区vr_日韩大片免费观看视频播放_亚洲欧美国产精品完整版

打開APP
userphoto
未登錄

開通VIP,暢享免費(fèi)電子書等14項(xiàng)超值服

開通VIP
顯卡顯存的前世今生終極剖析——高手進(jìn)階必知

目前CPU用的內(nèi)存正在從DDR3向DDR4過渡,而GPU用的顯存則是以GDDR2/3為主、跳過GDDR4、直奔GDDR5而去。或許很多朋友一時(shí)還難以接受GDDR5那夸張的頻率、不明白GDDR相比DDR發(fā)展速度為何如此'超前'、甚至搞不清楚GDDR1/2/3/4/5和DDR1/2/3之間'說不清道不明'的關(guān)系。

如果您是一位求知欲很強(qiáng)的電腦愛好者,那么本文非常適合您,筆者特意搜集了大量官方技術(shù)文檔,為大家獻(xiàn)上內(nèi)存和顯存鮮為人知的奧秘……

近年來CPU(中央處理器)和GPU(圖形處理器)的發(fā)展速度之快讓人目不暇接,新產(chǎn)品的運(yùn)算能力成倍提升,此時(shí)就對(duì)內(nèi)存子系統(tǒng)提出了嚴(yán)峻的需求,因?yàn)镃PU/GPU運(yùn)算所需的數(shù)據(jù)和生成的數(shù)據(jù)都是來自于內(nèi)存/顯存,如果存儲(chǔ)速度跟不上,那么就會(huì)浪費(fèi)很多時(shí)間在數(shù)據(jù)等待上面,從而影響CPU/GPU的性能發(fā)揮。

為了讓內(nèi)存/顯存不至于造成瓶頸,芯片廠商都在想方設(shè)法的提高帶寬:AMD和Intel相繼將內(nèi)存控制器整合在了CPU內(nèi)部,大大降低了延遲并提高存儲(chǔ)效率,Intel旗艦級(jí)CPU能夠支持三通道內(nèi)存,帶寬提升50%; 和 也先后使用了512Bit的顯存控制器,總帶寬倍增。

是何原因?qū)е聵I(yè)界三大巨頭如此大費(fèi)周折呢?這是因?yàn)閮?nèi)存技術(shù)的發(fā)展速度,其實(shí)并不如大家想象中的那么快,受到很多技術(shù)難題和傳統(tǒng)因素的制約,本文就對(duì)內(nèi)存和顯存的發(fā)展歷程及相關(guān)技術(shù)進(jìn)行詳細(xì)分析。

● 內(nèi)存的存取原理及難以逾越的頻障:

在半導(dǎo)體科技極為發(fā)達(dá)的臺(tái)灣省,內(nèi)存和顯存被統(tǒng)稱為記憶體(Memory),全名是動(dòng)態(tài)隨機(jī)存取記憶體(Dynamic Random Access Memory,DRAM)?;驹砭褪抢秒娙輧?nèi)存儲(chǔ)電荷的多寡來代表0和1,這就是一個(gè)二進(jìn)制位元(bit),內(nèi)存的最小單位。

DRAM的存儲(chǔ)單元結(jié)構(gòu)圖

DRAM的結(jié)構(gòu)可謂是簡(jiǎn)單高效,每一個(gè)bit只需要一個(gè)晶體管加一個(gè)電容。但是電容不可避免的存在漏電現(xiàn)象,如果電荷不足會(huì)導(dǎo)致數(shù)據(jù)出錯(cuò),因此電容必須被周期性的刷新(預(yù)充電),這也是DRAM的一大特點(diǎn)。而且電容的充放電需要一個(gè)過程,刷新頻率不可能無限提升(頻障),這就導(dǎo)致DRAM的頻率很容易達(dá)到上限,即便有先進(jìn)工藝的支持也收效甚微。

'上古'時(shí)代的FP/EDO內(nèi)存,由于半導(dǎo)體工藝的限制,頻率只有25MHz/50MHz,自SDR以后頻率從66MHz一路飆升至133MHz,終于遇到了難以逾越的障礙。此后所誕生的DDR1/2/3系列,它們存儲(chǔ)單元官方頻率(JEDEC制定)始終在100MHz-200MHz之間徘徊,非官方(超頻)頻率也頂多在250MHz左右,很難突破300MHz。事實(shí)上高頻內(nèi)存的出錯(cuò)率很高、穩(wěn)定性也得不到保證,除了超頻跑簡(jiǎn)單測(cè)試外并無實(shí)際應(yīng)用價(jià)值。

既然存儲(chǔ)單元的頻率(簡(jiǎn)稱內(nèi)核頻率,也就是電容的刷新頻率)不能無限提升,那么就只有在I/O(輸入輸出)方面做文章,通過改進(jìn)I/O單元,這就誕生了DDR1/2/3、GDDR1/2/3/4/5等形形色色的內(nèi)存種類,首先來詳細(xì)介紹下DDR1/2/3之間的關(guān)系及特色。

通常大家所說的DDR-400、DDR2-800、DDR3-1600等,其實(shí)并非是內(nèi)存的真正頻率,而是業(yè)界約定俗成的等效頻率,這些DDR1/2/3內(nèi)存相當(dāng)于老牌SDR內(nèi)存運(yùn)行在400MHz、800MHz、1600MHz時(shí)的帶寬,因此頻率看上去很夸張,其實(shí)真正的內(nèi)核頻率都只有200MHz而已!

內(nèi)存有三種不同的頻率指標(biāo),它們分別是核心頻率、時(shí)鐘頻率和有效數(shù)據(jù)傳輸頻率。核心頻率即為內(nèi)存Cell陣列(Memory Cell Array,即內(nèi)部電容)的刷新頻率,它是內(nèi)存的真實(shí)運(yùn)行頻率;時(shí)鐘頻率即I/O Buffer(輸入/輸出緩沖)的傳輸頻率;而有效數(shù)據(jù)傳輸頻率就是指數(shù)據(jù)傳送的頻率(即等效頻率)。

● SDR和DDR1/2/3全系列頻率對(duì)照表:

常見DDR內(nèi)存頻率對(duì)照表

通過上表就能非常直觀的看出,近年來內(nèi)存的頻率雖然在成倍增長(zhǎng),可實(shí)際上真正存儲(chǔ)單元的頻率一直在133MHz-200MHz之間徘徊,這是因?yàn)殡娙莸乃⑿骂l率受制于制造工藝而很難取得突破。而每一代DDR的推出,都能夠以較低的存儲(chǔ)單元頻率,實(shí)現(xiàn)更大的帶寬,并且為將來頻率和帶寬的提升留下了一定的空間。

● SDR和DDR1/2/3存儲(chǔ)原理示意圖:

雖然存儲(chǔ)單元的頻率一直都沒變,但內(nèi)存顆粒的I/O頻率卻一直在增長(zhǎng),再加上DDR是雙倍數(shù)據(jù)傳輸,因此內(nèi)存的數(shù)據(jù)傳輸率可以達(dá)到核心頻率的8倍之多!通過下面的示意圖就能略知一二:

那么,內(nèi)存IO頻率為什么能達(dá)到數(shù)倍于核心頻率呢?

相信很多人都知道,DDR1/2/3內(nèi)存最關(guān)鍵的技術(shù)就是分別采用了2/4/8bit數(shù)據(jù)預(yù)取技術(shù)(Prefetch),由此得以將帶寬翻倍,與此同時(shí)I/O控制器也必須做相應(yīng)的改進(jìn)。

● DDR1/2/3數(shù)據(jù)預(yù)取技術(shù)原理:

預(yù)取,顧名思義就是預(yù)先/提前存取數(shù)據(jù),也就是說在I/O控制器發(fā)出請(qǐng)求之前,存儲(chǔ)單元已經(jīng)事先準(zhǔn)備好了2/4/8bit數(shù)據(jù)。簡(jiǎn)單來說這就是把并行傳輸?shù)臄?shù)據(jù)轉(zhuǎn)換為串行數(shù)據(jù)流,我們可以把它認(rèn)為是存儲(chǔ)單元內(nèi)部的Raid/多通道技術(shù),可以說是以電容矩陣為單位的。

內(nèi)存數(shù)據(jù)預(yù)取技術(shù)示意圖:并行轉(zhuǎn)串行

這種存儲(chǔ)陣列內(nèi)部的實(shí)際位寬較大,但是數(shù)據(jù)輸出位寬卻比較小的設(shè)計(jì),就是所謂的數(shù)據(jù)預(yù)取技術(shù),它可以讓內(nèi)存的數(shù)據(jù)傳輸頻率倍增。試想如果我們把一條細(xì)水管安裝在粗水管之上,那么水流的噴射速度就會(huì)翻幾倍。

明白了數(shù)據(jù)預(yù)取技術(shù)的原理之后,再來看看DDR1/2/3內(nèi)存的定義,以及三種頻率之間的關(guān)系,就豁然開朗了:

● SDRAM(Synchronous DRAM):同步動(dòng)態(tài)隨機(jī)存儲(chǔ)器

之所以被稱為'同步',因?yàn)镾DR內(nèi)存的存儲(chǔ)單元頻率、I/O頻率及數(shù)據(jù)傳輸率都是相同的,比如經(jīng)典的PC133,三種頻率都是133MHz。

SDR在一個(gè)時(shí)鐘周期內(nèi)只能讀/寫一次,只在時(shí)鐘上升期讀/寫數(shù)據(jù),當(dāng)同時(shí)需要讀取和寫入時(shí),就得等待其中一個(gè)動(dòng)作完成之后才能繼續(xù)進(jìn)行下一個(gè)動(dòng)作。

● DDR(Double Date Rate SDRAM):雙倍速率同步動(dòng)態(tài)隨機(jī)存儲(chǔ)器

雙倍是指在一個(gè)時(shí)鐘周期內(nèi)傳輸兩次數(shù)據(jù),在時(shí)鐘的上升期和下降期各傳輸一次數(shù)據(jù)(通過差分時(shí)鐘技術(shù)實(shí)現(xiàn)),在存儲(chǔ)陣列頻率不變的情況下,數(shù)據(jù)傳輸率達(dá)到了SDR的兩倍,此時(shí)就需要I/O從存儲(chǔ)陣列中預(yù)取2bit數(shù)據(jù),因此I/O的工作頻率是存儲(chǔ)陣列頻率的兩倍。????

DQ頻率和I/O頻率是相同的,因?yàn)镈Q在時(shí)鐘上升和下降研能傳輸兩次數(shù)據(jù),也是兩倍于存儲(chǔ)陣列的頻率。???

● DDR2(DDR 2 SDRAM):第二代雙倍速率同步動(dòng)態(tài)隨機(jī)存儲(chǔ)器

DDR2在DDR1的基礎(chǔ)上,數(shù)據(jù)預(yù)取位數(shù)從2bit擴(kuò)充至4bit,此時(shí)上下行同時(shí)傳輸數(shù)據(jù)(雙倍)已經(jīng)滿足不了4bit預(yù)取的要求,因此I/O控制器頻率必須加倍。

至此,在存儲(chǔ)單元頻率保持133-200MHz不變的情況下,DDR2的實(shí)際頻率達(dá)到了266-400MHz,而(等效)數(shù)據(jù)傳輸率達(dá)到了533-800MHz。

● DDR3(DDR 3 SDRAM):第三代雙倍速率同步動(dòng)態(tài)隨機(jī)存儲(chǔ)器

DDR3就更容易理解了,數(shù)據(jù)預(yù)取位數(shù)再次翻倍到8bit,同理I/O控制器頻率也加倍。此時(shí),在存儲(chǔ)單元頻率保持133-200MHz不變的情況下,DDR3的實(shí)際頻率達(dá)到了533-800MHz,而(等效)數(shù)據(jù)傳輸率高達(dá)1066-1600MHz。

綜上可以看出,DDR1/2/3的發(fā)展是圍繞著數(shù)據(jù)預(yù)取而進(jìn)行的,同時(shí)也給I/O控制器造成了不小的壓力,雖然存儲(chǔ)單元的工作頻率保持不變,但I(xiàn)/O頻率以級(jí)數(shù)增長(zhǎng),我們可以看到DDR3的I/O頻率已逼近1GHz大關(guān),此時(shí)I/O頻率成為了新的瓶頸,如果繼續(xù)推出DDR4(注意不是GDDR4,兩者完全不是同一概念,后文會(huì)有詳細(xì)解釋)的話,將會(huì)受到很多未知因素的制約,必須等待更先進(jìn)的工藝或者新解決方案的出現(xiàn)才有可能延續(xù)DDR的生命。

前面介紹的是關(guān)于歷代內(nèi)存的技術(shù)原理,可以說是比較微觀的東西,反映在宏觀上,就是常見的內(nèi)存顆粒及內(nèi)存條了,這都是些看得見摸得著的東西,但有些概念還是不容易理解,這里一一進(jìn)行說明:

● 內(nèi)存位寬——SDR/DDR1/2/3單條內(nèi)存都是64bit

內(nèi)存模組的設(shè)計(jì)取決于內(nèi)存控制器(集成在北橋或者CPU內(nèi)部),理論上位寬可以無限提升,但受制因素較多:高位寬將會(huì)讓芯片組變得十分復(fù)雜,對(duì)主板布線提出嚴(yán)格要求,內(nèi)存PCB更是絲毫馬虎不得,內(nèi)存顆粒及芯片設(shè)計(jì)也必須作相應(yīng)的調(diào)整。可謂是牽一發(fā)而動(dòng)全身,所以多年來業(yè)界都是墨守成規(guī),維持64bit的設(shè)計(jì)不變。

相比之下,顯卡作為一個(gè)整體就沒有那么多的顧忌,只需重新設(shè)計(jì)GPU內(nèi)部的顯存控制器,然后PCB按照位寬要求布線,焊更多的顯存顆粒上去就行了,雖然成本也很高但實(shí)現(xiàn)512bit并沒有太大難度。

● 多通道內(nèi)存——雙通道/三通道

既然實(shí)現(xiàn)高位寬內(nèi)存條太難,那么就退而求其次,讓兩條內(nèi)存并行傳輸數(shù)據(jù),同樣可以讓位寬翻倍。目前流行的雙通道技術(shù)就是如此,北橋或者CPU內(nèi)部整合了兩個(gè)獨(dú)立的64bit內(nèi)存控制器,同時(shí)傳輸數(shù)據(jù)等效位寬就相當(dāng)于128bit。

Intel Nehalem核心CPU直接整合三通道內(nèi)存控制器,位寬高達(dá)192bit。但由于CPU、主板、內(nèi)存方面成本都增加不少,因此在主流Lynnfield核心CPU上面又回歸了雙通道設(shè)計(jì)。事實(shí)上服務(wù)器芯片組已經(jīng)能夠支持四通道內(nèi)存,對(duì)服務(wù)器來說成本方面不是問題,只是對(duì)穩(wěn)定性和容錯(cuò)性要求很高。

● 內(nèi)存顆粒位寬:4/8/16/32bit

理論上,完全可以制造出一顆位寬為64bit的芯片來滿足一條內(nèi)存使用,但這種設(shè)計(jì)對(duì)技術(shù)要求很高,良品率很低導(dǎo)致成本無法控制,應(yīng)用范圍很窄。

所以內(nèi)存芯片的位寬一般都很小,臺(tái)式機(jī)內(nèi)存顆粒的位寬最高僅16bit,常見的則是4/8bit。這樣為了組成64bit內(nèi)存的需要,至少需要4顆16bit的芯片、8顆8bit的芯片或者16顆4bit的芯片。

而顯卡對(duì)位寬要求很高,容量反而退居其次,所以顯存顆粒的位寬普遍比內(nèi)存顆粒大(這就是顯存和內(nèi)存主要區(qū)別之一),比如GDDR3/4/5顆粒都是32bit,4顆就能滿足低端卡128bit的需要,8顆可以滿足高端卡256bit的需要;而低端GDDR2顆粒為16bit,需要8顆才能組成低端卡128bit的需要。

● 內(nèi)存芯片的邏輯Bank

在芯片的內(nèi)部,內(nèi)存的數(shù)據(jù)是以bit為單位寫入一張大的矩陣中,每個(gè)單元稱為CELL陣列,只要指定一個(gè)行一個(gè)列,就可以準(zhǔn)確地定位到某個(gè)CELL,這就是內(nèi)存芯片尋址的基本原理。這個(gè)陣列我們就稱為內(nèi)存芯片的BANK,也稱之為邏輯BANK(Logical BANK)。

不可能只做一個(gè)全容量的邏輯Bank,因?yàn)閱我坏倪壿婤ank將會(huì)造成非常嚴(yán)重的尋址沖突,大幅降低內(nèi)存效率。所以大容量?jī)?nèi)存顆粒都是由多個(gè)邏輯Bank疊加而成的。簡(jiǎn)單來說,我們可以把一個(gè)Bank看作是一片平面的矩陣紙,而內(nèi)存顆粒是由多片這樣的紙疊起來的。

一個(gè)Bank的位寬就是內(nèi)存顆粒的位寬,內(nèi)存控制器一次只允許對(duì)一個(gè)Bank進(jìn)行操作,由于邏輯Bank的地址線是公用的,所以在讀寫時(shí)需要加一個(gè)邏輯Bank的編號(hào),這個(gè)動(dòng)作被稱為片選。

補(bǔ)充內(nèi)容:

內(nèi)存Bank的探討 目前很多人對(duì)內(nèi)存Bank(電腦系統(tǒng)與內(nèi)存之間數(shù)據(jù)總線的基本工作單位)都有一種誤解,認(rèn)為單面內(nèi)存就是單Bank,雙面內(nèi)存就是雙Bank的。其實(shí)這種觀念是不對(duì)的,內(nèi)存的Bank(指物理Bank)數(shù)和內(nèi)存顆粒的面無關(guān),它們之間有什么聯(lián)系呢? 要講清這個(gè)問題,就要提到內(nèi)存的邏輯Bank,下面就給大家介紹一下物理Bank和邏輯Bank的概念。在介紹之前,我們先簡(jiǎn)單看一下現(xiàn)在市場(chǎng)上的DRAM內(nèi)存產(chǎn)品.現(xiàn)在市場(chǎng)上的內(nèi)存主要有:SDRAM、DDR SDRAM及Rambus。其中Rambus內(nèi)存的控制器和前兩者不同,且內(nèi)部Bank和前兩者也不同,將在后面單獨(dú)介紹。先主要介紹SDRAM和DDR SDRAM的Bank問題,因?yàn)镾DRAM就內(nèi)核、Bank結(jié)構(gòu)而言,和DDR SDRAM沒有什么區(qū)別,這里作為一個(gè)整體來講。邏輯Bank及其結(jié)構(gòu)內(nèi)存芯片存儲(chǔ)數(shù)據(jù)的基本單位是bit(位),而進(jìn)行尋址的基本單位則是Byte(字節(jié)),一個(gè)Byte就等于8bit。大家知道,在平面坐標(biāo)系中,要確定一個(gè)點(diǎn)就要先找到它的橫坐標(biāo)和縱坐標(biāo)。而在內(nèi)存中數(shù)據(jù)的定位也很相似,內(nèi)存中的數(shù)據(jù)結(jié)構(gòu)就是一個(gè)大的數(shù)據(jù)陣列,為了便于理解,我們把它假想成一個(gè)大的表格,前面我們提到的平面坐標(biāo)系中的點(diǎn),在這里我們可以理解為經(jīng)過定位后的單元格,當(dāng)然在一個(gè)單元格中不是只有1bit的數(shù)據(jù),而是由多個(gè)bit組成一個(gè)組放在單元格內(nèi),這里一個(gè)單元格我們可以稱作一個(gè)組,這個(gè)單元格的位數(shù)也就是內(nèi)存邏輯Bank的位寬。在進(jìn)行數(shù)據(jù)讀取時(shí),先進(jìn)行行的選定,再進(jìn)行列的選定,最后再?gòu)倪@個(gè)單元格中讀取出所需要的數(shù)據(jù)。而這由許許多多的單元格組成的大表我們就可以理解成邏輯Bank,當(dāng)然因?yàn)橹圃旃に嚰皵?shù)據(jù)尋址的原因,不可能讓這個(gè)表格無限大,一般內(nèi)存芯片中都是將內(nèi)存容量分成幾個(gè)陣列來制造,即多邏輯Bank。隨著內(nèi)存芯片容量的不斷增加,邏輯Bank數(shù)量也在不斷增加,早期的16Mbit之類的芯片采用的還是兩個(gè)邏輯Bank的設(shè)計(jì),現(xiàn)階段常見內(nèi)存芯片的Bank一般為4個(gè)(不包括Rambus),這點(diǎn)大家可通過內(nèi)存條的編碼進(jìn)行識(shí)別。內(nèi)存芯片設(shè)計(jì)時(shí)在一個(gè)時(shí)鐘周期內(nèi)只允許對(duì)一個(gè)邏輯Bank進(jìn)行操作(實(shí)際上內(nèi)存芯片的位寬就是邏輯Bank的位寬),而不能對(duì)所有邏輯Bank同時(shí)操作。所以邏輯Bank的地址線是通用的,只要再有一個(gè)邏輯Bank編號(hào)加以區(qū)別就可以了。內(nèi)存芯片的位寬決定了一次能從它那里讀出多少數(shù)據(jù),并不是內(nèi)存芯片里所有單元的數(shù)據(jù)能夠一次全部讀出。為了加深大家對(duì)邏輯Bank的理解,我們來看看一個(gè)單芯片的邏輯Bank示意圖這里不用過于注意結(jié)構(gòu)細(xì)節(jié),只需要看看4個(gè)內(nèi)存陣列。從圖中可以很清楚地看到這個(gè)芯片是一個(gè)Bank數(shù)為4的芯片,其列和行分別為4096和2048,而邏輯位寬是4bit,將這三者相乘就是這個(gè)邏輯Bank的容量,這里是4096×2048×4 bit =32Mb。再乘以Bank的數(shù)量,則芯片的容量就可以算出來了,這里很顯然是4個(gè)Bank,那么芯片的容量就是128Mb了。用虛線框起來的就是一個(gè)完整的邏輯Bank??梢娨粋€(gè)Bank由內(nèi)存陣列、傳感放大器、一個(gè)行解碼器、一個(gè)列解碼器組成。

接下來我們簡(jiǎn)單看看物理Bank,物理Bank的含義就是指內(nèi)存和主板北橋芯片之間傳遞數(shù)據(jù)的通道,自586以后的CPU數(shù)據(jù)總線均為64bit位寬,而CPU一次只能對(duì)一個(gè)物理Bank進(jìn)行訪問,所以一般情況下我們就把64bit作為一個(gè)物理Bank(Physical Bank),在前面我們已經(jīng)講過了邏輯Bank,所以在這里我給大家講一下如何自己算出物理Bank,大家就會(huì)非常好理解了。由于CPU一次只能打開一個(gè)物理Bank,在單芯片上也只能打開一個(gè)邏輯Bank,這樣我們就知道邏輯Bank的位寬也就是單芯片的位寬了,我們把芯片的數(shù)據(jù)寬度和芯片的數(shù)量相乘再除以64就得到了內(nèi)存條的物理Bank數(shù)了,即內(nèi)存的Bank數(shù)=數(shù)據(jù)寬度×芯片數(shù)量/64?,F(xiàn)在大家初步明白了內(nèi)存的物理Bank和內(nèi)存的面數(shù)無關(guān)了吧?后面我還會(huì)舉例說明。在大概了解了SDRAM和DDR內(nèi)存的物理Bank及邏輯Bank之后。 下面我們來簡(jiǎn)單了解一下Rambus的Bank情況。Rambus的Bank為了講解方便,下面以PC800 Rambus為例。Rambus不再采用SDRAM和DDR內(nèi)存的并聯(lián)技術(shù),而是采用了更先進(jìn)的串聯(lián)技術(shù)。就現(xiàn)階段而言,PC800 Rambus使用400MHz的16位總線,在一個(gè)時(shí)鐘周期內(nèi)可以在上升沿和下降沿同時(shí)傳輸數(shù)據(jù),實(shí)際操作頻率為400MHz×2=800MHz,理論帶寬為16bit×2×400MHz/8=1.6GB/s,再配合850主板芯片的雙通道模式,可以達(dá)到3.2GB/s的數(shù)據(jù)帶寬。這也是大家熟知的高帶寬,而它最重要的優(yōu)勢(shì)在于其邏輯Bank上,就現(xiàn)階段的主流 Rambus來說,其邏輯Bank數(shù)高達(dá)32個(gè),擁有更多的Bank數(shù)則意味著具有較少的Bank沖突,尋址流更加短暫隨意。另外還可以提高尋址命中率和降低潛伏周期。當(dāng)然,更多的Bank也使Rambus的制作模具制造更復(fù)雜,也就增加了成本。于是RAMBUS隨后又推出了4i 架構(gòu)的DRDRAM──在每個(gè)顆粒芯片上只有4個(gè)Bank。

一.內(nèi)存芯片的邏輯BANK

在芯片的內(nèi)部,內(nèi)存的數(shù)據(jù)是以位(bit)為單位寫入一張大的矩陣中,每個(gè)單元我們稱為CELL,只要指定一個(gè)行(Row),再指定一個(gè)列(Column),就可以準(zhǔn)確地定位到某個(gè)CELL,這就是內(nèi)存芯片尋址的基本原理。這個(gè)陣列我們就稱為內(nèi)存芯片的BANK,也稱之為邏輯BANK(Logical BANK)。由于工藝上的原因,這個(gè)陣列不可能做得太大,所以一般內(nèi)存芯片中都是將內(nèi)存容量分成幾個(gè)陣列來制造,也就是說存在內(nèi)存芯片中存在多個(gè)邏輯BANK,隨著芯片容量的不斷增加,邏輯BANK數(shù)量也在不斷增加,目前從32MB到1GB的芯片基本都是4個(gè),只有早期的16Mbit和32Mbit的芯片采用的還是2個(gè)邏輯BANK的設(shè)計(jì),譬如三星的兩種16MB芯片:K4S161622D(512K x 16Bit x 2 BANK)和K4S160822DT(1Mx 8Bit x 2 BANK)。芯片組本身設(shè)計(jì)時(shí)在一個(gè)時(shí)鐘周期內(nèi)只允許對(duì)一個(gè)邏輯BANK進(jìn)行操作(實(shí)際上芯片的位寬就是邏輯BANK的位寬),而不是芯片組對(duì)內(nèi)存芯片內(nèi)所有邏輯BANK同時(shí)操作。邏輯BANK的地址線是通用的,只要再有一個(gè)邏輯BANK編號(hào)加以區(qū)別就可以了(BANK0到BANK3)。但是這個(gè)芯片的位寬決定了一次能從它那里讀出多少數(shù)據(jù),并不是內(nèi)存芯片里所有單元的數(shù)據(jù)一次全部能夠讀出

每個(gè)邏輯BANK有8M個(gè)單元格(CELL),一些廠商(比如現(xiàn)代/三星)就把每個(gè)邏輯BANK的單元格數(shù)稱為數(shù)據(jù)深度(Data Depth),每個(gè)單元由8bit組成,那么一個(gè)邏輯BANK的總?cè)萘烤褪?4Mbit(8M×8bit),4個(gè)邏輯BANK就是256Mbit,因此這顆芯片的總?cè)萘烤褪?56Mbit(32MB)。

內(nèi)存芯片的容量是一般以bit為單位的。比如說32Mbit的芯片,就是說它的容量是32Mb(b=bit=位),注意位(bit)與字節(jié)(Byte)區(qū)別,這個(gè)芯片換算成字節(jié)就是4MB(B=Byte=字節(jié)=8個(gè)bit),一般內(nèi)存芯片廠家在芯片上是標(biāo)明容量的,我們可以芯片上的標(biāo)識(shí)知道,這個(gè)芯片有幾個(gè)邏輯BANK,每個(gè)邏輯bank的位寬是多少,每個(gè)邏輯BANK內(nèi)有多少單元格(CELL),比如64MB和128MB內(nèi)存條常用的64Mbit的芯片就有如下三種結(jié)構(gòu)形式:

①16 Meg x 4 (4 Meg x 4 x 4 banks) [16M╳4]

②8 Meg x 8 (2 Meg x 8 x 4 banks) [8M╳8]

③4 Meg x 16 (1 Meg x 16 x 4 banks) [4M╳16]

表示方法是:每個(gè)邏輯BANK的單元格數(shù)×邏輯BANK數(shù)量×每個(gè)單元格的位數(shù)(芯片的位寬)。芯片邏輯BANK位寬目前的工藝水平只能最多做到16位,因此大家看到幾乎所有的芯片邏輯BANK位寬只可能4/8/16三者之一。以前16Mbit的芯片基本采用的單個(gè)芯片兩個(gè)邏輯BANK,但是到了64Mbit基本就都是4個(gè)邏輯BANK設(shè)計(jì)了

二.內(nèi)存條的物理BANK

通常主板上的每個(gè)內(nèi)存插槽分為兩段,這個(gè)大家從VIA主板BIOS設(shè)置中的BANK 0/1 DRAM Timing選項(xiàng)很容易推理得到,實(shí)際上也就是兩個(gè)BANK,不過這里的BANK概念與我們前面分析芯片內(nèi)部結(jié)構(gòu)時(shí)提到的BANK可不一樣。簡(jiǎn)單地說這個(gè)BANK就是內(nèi)存和主板上的北橋芯片之間用來交換數(shù)據(jù)的通道,目前以SDRAM系統(tǒng)為例,CPU與內(nèi)存之間(就是CPU到DIMM槽)的接口位寬是64bit,也就意味著CPU一次會(huì)向內(nèi)存發(fā)送或從內(nèi)存讀取64bit的數(shù)據(jù),那么這一個(gè)64bit的數(shù)據(jù)集合就是一個(gè)內(nèi)存條BANK,很多廠家的產(chǎn)品說明里稱之為物理BANK(Physical BANK),目前絕大多數(shù)的芯片組都只能支持一根內(nèi)存包含兩個(gè)物理BANK,但是針對(duì)某個(gè)具體的條子,很多人想當(dāng)然,認(rèn)為每個(gè)DIMM插槽使用內(nèi)存條的面數(shù)來區(qū)分占用幾個(gè)BANK通道,單面的(16M,64M)只占用一個(gè)物理BANK,而雙面的(32M,128M)則需占用兩個(gè)物理BANK。實(shí)際上物理BANK與面數(shù)是無關(guān)的,PCB電路可以設(shè)計(jì)成雙面和單面,也可把全部芯片(16顆)放在一面上(至少?gòu)睦碚撋鲜峭耆赡埽?。有些?nèi)存條單面就是一個(gè)物理BANK,但有些雙面才是一個(gè)物理BANK,所以不能一概而論。256MB內(nèi)存條就是一個(gè)典型的例子,雖然是雙面并多達(dá)16枚芯片,但仍然是單個(gè)物理BANK的。要準(zhǔn)確知道內(nèi)存條實(shí)際物理BANK數(shù)量,我們只要將單個(gè)芯片的邏輯BANK數(shù)量和位寬以及內(nèi)存條上芯片個(gè)數(shù)搞清楚。各個(gè)芯片位寬之和為64就是單物理BANK,如果是128就是雙物理BANK。CPU一次只能對(duì)一個(gè)物理BANK進(jìn)行訪問和操作(因?yàn)橐粋€(gè)物理BANK是64bit的位寬),那么內(nèi)存條要保證一個(gè)周期內(nèi)向數(shù)據(jù)總線提供或接收64bit的數(shù)據(jù),而這些數(shù)據(jù)都是分別存儲(chǔ)在內(nèi)存條的芯片中。那么內(nèi)存條中有多個(gè)內(nèi)存芯片,這64位數(shù)據(jù)到底是有一個(gè)芯片提供還是由所有芯片每個(gè)提供一部分呢?我們還是以上面的那顆256Mbit的芯片為例,根據(jù)芯片組的工作原理,目前還沒有那家芯片生產(chǎn)廠家做出位寬16位以上的芯片,所以現(xiàn)在的芯片組設(shè)計(jì)時(shí)都是要求內(nèi)存條上每個(gè)芯片均承擔(dān)提供數(shù)據(jù)的任務(wù),也就是說內(nèi)存條上的每個(gè)芯片都要要對(duì)這64位數(shù)據(jù)做貢獻(xiàn),而那顆內(nèi)存芯片的位寬是8位,因此用這個(gè)芯片組成內(nèi)存條只需要8顆芯片即完成了64位數(shù)據(jù)并發(fā)任務(wù),算下來,內(nèi)存條的容量就是32 MB (256Mbit)×8=256MB的容量,假如是內(nèi)存芯片的位寬是4位,那么需要的芯片數(shù)量必須是16顆,這時(shí)假如使用八顆位寬還是8位的64MB(512Mbit)芯片(單個(gè)芯片的總?cè)萘糠艘环┙M裝,盡管內(nèi)存條上的總?cè)萘窟_(dá)到了256MB的要求,還是由于位寬不夠是不能正常工作。要能工作就必須采用16位位寬的64MB(512Mbit)芯片。

586以上電腦的數(shù)據(jù)總線寬度都是64bit,即每次讀取內(nèi)存為64bit,SDRAM內(nèi)存條的設(shè)計(jì)帶寬也是64bit,內(nèi)存條的帶寬為條上各個(gè)內(nèi)存芯片的帶寬之和,基本條件為帶寬之和應(yīng)等于64bit或其倍數(shù)。假如出現(xiàn)了各個(gè)芯片位寬之和等于128。則分成兩個(gè)64位,當(dāng)讀取一個(gè)64位部分時(shí),另一個(gè)64位部分就不能讀取,通常很多廠家就分別將這兩部分放在內(nèi)存的兩面上。這就造成了許多人的錯(cuò)覺:雙面是兩個(gè)BANK的,單面是一個(gè)BANK的。實(shí)際根本不能這樣認(rèn)識(shí),比如大度256MB內(nèi)存,盡管兩面16個(gè)芯片,但是由于內(nèi)存芯片的位寬是4位(32Mbit×4),所以必須要有4×16=64才能達(dá)到系統(tǒng)所要求的位寬。這時(shí)由于芯片大小的限制,不可能將16顆芯片都放在一面上,所以只能設(shè)計(jì)成雙面。對(duì)于64Mbit芯片(4M*16)來說,芯片帶寬16bit,8顆芯片帶寬=16*8=128bit(即兩個(gè)BANK),4顆芯片帶寬=16*4=64bit(即一個(gè)BANK)。兩個(gè)物理BANK的情況只有出現(xiàn)在位寬超出了64位的情況下(即位寬出現(xiàn)了富余),由于芯片組任一時(shí)刻只能處理一個(gè)64位,所以才分成兩個(gè)物理BANK。今后隨著新一代數(shù)據(jù)總線位寬的提高,也許CPU的胃口就不是一次只能64位數(shù)據(jù)了,可能是128位甚至更多。

另外我們常說的內(nèi)存交錯(cuò)設(shè)置并不是指的物理BANK的交錯(cuò)。也就是說不是內(nèi)存條雙面的交錯(cuò),而是指內(nèi)存芯片內(nèi)部邏輯BANK的交錯(cuò),如果芯片有4個(gè)BANK,那么就可以進(jìn)行4路交錯(cuò),如果只有兩個(gè)BANK就只能是二路交錯(cuò)。很多資料介紹的以內(nèi)存條的單面或雙面來決定交錯(cuò)是錯(cuò)誤的,實(shí)際上就是混淆了物理BANK和邏輯BANK的區(qū)別。

.邏輯Bank  邏輯Bank的英文全稱為L(zhǎng)ogical Bank,簡(jiǎn)稱L-Bank。如果將物理Bank說成是內(nèi)存顆粒陣列的話,那么邏輯Bank可以看做是數(shù)據(jù)存儲(chǔ)陣列。不過與物理Bank不同,SDRAM與DDR內(nèi)存的邏輯Bank并不完全一樣,所以我將分開來簡(jiǎn)單介紹一下?! 『?jiǎn)單地說,SDRAM的內(nèi)部是一個(gè)存儲(chǔ)陣列(圖1),因?yàn)槿绻枪艿朗酱鎯?chǔ),就很難做到隨機(jī)訪問了。陣列就如同表格一樣,將數(shù)據(jù)'填'進(jìn)去。因此邏輯Bank我們可以看成是一張邏輯二維表,在此表中內(nèi)存的數(shù)據(jù)是以位(bit)為單位寫入一個(gè)大的矩陣中,每個(gè)單元我們稱為CELL,只要指定一個(gè)行(Row),再指定一個(gè)列(Column),就可以準(zhǔn)確地定位到某個(gè)CELL,里面每個(gè)單元都可以存儲(chǔ)數(shù)據(jù),而且每個(gè)單元的存儲(chǔ)空間相同——因?yàn)閷?shí)際上與物理Bank每個(gè)單元具體存儲(chǔ)數(shù)據(jù)量相同。這個(gè)具體的單元存儲(chǔ)數(shù)據(jù)量即為邏輯Bank的位寬(實(shí)際上內(nèi)存的位寬就是邏輯Bank的位寬),一般有4bit、8bit和16bit等幾種。如果你認(rèn)為不好理解的話,那么你可以用硬盤操作中的簇與扇區(qū)的關(guān)系來理解內(nèi)存中的存儲(chǔ)形式——扇區(qū)是硬盤中的最小存儲(chǔ)單元相當(dāng)于內(nèi)存中的存儲(chǔ)體?、煻粋€(gè)簇則包含多個(gè)扇區(qū)相當(dāng)于邏輯Bank中的存儲(chǔ)單元 數(shù)據(jù)的交換都是以一個(gè)簇為單位進(jìn)行。由于工藝上的原因,這個(gè)陣列不可能做得太大,所以一般內(nèi)存芯片中都是將內(nèi)存容量分成幾個(gè)陣列來制造,也就是說內(nèi)存芯片中存在多個(gè)邏輯Bank,隨著芯片容量的不斷增加,邏輯Bank數(shù)量也在不斷增加。  主板芯片組本身時(shí)在一個(gè)時(shí)鐘周期內(nèi)只允許對(duì)一個(gè)邏輯Bank進(jìn)行操作,而不是主板芯片組對(duì)內(nèi)存芯片內(nèi)所有邏輯Bank同時(shí)操作。邏輯Bank的地址線是通用的,只要再有一個(gè)邏輯Bank編號(hào)加以區(qū)別就可以了(Bank0到Bank3)。但是這個(gè)芯片的位寬決定了一次能從它那里讀出多少數(shù)據(jù),并不是內(nèi)存芯片里所有單元的數(shù)據(jù)能夠一次全部讀出。

對(duì)于DDR內(nèi)存,邏輯Bank的作用、原理與在SDRAM中是一樣的,區(qū)別主要是在邏輯Bank容量、規(guī)格之上。從上面大家已經(jīng)知道,SDRAM中邏輯Bank存儲(chǔ)單元的容量與芯片位寬相同,但DDR中并不是這樣。DDR的邏輯存儲(chǔ)單元的容量是芯片位寬的一倍:即'芯片位寬×2=存儲(chǔ)單元容量',同時(shí)DDR中的真正行、列地址數(shù)量也與同規(guī)格SDRAM不一樣了。這主要是由于DDR的工作原理所決定的。DDR這種內(nèi)部存儲(chǔ)單元容量的設(shè)計(jì),就是常說的兩位預(yù)?。?-bit Prefetch),也稱為2-n Prefetch(n代表芯片位寬)。注:目前品牌內(nèi)存大都在包裝和說明書中標(biāo)明邏輯Bank,對(duì)于兼容條,你可以根據(jù)內(nèi)存顆粒上的編號(hào)標(biāo)志進(jìn)行計(jì)算。至于物理Bank,大家可以根據(jù)以上介紹的原理計(jì)算出來,在這里我就不多說了。另外我們常說的內(nèi)存交錯(cuò)設(shè)置并不是指的物理Bank的交錯(cuò),也就是說不是內(nèi)存條雙面的交錯(cuò),而是指內(nèi)存芯片內(nèi)部邏輯Bank的交錯(cuò)。如果芯片有4個(gè)Bank,那么就可以進(jìn)行4路交錯(cuò),如果只有兩個(gè)Bank就只能是2路交錯(cuò)。很多資料介紹的以內(nèi)存條的單面或雙面來決定交錯(cuò)是錯(cuò)誤的,實(shí)際上就是混淆了物理Bank和邏輯Bank的區(qū)別。

物理Bank  傳統(tǒng)內(nèi)存系統(tǒng)為了保證CPU的正常工作,必須一次傳輸完CPU在一個(gè)傳輸周期內(nèi)所需要的數(shù)據(jù)。而CPU在一個(gè)傳輸周期能接收的數(shù)據(jù)容量就是CPU數(shù)據(jù)總線的位寬,單位是bit(位)。內(nèi)存與CPU之間的數(shù)據(jù)交換通過主板上的北橋進(jìn)行,內(nèi)存總線的數(shù)據(jù)位寬等同于CPU數(shù)據(jù)總線的位寬,這個(gè)位寬就稱之為物理Bank(Physical Bank,簡(jiǎn)稱P-Bank)的位寬。以目前主流的DDR系統(tǒng)為例,CPU與內(nèi)存之間的接口位寬是64bit,也就意味著CPU在一個(gè)周期內(nèi)會(huì)向內(nèi)存發(fā)送或從內(nèi)存讀取64bit的數(shù)據(jù),那么這一個(gè)64bit的數(shù)據(jù)集合就是一個(gè)內(nèi)存條Bank。目前絕大多數(shù)的芯片組都只能支持一條內(nèi)存包含兩個(gè)物理Bank。不過以前有不少朋友都認(rèn)為,內(nèi)存的物理Bank是由面數(shù)決定的:即單面內(nèi)存條則包含一個(gè)物理Bank,雙面內(nèi)存則包含兩個(gè)。其實(shí)這個(gè)看法是錯(cuò)誤的!  一條內(nèi)存條的物理Bank是由所采用的內(nèi)存顆粒的位寬決定的,各個(gè)芯片位寬之和為64bit就是單物理Bank;如果是128bit就是雙物理Bank。讀到這里,大家也應(yīng)該知道,我們可以通過兩種方式來增加這種類型內(nèi)存的容量。第一種就是通過增加每一個(gè)獨(dú)立模塊的容量來增加Bank的容量,第二種方法就是增加Bank的數(shù)目。由于目前內(nèi)存顆粒位寬的限制,一個(gè)系統(tǒng)只有一個(gè)物理Bank已經(jīng)不能滿足容量的需要。所以,目前新一代芯片組可以支持多個(gè)物理Bank,最少的也能支持4個(gè)物理Bank。對(duì)于像Intel i845D這種支持4個(gè)Bank的芯片組來說,我們?cè)谶x購(gòu)內(nèi)存時(shí)就要考慮一下插槽數(shù)與內(nèi)存Bank 的分配問題了。因?yàn)槿绻x購(gòu)雙Bank的內(nèi)存,這意味著在Intel i845D芯片組上我們最多只能使用兩條這樣的內(nèi)存,多了的話芯片組將無法識(shí)別。這里我建議大家最好根據(jù)自己的主板所提供的內(nèi)存插槽數(shù)目來選購(gòu)內(nèi)存,如果主板只提供了兩個(gè)內(nèi)存插槽,那就不必為內(nèi)存是單Bank還是雙Bank而擔(dān)心了。而如果主板提供了4個(gè)內(nèi)存插槽(同一種規(guī)格),那么應(yīng)該盡量購(gòu)買單Bank或大容量雙Bank的內(nèi)存,以免給日后升級(jí)留下不必要的麻煩。注:SDRAM與DDR內(nèi)存的物理Bank是一樣的,不過在RDRAM內(nèi)存規(guī)格中,物理Bank被通道(Channel)取代。

● 內(nèi)存條的物理Bank

內(nèi)存控制器的位寬必須與內(nèi)存條的位寬相等,這樣才能在一個(gè)時(shí)鐘周期內(nèi)傳輸所有數(shù)據(jù),這個(gè)位寬就被成為一個(gè)物理Bank(通常是64bit),每條內(nèi)存至少包含一個(gè)Bank,多數(shù)情況下?lián)碛卸€(gè)物理Bank。

一個(gè)物理Bank不會(huì)造成帶寬浪費(fèi),理論上是最合理的配置,但為了實(shí)現(xiàn)大容量?jī)?nèi)存,單條內(nèi)存多物理Bank也是允許的,但內(nèi)存控制器所能允許的最大Bank數(shù)存在上限,常見的是雙物理Bank設(shè)計(jì),只有特殊內(nèi)存或者服務(wù)器內(nèi)存才會(huì)使用四Bank以上的設(shè)計(jì),因?yàn)檫@種內(nèi)存兼容性不好,'挑'芯片組。

事實(shí)上顯卡上也存在雙物理Bank設(shè)計(jì),目的就是為了實(shí)現(xiàn)超大顯存容量,比如1GB的9800GT,正反兩面共有16顆16M×32bit的GDDR3顯存,總位寬達(dá)512bit,實(shí)際上顯存控制器只支持256bit,這樣就是雙物理Bank。

早在SDRAM時(shí)代,顯卡上用的'顯存顆粒'與內(nèi)存條上的'內(nèi)存顆粒'是完全相同的。在那個(gè)時(shí)候,GPU本身的運(yùn)算能力有限,對(duì)數(shù)據(jù)帶寬的要求自然也不高,所以高頻的SDRAM顆粒就可以滿足要求。

某TNT2顯卡,使用的是PC166的SDR內(nèi)存顆粒

● 內(nèi)存滿足不了顯卡的需求,顯存應(yīng)運(yùn)而生

本是同根生的狀況一直持續(xù)到SDR和DDR交接的時(shí)代,其實(shí)最早用在顯卡上的DDR顆粒與用在內(nèi)存上的DDR顆粒仍然是一樣的。后來由于GPU特殊的需要,顯存顆粒與內(nèi)存顆粒開始分道揚(yáng)鑣,這其中包括了幾方面的因素:

1. GPU需要比CPU更高的帶寬。GPU不像CPU那樣有大容量二三級(jí)緩存,GPU與顯存之間的數(shù)據(jù)交換遠(yuǎn)比CPU頻繁,而且大多都是突發(fā)性的數(shù)據(jù)流,因此GPU比CPU更加渴望得到更高的顯存帶寬支持。位寬×頻率=帶寬,因此提高帶寬的方法就是增加位寬和提高頻率,但GPU對(duì)于位寬和頻率的需求還有其它的因素。

2.顯卡需要高位寬的顯存。顯卡PCB空間是有限的,在有限的空間內(nèi)如何合理的安排顯存顆粒,無論高中低端顯卡都面臨這個(gè)問題。從布線、成本、性能等多種角度來看,顯存都需要達(dá)到更高的位寬。

最早的顯存是單顆16bit的芯片,后來升級(jí)到32bit,將來甚至還會(huì)有更高的規(guī)格出現(xiàn)。而內(nèi)存則沒有那么多要求,多年來內(nèi)存條都是64bit,所以單顆內(nèi)存顆粒沒必要設(shè)計(jì)成高位寬,只要提高容量就行了,所以(內(nèi)存芯片顆粒的)位寬一直維持在4/8bit。

3.顯卡能讓顯存達(dá)到更高的頻率。顯存顆粒與GPU配套使用時(shí),一般都經(jīng)過專門的設(shè)計(jì)和優(yōu)化,而不像內(nèi)存那樣有太多顧忌。GPU的顯存控制器比CPU或北橋內(nèi)存控制器性能優(yōu)異,而且顯卡PCB可以隨意的進(jìn)行優(yōu)化,因此顯存一般都能達(dá)到更高的頻率。而內(nèi)存受到內(nèi)存PCB、主板走線、北橋CPU得諸多因素的限制很難沖擊高頻率

由此算來,顯存與內(nèi)存'分家'既是意料之外,又是情理之中的事情了。為了更好地滿足顯卡GPU的特殊要求,一些廠商(如三星等)推出了專門為圖形系統(tǒng)設(shè)計(jì)的高速DDR顯存,稱為'Graphics Double Data Rate DRAM',也就是我們現(xiàn)在常見的GDDR。

GDDR——顯存和內(nèi)存正式分家

GDDR作為第一代專用的顯存芯片,其實(shí)在技術(shù)方面與DDR沒有任何區(qū)別,同樣采用了2bit預(yù)取技術(shù),理論頻率GDDR并不比DDR高多少。不過后期改進(jìn)工藝的GDDR有了優(yōu)秀PCB的顯卡支持之后,GDDR顯存最高沖刺至900MHz,而DDR內(nèi)存只能達(dá)到600MHz左右,顯存和內(nèi)存的差距從此逐漸拉開。

· TSOP封裝的GDDR 16bit:

128M×16Bit 4.0ns TSOP II封裝的GDDR,單顆16MB,理論頻率500MHz當(dāng)年9550、FX5700等128Bit中端卡需要搭配8顆才能組成128Bit

TSOP封裝的GDDR顆粒,外觀規(guī)格特性都與DDR內(nèi)存顆粒沒有什么區(qū)別,所以在很多人看來'GDDR'與'DDR'是可以'劃等號(hào)'的。其實(shí)兩者還是有些差別:

· GDDR采用4K循環(huán)32ms的刷新周期,而DDR采用8K循環(huán)64ms的刷新周期;

· GDDR為了追求頻率在延遲方面放的更寬一些,畢竟GPU對(duì)延遲不太敏感;

· GDDR顆粒的容量小、位寬大,一般是128Mbit×16Bit(16MB)的規(guī)格,而DDR顆粒的容量大、位寬小,雖然也有16Bit的顆粒,但最常見的還是8Bit和4Bit,單顆容量32MB或64MB。

為了實(shí)現(xiàn)更大的位寬,并進(jìn)一步提升GDDR的性能,后期很多廠商改用了電氣性能更好的MBGA封裝,當(dāng)然也有內(nèi)存顆粒使用MBGA封裝,但規(guī)格已有了較大差異,主要是顆粒位寬不同。

· MBGA封裝的GDDR 32bit:

128Mbit×32Bit 2.2ns MBGA封裝的GDDR,單顆16MB,理論頻率900MHz8顆組成128MB 256Bit規(guī)格,是GDDR1最后的輝煌

MBGA封裝GDDR的單顆位寬首次達(dá)到了32Bit,從此就標(biāo)志著GDDR與DDR正式分道揚(yáng)鑣,32Bit的規(guī)格被GDDR2/3/4/5一直沿用至今。

GDDR顯存的這兩種封裝:MBGA與TSOP構(gòu)成的高低配,曾一度一統(tǒng)顯卡市場(chǎng)。雖然GDDR已經(jīng)退出歷史舞臺(tái),但32Bit主攻中高端、16Bit主攻低端的局面,時(shí)至今日依然得到了延續(xù)。

GDDR2第一版:短命的早產(chǎn)兒 高壓高發(fā)熱

GDDR2源于DDR2技術(shù),也就是采用了4Bit預(yù)取,相比DDR1代可以將頻率翻倍。雖然技術(shù)原理相同,但GDDR2要比DDR2早了將近兩年時(shí)間,首次支持DDR2內(nèi)存的915P主板于2004年中發(fā)布,而首次搭載GDDR2顯存的FX5800Ultra于2003年初發(fā)布,但早產(chǎn)兒往往是短命的。

在設(shè)計(jì)NV30芯片時(shí)依然保持128Bit顯存位寬,為了提高帶寬必須使用高頻顯存,700MHz的GDDR已經(jīng)無法滿足需求了,于是冒險(xiǎn)嘗試GDDR2。第一代GDDR2受制造工藝限制,電壓規(guī)格還是和DDR/GDDR一樣的2.5V,雖然勉強(qiáng)將頻率提升至1GHz左右,但功耗發(fā)熱出奇的大。

128Mbit×32Bit 2.0ns MBGA 144Ball封裝的GDDR2,單顆16MB,理論頻率1000MHzGDDR2第一版只有2.2ns和2.0ns兩種速度

GDDR2第一版只在FX5800/Ultra和FX5600Ultra這三款顯卡上出現(xiàn)過(也包括對(duì)應(yīng)的專業(yè)卡及個(gè)別非公版顯卡), 也有極少數(shù)9800Pro使用了GDDR2。高電壓、高發(fā)熱、高功耗、高成本給人的印象非常差。隨著FX5900改用GDDR及256Bit,GDDR2很快被人遺忘。

FX5800Ultra需要為顯存專門安裝厚重的散熱片

GDDR2失敗的主要原因是 GeForce FX系列架構(gòu)和性能的問題,之后即便改用了256Bit高頻GDDR(此時(shí)GDDR的頻率已被提升至850-900MHz,直逼GDDR2),F(xiàn)X5950Ultra依然不是9800XT的對(duì)手。當(dāng)然GDDR2自身規(guī)格的不完善也造成了它無法入住中低端顯卡,被時(shí)代所遺棄。

GDDR2雖然壞毛病一大堆,但它也擁有一些新的特性,比如首次使用片內(nèi)終結(jié)電阻,PCB設(shè)計(jì)比GDDR更加簡(jiǎn)潔,這個(gè)特性被后來的gDDR2和GDDR3繼承。

gDDR2第二版:統(tǒng)一低端顯卡 永遠(yuǎn)的配角

由于第一代GDDR2的失敗,高端顯卡的顯存是直接從GDDR跳至GDDR3的,但GDDR2并未消亡,而是開始轉(zhuǎn)型。幾大DRAM大廠有針對(duì)性的對(duì)GDDR2的規(guī)格和特性做了更改(說白了就是DDR2的顯存版),由此gDDR2第二版正式登上顯卡舞臺(tái),時(shí)至今日依然活躍在低端顯卡之上。

gDDR2第二版相對(duì)于第一版的改進(jìn)主要有:

· 工作電壓從2.5V降至1.8V,功耗發(fā)熱大降;

· 制造工藝有所進(jìn)步,功耗發(fā)熱進(jìn)一步下降,成本降低,同時(shí)良率和容量有所提升;

· 顆粒位寬從32Bit降至16Bit,只適合低端顯卡使用;

· 封裝形式從144Ball MBGA改為84Ball FBGA,外觀上來看從正方形變成長(zhǎng)方形或者長(zhǎng)條形;

各大廠商均有g(shù)DDR2顆粒

由于電壓的下降,第二代gDDR2的頻率要比第一代GDDR2低,主要以2.5ns(800MHz)和2.2ns(900MHz)的規(guī)格為主,當(dāng)然也有2.8ns(700MHz)的型號(hào)。直到后期制造工藝上去之后,第二代gDDR2才以1.8V電壓突破了1000MHz,最高可達(dá)1200MHz,趕超了第一代高壓GDDR2的記錄。

采用gDDR2顯存的經(jīng)典顯卡有:7300GT、7600GS、X1600Pro、8500GT……一大堆低端顯卡。

注意三星官方網(wǎng)站對(duì)于顯存的分類

相信很多朋友也注意到了,本頁gDDR2的第一個(gè)字母為小寫,幾大DRAM廠商在其官方網(wǎng)站和PDF中就都是這么寫的,以示區(qū)分。我們可以這么認(rèn)為:大寫G表示顯卡專用,32bit定位高端的版本;而小寫g表示為顯卡優(yōu)化,16bit定位低端的版本,本質(zhì)上與內(nèi)存顆粒并無區(qū)別。

事實(shí)上,GDDR3和gDDR3之間也是這種關(guān)系,稍后我們會(huì)做詳細(xì)介紹。

GDDR源于DDR,GDDR2源于DDR2,而GDDR3在頻率方面的表現(xiàn)又與DDR3比較相似,于是很多人認(rèn)為GDDR3就是顯存版的DDR3,這可是個(gè)天大的誤區(qū)。

● GDDR3:一代王者GDDR3源于DDR2技術(shù)

無論GDDR還是GDDR2,由于在技術(shù)方面與DDR/DDR2并無太大差別,因此最終在頻率方面GDDR并不比DDR高太多。在經(jīng)歷了GDDR2的失敗之后,兩大圖形巨頭 和 對(duì)JEDEC組織慢如蝸牛般的標(biāo)準(zhǔn)制訂流程感到越來越失望,認(rèn)為他們制定的顯存不能適應(yīng)GPU快節(jié)奏的產(chǎn)品更新?lián)Q代周期,于是 和 的工作人員積極參與到了JEDEC組織當(dāng)中,以加速顯存標(biāo)準(zhǔn)的起草及制定。

雙方一致認(rèn)為,顯存與內(nèi)存在數(shù)據(jù)存儲(chǔ)的應(yīng)用方面完全不同,在內(nèi)存核心頻率(電容刷新頻率)無法提升的情況下,單純提高I/O頻率來獲得高帶寬很不現(xiàn)實(shí)。因此,必須要有一種針對(duì)高速點(diǎn)對(duì)點(diǎn)環(huán)境而重新定義的I/O接口。于是GDDR3誕生了,這是第一款真正完全為GPU設(shè)計(jì)的存儲(chǔ)器。

GDDR3和GDDR2/DDR2一樣,都是4Bit預(yù)取架構(gòu),GDDR3主要針對(duì)GDDR2高功耗高發(fā)熱的缺點(diǎn)進(jìn)行改進(jìn),并提升傳輸效率來緩解高延遲的負(fù)面影響。

· 點(diǎn)對(duì)點(diǎn)DQS,讀寫無需等待

GDDR2只有一條數(shù)據(jù)選擇脈沖(DQS),是單一雙向的,而GDDR3則擁有讀與寫兩條獨(dú)立的DQS,而且是點(diǎn)對(duì)點(diǎn)設(shè)計(jì)。這樣做的好處在于,在讀取之后如果馬上進(jìn)行寫入時(shí),不必再等DQS的方向轉(zhuǎn)變,由此實(shí)現(xiàn)讀寫操作的快速切換。

相比GDDR2/DDR2,GDDR3的讀寫切換動(dòng)作可以少一個(gè)時(shí)鐘周期,如果需要對(duì)某一個(gè)連續(xù)的區(qū)塊同時(shí)讀寫數(shù)據(jù)時(shí),GDDR3的速度就要比GDDR2快一倍。

由于存儲(chǔ)單元自身的特性,內(nèi)存顆粒的邏輯Bank是無法同時(shí)讀寫數(shù)據(jù)的,并不存在'全雙工'一說,但GDDR3的這項(xiàng)改進(jìn)讓順序讀寫成為可能。GPU本身緩存很小,與顯存之間的數(shù)據(jù)交換極其頻繁,讀寫操作穿插進(jìn)行,因此GDDR3點(diǎn)對(duì)點(diǎn)設(shè)計(jì)的DQS可以讓顯存存儲(chǔ)效率大增。但對(duì)于CPU來說,讀寫切換并不如GPU那么頻繁,而且CPU擁有大容量的二三級(jí)緩存,所以GDDR3這種設(shè)計(jì)并不能極大的提升內(nèi)存帶寬,也沒有引入到下一代DDR3當(dāng)中。

· 改進(jìn)I/O接口,簡(jiǎn)化數(shù)據(jù)處理,控制功耗

同時(shí)GDDR3也對(duì)I/O控制電路和終結(jié)電阻進(jìn)行了修改,它不再沿用GDDR2的'推式(Push Pull)'接收器,而將其改為虛擬開極邏輯方式(Pseudo Open Drain Logic),并且通過將所有的三相數(shù)據(jù)信號(hào)轉(zhuǎn)移到本位電路上,來簡(jiǎn)化數(shù)據(jù)處理,將DC電流壓至最小,只有當(dāng)邏輯LOW移至總線上時(shí)才會(huì)消費(fèi)電力,從而很好的控制了功耗和發(fā)熱。

GDDR3的頻率能達(dá)到現(xiàn)在這么高,其實(shí)并沒有什么訣竅,憑借的就是不斷改進(jìn)的工藝制程,來暴力拉升頻率。資歷稍老點(diǎn)的玩家應(yīng)該知道,GDDR3于2004年初次登臺(tái)亮相時(shí),6600GT的顯存頻率僅為1GHz,并不比GDDR2高,5年過去了,GDDR3從1GHz一路攀升至2GHz甚至2.5GHz,生命力得到了延續(xù)。

明白了GDDR3的原理技術(shù)后,再來看看實(shí)物。GDDR3和GDDR1類似,也有兩種封裝形式:

● 144Ball MBGA封裝,為了向下兼容GDDR和GDDR2

最初的GDDR3采用了144Ball MBGA封裝,這與GDDR和GDDR2第一版完全相同,外觀也是正方形,三者的電氣性能相似,支持GDDR3的GPU也可使用GDDR顯存,PCB和電路只需做少量調(diào)整。

三星2.0ns 256M×32Bit GDDR3顆粒

144Ball封裝的GDDR3只有256M×32Bit一種規(guī)格,所以8顆顯存組成256MB 256Bit、或者4顆顯存組成128MB 128Bit是當(dāng)時(shí)的主流。5700Ultra就首次使用了GDDR3取代了GDDR2。

144Ball封裝的GDDR3主要有2.0ns(1000MHz)和1.6ns(1250MHz)兩種速度,1.4ns良率不高產(chǎn)量很小,最高頻率止步于1400MHz。曾被7800GTX/GT、6800GS、6600GT、X850/X800/X700等顯卡大量采用。由于144Ball封裝及PCB電路限制了其頻率的提升,很快GDDR3就改用了電氣性能更好的136Ball FBGA封裝。

● 136Ball FBGA封裝,頻率容量節(jié)節(jié)攀升

為了提高電氣性能和環(huán)保水平,從2005年開始,GDDR3開始采用全新的136Ball FBGA封裝,并統(tǒng)一使用無鉛封裝工藝。新封裝使得顯卡PCB必須重新設(shè)計(jì),但也為GDDR3的騰飛鋪平了道路。

三星0.8ns GDDR3顯存 512M×32Bit規(guī)格

136Ball封裝GDDR3的優(yōu)勢(shì)如下:

· 規(guī)格不再局限于8M×32Bit一種,16M×32Bit成為主流,目前32M×32Bit已大量采用;

· 伴隨著制造工藝的進(jìn)步,額定電壓從2.0V進(jìn)一步降至1.8V,但一些高頻顆??蛇m當(dāng)加壓;

· 速度從1.4ns起跳,經(jīng)過1.2ns、1.1ns、1.0ns一路發(fā)展至0.8ns、0.7ns,最快速度可突破2500MHz,但這是以犧牲延遲為代價(jià)的,好在GPU對(duì)延遲不太敏感;

當(dāng)GDDR3的頻率首次達(dá)到2000MHz時(shí),很多人都認(rèn)為離極限不遠(yuǎn)了,于是未雨綢繆的抓緊制定GDDR4規(guī)范,但沒想到在DRAM廠商的努力及新工藝的支持下,GDDR3的生命得到了延續(xù),0.8ns 0.7ns的型號(hào)相繼量產(chǎn),而且容量更大的32M×32Bit顆粒也成為主流,基本上能夠滿足高中低端所有顯卡的需要。

當(dāng)前速度最快0.77ns GDDR3顯存顆粒,理論頻率可達(dá)2600MHz

當(dāng)年2.2ns GDDR最高可達(dá)900MHz,核心頻率和I/O頻率止步于450MHz。經(jīng)過5年時(shí)間的發(fā)展,GDDR3憑借新工藝終于在核心頻率和I/O頻率方面取得突破,核心頻率可達(dá)600MHz以上,I/O頻率超過1200MHz,此時(shí)過高的I/O頻率成為了新的瓶頸。

GDDR3采用了DDR2的4bit預(yù)取技術(shù),所以采用DDR3 8bit預(yù)取技術(shù)的顯存只能按順序命名為GDDR4。GDDR4是在GDDR3的基礎(chǔ)上發(fā)展而來的,它繼承了GDDR3的兩大技術(shù)特性,但內(nèi)核改用DDR3的8bit預(yù)取技術(shù),并加入了一些新的技術(shù)來提升頻率。

● GDDR4的技術(shù)特性:

· 使用DDR3的8bit預(yù)取技術(shù),以較低的核心頻率達(dá)到更高帶寬,但延遲增加;

· 采用數(shù)據(jù)總線轉(zhuǎn)位技術(shù)(DBI,Data Bus Inversion,下文做詳細(xì)介紹),提高數(shù)據(jù)精度,降低功耗;

· 地址線只有GDDR3的一半,多余線用于電源和接地,有利于提升頻率,但導(dǎo)致延遲增加;

· 采用多重同步碼(Multi-Preamble)技術(shù),解決了GDDR3存在的爆發(fā)限制(Burst Limit on),從連續(xù)地址讀取少量數(shù)據(jù)時(shí)的性能大幅提升;

· 電壓從1.8V降至1.5V;

· 同頻功耗下降75%,2400MHz的GDDR4功耗只有2000MHz GDDR3的一半;

· 采用136Ball FBGA封裝,單顆32Bit,向下兼容GDDR3;

GDDR4的確更好超,但性能提升有限

由于采用了8bit預(yù)取技術(shù),因此在相同頻率下GDDR4的核心頻率(即電容刷新頻率)只有GDDR3的一半,理論上來講GDDR4最高頻率可達(dá)GDDR3的兩倍。但值得注意的是,雖然核心頻率通過8bit預(yù)取技術(shù)減半,但GDDR4與GDDR3的I/O頻率是完全相同的,因此GDDR4頻率提升的瓶頸在于I/O頻率而不是核心頻率。

由于制造工藝和技術(shù)水平的限制,雖然三星官方宣稱早已生產(chǎn)出3GHz以上的GDDR4,但實(shí)際出貨的GDDR4只有2GHz-2.5GHz,此后改進(jìn)工藝的GDDR3也追平了這一頻率。在相同頻率下,GDDR4比起GDDR3雖然功耗發(fā)熱低,但延遲大性能稍弱,再加上成本高產(chǎn)量小,GDDR4遭受冷落并不意外。

● 導(dǎo)致GDDR4失敗的非技術(shù)方面原因

GDDR3是 和 參與JEDEC組織后共同制定的顯存標(biāo)準(zhǔn),而GDDR4在標(biāo)準(zhǔn)制定過程中雙方產(chǎn)生了較大的分歧。 較為保守,認(rèn)為應(yīng)該保持DDR2 4bit預(yù)取技術(shù)不變,繼續(xù)改進(jìn)I/O控制器來提升頻率;而 則比較激進(jìn),準(zhǔn)備直接使用DDR3 8bit預(yù)取技術(shù)。

雙方爭(zhēng)執(zhí)的結(jié)果就是在JEDEC組織中德高望重的 獲勝(據(jù)稱 有位高層在JEDEC身居要職),而 則明確表示不支持GDDR4。因此GDDR4其實(shí)就是 一手策劃的,但得不到 支持的話,GDDR4立馬就失去了6成以上的市場(chǎng),由此導(dǎo)致DRAM廠不敢貿(mào)然投產(chǎn)。

最終只有三星一家生產(chǎn)了少量的GDDR4顯存,其他家都在觀望。當(dāng)然其他DRAM廠商都沒閑著,它們把精力都投在了深挖GDDR3的潛力當(dāng)中,于是我們看到了GDDR3的頻率節(jié)節(jié)攀升,GDDR4在沒有成本優(yōu)勢(shì)的情況下,也沒有頻率優(yōu)勢(shì),恰好當(dāng)時(shí)的幾代A卡更沒有性能優(yōu)勢(shì),GDDR4自然只有死路一條。

只有 生產(chǎn)過搭載GDDR4的顯卡,數(shù)量雖然不多但橫跨了三代產(chǎn)品:X1950XTX、HD2600XT和HD3870(也包括對(duì)應(yīng)的專業(yè)卡)——與當(dāng)年 使用GDDR2的顯卡數(shù)量相等。NVIDIA 在遭遇滑鐵盧后果斷放棄了GDDR2,而 對(duì)于GDDR4則是難以割舍,三年時(shí)間三代產(chǎn)品都有使用,但一直都是非主流。

GDDR4的失敗并不是技術(shù)原因,和當(dāng)年的GDDR2相比它要成熟很多,沒推起來的原因主要是對(duì)手太強(qiáng): 的對(duì)手 很強(qiáng)大,另外GDDR4的對(duì)手GDDR3生命力太頑強(qiáng)了。

即便使用了8bit預(yù)取技術(shù),可GDDR4還是沒有與GDDR3拉開頻率差距,因?yàn)槠款i在I/O控制器上面而不是內(nèi)核,而GDDR5就是用來解決這一瓶頸的。

● GDDR5:恐怖的頻率是如何達(dá)成的

和GDDR4一樣,GDDR5采用了DDR3的8bit預(yù)取技術(shù),核心頻率顯然不是瓶頸,如何提升I/O頻率才是當(dāng)務(wù)之急。但GDDR5并沒有讓I/O頻率翻倍,而是使用了兩條并行的DQ總線,從而實(shí)現(xiàn)雙倍的接口帶寬。

GDDR5各項(xiàng)總線工作頻率示意圖

雙DQ總線的結(jié)果就是,GDDR5的針腳數(shù)從GDDR3/4的136Ball大幅增至170Ball,相應(yīng)的GPU顯存控制器也需要重新設(shè)計(jì)。GDDR5顯存擁有多達(dá)16個(gè)物理Bank,這些Bank被分為四組,雙DQ總線交叉控制四組Bank,達(dá)到了實(shí)時(shí)讀寫操作,一舉將數(shù)據(jù)傳輸率提升至4GHz以上!

以往GDDR1/2/3/4和DDR1/2/3的數(shù)據(jù)總線都是DDR技術(shù)(通過差分時(shí)鐘在上升沿和下降沿各傳輸一次數(shù)據(jù)),官方標(biāo)稱的頻率X2就是數(shù)據(jù)傳輸率,也就是通常我們所說的等效頻率。而GDDR5則不同,它有兩條數(shù)據(jù)總線,相當(dāng)于Rambus的QDR技術(shù),所以官方標(biāo)稱頻率X4才是數(shù)據(jù)傳輸率。比如HD4870官方顯存頻率是900MHz,而大家習(xí)慣稱之為3600MHz。

● 失敗乃成功之母,冒險(xiǎn)使用GDDR5助RV770挑戰(zhàn)GTX200

GDDR4的失敗并沒有阻擋 前進(jìn)的腳步,在意識(shí)到GDDR4頻率提升的瓶頸之后,GDDR5草案的制定就被提上日程, 和 技術(shù)人員重新聚首,開展第二次合作共商大計(jì)。GDDR5吸取了前輩們的諸多優(yōu)點(diǎn),可謂是取其精華棄其糟粕,在I/O改進(jìn)方面雙方也不再有太多矛盾。

技術(shù)方面的問題不難解決,最難的是時(shí)間和進(jìn)度。 在R600上面冒險(xiǎn)使用512Bit顯存控制器來提升顯存帶寬,結(jié)果輸?shù)靡粩⊥康兀谑荝V670只好回歸256Bit,導(dǎo)致性能原地踏步。而GDDR4相比GDDR3沒有頻率優(yōu)勢(shì),因此 迫切的需要GDDR5迅速投產(chǎn)以滿足新一代GPU的需要,RV770只有256Bit,急需高頻顯存的支持。

對(duì)手 對(duì)于GDDR5當(dāng)然很感興趣,但卻一點(diǎn)都不著急,保守的 決定堅(jiān)守GDDR3,GTX200核心使用了512Bit顯存控制器來提升帶寬。比起R600的環(huán)形總線, 從256Bit到384Bit再到512Bit一步一個(gè)腳印走出來的交叉總線顯然更加成熟。

以256Bit對(duì)抗512Bit, 只能將籌碼全部押在GDDR5身上,于是在GDDR5標(biāo)準(zhǔn)尚未完全確立之前, 已經(jīng)在緊鑼密鼓的測(cè)試性能,并督促DRAM廠投產(chǎn)??梢哉fGDDR5和GDDR2/4一樣也是個(gè)早產(chǎn)兒,但失敗乃成功之母,有了完善的技術(shù)規(guī)格和制造工藝的支持,GDDR5一出世便令人刮目相看。

憑借GDDR5翻倍的數(shù)據(jù)傳輸率,HD4870以256Bit將448Bit的GTX260挑落馬下,迫使 通過降價(jià)、提升規(guī)格、改進(jìn)工藝等諸多手段來反擊。128Bit的HD4770性能也完勝256Bit的9600GT并直逼9800GT。

SDR+DDR1/2/3和GDDR1/2/3/4/5全系列規(guī)格參數(shù)匯總:

● 顯存引領(lǐng)DRAM發(fā)展,未來內(nèi)存將以顯存為藍(lán)本開發(fā)

縱觀近年來內(nèi)存與顯存的發(fā)展,就會(huì)發(fā)現(xiàn)顯存的發(fā)展速度已經(jīng)遠(yuǎn)遠(yuǎn)超越了內(nèi)存,顯存帶寬幾乎達(dá)到了內(nèi)存帶寬的10倍之多,而且這個(gè)差距還在不斷的加大。目前三通道DDR3已經(jīng)足夠桌面CPU用好一陣子了,而GPU對(duì)顯存帶寬的渴求似乎是個(gè)永遠(yuǎn)都填不滿的無底洞。

正因?yàn)槿绱?,顯存逐漸脫離了內(nèi)存的發(fā)展軌跡,在經(jīng)過幾次并不成功的嘗試之后,從內(nèi)存的配角/附屬品,開始走向了反客為主的道路。GDDR2提前DDR2近兩年、GDDR4提前DDR3一年多,雖然都以失敗而告終,但卻為GDDR5的成功打下了堅(jiān)實(shí)的基礎(chǔ)。

在內(nèi)存領(lǐng)域,如今DDR3才剛剛站穩(wěn)腳跟,至少將統(tǒng)治PC兩至三年,但DDR4的標(biāo)準(zhǔn)已經(jīng)在積極制定當(dāng)中,而其技術(shù)規(guī)格將會(huì)以GDDR5為藍(lán)本——也就是說保持DDR3 8bit預(yù)取技術(shù)不變,改進(jìn)I/O控制器,個(gè)中原因相信認(rèn)真閱讀了本文的朋友們應(yīng)該知道吧。

【3C168 中關(guān)村湖南】顯卡界近期新技術(shù)不斷,除了40nm普及、AMD的DirectX 11 Radeon HD 5000系列發(fā)布外,還有一個(gè)與顯卡性能息息相關(guān)的技術(shù)迅速普及,那就是GDDR5顯存顆粒。從第一款采用GDDR5顯存的Radeon HD 4770開始,GDDR5顯存就成為了AMD高端顯卡的標(biāo)配,如今,AMD中端Radeon HD 5700/4700系列也開始采用GDDR5顯存,NVIDIA方面最新的GeForce GT 240也搭上了GDDR5顯存的快車!由此可見,GDDR5顯存時(shí)代將迅速來臨,用來取代服役已久的GDDR3顯存顆粒。 華碩作為全球?yàn)閿?shù)不多同時(shí)兼AIC/AIB為一身的公司,對(duì)GDDR5顯存的支持自然不遺余力,走在業(yè)界的前列,如今GDDR5大軍全面來襲!包括:華碩EAH5870/2DIS/1GD5、華碩EAH5850/2DIS/1GD5、華碩EAH5770/2DIS/1GD5、華碩EAH5750/2DIS/1GD5、華碩EAH4750 F1/DI/512MD5、華碩ENGT240/DI/512MD5等多款產(chǎn)品。那么GDDR5顯存顆粒到底有什么優(yōu)勢(shì),能夠取代稱霸顯存顆粒多年的GDDR3顯存顆粒,下面我們將會(huì)大家揭開謎團(tuán)?

上面這張圖清楚的反應(yīng)了帶寬與顯存頻率位寬之間的關(guān)系!假設(shè)有一批貨物(數(shù)據(jù))要從倉(cāng)庫(顯存)運(yùn)到工廠(GPU)處理,怎么樣才能更快的完成這件工作?我們有兩種方式:第一,在只有驢車運(yùn)輸?shù)那闆r下,可行的方法拓寬工廠與倉(cāng)庫之間的車道數(shù),這樣一次可以跑更多的驢車,也就是增加顯存位寬,第二種就是在道路不變下,把驢車換成汽車,這樣同樣可以更快的完成任務(wù)。

其實(shí)近幾年來,顯卡的發(fā)展一直都是兩種方式同步進(jìn)行,顯卡從幾年前的64Bit已經(jīng)發(fā)展到了512Bit,顯存速度也從原來的500MHz發(fā)展到GDDR3顯存最高的2600MHz(GDDR5出現(xiàn)以前),但是增加顯存位寬這條路徑已經(jīng)出現(xiàn)了瓶頸,512Bit已經(jīng)是目前GPU位寬設(shè)計(jì)的極限,且不論失敗的Radeon HD 2900 XT,即使是看起來風(fēng)光無限的GT200系列,由于顯存控制器占據(jù)了大量的晶體管,芯片設(shè)計(jì)太過復(fù)雜,導(dǎo)致GT200系列無論功耗還是發(fā)熱量都不盡人意, 因此NVIDIA已經(jīng)決定在GT300中采用384Bit位寬,而AMD早就在Radeon HD 3870就已經(jīng)恢復(fù)到了256Bit位寬,可見想增加帶寬,采用拓寬道路數(shù)已經(jīng)不太現(xiàn)實(shí),那么就只有將驢車換成法拉利跑車了!

將驢車換成法拉利跑車需要幾步?答:三步!

最早的驢車可以視為GDDR顯存,最早的頻率為400MHz,到后期隨著工藝的發(fā)展到了900MHz,之后出現(xiàn)了GDDR2顯存顆粒,這應(yīng)該算是第一步,盡管最初的GDDR2顯存由于工藝和電壓?jiǎn)栴},并不成功。

第二步是GDDR3顯存顆粒,這也是近幾年顯卡采用最普遍的顯存顆粒,在這期間GDDR2顯存顆粒才由于制程提升且電壓由2.5V降低到1.8V才開始普遍采用在低端顯卡上,GDDR3顯存最初只有1000MHz,到現(xiàn)在發(fā)展到了最快的0.77ns的2600MHz,此時(shí)可以視為將驢車換成了寶馬,速度提升了非常明顯,但是這看要和誰比!因?yàn)楹虶DDR5相比,GDDR3能夠達(dá)到最高頻率還不及GDDR5的起跳頻率。

第三步就是GDDR5顯存顆粒,當(dāng)然也許有的玩家會(huì)說第三步不是GDDR4顯存顆粒嗎?這是要說的是,GDDR4確實(shí)也是非常優(yōu)秀的產(chǎn)品,不過其致命點(diǎn)是雖然頻率夠高,最高可達(dá)3000MHz,但是延遲也同樣過高,同頻率下性能無法抗衡GDDR3顯存顆粒,目前GDDR4顯存顆粒大部分徘徊在2400MHz左右,實(shí)際上性能與2000MHz的GDDR3顯存性能相差無幾,盡管功耗等方面仍有優(yōu)勢(shì),但是沒有得到NVIDIA的支持,且生產(chǎn)成本與GDDR3相比過高,于是并沒有大面積普及。而GDDR5顯存顆粒就不同了,他不但得到了AMD與NVIDIA的全力支持,且最低起跳頻率為3600MHz,目前最高默認(rèn)頻率達(dá)到了4800MHz,通過超頻甚至已經(jīng)達(dá)到6000MHz的超高頻率。

那么GDDR5是如何實(shí)現(xiàn)法拉利的速度的?

在這個(gè)話題之前我們要先明白顯存的的三個(gè)頻率:核心頻率、I/O頻率、等效頻率。核心頻率是內(nèi)部電容的刷新頻率,它是內(nèi)存的真實(shí)運(yùn)行頻率;時(shí)鐘頻率即I/O(輸入/輸出緩沖)的傳輸頻率;而有效數(shù)據(jù)傳輸頻率就是指數(shù)據(jù)傳送的頻率(即等效頻率)。其中顯存的核心頻率現(xiàn)在很少被人提起,大家提到最多的是I/O傳輸頻率(也就是官方標(biāo)稱的頻率)及等效頻率,等效頻率就是我們談?wù)擄@卡時(shí)所說的頻率,舉個(gè)例子,比如我們說Radeon HD 5870的頻率是4800MHz,官方則稱其為1200MHz,其中4800MHz就是等效頻率,1200MHz為I/O頻率,而實(shí)際顯存的核心頻率僅為150MHz。那么這150MHz是如何得來的呢?

其實(shí)這個(gè)問題并不復(fù)雜,首先我們要了解一個(gè)名字——數(shù)據(jù)預(yù)取技術(shù),顧名思義就是預(yù)先/提前存取數(shù)據(jù),GDDR/GDDR2/GDDR3/GDDR4/GDDR5分別采用了2Bit/4Bit/4Bit/8bit/8it數(shù)據(jù)預(yù)取技術(shù),也就是說I/O控制器在發(fā)出請(qǐng)求之前,它們會(huì)分別準(zhǔn)備好2Bit/4Bit/4Bit/8bit/8it數(shù)據(jù)。

那么我們可以得出一個(gè)結(jié)論,那就是如果核心頻率同為200MHz的話,那么GDDR/GDDR2/GDDR3/GDDR4/GDDR5的I/O頻率分別是400Mz/800MHz/800MHz/1600MHz/1600MHz,等效頻率是800MHz/1600MHz/1600MHz/3200MHz/3200MHz,其中I/O頻率五種顯存都是正確的,而等效頻率只有GDDR/GDDR2/GDDR3/GDDR4是正確的,因?yàn)镚DDR5的等效頻率并不是3200MHz,而是6400MHz。這又是為什么呢?

因?yàn)镚DDR/GDDR2/GDDR3/GDDR4的數(shù)據(jù)總線都是DDR技術(shù)(通過差分時(shí)鐘在上升沿和下降沿各傳輸一次數(shù)據(jù)),I/O頻率X2就是等效頻率,而GDDR5兩條并行的DQ總線,從而實(shí)現(xiàn)雙倍的接口帶寬,相當(dāng)于Rambus的QDR技術(shù),所以I/O頻率X4才是等效頻率,說到這里相信大家都可以理解為什么GDDR5顯存可以擁有那么高的速度了吧!

上面的表是否正確?正確?。匡@存的計(jì)算不同于內(nèi)存的計(jì)算?

使用內(nèi)存計(jì)算方法的結(jié)論 ????

同時(shí)我們也注意到,上文我們提到GDDR5中達(dá)到4800MHz頻率也只需要150MHz的核心頻率,所以GDDR5顯存的電壓可以更低,僅有1.5V,比GDDR3可節(jié)省17%的電量,更低的電壓意味著更低的功耗和發(fā)熱量,對(duì)于顯卡工作的穩(wěn)定至關(guān)重要。

有了GDDR5顯存顆粒的幫助,上述華碩顯卡自然會(huì)在性能上更具優(yōu)勢(shì),根據(jù)顯存帶寬=顯存位寬×顯存工作頻率/8的公式,即使是只有128Bit的華碩EAH5770/2DIS/1GD5,通過4800MHz的頻率也可以達(dá)到4800MHz×128bit/8=76.8GB/s,而采用256Bit的GeForce GTS 250的帶寬也僅為2200MHz×256Bit/8=70.4GB/s。又例如同一芯片GeForce GT 240如果分別采用GDDR3和GDDR5顯存顆粒,他們性能會(huì)相差10%以上,足見GDDR5在性能上可提供更大的發(fā)揮空間!

GDDR5等效頻率=物理頻率×8(GDDR5為8bit預(yù)讀?。?(雙總線上下延傳輸)因?yàn)?,?biāo)稱頻率=物理頻率×8(GDDR5為8bit預(yù)讀取)所以GDDR5等效頻率也等于 標(biāo)稱頻率×4。

一起來認(rèn)識(shí)GDDR5顯存

頻率是存儲(chǔ)器最為顯著的特征。目前GDDR3的數(shù)據(jù)傳輸頻率最高可以達(dá)到2600MHz,相比之下,目前GDDR5可以達(dá)到5000MHz。不過這依舊不是終點(diǎn),GDDR5最高數(shù)據(jù)傳輸頻率將達(dá)到6000MHz。和之前幾代GDDR顯存一樣,GDDR5也是建立在多倍數(shù)據(jù)預(yù)取技術(shù)上的產(chǎn)品。根據(jù)顯存發(fā)展的歷史來看,GDDR1顯存采用2bit數(shù)據(jù)預(yù)取技術(shù),GDDR2、GDDR3和GDDR4都采用了4bit數(shù)據(jù)預(yù)取技術(shù),GDDR5正是新一代8bit數(shù)據(jù)取技術(shù)的產(chǎn)物,達(dá)到了令人驚異的高性能。

優(yōu)秀的雙總線設(shè)計(jì)—高速傳輸無憂

相比GDDR3采用的4bit預(yù)取數(shù)據(jù)而言,GDDR5的優(yōu)勢(shì)在于將預(yù)取數(shù)據(jù)增加到了8bit,因此GDDR5就能夠在同樣的物理時(shí)鐘頻率下達(dá)到更高的數(shù)據(jù)傳輸速度。不僅如此,GDDR5顯存采用了雙數(shù)據(jù)總線,能夠同時(shí)在數(shù)據(jù)總線的上升和下降階段傳輸數(shù)據(jù)。同時(shí),每條總線都獨(dú)立配備了完整的DBI,可以獨(dú)立傳輸、校驗(yàn)數(shù)據(jù),是完整的雙總線規(guī)格。以往單數(shù)據(jù)總線的GDDR2、GDDR3等顯存標(biāo)稱頻率是等效工作頻率的1/2(比如標(biāo)稱頻率為900MHz的GDDR3顯存,等效工作頻率為1800MHz),而GDDR5顯存由于雙總線技術(shù)的存在,每條總線都可以在上升和下降階段傳輸數(shù)據(jù),因此標(biāo)稱頻率是等效工作頻率的1/4。以4000MHz等效工作頻率的GDDR5顯存為例,它的標(biāo)稱頻率為1000MHz。由于采用了8bit的預(yù)取技術(shù),因此它的實(shí)際物理運(yùn)行頻率為125MHz。

GDDR顯存幾種頻率的差別

物理運(yùn)行頻率:是指GDDR顯存實(shí)際運(yùn)行的物理頻率,這個(gè)頻率可以在主板上用儀器實(shí)際測(cè)得。在通常的使用中,物理運(yùn)行頻率是極少被提及的。

標(biāo)稱頻率:由于采用了多倍預(yù)取技術(shù),因此GDDR顯存的標(biāo)稱頻率遠(yuǎn)遠(yuǎn)高于物理運(yùn)行頻率。以GDDR3為例,它采用4bit預(yù)取,因此物理運(yùn)行頻率為250MHz的GDDR3顯存,標(biāo)稱頻率就為1000MHz。在GPU-Z、Rivatuner等軟件的截圖中,看到的顯存頻率就是標(biāo)稱頻率。

等效工作頻率:等效工作頻率是GDDR顯存衡量實(shí)際傳輸數(shù)據(jù)能力的頻率。一般GDDR2、GDDR3、GDDR4等單總線顯存的等效工作頻率是標(biāo)稱頻率的2倍。而GDDR5采用了雙總線技術(shù),因此等效工作頻率是標(biāo)稱頻率的4倍。我們經(jīng)??吹綇S商和大部分媒體宣傳的顯存頻率實(shí)際就是等效工作頻率,這也是大家使用最廣泛、認(rèn)知度最高的GDDR顯存頻率。另外,等效工作頻率可以直接和顯存位寬相乘進(jìn)行計(jì)算。比如等效工作頻率為2000MHz的GDDR3顯存,如果顯存的位寬為128bit,那么總顯存帶寬就是2000MHz×128bit÷8=32GB/s。

穩(wěn)定+節(jié)能,其實(shí)很簡(jiǎn)單—Data eye optimization數(shù)據(jù)核心優(yōu)化

對(duì)于數(shù)據(jù)的優(yōu)化是存儲(chǔ)器最為重要的方面,GDDR5重點(diǎn)采用了四項(xiàng)技術(shù)來保證數(shù)據(jù)的穩(wěn)定性和安全性。Data/address bit inversion,即數(shù)據(jù)/地址位反演是指在傳輸過程中,數(shù)據(jù)或者地址位內(nèi)的信息被按照一定的規(guī)則做了反演處理。數(shù)據(jù)/地址位反演技術(shù)的作用在于有效地改善了噪音對(duì)數(shù)據(jù)信號(hào)的影響,保證了數(shù)據(jù)在傳輸和存儲(chǔ)過程中的穩(wěn)定性。不難看出,數(shù)據(jù)/地址位反演技術(shù)是GDDR5在傳輸中最重要的處理技術(shù),也是降低功耗和提高數(shù)據(jù)穩(wěn)定性的首要法寶。

除了數(shù)據(jù)/地址位反演技術(shù)外,三項(xiàng)動(dòng)態(tài)調(diào)節(jié)技術(shù):adjustable driver strengths、adjustable voltages和adjustable terminations也是GDDR5數(shù)據(jù)核心優(yōu)化的重要組成部分。它們分別針對(duì)驅(qū)動(dòng)器、電壓和終止裝置進(jìn)行自動(dòng)調(diào)節(jié)。在傳統(tǒng)的顯存數(shù)據(jù)傳輸過程中,由于顯存并行傳輸?shù)奶匦?,?duì)線長(zhǎng)和外界干擾有著嚴(yán)格的規(guī)定。因此我們常常在顯存周圍看到大量的密密麻麻的終結(jié)電阻(減少反射損耗)等元件,顯卡不得不在顯存周圍采用蛇形走線來盡可能做到信號(hào)線等長(zhǎng)。但在GDDR5上這些嚴(yán)格的要求被弱化了,GDDR5自帶的調(diào)節(jié)系統(tǒng)可以在一定范圍內(nèi)保證數(shù)據(jù)信號(hào)在高速運(yùn)行時(shí)不出錯(cuò),甚至信號(hào)線都可以不用嚴(yán)格等長(zhǎng)。除了更寬松的信號(hào)傳輸空間外,GDDR5對(duì)電壓和溫度的動(dòng)態(tài)調(diào)節(jié)和實(shí)時(shí)監(jiān)控,也使得整個(gè)信號(hào)在傳輸過程中的安全性更高。另外,工程人員可以在BIOS中寫入設(shè)定好的調(diào)整信息,避免在PCB已經(jīng)正式出樣(layout)之后由于信號(hào)穩(wěn)定性問題導(dǎo)致返工。

如何識(shí)別GDDR5顯存

目前已經(jīng)上市的GDDR5顯存擁有兩種速度規(guī)格和兩種容量規(guī)格,可選擇余地并不多。以市場(chǎng)常見的奇夢(mèng)達(dá)GDDR5顯存為例,分為-40X和-50X兩種,分別對(duì)應(yīng)4.0Gbps和5.0Gbps的傳輸速率,即理論上它們的等效工作頻率為4000MHz和5000MHz。尚未上市的現(xiàn)代和三星GDDR5顯存分類則更細(xì),擁有3500MHz、4000MHz、4500MHz和5000MHz等多種頻率規(guī)格。

編號(hào)為奇夢(mèng)達(dá)IDGV51-05A1F1C-40X的GDDR5顯存

奇夢(mèng)達(dá)GDDR5顯存規(guī)格列表

安全+自由,放心傳數(shù)據(jù)—Adaptive interface timing時(shí)鐘自適應(yīng)技術(shù)

信號(hào)線和時(shí)鐘穩(wěn)定性是高速顯存設(shè)計(jì)中最重要的部分。GDDR5顯存擁有多達(dá)5條需要校準(zhǔn)的時(shí)鐘信號(hào),分別是Clock、Command Clock、ADDR、Write Clock、DATA Clock時(shí)鐘信號(hào)。在高速運(yùn)行的情況下(諸如高達(dá)2GHz),任何一點(diǎn)微小的差距都會(huì)帶來整個(gè)系統(tǒng)的數(shù)據(jù)錯(cuò)誤、崩潰。因此,GDDR5在時(shí)序自動(dòng)校準(zhǔn)、自適應(yīng)技術(shù)上已經(jīng)有了一套非常完整的方案,能夠帶來非常高的數(shù)據(jù)運(yùn)行效率。

首先,GDDR5會(huì)要求地址時(shí)鐘和總線時(shí)鐘(ADDR和CK#)進(jìn)行對(duì)照并對(duì)齊。實(shí)際上這是在進(jìn)行一次芯片的初始化,在此階段控制器可以找到最佳的相位設(shè)置。接下來就需要校準(zhǔn)Write Clock(WCK)和基準(zhǔn)Clock(CK#)之間的數(shù)據(jù),這個(gè)過程被稱為'WCK-to-CK'。在這個(gè)過程中,控制器可以找出WCK和CK#之間相位的差距,是'早'還是'遲',然后為每一個(gè)DRAM給出相應(yīng)的調(diào)節(jié)數(shù)據(jù)。最后,控制器會(huì)調(diào)整數(shù)據(jù)總線(DATA和WCK)。由于數(shù)據(jù)總線DATA的頻率是WCK寫入時(shí)鐘的2倍,因此每次校準(zhǔn)會(huì)涉及到兩個(gè)字節(jié)。

GDDR5的這種校準(zhǔn)方法,使得整個(gè)數(shù)據(jù)線環(huán)環(huán)相扣,降低了由于時(shí)鐘不同步帶來的數(shù)據(jù)錯(cuò)誤或系統(tǒng)延遲,也在很大程度上降低了PCB設(shè)計(jì)的難度。由于有內(nèi)部校準(zhǔn)機(jī)制的存在,工程師們?cè)赑CB布線的一致性方面就有了更寬松的空間,這讓整個(gè)PCB的布線更為自由和寬松。

另外,更為自由的數(shù)據(jù)預(yù)取技術(shù)也讓GDDR5在圖形應(yīng)用中充滿了優(yōu)勢(shì)。在圖形計(jì)算中存在大量密集而微小的數(shù)據(jù),這些數(shù)據(jù)甚至?xí)∮贕DDR5每次預(yù)取的最低數(shù)據(jù)。如果采用固定的預(yù)取值的設(shè)計(jì)方法,即每次無論數(shù)據(jù)大小(甚至使用空位)都一定要完全占據(jù)傳輸總線,無疑會(huì)耗費(fèi)很多能量。因此,GDDR5允許小于預(yù)取數(shù)量的數(shù)據(jù)傳輸,即采用低預(yù)取方式。這種靈活的設(shè)計(jì),讓GDDR5在傳輸大量小數(shù)據(jù)量運(yùn)作時(shí),功耗有明顯的降低。

GDDR5的折疊模式

大多數(shù)的單顆GDDR顯存位寬均為32bit,GPU如果是128bit的顯存位寬,就需要4顆顯存就可以使位寬相互匹配。但如果顯卡要使用8顆顯存形成更大容量的話,就需要相應(yīng)的GPU顯存控制器支持雙BANK讀寫才可完成,靈活度不夠高。而GDDR5顯存內(nèi)置雙數(shù)據(jù)總線,32bit的顯存可以輕松拆分為16bit顆粒使用,不需要GPU的額外支持也可以使顯存容量翻倍。這種設(shè)計(jì)簡(jiǎn)化了GPU的顯存控制器,增加了用戶選擇的自由度。

糾錯(cuò)+校驗(yàn),完美保傳輸—Error compensation誤差補(bǔ)償技術(shù)

由于電磁環(huán)境或者傳輸中溫度、電壓等復(fù)雜因素的影響,顯存在數(shù)據(jù)傳輸和存儲(chǔ)過程中可能會(huì)產(chǎn)生少量的錯(cuò)誤——一個(gè)簡(jiǎn)單的顯存數(shù)據(jù)錯(cuò)誤除了導(dǎo)致渲染失敗以外,還可能導(dǎo)致顯卡徹底失去響應(yīng)、藍(lán)屏和系統(tǒng)崩潰等嚴(yán)重問題。因此對(duì)錯(cuò)誤數(shù)據(jù)的校驗(yàn)和補(bǔ)償,成為GDDR5瞄準(zhǔn)的又一個(gè)重要目標(biāo)。

GDDR5的數(shù)據(jù)校驗(yàn)采用了CRC(Cycle Redundancy Check循環(huán)冗余校驗(yàn))方式。CRC校驗(yàn)是建立在GDDR5的DATA I/O和DBI的基礎(chǔ)上,如 果出現(xiàn)錯(cuò)誤,則觸發(fā)數(shù)據(jù)傳輸總線,然后快速重新讀取數(shù)據(jù),或者利用如Data Mask(數(shù)據(jù)掩蔽)等功能修改數(shù)據(jù)并重新傳輸。這種校驗(yàn)方式的優(yōu)勢(shì)在于能夠100%檢測(cè)出所有單、雙數(shù)據(jù)誤差。

Data Mask(數(shù)據(jù)掩蔽)是這樣一項(xiàng)技術(shù):GDDR5顯存在每次讀寫數(shù)據(jù)時(shí),并不是改寫所有的數(shù)據(jù),大部分?jǐn)?shù)據(jù)都不需要修改。因此GDDR5利用地址總線對(duì)一部分?jǐn)?shù)據(jù)進(jìn)行掩蔽,在下一次數(shù)據(jù)讀寫到來時(shí),僅僅對(duì)沒有掩蔽的數(shù)據(jù)進(jìn)行更改。這樣就能在最快的時(shí)間內(nèi)完成數(shù)據(jù)讀寫。

本站僅提供存儲(chǔ)服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊舉報(bào)
打開APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
NVIDIA悄然推出DDR4版本GT 1030,不過對(duì)它的作用是不會(huì)變的
AMD桌面顯卡規(guī)格表
CPU和GPU的簡(jiǎn)介
DDR5內(nèi)存是怎么做到頻率翻倍的?
為什么顯卡都是DDR5內(nèi)存電腦才DDR4?
為了搞懂GDDR5X 我們把內(nèi)存技術(shù)翻個(gè)底朝天
更多類似文章 >>
生活服務(wù)
分享 收藏 導(dǎo)長(zhǎng)圖 關(guān)注 下載文章
綁定賬號(hào)成功
后續(xù)可登錄賬號(hào)暢享VIP特權(quán)!
如果VIP功能使用有故障,
可點(diǎn)擊這里聯(lián)系客服!

聯(lián)系客服