您現在的位置是:首頁 > 綜藝首頁綜藝

詳談伺服器記憶體和視訊記憶體知識

由 全球政企解決方案 發表于 綜藝2021-08-27
簡介HBM是後起之秀,目前只有是AMD家獨使用,第一代HBM技術其堆疊的視訊記憶體核心容量2Gb(1個堆疊是4顆核心),資料頻率1Gbps,位寬1024bit

記憶體是記憶體嗎

原創 Hardy

詳談伺服器記憶體和視訊記憶體知識

早期記憶體透過儲存器匯流排和北橋相連,北橋透過前端匯流排與CPU通訊。從Intel Nehalem起,北橋被整合到CPU內部,記憶體直接透過儲存器匯流排和CPU相連。

詳談伺服器記憶體和視訊記憶體知識

所以,在AMD採用Socket FM1,Intel採用LGA 1156插槽之後的處理器都集成了北橋,獨立的北橋已經消失,主機板上僅餘下南橋。

計算機體系的主要矛盾在於CPU太快了,而磁碟太慢了。所以它倆是不能夠直接通訊的,需要增加一個過渡層,這就是記憶體的作用。哈佛結構是一種將程式指令儲存和資料儲存分開的儲存器結構。

記憶體(Memory)也被稱為記憶體儲器,其作用是用於暫時存放CPU中的運算資料,以及與硬碟等外部儲存器交換的資料。計算機中所有程式的執行都是在記憶體中進行的,因此記憶體的效能對計算機的影響非常大。

1996年底,SDRAM開始在系統中出現,不同於早期的技術,SDRAM的出現是為了與CPU的計時同步化所設計。

SDRAM亦可稱為SDR SDRAM(Single Data Rate SDRAM),Single Data Rate為單倍資料傳輸率,SDR SDRAM的核心、I/O、等效時脈皆相同, SDR SDRAM在1個週期內只能讀寫1次,若需要同時寫入與讀取,必須等到先前的指令執行完畢,才能接著存取。

詳談伺服器記憶體和視訊記憶體知識

DDR SDRAM為雙通道同步動態隨機存取記憶體,是新一代的SDRAM技術。別於SDR(Single Data Rate)單一週期內只能讀寫1次,DDR的雙倍資料傳輸率指的就是單一週期內可讀取或寫入2次。在核心頻率不變的情況下,傳輸效率為SDR SDRAM的2倍。

總結:DDR採用時鐘脈衝上升、下降沿各傳一次資料,1個時鐘訊號可以傳輸2倍於SDRAM的資料,所以又稱為雙倍速率SDRAM。它的倍增係數就是2。

DDR2 SDRAM為雙通道兩次同步動態隨機存取記憶體。DDR2記憶體Prefetch又再度提升至4bit(DDR的兩倍),DDR2的I/O時脈是DDR的2倍。

總結:DDR2仍然採用時鐘脈衝上升、下降時各傳一次資料的技術(不是傳2次),但是一次預讀4bit資料,是DDR一次預讀2bit的2倍,因此,它的倍增係數是2X2=4。

DDR3SDRAM為雙通道三次同步動態隨機存取記憶體。DDR3記憶體Prefetch提升至8bit,即每次會存取8 bits為一組的資料。DDR3傳輸速率介於800~1600 MT/s之間。

此外,DDR3 的規格要求將電壓控制在1。5V,較DDR2的1。8V更為省電。DDR3也新增ASR (Automatic Self-Refresh)、SRT(Self-Refresh Temperature)等兩種功能,讓記憶體在休眠時也能夠隨著溫度變化去控制對記憶體顆粒的充電頻率,確保系統資料完整性。

總結:DDR3作為DDR2的升級版,最重要的改變是一次預讀8bit,是DDR2的2倍,DDR的4倍,所以,它的倍增係數是2*2*2=8。

DDR4 SDRAM提供比DDR3/DDR2更低的供電電壓1。2V以及更高的頻寬。DDR4 新增了4 個Bank Group 組的設計,各個Bank Group具備獨立啟動操作讀、寫等動作特性,Bank Group 組可套用多工的觀念來想像,亦可解釋為DDR4 在同一時脈工作週期內,至多可以處理4 組資料,效率明顯好過於DDR3。

另外,DDR4增加了DBI(Data BusInversion)、CRC(Cyclic Redundancy Check)、CA parity等功能,讓DDR4記憶體在更快速與更省電的同時亦能夠增強訊號的完整性和儲存的可靠性。

Intel在2017年推出對應於六代酷睿Skylake的伺服器平臺“Purley”,採用14nm工藝、最多28核心56執行緒、6通道DDR4記憶體、光纖互連通道,採用UPI匯流排替代QPI匯流排等等。UPI是 UltraPath Interconnect(超級通道互連)縮寫,資料傳輸率可達9。6GT/s、10。4GT/s,頻寬更足,靈活性更強,每條訊息可以傳送多個請求。

記憶體未來三大演進方向分別為容量、電壓和頻率。

容量越來越大(4GB -> 8GB -> 16GB ->32GB -> 64GB->…512GB)

電壓越來越低(1。5v -> 1。35v -> 1。2v->…)

頻率越來越高(1333 -> 1600 -> 1866-> 2133 -> 2400->。。3200)

主流記憶體生產廠家分為記憶體顆粒廠商和模組廠商,三大記憶體顆粒(DRAM)原廠依次為Samsung、SK Hynix和Micron。模組廠商Ramaxel和Kingston透過從顆粒廠商購買顆粒製作記憶體條(DIMM)。

詳談伺服器記憶體和視訊記憶體知識

記憶體有三種不同的頻率指標,它們分別是核心頻率、時鐘頻率和有效資料傳輸頻率。

核心頻率即為記憶體Cell陣列(Memory Cell Array)的工作頻率,它是記憶體的真實執行頻率;

時鐘頻率即I/OBuffer(輸入/輸出快取)的傳輸頻率;

有效資料傳輸頻率則是指資料傳送的頻率。

系統最大記憶體頻寬 = 記憶體標稱頻率*記憶體匯流排位數*通道數*CPU個數

實際記憶體頻寬 = 記憶體標稱頻率*記憶體匯流排位數*實際使用的通道數

實際記憶體帶=記憶體核心頻率*記憶體匯流排位數*實際使用的通道數*倍增係數。

從SDRAM-DDR時代,資料匯流排位寬時鐘沒有改變,都為64bit,但若是採用雙通道技術,可以獲得64*2=128bit的位寬。

下面計算一條標稱DDR31066的記憶體條在預設頻率下的頻寬,1066是指有效資料傳輸頻率,除以8才是核心頻率,一條記憶體只用採用單通道模式,位寬為64bit。所以,實際記憶體頻寬=(1066/8)*64*1*8=68224Mbit。

由此可知,如果記憶體工作在標稱頻率的時候,可以直接用標稱頻率*位寬*實際使用的通道數,簡化公式=1066*64*1=68224Mbit。

如果說記憶體頻寬是處理器與記憶體交換資料的關鍵,那麼視訊記憶體頻寬對顯示卡同樣也很重要。GPU核心負責運算,視訊記憶體負責資料儲存,二者之間需要頻繁交換資料,這就要依賴視訊記憶體帶寬了,更高的頻寬可以讓顯示卡在處理高解析度、高畫質時更加得心應手。

視訊記憶體頻寬從大的方面來說是視訊記憶體頻率及視訊記憶體位寬來決定的,不過實際頻寬就要看具體情況了,目前主流顯示卡的位寬多是128bit、256bit、384bit及512bit,更能決定頻寬的還是視訊記憶體型別,它們決定了視訊記憶體頻寬的極限。

目前最主流的視訊記憶體當然是GDDR5,之前還有過曇花一現的GDDR4,現在低端市場上還有gDDR3視訊記憶體殘存,AMD在其顯示卡上使用了HBM視訊記憶體,相比GDDR5視訊記憶體更強大,頻寬大幅提升。

詳談伺服器記憶體和視訊記憶體知識

就這二者來說,GDDR5內部I/O頻寬是32bit,目前的NVIDIA顯示卡的GDDR5視訊記憶體頻率可以達到1750MHz,它是4倍速率機制,資料頻率是7Gbps,單個晶片的頻寬是28GB/s。目前的HBM視訊記憶體的頻率只有500MHz,2倍頻率率機制,資料頻率是1Gbps,不過它的I/O頻寬極高,彌補了頻率不足。

GDDR5和HBM視訊記憶體是目前最主流的視訊記憶體技術。

目前gDDR3視訊記憶體基本上是NVIDIA及AMD部分低端顯示卡在用。GDDR5絕對是目前的主流,單顆晶片的容量逐漸從之前的2Gb提高到4Gb,美光前不久還量產出貨了8Gb(1GB)顆粒的,高階顯示卡也只要4-8顆晶片即可實現4-8GB容量視訊記憶體,這將進一步推動大容量顯示卡的出現。

詳談伺服器記憶體和視訊記憶體知識

HBM是後起之秀,目前只有是AMD家獨使用,第一代HBM技術其堆疊的視訊記憶體核心容量2Gb(1個堆疊是4顆核心),資料頻率1Gbps,位寬1024bit。

視訊記憶體頻寬=視訊記憶體等效資料頻率(Gbps)*視訊記憶體總位寬(bit)/8=視訊記憶體實際頻率(MHz)*視訊記憶體資料倍率(1、2、4不等)*視訊記憶體等效位寬(64-512bit不等)/8

由於顯示卡廠更習慣用數字更大更好看的資料頻率來標記產品規格,上述公司實際上還可以更簡單,直接變成:

視訊記憶體頻寬(GB/s)=視訊記憶體資料頻率(Gbps)*視訊記憶體等效位寬(bit)/8

拿NVIDIA的GeForce GT 720顯示卡來舉例說明,該卡位寬僅為64bit,同時支援gDDR3和GDDR5視訊記憶體,前者的典型頻率900MHz,後者的典型頻率是1250MHz,兩種配置下頻寬分別是:

gDDR3:GT 720顯示卡的頻寬為:900MHz *2*64 bit/8= 14。4GB/s,或者是1。8Gbps *64bit/ 8= 14。4GB/s。

GDDR5:GT 720顯示卡的頻寬為1250MHz *4*64 bit/8 = 40GB/s,或者是5Gbps* 64bit/8=40GB/s。

詳談伺服器記憶體和視訊記憶體知識

更多

架構師技術

關知識請參考“

架構師技術全店資料打包彙總(全)

”電子書(

32本技術資料打包彙總、詳解目錄和內容

請透過“

閱讀原文

”獲取)。