淘新聞

英偉達首發HBM2專業加速卡:真核彈

對於HBM顆粒,可能很多玩家都不是很瞭解。因為目前用上HBM顆粒的顯卡並不多,最早也就只有AMD Fury系列顯卡採用了這種顆粒,N卡用上這種顆粒的是在一年前發佈的全新資料中心加速器Tesla P100,但直到現在才開始供貨。

採用這種顆粒的顯卡擁有超高頻寬和大並行度存儲能力,可以簡化PCB設計並明顯降低整卡總功耗。原因是與以往的顯存形式不同,採用HBM顆粒的顯存的最大特點在於向“空間”要“空間”。前一個“空間”指的是立體空間,後一個“空間”則指存儲空間。傳統顯存的存儲模式以平面分佈為基礎,所有存儲顆粒均分佈於二維平面當中,除了使用更大容量的單顆顆粒之外,如果要拓展容量就只能佔用更多的平面空間。HBM顯存則將顆粒集中在一起並向“上”進行了空間的延伸,在相同的“占地面積”下,HBM顯存能夠實現數倍于傳統顯存的存儲容量。

作為基於“Pascal帕斯卡”架構GP100核心的頂級產品,Tesla P100擁有3584個流處理器(隱藏了256個),支持ECC可靠性保護、資料中心部署伺服器優化、增強程式設計性(頁面遷移引擎),面向人工智慧、自動駕駛、氣候預測、醫藥開發等專業領域。

Tesla P100提供包括傳統PCI-E 3.0擴展卡和新的NVLink這兩種樣式,前者能滿足絕大多數平臺,頻寬32GB/s,雙精度、單精確度、半精度浮點性能分別為4.7、9.3、18.7TFlops,同時搭配12GB或者16GB HBM2,頻寬549GB/s或者732GB/s。新的NVLink是英偉達自主研發的新型伺服器匯流排,在合理頻寬也有32GB/s,雙精度、單精確度、半精度浮點性能分別為5.3、10.6、21.2TFlops,顯存只提供16GB HBM2一種選擇,頻寬為732GB/s。

性能方面,八塊並行的性能相當於Intel Xeon E5-2698 v3雙路伺服器的近50倍,四塊並聯則可以取代32顆處理器並聯,並節省70%的成本。