沉寂了許久的GPU顯卡市場終於熱鬧起來了!AMD的北極星、NVIDIA的帕斯卡兩大真正全新的架構即將隆重登場,各種爆料讓人激動不已。
今天,TechPowerUp又拿到了帕斯卡家族頂級大核心GP100的架構示意圖,對它的基本規格也終於有了一個清楚的認識。
可以看出,帕斯卡架構的GP100核心在大體上仍然沿用了NVIDIA GPU這些年的設計思路,但規模更加強大,也有一些增強之處。
整個核心被分成了6組GPC(圖形處理簇),這是具備高度獨立性的GPU單元,擁有自己的渲染前端和後端。
每個GPC內包含10組SM(流式多處理器單元),而每個SM擁有64個CUDA核心,也就是整個GPU擁有60組SM、3840個CUDA核心,同時還有240個紋理單元。
已經宣佈的高性能計算卡Tesla P100只開啟了56組SM、3584個CUDA核心,即便如此也比麥克斯韋家族GM200核心(3072個CUDA核心)大了整整四分之一!
在圖片邊緣可以看到八組顯存控制器,組成了4096-bit HBM2的規格,可提供720GB/s的超高頻寬(理論上最高能做到1TB/s)。
另外還可以看到一個新的“High-speed Hub”(高速控制中心),由此伸出四個NVLink匯流排埠,官方號稱單向頻寬80GB/s,但不清楚是每個埠的,還是集體的。
NVLink匯流排類似多處理器系統中的Intel QPI、AMD HT,可以高速直連多個GPU,並支援真正的記憶體虛擬化,可大大加速GPU計算性能。
儘管規模如此龐大,帕斯卡核心依然可以運行在超高頻率上,Tesla P100的核心基礎、加速頻率就分別有1328MHz、1480MHz,熱設計功耗300W。
別忘了,GP100核心可是和AMD Fiji一樣集成了四顆HBM2顯存和仲介層,能做到如此大規模、高頻率,實在不容易。