近日(4月12日),雷鋒網受邀參加了英偉達在北京國家會議中心舉行媒體發佈會。會上英偉達展示了其發佈不久的基於Pascal 架構的Quadro系列顯卡,包括:GP100、P2000、P4000、P5000、P6000 等。
不同於Geforce的消費級娛樂定位,Quadro立足高端,面向專業級的需求,英偉達的願景是讓它們能夠將臺式工作站轉變為具有突破性能力的超級電腦,並為不同行業的專業任務提供保障。
Quadro系列顯卡(雷鋒網現場拍攝)
Pascal
架構的全新NVIDIA Quadro產品陣容致力於為企業提供視覺計算平臺,簡化設計和模擬工作流程。與上一代產品相比,新Quadro產品不僅具有超快速記憶體,而且速度最多可以提升兩倍(基於SPECviewperf 12 基準的計算結果)。
其中GP100為該系列的旗艦產品,被科技媒體和粉絲們稱為超當量核彈。
Quadro GP100參數及系列特點
GP100
GP100基於 Pascal 核心,匹配16GB HBM2顯存,單精確度CUDA核心數 3584個,雙精度CUDA核心數 1792個,半精/單精/雙精浮點運算性能分別是20TFLOPS、10TFLOPS和5TFLOPS,頻寬高達720GB/s,功耗235W 。同其他新發佈的專業卡一樣,它的性能提升也是全方面的(比如同步多重投影、VRWorks、Iray VR),同時還強化了虛擬化、Sync II、雙路NVlink等。
這也是NVlink首次在Windows系統上獲得支援,此前僅僅用於IBM Power8系統和基於Linux的DGX-1,頻寬最高80GB/s。
這個系列官方給出的特點如下:
統一模擬、HPC、渲染和設計 – GP100將前所未有的雙精度性能與16GB的高頻寬記憶體(HBM2)相結合,因此用戶可以在設計過程中進行模擬,並以前所未有的速度採集逼真的多物理場模擬。客戶
能夠將兩個GP100 GPU與NVLink™技術相結合,並擴展到32GB的HBM2
,以在單一工作站上創建龐大的視覺化計算解決方案。
擴展後的Quadro P6000(雷鋒網現場拍攝)
探索深度學習 – GP100提供超過20 TFLOPS的半精度計算,可謂在Windows和Linux環境中進行深度學習的理想開發平臺。
將VR集成到設計和模擬工作流程中 – VR 認證的Quadro GP100和P4000具有創建詳細、逼真、沉浸式環境的能力,能夠大規模實現更加宏大、更加複雜的設計體驗。
盡享照片級真實感設計的優勢 –
基於Pascal 架構的Quadro GPU 渲染照片級真實感圖像的速度為CPU的18倍 。
創建廣闊的視覺化工作區 – 可在多達四個5K顯示器上以高解析度和HDR顏色顯示資料。
經濟高效地構建超高解析度及多顯示幕配置 – 通過將多達8個P4000 GPU和兩個Quadro Sync II顯卡相結合,可通過單一主機殼實現多達32個4K顯示器的配置。
GPU在CAE上的應用
Sandeep Gupte
CAE(Computer Aided Engineering)指工程設計中的電腦輔助工程。英偉達專業視覺化業務高級總監 Sandeep Gupte 表示:
對於這部分使用者,大部分是使用類似Ansys、ABAQUS等分析軟體求解複雜工程和產品的結構力學性能。大規模的資料計算往往讓設計分析的過程十分漫長,而如果使用CPU+GPU加速的方案將會大大的節省運算時間。
GPU 加速計算是指在完成應用任務時,同時利用GPU 和 CPU。由於GPU出色的並行任務處理能力,將應用程式中計算密集部分的工作負載轉移到 GPU,同時仍由 CPU 運行其餘程式碼。這樣,從使用者的角度來看,應用程式的運行速度明顯加快。
流言終結者中有一段很有意思的視頻,為我們直觀的展示了相比於CPU,GPU的平行計算為什麼有如此令人震撼的優勢。
Sandeep舉了個實際的例子,在現場一個集成了一張GP100 的工作站裡,工作人員使用ABAQUS對一個模型進行了470萬的網格劃分和計算,由於時間關係,現場並未將計算完成。這是因為類似這樣大規模的計算,往往需要運行數十個小時甚至是數十天才能完成。不過Sandeep告訴雷鋒網,相比僅使用CPU計算的方案,GPU加速可以將計算時間將縮短為原來的1/3。
GPU在真實物理渲染(PBR)上的應用
也許你覺得CAE的栗子還不夠震撼,在圖形渲染方面,英偉達中國區銷售總監何猶卿表示,目前主流的渲染器都已經在做GPU加速平臺,因為一幀4K的電影畫面,如果還使用CPU渲染,需要288小時,而用GPU渲染只需要3個多小時。
GPU在深度學習上的應用
在深度學習領域,也是高性能GPU大展拳腳的地方,近年來深度學習的大發展除了科學家們孜孜不倦的學術探索外,和GPU運算能力的突飛猛進也密切相關。英偉達CEO黃仁勳曾表示:
電腦科學家綜合 Yann LeCun 的卷積神經網路、Geoff Hinton 的反向傳播演算法,以及 Stochastic 的梯度下降訓練法,加上吳恩達 (Andrew Ng) 對 GPU 的大規模應用,來加快深度神經網路 (DNN) 的運算速度,才促進「深度學習」這項現代人工智慧技術出現大爆炸般的發展局面。
對於人工智慧未來將對設計工作產生的影響,Sandeep介紹了一種叫做生成式製造流程的人工智慧概念設計方法。比如設計者要設計一把椅子,一般情況下需要通過CAD軟體設計出兩三個方案,然後交由決策者選擇。而有了人工智慧參與後,設計者僅需提出邊界條件,例如承重多少,自重多少,尺寸如何等等,人工智慧就可以自動生成出上百種的設計方案供決策者挑選,這不但有助於遴選出最佳的設計方案,還能大大的縮短設計的週期。
GPU在VR上的應用
在VR的應用方面,為消費級玩家所熟知的Geforce系列更多是針對個人娛樂的應用,而Quadro系列則是面向專業級的任務。如果僅僅是遊戲,即便畫面的真實感和準確性有些許偏差,也不會造成太嚴重的後果。但是如果是在工作決策中使用,那麼就要求畫面盡可能的逼真,這時候就需要Quadro系列顯卡和 Iray VR了。
據Sandeep介紹, Iray 是Nvidia的一款逼真的渲染解決方案,現已許可給 Dassault Systèmes 和 Autodesk 等軟體廠商。 利用 Iray 應用,連接至 Quadro 視覺計算設備(VCA)後,就可以享受逼真的渲染體驗。 把多個 Quadro VCA 結合到一起後,基於光場即時計算,操作模型或場景時還能夠捕捉到細微的光線和反射。
QUEST計畫
Sandeep還提到英偉達首次在國內推出了QUEST計畫(Quadro Embedded System Program),即基於Quadro的嵌入式系統計畫,針對高性能嵌入式系統的開發者,開發企業可以申請加入此計畫,英偉達將和他們合作設計適用於他們解決方案的GPU。除此之外,英偉達還會提供設計包(Design Kit)、SDK、樣本代碼、訓練等。該項目免費,並且沒有設置申請數量的限制,但是由於致力於一同打造品質、可靠性和性能俱佳的高性能嵌入式解決方案,所以英偉達在合作夥伴的遴選上會比較謹慎。