NVIDIA Tesla V100正式發佈 5120個CUDA性能再翻1倍
老黃又曝核彈了!就在GTC2017的演講上,黃仁勳正式宣佈了基於下一代的Volta架構的Tesla V100,擁有5120個CUDA核心,16GB HBM2以及15TFLOPS的單精確度性能,就連老黃自己都用了難以置信作為形容詞。
這塊Tesla V100擁有12nm工藝,晶片面積為815平方毫米,高達210億顆電晶體,記憶體頻寬900GB/s。而Tesla V100的任務與P100相似,主要負責高性能運算和深度學習。在相同條件和數量下,Tesla V100能將性能提升1倍甚至更多,P100上原本需要20個小時完成的任務量放到Tesla V100只需要不到10小時。
現場老黃制止不住自己的興奮勁,一連演示了三個不同的DEMO。這塊基於Volta的GV100核心現場怒艸Maxwell的Titan X,一點不給老顯卡任何一點面子。于此同時,塞滿Tesla V100的NVIDIA DGX-1主機也被同時發佈,內置8張Tesla V100顯卡,原本TITAN X需要8天完成的運算量在這個盒子面前被壓縮到了8小時。
同時基於Tesla V100推出的還有DGX工作站,採用4張Tesla V100,1500W功耗,自帶水冷,售價69000刀,重點是面向深度學習工程師。在現場老黃甚至忍不住調戲了一下SkyLake,在大規模運算上的表現,Tesla V100比Intel的SkyLake快上15到25倍。
更重要的是上述的所有產品不會只停留在PPT,產品會在今年第三季度問世,並在第四季度開始出貨OEM產品。如果與Pascal時代相同,GV10x系列的GPU將有機會登陸消費級顯卡,並且性能表現不俗。不知道現在還在考慮如何降價的A卡們,現在是個什麼心情。
與此同時,NVIDIA Drive PX平臺也獲得了更新,豐田正式加入NVIDIA的自動駕駛陣營,而車載Xavier SoC則已經開始部署Volta GPU。Volta雖然距離正式發佈還有一個季度,但NVIDIA已經為其設計好了工作站、計算中心、雲計算、車載系統等多個場景,顯然NVIDIA並沒有打算留給任何對手任何喘氣的機會。