新王的誕生--ASUS GEFORCE GTX1080公版民用評測
目錄
前言
第一章、外觀
第二章、拆解
第三章、架構
第一節、GP104構架的GTX1080
第二節、GP100構架的TESLA P100
第三節、GM204構架的GTX980
第四節、架構對比
第四章、TSMC 16nm FinFET +
第五章、GPU BOOST 3.0
第六章、GDDR5X
第七章、測試
第一節、測試平臺裝機SHOW
第二節、基準測試
1、基礎資訊
2、解碼支援
3、3DMARK
4、烤機測試
5、VR STREAM測試
6、AIDA64 GPGPU通用計算測試
7、顯卡殺手級遊戲測試
第八章、雜談公版
總結
新王的誕生--ASUS GEFORCE GTX1080評測
前言
GEFORCE GTX 1080可以說是近三年來比上一代效能提升最大的顯卡,NVIDIA三年來終於有一次沒有擠牙膏,除了剛剛發佈還沒有進入國內的新TITAN X,暫時GTX 1080仍然是NVIDIA民用顯卡的的新王。
基本資訊:
GeForceGTX1080擁有2560個CUDA處理器,核心頻率1607MHz,boost頻率1733MHz,擁有8GBGDDR5X顯存,等效顯存頻率10GHz。顯卡位寬為256bit,頻寬320GB/s。採用單8pin供電,TDP180w,單精確度浮點運算運算能力是9Teraflops,原生支援8K解析度。
第一章、外觀
拿到ASUS的公版GTX1080真是一個意外,原本可能是每個品牌各一張,隨機發貨的,結果看來可能我和華碩有緣。
三面觀,華碩的公版顯卡包裝一直很多年保持著同樣的風格,我所見到的TITAN如是,GTX980如是,現在1080也如是。
8GB GDDR5X顯存是GTX1080一個最大的看點,簡單理解GDDR5X就是GDDR5的BOOST。
開始對FOUNDERS EDITION還是比較模糊的,發佈之前各種猜測超公版的概念,結果其實就是公版而已。
NVIDIA的GEFORECE GTX VR READY認證,VR READY是一個前瞻趨勢。
3年質保,堅若磐石。
顯卡一些特性的印刷介紹
內盒
華碩公版卡的內包裝真是簡單到不能再簡單了。
顯卡、說明書、光碟、質保卡,沒了。
取下PCIE金手指、IO介面、SLI金手指上的塑膠套。
泰坦皮升級版,很多人對棱角分明的新泰坦皮褒貶不一,就拍照來說,多邊形更有利於細節的勾勒。
這次採用的渦輪風扇應該是酷冷代工,62%轉速2400多轉幾乎沒有任何聲音。有時候改變都是在沉默之中悄悄的UPDATE了,你不一定知道,但是它客觀存在。
GTX信仰LOGO
金手指上方的NVIDIA標誌是公版的象徵。
渦輪風扇的前置進風口
全金屬背板,這次NVIDIA沒有在背板螺絲處設計易碎標,看來是可以隨便拆散熱器也不會影響保修了。
公版血統標籤
大大的信仰綠燈
SLI金手指
單8PIN供電
顯卡的下側面
IO介面是一個DVI,3個DP1.4,一個HDMI2.0四介面。
第二章、拆解
首先卸掉IO擋板
兩截式背板,裡附塑膠紙隔離,防止金屬背板和PCB接觸發生短路
風扇罩上的GTX1080 LOGO說了很久的LED特效呢?
顯卡上下部的金屬格條
大部分人拆到這裡會有點茫然,沒事,下掉背板之後,這裡的散熱片是沒有螺絲固定的可以直接取出。
散熱片底部採用均熱板設計
拆卸風扇罩上的螺絲,需要注意的是別扯壞下面的2PIN線。
全金屬風扇罩
一般拆到這裡大家就會收手,說反正核心也暴露出來了,看看就行了,其實是因為這裡需要特殊的工具才可以直接拆下去,要拆掉PCB上的散熱片需要從PCB背面下手。
PCB背面的螺絲是特製的外六角,一般工具無法開啟。
我使用南旗的工具套筒直接給下了,
下完背面所有螺絲之後,散熱片分離,PCB暴露出來了。
PCB背面
PCB正面
PCB的核心區特寫
GPU核心:GP104-400-A1
顯存:鎂光6HA77 D9XTS GDDR5X顯存,單顆1GB容量,32bit位元寬,8顆正好組成256bit,8GB的顯存陣列。
GTX 1080採用了4+1+1相供電設計,每相都是一個上下橋複合MOS,4相核心供電,1相顯存供電,還1相供電做平衡。這個用料只能說中規中矩,並無豪華可言,供電上的空焊點很多,想必是為GTX1080TI預留的。
第三章、架構
我收集了一下GTX1080/TESLA P100/GTX980的公版資料,匯總成圖,其中有很多可能和各大媒體的解讀有出入,無礙,技術交流並不存在去偽存真,只存在不停的認知。架構解析的目的是辨識GTX1080究竟是傳承自誰的架構。
第一節、GP104構架的GTX1080
GTX 1080核心代號GP104,上圖為GP104的“完整”架構,其實說完整有點過,NV IDIA官方給的圖原本就不完整,缺失了雙精度計算單元,這個我們後面再說。
GP104包含4組顯卡處理器集群(GPC)
每個GPC有5個流處理器組(SM)
每個SM有128個CUDA單元(CUDA CORE)
共計2560個CUDA單元
8組32bit顯存控制器,每組連接8個ROP單元和256KB L2緩存。總位元寬是256bit,ROP單元64個,L2緩存2048KB。
這是官方給出的流處理器組(SM)架構圖,其實缺失了雙精度計算單元(DP UNIT)
修正後的GP104架構圖
SM修正後的架構圖裡有包含單精確度浮點和整數運算單元的CUDA CORE,雙精度運算的DP Unit,計算各種特殊函數例如sin/cos的SFU。每個SM含有4個黃色的DP UNIT和128個綠色的CUDA CORE。
所以運算能力上,FP64(雙精度):FP32(單精確度)=4:128=1:32
每個CUDA CORE由浮點運算單元(FP Unit)和整數算數邏輯單位(INT Unit)組成。
GTX1080的CUDA CORE其實分兩種,CORE1和CORE2:
CORE1由一個FP32計算單元和2個INT8的計算單元組成
CORE2由兩個FP16計算單元和2個INT8的計算單元組成
FP32單元計算單精確度浮點運算。
FP16單元計算半精度浮點運算,也可以兩個一起計算FP32的單精確度浮點運算。
INT8單元的計算精度等於FP16的一半,FP32的四分之一。
每一個CUDA CORE無論1還是2裡都具有2個INT8,所以理論上INT8運算能力是FP32的2倍。
所以運算能力上,INT8:FP32(單精確度)=2:1
每128個CUDA CORE裡有一個CUDA CORE2具有2個FP16計算單元,這兩個FP16計算單元可以合併計算FP32也可以分開計算FP16;剩下的127個CUDA CORE1裡面具有127個FP32計算單元。
無論CORE1還是CORE2計算FP32單精確度運算的時候,都是一樣的。
但是計算FP16半精度運算的時候,只有CORE2有用,
其實MAXWELL就可以1:1的使用FP32模擬運算FP16了,但是GP104的這個FP32模擬FP16被NVIDIA無情的封殺了,可能覺得GP104太強了,習慣性的直接給半精度閹割上了一刀。
所以運算能力上,FP16(半精度):FP32(單精確度)=1:64
第二節、GP100構架的TESLA P100
TESLA P100屬於PASCAL的GP100架構,但並不是TESLA-PASCAL的完整構架。TESLA P100是以PASCAL架構的首張NVIDIA計算卡的身份出現為GTX1080造勢的,但是不可否認在大家為P100的架構震驚的同時,SHUT UP AND TAKE MY MONEY了,但是其實我想說GTX1080和P100真的沒啥關係。被P100引誘而去購買GTX1080的同學我只能說你再一次被老黃騙了。
上圖為TESLA-PASCAL的完整構架,60組SM單元,TESLA P100只用56組。
GP100包含28組紋理處理器集群(TPC)
每個TPC有2個流處理器組(SM)
每個SM有64個CUDA單元(CUDA CORE)和32個雙精度計算單元(DP Unit)
共計3584個CUDA CORE和1792個FP Unit
GP100為了適應高性能計算還大幅增加了緩存及寄存器大小,內置L2緩存從GM200的3072KB增加到了4096KB,每組SM單元的共用寄存器檔大小還是256KB,但總數從6144KB增加到了14336KB,可以以80TB/s的速率傳輸資料。基準時鐘速度為1.3GHz,提升為1.4GHz,TDP為300W。
GP100 SM構架圖
每組SM單元64個CUDA CORE,還有32個雙精度計算單元(DP Unit)
GP100繼承了Kepler雙精度單元獨立式設計。 CUDA 核中的FP unit(浮點單元)具備單精確度計算能力,對雙精度浮點計算僅開放支援,並不具備實質的雙精度浮點能力,必須要在CUDA旁添加雙精度浮點單元(DP unit)輔助CUDA核進行雙精度浮點計算,才能讓CUDA核具備雙精度浮點能力。數量眾多的DP unit也因此成為計算卡的標誌,同時為了降低增加DP unit帶來的功耗,Tesla計算卡刪去了與計算方面無關的部分。
所以,所以運算能力上,FP64(雙精度):FP32(單精確度)=32:64=1:2
另外,我們前面說過GP104核心的CUDA CORE會有兩種,但是GP100的CUDA CORE只有一種,就是雙FP16計算單元+雙INT8計算單元的組合,所以GP100的CUDA CORE不但具備單精確度FP32的浮點運算能力,還具備雙倍的半精度FP16的浮點運算能力。
FP32單元計算單精確度浮點運算。
FP16單元計算半精度浮點運算,也可以兩個一起計算FP32的單精確度浮點運算。
所以運算能力上,FP16(半精度):FP32(單精確度)=2:1
INT8單元的計算精度等於FP16的一半,FP32的四分之一。
每一個CUDA CORE都具有2個INT8,所以理論上INT8運算能力是FP32的2倍。
所以運算能力上,INT8:FP32(單精確度)=2:1
第三節、GM204構架的GTX980
GTX980屬於MAXWELL的GM204完整架構。
GTX 980核心代號GM204,上圖為GM1204的“完整”架構
GM204包含4組顯卡處理器集群(GPC)
每個GPC有4個流處理器組(SMM)
每個SM有128個CUDA單元(CUDA CORE)
共計2048個CUDA單元
4組64bit顯存控制器,每組連接16個ROP單元和512KB L2緩存。總位元寬是256bit,ROP單元64個,L2緩存2048KB。
官方的SMM構架圖依然丟失了DP Unit的描述。
修正後的SMM架構圖
在Maxwell中,NVIDIA給每個SMM中添加了4個DP unit,達到128 CUDA:4 DP unit 的單雙精度比,且DP單元和CUDA工作在相同頻率上,因此Maxwell可以實現1/32 DP運算力。
所以,所以運算能力上,FP64(雙精度):FP32(單精確度)=1:32
前面說過GP104核心的CUDA CORE會有兩種,GM204的CUDA CORE只有一種,就是FP32計算單元+雙INT8計算單元的組合,但是GM206的CUDA CORE不但具備單精確度FP32的浮點運算能力,還具備相同的的模擬半精度FP16的浮點運算能力。
所以運算能力上,FP16(半精度):FP32(單精確度)=1:1
INT8單元的計算精度等於FP16的一半,FP32的四分之一。
每一個CUDA CORE都具有2個INT8,所以理論上INT8運算能力是FP32的2倍。
所以運算能力上,INT8:FP32(單精確度)=2:1
第四節、架構對比
可以看出即使同為PASCAL架構的GP100和GP104,完全是兩個不同的架構方向,GP100更類似於Kepler架構,拿掉了一切和計算無關的東西,而GP104更類似於MAXWELL架構,拿掉了一切和遊戲無關的東西,這一點從架構圖中可以看出。所以GP100和GP104其實沒多大的傳承關係,你可以認為他們是不同的架構。
GP104和GM204的架構是非常類似的:
1、GP104的SM單元和GM204的SMM單元是極其類似的架構。
2、GPC包含的SM單元來說,GP104是5個,GM204是4個。
3、GP104有兩種CUDA CORE,一種含有FP32計算單元,一種含有2個FP16計算單元,而GM204只有前者。
4、GM204的FP32單精確度計算單元可以類比半精度FP16的運算,但是GP104這個功能遮罩了或者說以後看情況考慮開放驅動支援。
5、GP104是TSMC 16nm FinFET+工藝製造,GM204是TSMC 28nm HPM工藝製造。從漏電率來說GP104好很多,所以無論是相同功耗下所可以達到的主頻還是相同性能下所需要的功耗以及發熱量來說,GP104都具備壓倒性的優勢。
當然GP104相對GM204而言還有一些小的不同點和技術升級的,但是大部分是相同的,所以要一句話簡單總結GP104和MAXWELL的關係就是:16nm FinFET+工藝製造的MAXWELL VR升級版。
當然GP104相比GM204除了物理架構細微區別之外還有一些技術實現上的區別:
1、支援指令級別的多工搶佔。
假設GPU正在渲染多邊形模型,或者執行大資料計算,GM204只能在當前著色程式完全執行完成之後才能進行任務切換,而GP104可以在著色程式執行三分之一的時候暫停讓車,GPU計算資源會自動分配給具有更高優先順序的任務。
2、VR渲染的均勻採樣
GP104有兩項技術:快速幾何著色器和多視口投影,使用這兩項技術GP104可以實現VR渲染的均勻採樣,以往的VR渲染之中,每個單位角度的圖元密度非常接近,而GP104達到的效果是離透鏡中心越遠採樣密度越高,這個小改動讓VR渲染在不影響結果正確性的前提下節約接近一半的圖元計算。
第四章、TSMC 16nm FinFET +
FinFET( Fin Field-Effect Transistor , 鰭式場效電晶體)是新型的多重閘道3D電晶體,是曾任台積電技術長的柏克萊電機系教授胡正明所發明。 FinFET是源自于目前傳統標準的電晶體—場效電晶體(Field-effecttransistor;FET)的一項創新設計。
按照TSMC的PPT爆料,16NM FinFET比28nm HPM工藝的產品,相同功耗性能提升38%,相同性能節能54%。
在傳統電晶體結構中,控制電流通過的閘門,只能在閘門的一側控制電路的接通與斷開,屬於平面的架構。
在FinFET的架構中,閘門成類似魚鰭的叉狀3D架構,可於電路的兩側控制電路的接通與斷開。 這種設計可以大幅改善電路控制並減少漏電流(leakage),也可以大幅縮短電晶體的閘長。
GP104使用的台積電新工藝16nm FinFET+,內部命名CLN16FF+,沿用20nm工藝的後端互連架構,並加入FinFET立體電晶體技術,這種設計可以大幅改善電路控制並減少漏電率,也可以大幅縮短電晶體的閘長,減少漏電率的同時提高了性能降低了功耗。
上一代MAXWELL最高的BOOST頻率也才1325MHz,這一代PASCAL GTX1080核心主頻就高達1607MHz,通過BOOST 3.0直接拉到1733MHz,性能提升幅度如此巨大,源於TSMC 16nm FinFET+制程對漏電率的控制做到了很高的水準,這才是NV敢把GTX1080頻率拉到這麼高的主要原因。
第五章、GPU BOOST 3.0
GPU Boost可以根據負載和溫度自動調整GPU頻率和電壓。
GPU Boost 1.0加速技術,影響頻率提升的主要因素就是顯卡TDP功耗,GPU會根據顯卡當前的狀態來管理頻率加速狀態。
GPU Boost 2.0技術,考慮的因素不光是功耗,還有顯卡的溫度,也就是說GPU加速頻率要照顧到功耗及溫度兩方面,不會為了性能而讓溫度超標,這樣可以不僅可以提高性能,也不會導致溫度失控進而導致風扇轉速飆升,帶來額外的噪音。
無論GPU Boost 1.0還是GPU Boost 2.0,GPU頻率增加的步進都是固定的,大約是13MHz一個GPU Offset,而在GTX 1080顯卡上,NVIDIA又帶來了GPU Boost 3.0技術,它的一個關鍵改變就是Offset頻率不再固定,每個電壓點都有對應的頻率Offset,這樣做的一個好處就是GPU實際加速頻率可以更接近理論值,只要溫度允許,頻率可以往上跳一個較大幅度,隨著溫度升高,再慢慢降低頻率。這樣可以充分利用GPU的功率空間。
第六章、GDDR5X
GDDR5X一些特性大家都度娘很多次了,我想這裡可以說的更簡單一些就是:
GDDR5 1.25GHz下可以達到的資料輸送量是5Gb/s
GDDR5X 1.25GHz下可以達到的資料輸送量是10Gb/s
這就是最簡單的差別。
第七章、測試
第一節、測試平臺裝機SHOW
主機板:超微C7Z170
CPU:INTEL I7 6700K
記憶體:英睿達DDR4 2666 8GBX2
主機殼:酷冷至尊MASTERCASE MAKER 5
SSD:金士頓UV400 240GBX2
電源:酷冷至尊V850
首先搭建好平臺,散熱是酷冷至尊T400S
對比測試顯卡採用上一代的GM204核心的同定位產品GTX980
平臺裝入主機殼
裝載好SSD
裝好GTX1080顯卡
裝載ASUS PCE-AC88 WIFI網卡
主機四面觀
連續裝上2層主機殼面板
光污染特效
顯示器使用4K 32寸專業級AOC LV323HUPX
內置DP1.2版本和HDMI2.0版本均支援4K 60HZ刷新率輸出
第二節、基準測試
1、基礎資訊
驅動版本372.54,作業系統WIN10 X64專業版,
基本資訊:
GeForceGTX1080擁有2560個CUDA處理器,核心頻率1607MHz,boost頻率1733MHz,擁有8GBGDDR5X顯存,等效顯存頻率10GHz。顯卡位寬為256bit,頻寬320GB/s。採用單8pin供電,TDP180w,單精確度浮點運算運算能力是9Teraflops。
待機溫度41度,
HDMI2.0完美支持4K 60HZ
DP1.2完美支持4K 60HZ
2、解碼支持
最新的DXVA CHECKER顯示GTX1080已經支援8K視頻硬解,不過也正常對於一張8K解析度支持的顯卡來說,不支援8K高清解碼就太搞笑了。
下面測試8K高清能力,測試視頻為[TIMESTORM.8K.視頻] 挪威NORWAY 8K VP9,測試軟體為K-Lite Mega Codec Pack 12.3.0
關閉DXVA硬體加速,負載:CPU100%,GPU6%,基本流暢略有卡頓
開啟DXVA硬體加速,負載:CPU 8%,GP U11%,流暢無卡頓。
3、3DMARK
3DMark根據設備的不同等級而分成三種不同的測試場景:Ice Storm針對移動設備,或者性能入門的電腦;Cloud Gate針對筆記型電腦和家用平臺;而Fire Strike則針對高性能平臺。
Fire Strike是測試專用遊戲電腦和高端電腦元件性能。Fire Strike使用限制為Direct3D 11級的DirectX 11引擎,適用於檢測DirectX 11的硬體,解析度是1920x1080。Fire Strike場景完全支援DX11,專為高性能遊戲PC打造,是有史以來最複雜、技術最豐富的測試場景,畫面渲染細節度遠遠超過了其它任何基準測試工具。
3DMARK FIRE STRIKE:16519
Fire Strike EXTREME使用限制為Direct3D 11級的DirectX 11引擎,適用於檢測DirectX 11的硬體,解析度是2560x1440。
3DMARK FIRE STRIKE EXTREME:9162
FIRE STRIKE ULTRA使用限制為Direct3D 11級的DirectX 11引擎,適用於檢測DirectX 11的硬體,解析度是3840X2160,是首個面向4K解析度的基準測試。
3DMARK FIRE STRIKE ULTRA:198
2016年7月15日,3DMark開發商Furmark正式推出了全新的測試元件:Time Spy。
Time Spy,充分融入了DX12的相關革新技術,嚴格考核顯卡和CPU的DX12性能。一座太空博物館內無數藏品,每個場景都有豐富的細節和陰影,堪稱是目前畫面最為複雜的性能測試場景。,圖形測試渲染解析度為2560X1440。
3DMARK Time Spy:6259
3DMARK整體測試的結果說明GTX1080是一張能流暢運行4K大型遊戲的顯示卡。
4、烤機測試
軟體使用FURMARK滿載烤機30分鐘,平均溫度83度。風扇一直在62% 2486轉,完全沒有噪音。
5、VR STREAM測試
在VR測試部分使用SteamVR Performance Test進行測試,該程式可以全面檢測使用者的PC性能,考驗PC是否能夠支援VR設備穩定流暢運行。
SteamVR效能測試會透過一段2分鐘由Valve製作的《光圈科技機械人維修VR展示》來評估玩家電腦的渲染力。
在收集相關資料後,它將判斷玩家所使用的系統能否維持在90fps的幀率運作以及VR內容的視覺保真能否夠校調至建議的水準標準。GTX1080顯示保真度非常高,14249幀每一幀均高於90fps,而且完全是一條直線沒有任何波動,系統給出的評價是遠高於推薦高保真VR的配置。
Pascal可以同時進行VR渲染的左右眼投影,這個和以往的多視口投影有本質不同,因為左右眼的投影矩陣不同。結果就是場景幾何體只需要在頂點著色器裡處理一遍,而不是以往的兩遍。在幾何量是瓶頸的時候,性能可以大幅提升。
6、CINEBENCH R15
CineBench R15 64BIT加強了著色器、抗鋸齒、陰影、燈光以及反射模糊等的考察,使用針對電影電視行業開發的Cinema 4D特效軟體引擎,可以測試顯卡的OpenGL性能。
GTX1080的成績142.66cb,已經超越了專業顯卡QUADRO K4000M的OPENCL性能的雙倍有餘。
6、AIDA64 GPGPU通用計算測試
AIDA64 GPGPU套件是OpenCL GPGPU基準測試套件,考察顯卡的通用計算能力,並且可以計算單精確度和雙經典浮點運算能力,已經INT24、INT32、INT64的計算效能。
7、顯卡殺手級遊戲測試
巫師3:狂獵
巫師3:狂獵是一款得到公認的DX11下的顯卡殺手級遊戲,讓你痛苦讓你憂,畫質糾結黨的噩夢。
4K解析度下,特高畫質設置,特效全開
在人物的移動和跑動中大約平均在35幀左右,REDengine 3引擎搭配Gameworks、Hair Works以及HBAO+等技術是明顯的NV控的顯卡殺手級遊戲,GTX1080渲染後的遊戲細節真是絕美。
奇點灰燼
首款DX12顯卡殺手的遊戲
DX12版本
設置為4K最高畫質運行自帶BENCHMARK
作為首款DX12顯卡殺手的遊戲來說,這畫面太震撼不敢看。
重度畫面模型比較多的情況下的測試結果,47.6幀。
GTA5
經常朋友說:要判斷自己的硬體設定是否需要更新換代你應該去試著跑一跑《GTA5》的“全畫質全幀數”模式(特效全開之下將某項數字調到60)。我都是用這句話來作為遊戲性能評估的標杆的。
4K解析度不開啟AA和進階影像的情況下
隨便跑都有50幀以上,平均幀數在56
開啟進階影像最高之後
繼續開啟全屏60HZ刷新率,MSAA開啟X4,NVIDIA TXAA開啟。其餘保持不變
馬上FPS掉在40,平均FPS在37
這個遊戲即使4K到頂的畫質的解析力仍屬一般,但是遊戲可玩性確實強大。
古墓麗影 崛起
《古墓麗影:崛起》已支持DX12,成為繼《殺手6》之後另外一款支持DX12的3A大作,由於一開始是根據DX11開發的因此並不能有效利用DX12的新特性,所以DX12表現的幀數會明顯低於DX11的。
我使用DX12進行測試
全部4K最高畫質,進行BENCHMARK測試
BENCHMARK測試第一關是山頂,
第二關是敘利亞
第三關是叢林
得到的整體分數即平均的FPS在44.60。
第八章、雜談公版
我對顯卡有著嚴重的公版情節,無論A卡N卡,我在選卡的時候都會儘量選擇公版卡。
公版顯卡:公版顯卡就是設計與生產完全按照顯卡晶片廠商(NVIDIA、AMD)提供的板卡PCB、散熱設計方案的顯卡。
非公版的顯卡:PCB設計與公版顯卡方案不一致,不採用官方建議設計的顯卡,注意,所有對公版設計方案稍作改動的顯卡依然屬於非公版顯卡。非公版顯卡還要細分為普通版、超頻版、縮水版(閹割版),顧名思義,非公版顯卡對比規格品質一致的公版顯卡具有有好有壞特性。
----來自網路
我的看法和網上的區別在於:
我認為公版顯卡是一個完整的工業設計品,包括電路,PCB,IC,晶片,顯存,散熱都經過原常實驗室的考量和測試後發佈的用於解釋GPU特性的一個SAMPLE。
那麼為什麼會有非公版的產生?
1、非公縮水版
因為CUT DOWN會產生巨大的利潤,節約成本,面對市場巨大的競爭壓力,只有閹割才能有效降低成本。
2、非公普通版和高頻版
其實我們見到市場大部分的顯卡都是普通版或者高頻版非公版,華碩的鷹騎士、微星的GAMING、HIS的ICEQ都是此類產品,這類非公版的設計目的不是為了閹割,而是因為各大廠的生產線的存在是需要一些方案去唯度的,比如說,HIS的ICEQ或者MSI的GAMING顯卡方案,這個系列的PCB和IC包括散熱器的配套採購是固定下來的,供應商簽訂了長期供貨的合同,那麼這個產品系列的所有生產供給都是完善的,不會因為缺IC或者PCB而供不上貨,只要下單,即可快速生產成型。
但是公版卡不是這樣,每一個版本的公版卡都不會提前告知下游廠家,我準備用哪些IC我準備設計哪種規格的PCB,我定制了哪一款散熱器,比如GTX980和GTX1080公版,區別就很大,從散熱器到物料區別也很大,假如哪一家廠商試圖去生產公版的GTX980,那麼他再去生產公版的GTX1080的時候,生產線就得重新佈局,採購物料得重新簽訂供給合同,從顯卡的發佈時效佔領市場佈局造成的損失到其中過度耗費的人力物力都是巨大的,對於顯卡廠商來說得不償失,一般都是顯卡的核心既定下來之後,下游廠家就開始針對自己系列產品的設計了,這樣能保證最高的發佈時效性和最快的生產效率,生產線小幅改動下,物料不變或者微調即可大批量量產顯卡。
但是非公普通版和高頻版能否達到公版顯卡的穩定性呢?看怎麼解讀這個問題
1、如果你只是隨便玩玩遊戲,非公版顯卡也許更適合配色,外觀更絢麗,風扇更靜音,頻率也許還略高於公版顯卡。那麼確實區別不大的。
2、如果你要做一些專業性用途,CUDA計算應用類任務,半精度單精確度雙精度浮點運算這類,公版顯卡的穩定性和相容性就顯露出來了。
3、運行穩定性:設計理念不同,公版卡的設計不止是針對民用遊戲市場,同時公版卡設計也兼顧到了專業卡市場比如FIRL GL、QUADRO、TESLA等專業顯卡市場,所以他們原廠的產品設計是同時兼顧到各方面需求的而且通過內部LAB的嚴格測試,你會看到一個散熱器和PCB原型基本幾乎用完對應的GEFORCE、QUADRO、TESLA三條生產線,而且確保最大的安全可靠。
總結:
我的評測還很淺薄還有很多技術方面的沒有涉及,但是就短期的使用對GTX1080有了很直觀的感受:
1、GTX1080確實在核心和顯存頻率上大幅提升了,前所唯有的在兩代產品之間實現最大的提升幅度。
2、GTX1080的3DMARK穩定性測試我測了2次都是95%無法通過,過高頻率的提升在一定程度上是否會造成穩定性的下降,這個仍未可知。
3、GTX1080的發熱量和噪音控制的相當的出色,看不見的改進,讓這塊顯卡在滿載下也就83度而已,而且風扇轉速才62%不超過2500轉,幾乎沒有噪音。
4、單8PIN 180W的TDP功耗降低了GTX1080的周邊配套硬體環境的成本,幾乎任何一台具有350w-400W電源的臺式電腦只要購買此款顯卡都可以方便的安裝和正常使用。
5、就單精確度浮點運算這點而言,GTX1080 1070系列無疑是性價比最高的產品。
從單精確度浮點運算的能耗比而言,GTX的1080的能耗比勝過GTX1070而且是幾乎最好的選擇。
1/32的雙精度浮點運算和MAXWELL的GM204相同,1/64的半精度浮點運算就如同帕斯卡的一個笑話一樣存在,人為的驅動限制硬生生的閹割,不過可以理解,因為GP104為了達到最高的頻率必須放棄一些遊戲不太涉及到的運算,這樣保證高頻下的穩定性。
【結語】
本文由什麼值得買網友“gaojie20”撰寫並授權轉載,由於篇幅原因,僅選取了精華的部分進行分享。完整原文可去我站《新王的誕生--ASUS GEFORCE GTX1080公版民用評測》查看,如果你有更多好物想跟我們分享,歡迎在評論區與我們互動。
本文著作權歸作者本人和什麼值得買共同所有,未經許可不得轉載。