挑戰神威太湖之光 日本超算有什麼獨到之處?
在中國神威太湖之光率先將性能沖到100P後,日本也按捺不住了,日本富士通發佈了要建1000P超算的PPT,而且還引ARM為外援。也許有人會問,能成麼?
其實,日本在超算上的技術實力並不差,而且還曾經有過京這樣曾經雄踞TOP500榜首的大機器,雖然在TOP500上被後來者超越,但在Graph500上依舊雄踞榜首。只是日本經濟持續低迷和時運不濟,日本超算逐步被中國和美國拉出了距離。
日本超算京才是世界第一?
就在神威太湖之光在TOP500榮登榜首之際,日本經濟新聞報導,“神威太湖之光雖然排名比較靠前,但其適合的領域有限,對於用戶而言是比較難用的機器”,日本很多相關人士表示,“超級電腦要有用才行”。
日本東京工業大學教授松岡聰說——
“京與神威背後的設計思想有很大的不同,京是通過擴充海量記憶體,可廣泛應對各種現實運算的超級電腦。在500強中速度雖然僅為神威的九分之一,但京即使面對複雜的運算也不容易減速。神威雖然排名比較靠前,但被認為其適合的領域有限。松岡表示神威對於用戶而言是比較難用的機器,這點不可否認。”
為此,筆者諮詢了業內專家,他認為松岡說的有一定道理,並表態:“客觀地說,如果我自己出錢買的話,我選擇京”。
也有業內專家表示——
“畢竟異構眾核是大趨勢......從計算性能上看,神威太湖之光依然是世界第一”
京有什麼獨到之處?
雖然京在Linpack性能上大約是神威太湖之光的九分之一,儘管日本目前並沒有建設出能與天河2號、神威太湖之光相匹敵的超算,但就京本身而言,還是有其獨到之處的。
2016年7月,在Graph500排行榜上,京連續第三次奪得冠軍。在測試中京用0.45秒時間成功解開了由大約1萬億個根節點及16萬億個分支節點組成的大規模圖表廣度優先搜索問題。基準測試得分為38621GTEPS。排名第二的是中國的神威太湖之光,成績為23756GTEPS;排名第三的是美國的紅杉,為23751GTEPS,排名第四的是美國米拉,14982GTEPS。什麼是Graph500呢?其實,除了強調Linpack性能的TOP500,還有強調記憶體頻寬和延遲的Graph500,和強調節能環保的Green500。
Graph500對全系統的記憶體頻寬和記憶體延遲有很高的要求,而計算能力本身已經不影響測試結果了,這種測試偏向於訪存密集型運算,在大資料分析以及大規模圖表分析等場景下比較有意義。
近年來,有觀點認為Linpack測試已經過時了,TOP500創始人之一的田納西大學教授Jack Dongarra就提出了HPCG測試,與Linpack關注線性方程的計算性能不同,HPCG更加看中整體性能的平衡,能代表了共軛梯度反覆運算法的一類應用的計算和通信特徵,但也僅僅代表了某一個方面的特徵,並不能涵蓋超算的所以特徵。如果計算性能和通信不是一個量級的,即便兩項指標分開看都很強,但也會導致HPCG偏低的結果。截至目前,HPCG還沒有被業界廣泛接受。
在HPCG測試中,京的表現也不錯,僅次於天河2號,成績為554.4TFLOPS,天河2號的成績為580TLFOPS,位列第三的神威太湖之光HPCG性能是371.2TFLOPS。如果用代表運算實際效率的HPCG/HPL這項指標看,天河2號的HPCG/HPL參數為1.1%,神威太湖之光的HPCG/HPL參數為0.4%,而京的HPCG/HPL參數為4.9%。HPCG更看重綜合性能,要求計算性能、記憶體頻寬、延遲等指標兼顧,一旦出現某項性能特別強的情況,也就是出現偏科的情況,即便幾項指標都不差,也會出現HPCG運算速度偏低的情況。
計算和通信的不平衡導致HPCG/HPL偏低
神威太湖之光HPCG/HPL偏低的原因就在於計算性能和通信等要素之間的不平衡程度較高——神威太湖之光之所以能在TOP500排名第一、Green500排名第三、在Linpack浮點性能93PFLOPS、Linpack效率高達74.16%的情況下,性能功耗比達到6G/W,做到了兼顧計算性能和節能環保,而且這還是在處理器的製造工藝落後Intel兩代,採用28nm製造工藝的情況下做到的。
原因就在於借助大量處理器並行來提高運算速度,同時通過降低耗電極大的記憶體性能來削減能耗,這會加重綜合性能上的不平衡——這種不平衡並非是計算性能差,或者互聯網路差——在計算性能上神威太湖之光是頂級的,在互聯網路方面,神威太湖之光只是主流水準,還稱不上頂級的互聯網路正是因為計算和通信上的不平衡,導致神威太湖之光HPCG/HPL參數偏低。
而京在這項參數上之所以高,就是因為雖然在計算性能和通信並非頂級水準,但因為計算性能和通信屬於一個量級,加上屬於同構超算的因素,所以HPCG/HPL參數會比較高。
這兩個測試的意義在於說明了京的易用性較好,而且通過擴充海量記憶體,可廣泛應對各種現實運算,具有較廣的應用面,而且在計算性能和通信上做的非常均衡。相比之下,神威太湖之光就屬於各方面性能都不錯,但計算性能特別強悍的類型,在均衡性上是不如京的。但這並不意味著神威太湖之光就不如一台幾年前的大機器,實際上,在絕對性能和在神威太湖之光所擅長的應用上,京是無法企及的。
日本下一代超算會是什麼樣?
在德國法蘭克福舉辦的國際超級電腦大會上,日本富士通公司透露它的下一代超級電腦Post-K將使用ARMv8 架構,根據富士通公佈的計畫Post-K計畫在2020年推出,計畫應用性能是K的100倍,也就是性能將達到1000 PFLOPS,換言之就是神威太湖之光性能的10倍。
另外,富士通還公佈了可以用於建設100P超算的技術儲備——SPARC64 XIfx處理器,該款處理器有32個核心用於計算,2核心用於運行OS服務,有點類似於BlueGene/Q,採用20nm製造工藝,雙精浮點性能超過1TFlops。至於日本能不能將技術圖紙變成現實,只能有時間來檢驗了。