國產x86處理器最新成果搶先看
說到在個人電腦中應用最廣泛的x86處理器,可能大家首先想到的就是那兩家美國公司的產品,似乎沒有其他哪一個國家有能力敢在這個領域挑戰,除了中國。事實上早在2014年我國的x86處理器就已發佈,並在短短幾年內獲得了高速發展—從雙核心、四核心到現在的SOC八核心設計;從只能進行簡單的辦公應用,到全高清影音播放,再到與HTC VIVE配合,為玩家提供流暢的VR體驗,國產x86處理器發展所取得的成果絕對值得每一位國人關注。
在本刊2016年10月下刊的《真正走向市場化 揭秘中國兆芯x86處理器》一文中,我們曾率先報導了國產x86處理器的發展情況,並通過後續一系列實際產品報導、評測可以看到,雖然與國外x86處理器還有一定差距,但當前的兆芯開先ZX-C四核心處理器已經具備流暢運行WORD、PowerPoint各類辦公軟體,播放全高清視頻,運行《英雄聯盟》這類主流網遊的能力。那麼時隔大半年後,國產x86處理器又有什麼新的進展呢?在近期舉辦的北京國際互聯網科技博覽會暨世界網路安全大會上,上海兆芯積體電路有限公司為我們帶來了新的驚喜。
首款國產全融合x86:8核心處理器亮相
在本次兆芯展臺上,最搶眼的主角應該就是首次登臺亮相、核心架構名為“五道口”的兆芯ZX-D處理器,這款處理器目前有四核心、八核心兩個版本。雖然在之前基於“張江”核心架構的兆芯ZX-C處理器上,兆芯也推出了8核心設計的兆芯開勝ZX-C+處理器,但ZX-D處理器在架構上卻進行了很大的改進。
在之前的ZX-C+8核心處理器上,它的結構是由兩個ZX-C四核心處理器封裝在一起,在外觀上我們可以看到其PCB基板上有兩顆小核心。而ZX-D處理器則原生採用了四核心或八核心設計,並將記憶體控制器、PCIe控制器全部融入到晶片內部,也就是採用了SoC(System-on-Chip)設計,其外觀就是一個大大的核心。這樣的設計可以為ZX-D處理器帶來諸多好處。
首先兆芯對ZX-D處理器內核的流水線進行了重新設計,其中ZX-D處理器的整數流水線相比ZX-C大幅減少了分支預測失敗的開銷,同頻性能更強,並保持工作頻率不變而核心面積和功耗僅略微增加。此外CPU的L1及記憶體訪問都實現了頻寬翻倍,並在末級緩存引入了先進的替換演算法,在相同緩存容量的情況下可大幅減少某些應用程式的緩存缺失率。同時,ZX-D處理器緩存的性能與容量均有了很大提升。
在兆芯x86處理器中,每四顆處理器核心共用一部分緩存。在ZX-C+8核心處理器中,每四顆核心共用2MB緩存,總計4MB緩存。然而問題也來了,多核心處理器在工作時需要確保各個核心所能“看”到的緩存內容一致,知道哪個資料被改寫了,哪個任務該由哪顆核心來執行,避免衝突,實現效率最大化,因此就需要時刻同步,以保持快取一致性。但ZX-C+處理器只是一顆單純的運算核心,要讓每個四核模組中的緩存保持一致性,就需要將這個協調工作交給外部的北橋晶片—兩個四核心模組需要同步更新處理器內緩存的資料時,將由FSB前端匯流排傳輸到北橋作更新。雖然緩存的資料量並不巨大,但由於需要通過北橋進行處理,無疑會帶來一定的延遲,核心之間的通信就會變得緩慢,這將在一定程度上影響處理器性能的發揮。
而在ZX-D 8核心處理器中,它不僅提升了緩存容量,每四顆核心共用4MB緩存,總計擁有8MB緩存。更重要的是,處理器與北橋的完全融合,使得其緩存資料的一致性直接在處理器內部就可以完成。這也就意味著處理器之間的交互不用再通過北橋,而是使用片內高速點對點直連網路互聯,降低了延遲並提高了頻寬,為將來更多核心的互聯提供了基礎(有點類似ZEN架構)。
其次記憶體控制器、PCIe控制器的融合也可以大大提升記憶體與顯卡性能。在南北橋架構中,記憶體、顯卡都必須通過北橋由FSB前端匯流排將資料傳輸給處理器。但問題是在ZX-C平臺中,FSB前端匯流排頻率只有1333MHz,匯流排頻寬也就在10.6GB/s左右。而當今雙通道DDR4 2133的記憶體頻寬早已超過30GB/s,PCIe 3.0 x16顯卡的頻寬也達到16GB/s。所以前端匯流排使得ZX-C處理器已經無法很好地與最新硬體配合,發揮出各自的最大性能。因此在ZX-D處理器中,它在處理器內部整合了記憶體控制器(DDR4記憶體控制器,也使得兆芯ZX-D成為國產處理器中首個支援DDR4記憶體的產品)與PCIe控制器,處理器可通過內部的高頻寬直連匯流排訪問記憶體、顯卡。其中記憶體訪問頻寬提升了1~2倍,有效地發揮出了DDR4記憶體的優勢,對於處理器多核及多執行緒應用有顯著的提升。
▲以英特爾P35晶片組為例,在這類南北橋架構平臺中CPU都需要通過北橋、前端匯流排與顯卡、記憶體進行通信,不僅其頻寬被限制,通訊延遲也大為增加。
此外,ZX-D處理器還在內部集成了新一代圖形核心。雖然其具體規格還未披露,但從架構上我們就不難看出,相比ZX-C集成在北橋中的圖形核心,在CPU內部集成圖形核心首先可以降低處理器與圖形核心之間的通信延遲,提升渲染效率。更重要的是,相對於ZX-C平臺被限制在10.6GB/s以內的記憶體頻寬,圖形核心可以有效利用DDR4記憶體提供的高頻寬優勢,等同於大幅提升了顯存頻寬,集顯核心性能將得到提升。
▲兆芯開先、開勝ZX-D處理器在架構上更類似於當前的英特爾酷睿處理器,PCIe控制器、DDR4記憶體控制器全部集成在處理器中,直接與處理器通訊,僅需一個提供存儲功能與PCIe通道的IOE擴展晶片與它搭配。
經過以上一系列改進,目前根據兆芯的官方資料來看,在保持和開先ZX-C系列處理器工作頻率不變的前提下,兆芯ZX-D系列處理器比開先ZX-C系列處理器在整數單任務運算性能上有20%左右的提升,在整數多工運算性能上的提升更是接近50%。最後兆芯開勝ZX-D 8核心處理器的SPEC2006多工整數運算成績達到111分。其8核心產品整體性能達到Skylake核心的英特爾Core i3桌上出版處理器,其8核心產品具體成績如下:
兆芯開勝ZX-D 8核心處理器測試成績
SPEC2006 單任務 多工
整數性能 20.2 111
浮點性能 24.8 73.1
好,話不多說,接下來還是請大家通過從上一頁刊出的實際產品圖片,讓我們看看國產x86處理器在近期又取得了哪些進展。
國產x86處理器最新成果展
▲最新的兆芯開先ZX-D 四核心處理器,從處理器結構上可以很清晰地看到,它就是採用了一個大核心設計策略,CPU背面有大量觸點,將原北橋部分的記憶體控制器、PCIe控制器、集成圖形核心全部整合在處理器內部。目前這款處理器採用台積電28nm工藝生產,工作頻率在2.0GHz左右。
▲展會現場展出了首台基於兆芯開勝ZX-D 8核心處理器的桌上型電腦系統,搭配GeForce GTX 1070顯卡與DDR4 2133記憶體。處理器採用BGA封裝焊接在主機板上,由於8核心處理器產品的TDP熱設計功耗也就只有65W,因此僅需要一個小小風扇就能確保處理器穩定運行。同時雖然兆芯ZX-D系列處理器集成了北橋部分,但同當前其他x86處理器一樣,它仍需要搭配一顆IOE擴展晶片,來為系統提供存儲與額外的PCIe通道。這款晶片的具體型號為ZX-200,它可以提供SATA 6Gbps介面、M.2介面,以及大量PCIe x1、PCI插槽。而最讓人鼓舞的是,該主機板甚至還緊追潮流提供了USB 3.1 Type-A與Type-C介面。
▲那麼這套系統能為使用者帶來怎樣的體驗呢?從現場的測試來看,這台基於兆芯開勝ZX-D 8核心處理器的PC可以完美支援HTC VIVE VR系統,並流暢運行《水果忍者VR》、《VR經典射箭》等遊戲。同時在現場,兆芯也公佈了ZX-D處理器四核心、八核心處理器的SPEC 2006測試成績。總體而言,兆芯開勝ZX-D 8核心處理器的整體性能與英特爾Skylake Core i3桌上出版相當。
▲由聯想最新推出,基於兆芯開先ZX-C C4600處理器的昭陽CF03-T筆記型電腦,跟之前的產品相比加入了WIFI/藍牙模組,模具設計更加大氣,能更好地進行移動辦公應用。
▲採用x86國產處理器的最大目的就是提升安全性,這是由上海眾新科技開發,基於兆芯開先ZX-C C4600、C4610處理器的機架式伺服器,它搭載了國產TCM1.2安全可信晶片,支援可信啟動和檔加解密功能。這款伺服器可以對連接終端的應用程式和外設進行許可權管控;對終端的進程、IO使用狀況進行即時跟蹤,並通過日誌分析找出rootkit等潛在風險。其主要應用領域在軍政類安全部門,可有效防止個人電腦洩密。
▲兆芯也展出了之前的開勝ZX-C+系列8核心處理器,就是將兩個ZX-C四核心處理器封裝在一起,外觀上就是由兩個小核心組成,沒有集成記憶體、PCIe控制器,顯然最新的ZX-D處理器在架構設計上要先進得多。
此外,除了以上兆芯展出的最新產品外,那麼國產x86處理器還有哪些進展?為何大家會如此重視x86處理器的發展?現在存在哪些問題呢?為此在展會現場我們還對上海兆芯積體電路有限公司副總裁傅城博士進行了專訪。
國產x86處理器領軍人物專訪
▲上海兆芯積體電路有限公司副總裁傅城博士(圖中穿淺藍衣服者)接受了本刊專訪。
MC:兆芯x86處理器現階段取得了哪些成果?
傅城:首先國產x86處理器在不斷的壯大,性能不斷增強。目前兆芯的國產通用處理器有開先ZX-C四核、開先ZX-C+四核和開勝ZX-C+八核產品,均可應用到電腦、伺服器、嵌入式和工控設備的設計生產之中。三款國產通用處理器均實現了規模量產,兆芯ZX-D系列處理器目前也呼之欲出。同時兆芯處理器也得到了行業的認同,開先ZX-C系列處理器榮獲了多個行業獎項,包括“第18屆中國國際工業博覽會金獎”、“第十一屆(2016年度)中國半導體創新產品和技術”以及“2017年度大中華IC設計成就獎”。
當然更為重要的是,應用兆芯國產x86通用處理器的整機已在黨政軍辦公,信息化等國家重點系統工程中得到實際應用,並獲得了“性能良好,品質可靠,能夠滿足實際工作需要”的積極回饋。除桌面辦公領域之外,兆芯x86通用處理器在伺服器、嵌入式整機、存儲系統等領域也可以滿足用戶需求。隨著推廣的進行,應用兆芯x86通用處理器的各類設備將逐步進入到金融、電力、稅務等應用領域,根據需求進行全面國產化替代。
MC:為什麼兆芯會選擇x86架構來作為處理器的發展重點呢?
傅城:x86架構晶片在全球互聯網和資訊技術產業中都格外關鍵,事實上,我們幾乎每一個人現在的生活、工作都無法脫離x86架構晶片。x86架構在桌面辦公領域的份額高達95%以上,並且具有生態系統成熟,作業系統、辦公軟體遷移成本低廉,軟硬體相容性出色等優勢。面對全球範圍內已被廣泛接受的局勢,發展自主可控的x86高端通用晶片,在核心晶片和關鍵領域早日實現國產自主可控產品的替代,顯然是投入產出比較高的一種管道。
MC:目前在國產通用處理器的發展上,還存在哪些需要解決的問題?
傅城:我國通用處理器產業的發展上,形成了幾個不同的陣營,每個陣營都取得了一定的成果,但也都面臨著基本相似的問題。第一,完全自主IP(Intellectual Property智慧財產權的縮寫)的問題,目前國內處理器的核心技術IP能實現100%完全自主的公司並不多。需要說明的是,兆芯國產通用處理器和晶片組的相關IP,100%是由兆芯自主設計研發。
第二,是產業標準的問題,國產CPU設計公司在進行CPU設計研發工作時,必須要遵循的普遍是國際上的協定和標準。
第三,國產通用處理器的生態規模還比較有限,同時應用推廣的規模也比較有限。
第四,研發投入仍然不足,魏少軍教授曾指出,核高基專項每年的研發投入不及英特爾每年研發投入的8%,這個差距可想而知。(注:“核高基”是對核心電子器件、高端通用晶片以及基礎軟體產品的簡稱,是2006年國務院發佈的《國家中長期科學和技術發展規劃綱要(2006-2020)》中與載人航太、探月工程並列的16個重大科技專項之一。)
從解決問題的角度出發,針對第一個問題,企業需要實事求是,堅持自主創新。針對產業標準的問題,可以考慮利用市場吸引國際標準組織本土化這一管道加以改善,同時也需要產業內的龍頭企業和政府的積極參與和支援。生態規模和應用推廣有限,研發投入不足的問題,除了需要企業更加開放合作,也需要寄希望政府和相關組織的引導和支援。
MC點評
完全融合式的8核心設計,對記憶體控制器、PCIe控制器、圖形核心的整合,再加上對DDR4記憶體的支援,可以看到兆芯開先、開勝ZX-D處理器在基礎架構設計上已經與酷睿、銳龍等國外處理器站在了同一起跑線上,終於徹底擺脫了古老的FSB匯流排、北橋,性能上的提升也將必然而至。不可否認,由於各方面原因,國產x86處理器的核心性能與酷睿、銳龍相比肯定還存在一定的差距。性能達到Skylake核心Core i3桌上出版的評估雖不是讓人太激動,但“飯要一口一口地吃,路要一步一步地走”。CPU作為電腦硬體技術中的“皇冠”,國產x86處理器在發展過程中肯定會存在各種各樣的問題、難點,但無論作為個人還是媒體,我們都應以積極的態度推動問題的解決,而無需帶著偏頗的情感橫加指責,這畢竟是我們自己的產品。
這不僅僅是愛不愛國的問題,更是中國作為大國必須發展自己的x86處理器來完成很多日常涉密任務,畢竟我們不可能將大量政府人員、軍人的日常工作也交給太湖之光這樣的超級電腦;畢竟在日常工作中,長時間使用國外處理器來完成各種涉密任務也存在很大的風險。同時又有哪種國外處理器可以支援SM3和SM4高速國密演算法指令,可以快速完成各類檔的加解密呢?另一方面大量《微型電腦》讀者對兆芯的密切關注、諮詢,也顯示出消費級市場實際上對國產x86處理器也是非常期待的。好消息是,下一代採用16nm工藝的ZX-E處理器正在按計劃高速推進,兆芯處理器一直堅守的2.0GHz頻率也將有望獲得大幅提升,國產x86處理器最終走入消費級市場的步伐也將越來越近。因此為國產x86處理器營造一個健康、正常的發展環境,力爭早日在x86處理器領域實現三足鼎立應該成為中國電腦硬體產業努力的一個方向。