每秒 180 萬億次，穀歌新一代 TPU 三大變化值得關注

分類＼手機
時間＼2017-05-23

在人工智慧領域，訓練一個先進的機器學習模型需要投入大量的計算資源。隨著機器學習演算法越來越多的應用在各個領域並表現出優越的性能，對於機器學習演算法專業硬體的需求，也變得越來越強烈。

2016 年，穀歌首次公佈了專為加速深層神經網路運算能力而研發的晶片——TPU，在計算性能和能耗指標上，TPU 的表現都遠遠優於傳統 CPU、GPU 組合。（我們在上個月也曾發佈過一篇文章，解析 TPU 耀眼成績背後的原因）

在 5 月 19 日淩晨舉行的穀歌 I/O 2017 大會上，穀歌正式發佈了第二代 TPU。新的晶片相比初代產品，在

性能、應用、服務

方面再一次實現突破。

一、性能方面

新一代 TPU 能夠同時應用於高性能計算和浮點計算。並且最高可以達到每秒 180 萬億次的浮點運算性能。相比而言，上周英偉達剛剛推出的 GPU Tesla2 V100，每秒只能達到 120 萬億次浮點運算。

相比第一代在功能上實現從無到有的突破，第二代的起點相對更高，開發團隊也能更加集中資源來提升改進 TPU 的性能。相信通過硬體、軟體的優化，後續第三代、第四代在性能取得持續突破的可能性非常大。

二、應用方面

第一代 TPU 沒有特別提到組合應用、集群應用的功能，而且自身沒有存儲空間。第二代在發佈會上直接就展示了一個包含 64 顆二代 TPU 晶片的 TPU pod 運算陣列。這個運算陣列，最多可以為單個 ML 訓練任務提供每秒 11.5 千萬億次的浮點計算能力，大大加速機器學習模型的訓練。

也有專業媒體提到，新的 TPU 在左右兩側各有四個對外介面，在左側額外增加了兩個介面。這些介面未來可能允許 TPU 晶片直接連接記憶體，或者是直連高速網路，從而實現更加複雜的運算。理論上，開發者也能在此基礎上設計更多的功能，添加更多的擴展。

三、服務方面

從 Cloud TPU 的命名上面，也可以直觀地瞭解到，新一代的 TPU 將加入穀歌雲計算平臺，並對外提供雲服務。這也就意味著 TPU 不再只是穀歌內部的獨享服務，而將成為任何人都能輕鬆分享、應用的神器。

這裡就看出穀歌比較賊的地方了，第一代剛出來的時候，藏著掖著的，還特別低調地說只打算自己內部使用。二代研發出來，直接就上雲了：硬體不對外銷售，服務可以啊。

如果是直接的硬體銷售，很多中小型的公司（比如我們公司：智慧思特）可能會更加偏向於選用 GPU：應用範圍更廣，可以根據需要安排處理不同的任務。大型的公司（比如阿裡、Facebook），ML 任務量非常大，才會考慮採購 TPU，甚至出於經費、效率的考慮，自主組建團隊進行研發（比如這次穀歌自己做 TPU，Facebook 也有過自主研發資料中心硬體設備的報導）；

對外銷售服務的話，首先是啟動了中小企業的這塊需求市場，使用者只需根據使用時間進行付費，節省了成本。另外，大型企業自身的資源利用率也有了很大的提升，攤薄了成本。比如阿裡，為了應對雙十一準備的海量伺服器，在閒暇時間可以對外提供雲計算服務。最後，避免了跟硬體廠商（比如英偉達）直接的利益衝突。

四、小結

綜合來說，TPU，尤其是 Cloud TPU 讓大型互聯網公司印證了自主研發硬體的可行性。

性能上，針對自主業務進行成倍優化，節約硬體採購、資料中心建設、時間消耗等成本；應用上，可以靈活地與現有設施、設備進行組合、擴展；服務上，通過雲實現資源的對外銷售，賺取收益。

對應的，根據企業自身業務的不同，未來可能出現的定制化硬體設備也會不一樣。比如針對線上交易資料處理的 APU？針對線上社交互動的 FPU？

至於如何評價 Cloud TPU，大概可以算是標誌著人工智慧專業硬體時代的到來吧。

版權申明：本文由

智慧思特大資料

編輯整理，雷鋒網獲得授權轉載。