在萬眾期待中,Google雲計算平臺日前推出了支援雲端GPU加速服務的公開測試版,第一款支援的GPU型號是NVIDIA 的Tesla K80,使Google雲平臺的性能獲得了巨大提升。現在,用戶可以在穀歌雲平臺的三個地區玩轉基於NVIDIA GPU的虛擬機器,包括美東1區(us-east1),東亞1區(asia-east1)和西歐1區(europe-west1)。目前只支援使用gcloud的命令列工創建虛擬機器,但從下周起就可以雲終端介面來創建虛擬機器啦。
據雷鋒網瞭解,如果使用者的深度學習演算法需要額外的計算資源,其最多可以在自訂的Google 雲計端虛擬機器上連接將8個GPU(4塊K80的板子)。 GPU可以加速多種類型的計算和分析,包括視頻和圖像轉碼,地震分析,分子建模,基因組學,計算金融,模擬,高性能資料分析,計算化學,金融,流體動力學和視覺化。
圖1 NVIDIA K80 GPU加速器板
用戶只需在雲端的虛擬機器添加GPU, 而不必在自己的資料中心構建GPU集群。雷鋒網獲悉,Google 雲計算平臺上的GPU是直接連接到虛擬機器的,提供GPU的裸機性能。每個NVIDIA K80 GPU配置了2,496個流處理器和12 GB的GDDR5記憶體。用戶可以靈活地選擇1,2,4或8個NVIDIA GPU來構建伺服器形態,讓運行在伺服器上的虛擬機器實例擁有最佳性能。
圖2 Google Cloud支援多達8個GPU連接到自訂虛擬機器,從而優化應用程式的性能。
這些實例支援流行的機器學習和深度學習框架,如TensorFlow,Theano,Torch,MXNet和Caffe,以及NVIDIA流行的CUDA軟體,CUDA可用來構建GPU加速應用。
價錢
雲GPU和穀歌其它基礎設施一樣,價格是一大亮點。價格按分鐘計費,最低消費時長是10分鐘。在美國,連接到虛擬機器的每個K80 GPU的價格為每小時0.700美元,在亞洲和歐洲,每個GPU每小時0.770美元。和往常一樣,用戶只需按使用的量支付費用。這樣就不需要自己維護一個GPU集群,在零資本投資下獲得高速的深度學習和機器學習訓練。
圖3 GCE的GPU定價
加速的機器學習
Google雲GPU集成了Google 雲機器學習(Cloud ML),幫助您節省大規模使用TensorFlow框架訓練機器學習模型所需的時間。現在,您不需要花費幾天時間在單台機器上用大量的圖像資料集訓練一個圖像分類器,您可以在雲機器學習中使用多個GPU執行分散式訓練,大大縮短開發週期並快速反覆運算模型。
Google雲機器學習是一項託管服務,提供端到端培訓和預測工作流,集成了其他雲計算工具,如Google Cloud Dataflow,Google BigQuery,Google Cloud Storage和Google Cloud Datalab。
建議從從低量級開始,在小資料集上並訓練TensorFlow模型,然後啟動更大的雲機器學習,用整個資料集訓練模型,以充分利用Google 雲GPU的規模和性能。有關Cloud ML的更多資訊,請參閱
《快速入門指南》
並開始使用,查看
《Using GPUs for Training Models in the Cloud》
這篇檔以深入瞭解Google雲GPU。
下一步
請在Cloud NEXT(穀歌雲計算大會, 3月8日至10日在三藩市舉行)上註冊帳號,然後註冊CloudML 訓練營,並瞭解如何使用GPU增強雲計算性能。您可以使用gcloud命令列來創建虛擬機器,並嘗試在該虛擬機器上運行TensorFlow,體驗加速的機器學習。
詳細文檔可在在這個網站上查看
https://cloud.google.com/gpu/
。
本文摘自穀歌雲平臺博客,作者為谷歌產品經理John Barrus,由雷鋒網AI科技評論編譯,封面圖片 via
gsmarena
via
GPUs are now available for Google Compute Engine and Cloud Machine Learning