人工智慧,這個聽起來離我們特別遙遠的概念,正成為業內最熱門的話題。無論是圖像識別、人臉匹配,還是自動駕駛、人機交互,人工智慧正在給我們帶來巨大的驚喜和無與倫比的改變。在人工智慧行業中,PC界的巨頭自然不可能抽身在外,英特爾和英偉達,正在利用其在CPU、GPU、FPGA以及演算法、平臺上的優勢,向著業界頂端衝擊。那麼,在人工智慧方面,這兩家企業有什麼佈局呢?
人工智慧是目前業內研究的焦點。從早期讓電腦識別照片開始,到自動駕駛系統逐漸成熟,智慧語音系統使用日漸廣泛,智慧翻譯演算法也越來越準確,人們看到了一個前所未有的巨大市場—根據瑞銀的預測,到2020年,全球人工智慧市場將突破1800億美元。毫不誇張地說,人工智慧將成為業內技術爆發和經濟增長的重要技術和基本推動力,甚至有人將人工智慧和產業革命相關聯,認為人工智慧將帶來不亞於互聯網和資訊技術的產業革命,將人類從大量無意義的工作中解放出來。
面對如此龐大的市場和未來,搶先行動起來的除了政府和科學界人士外,還有天生嗅覺靈敏的跨國巨頭。在IT界這個人工智慧的發源地,跨國巨頭已經開始動用各種手段佈局人工智慧行業。其中英特爾和英偉達的動作非常令人關注:它們一個是PC業界巨頭,掌握著全球最先進的半導體工藝制程;另一個則是GPU和平行計算的實際規範制定者,正在利用GPU和深度學習撬動人工智慧的半壁江山。那麼,英特爾和英偉達在人工智慧產業上都有哪些實際行動呢?
英偉達的野心
深度學習帶來的飛躍
如果說最近幾年崛起較快的企業,那其中英偉達一定會佔據一個位置。這家公司的估值從2015年的不到一百億美元暴增到目前約600億美元,GPU的天然優勢和人工智慧的快速發展為其帶來了爆發的動力。
英偉達最重要的產品是GPU,此外,英偉達還涉足SoC晶片行業,也推出過Tegra系列處理器產品。早期英偉達為了盡可能多的利用GPU的通用計算功能,推出了CUDA語言和相關的開發套件。早期的CUDA環境應用範圍和內容都比較少,但是進入人工智慧時代後,“CUDA+GPU”的搭配面對深度學習表現出了極強的適應性和強大的計算能力。
從架構角度來說,GPU先天適合深度學習計算。
英偉達利用CUDA和GPU配合,實現了深度學習性能的大爆發。
一般來說,人們認為GPU更適合於大量併發計算,但是不夠擅長邏輯判讀等操作,這是因為GPU較短的流水線和先天面向圖形的設計結構所致。相比之下,CPU的流水線更長,分支預測、邏輯判斷等適應性更出色,但是更少的核心數量和較低的計算能力卻限制了它的性能。在深度學習應用中,以圖形識別為例,將大量的圖片資訊併發處理,並多次反覆運算的計算方法對CPU來說太過勉強。目前核心數量最多的CPU也只有32個物理核心,即使有超執行緒等技術的幫助,也只能做到64執行緒併發。實際上深度學習要求的併發數量更多,甚至超過數萬個,要求的計算能力往往在TFLOPS級別—這樣一來,執行緒數量少、流水線深度較深的CPU就無力維持了,並且在這種應用場景下無論哪個方面,CPU計算效率是遠不如GPU的。GPU數千個計算核心和超強的計算能力,很適合這樣的大規模併發運算。以英偉達為深度學習推出的Tesla P100為例,單精確度計算能力10.6TFLOPS,遠超目前最強大的CPU數個數量級。
在硬體和軟體上擁有優勢後,英偉達的觸角伸向了深度學習的應用領域。目前英偉達的主要精力放在下列幾個方面:
建立以GPU為核心的人工智慧生態圈
英偉達的核心是GPU,這一點在前文也有說明。不過,GPU現在的含義應該從“Graphics Processing Units”轉向“General-purpose Processing Units”,也就是通用處理器。顯然,GPU在人工智慧上的用途尤其是深度學習帶來的智慧化功能,使其能夠滿足更多場景和環境下的應用。除了硬體外,軟體方面英偉達借助CUDA成熟的生態環境,結合GPU的優勢,基本上已經成為了人工智慧深度學習方面的事實標準。具體到行業應用上,包括超級電腦、大學研究、工業設備以及大量研發類產品,英偉達的“GPU+CUDA”正在不斷的攻城掠地。
進軍自動駕駛
如果說英偉達在人工智慧和深度學習上的努力終於開花結果的話,那麼最大的那一顆果實就是自動駕駛。在2015年和2016年的CES展會上,英偉達的主題演講核心內容只有一個,就是自動駕駛平臺,主角就是Driver PX和Driver PX2。這兩款產品以Terga處理器為核心,搭配GPU來實現高效率的深度學習,最終可以達到Level 3到Level 4級別的自動駕駛。
當然,目前的Driver PX系列產品還存在很多問題,比如功耗過高(超過200W)、穩定性尚未經過考驗等。不過,在2017年的CES上,英偉達公佈了正在研發的全新一代產品“Xavier”,這是一顆專門為深度學習和智慧駕駛等應用領域設計的全新的產品,它採用的是新一代512 CUDA Core的Volta GPU架構,搭配八核心CPU,深度學習計算能力可達20DL TOPS,功耗降低至約20W,適合使用在汽車上作為主要計算核心。
英偉達推出的DriverPX 2,用於汽車自動駕駛。不過這款產品功耗太高,散熱甚至需要水冷,難以在民用汽車上長期使用。
另外,英偉達還推出了輔助駕駛系統AI Co-Pilot,依舊是利用了深度學習技術,它能夠根據駕駛員的語音、動作甚至是唇語、眼神等瞭解到駕駛員的意圖,並通過控制車外感測器和汽車操控來實現輔助駕駛功能。從產品來看,在真正的自動駕駛到來之前,AI Co-Pilot可以作為一個輔助駕駛功能幫助司機瞭解到周圍的情況和問題,包括示警、防碰撞、道路監測等,它相當於是一個過渡手段,用於補償在自動駕駛技術正式上市之前的這段空白時間。
AI Co-Pilot主要是利用深度學習技術完成輔助駕駛功能。
自動駕駛的級別
目前業內自動駕駛發展的如火如荼,各家都在推出不同的方案。不過為了更好地區分從人工駕駛到自動駕駛的差異,業內還是定義了一些級別,來衡量自動駕駛技術的發展程度。這個級別分級如下:
Level 0:完全沒有自動駕駛功能,所有控制都需要依靠人工實現。
Level 1:實現了一些自動駕駛功能,比如重要的巡航控制、車道保持、自動轉向、泊車輔助等,人工依舊需要控制。
Level 2:自動駕駛系統開始介入大部分操作,包括自動轉向、制動、加速等。不過人必須保持隨時接管汽車的能力。
Level 3:除了特殊環境和特殊情況(複雜的無道路場景),汽車都可以自動駕駛,人可以在乘車時做其他事情,但是駕駛員依舊需要準備應對突發情況。
Level 4:除了極端天氣和極端環境(比如暴風雨),汽車都可以自動駕駛,人可以在乘車時做其他事情,但是駕駛員依舊需要準備應對突發情況。
Level 5:人類只是貨物,駕駛完全交給機器來進行。
目前市場上絕大部分汽車的自動駕駛級別是Level 0,配備了諸如泊車輔助、自動巡航等功能的汽車可以勉強算作Level 1。目前宣稱具有高級輔助駕駛功能的汽車,一般也都是Level 1~ Level 2水準,很少有完全可以達到Level 2的,Level 3級別目前尚未有廠商可以保證,還需要進一步的觀察。
佈局更多場景
英偉達在自動駕駛領域的努力,為其帶來了一輪股價狂潮。不過英偉達並沒有停下腳步,還在進一步擴展自己的業務範圍,包括智慧家居、智慧醫療、無人機等場景。比如智慧家居方面英偉達發佈了名為SPOT的智慧家居控制中心,使用者可以使用語音來控制家裡的電器,實現包括燈光、音響、語音等全面的控制。在醫療方面,利用深度學習技術,英偉達和麻省總醫院正在訓練電腦識別高達100億份醫學影像,為疾病診斷、監測和治療做出努力,此外英偉達還和美國國家癌症研究所一起,推進癌症的深度學習研究。
上述所有佈局,都展示了英偉達利用GPU在深度學習上的優勢,進一步加強自己在技術領域的地位並擴展自己的市場,希望獲得更大的回報。回顧十幾年前,誰又能想到這樣一個主攻GPU顯卡的公司能發展至如此龐大的地步,甚至即將深入、掌控我們的生活。
小知識:什麼是深度學習
說起深度學習,人們總覺得非常遙遠。實際上深度學習並非憑空出現,而是一個模擬、類比大腦思考事物方式的過程。深度學習只是機器學習的一個分支技術,由於其技術、演算法和目前的軟硬體環境匹配度較高,因而得到了快速的發展。
深度學習的技術原理是由David Hubel和Torsten Wiesel提出的。他們於1958年在約翰·霍普金斯大學(The Johns Hopkins University)工作時,通過研究貓的瞳孔區域和大腦皮層神經元的對應關係,發現一種名為“方向選擇性細胞”的神經元,這種神經元主要是用於測量物體邊緣的方向。隨後在其他一些研究中顯示,大腦通過對採集到的資訊進行不斷反覆運算和抽象,經過多層處理,最終得到了我們大腦反應的資訊。
深度學習通過類比大腦處理圖像的方法查找關鍵單元。
我們用一個例子要說明深度學習是怎樣一個過程:假設有一個機器,它不懂閱讀,但是明白每個字的意思。當它看到一段話時,實際上由於整段話太長,它並不理解這段話的意思。這個時候,機器可以通過認識每個字並不斷地學習由字組成的詞,從而得知詞的意思;然後用詞推及短語,瞭解到短語的意思,最後再讀懂組成的句子。這是一個不斷學習和反覆運算的過程,通過“字—詞—短語—短句—段落”的反覆運算,最終理解一段話的意思。
以深度學習中比較常見的圖像識別為例,機器其實不懂任何圖像所表達的意思,在機器眼中,圖元層面的圖像就是一個個數位。但通過一些採樣演算法,機器能夠識別出顯著不同的圖像邊緣並記錄這些邊緣的特徵。雖然有了一些特徵資料,但是在圖元尺度上,這些資料實際上是零碎的、不可辨識的,它不代表任何東西。這個時候,通過多次的組合和反覆運算處理,機器開始擁有了將這些特徵點逐漸逼近原圖含義的能力,最終在多次反覆運算和組合、學習、對比後,機器能夠給出原圖有關資訊的答案。
這是深度學習在處理圖片,以圖片中的邊緣作為查找目標。
製備完成的碳納米管照片,可見條形結構。
從這裡也可以看出,所謂深度學習,是指在機器得到的資料和給出的最終資訊之間一個多層的、有深度的處理過程,因此它也被稱作Deep learning,用於處理這些資料的模型和演算法被稱作NeuralNetwork,也就是神經網路。深度學習和神經網路,組成了我們目前最常見的人工智慧的基礎。
Xavier處理器的秘密
目前英偉達對Xavier的基本結構還沒有公佈太多資訊,只是給出了一些最基本的參數,包括八核心CPU、Volta架構的GPU以及深度計算能力高達20DL TOPS,制程方面維持TSMC 16nmFinFET+不變。
從產品的角度來推測,Xavier在CPU部分應該改用了全新的架構,之前的Denver並沒有出現在發佈會上,考慮到其專用性,英偉達很可能涉及了新的架構來滿足深度學習的需求。另外在GPU方面,512 CUDA Core的Volta架構也是首次發佈,因為現在桌面產品還在使用Pascal架構。
最後來看深度學習能力,英偉達的想法:Xavier處理器的秘密是,在20W內做到20DL TOPS(TOPS)的深度計算能力(DL TOPS是一個8位元整數計算能力的衡量方法,Xavier希望做到1 DL TOPS/W),考慮到目前的DriverPX2的計算能力只有24DL TOPS,因此Xavier在工藝不變的情況下,架構上必須做出巨大的調整才可以做到。一旦Xavier的功耗控制在20W以內,那麼大批量在汽車上使用就不會成為難題了。
Xavier經過重新設計,功耗大幅度降低,在和博世合作後,外觀設計更像汽車配件,也更容易在汽車內使用和搭配了。
在功能上,Xavier能夠融合更多的感測器,包括攝像頭、雷射雷達、雷達、超聲波等。另外,Xavier目前在和博世合作開發提供給汽車廠商的版本。考慮到Xavier將在2018年或者2019年大批供貨,那麼首次在汽車上看到Xavier應該在2020年以後了。
借助Xavier和深度學習,汽車最終可實現完全的自動駕駛。
英偉達推出的智慧家庭控制中心。
英特爾的擴張
平臺化和大一統
在很多用戶的印象中,英特爾似乎對人工智慧的發展不那麼熱心。比如英特爾除了在展會上帶來一些有關人工智慧和深度學習的應用、案例外,一般用戶接觸不到太多案例。實際上,英特爾在人工智慧上走的是特殊的方法—通過收購和合併,打造一個人工智慧全產業鏈集團。
之前英特爾在人工智慧的研究方面也投入了不少精力。不過,和英偉達有GPU作為計算核心相比,英特爾在人工智慧領域之前沒有專精的產品,畢竟英特爾長期戰略是堅持以CPU為核心。但這種情況在2012年發生了變化,英特爾在2012年推出的Xeon Phi加速計算器,在眾核和大規模平行計算方面開始有了實際的硬體產品。在2016年的IDF上,英特爾也將重點瞄準了深度學習,其代號為Knights Mill的全新一代Xeon Phi的深度學習能力達到上代產品的4倍以上,採用全新10nm工藝打造,集成高達72個Airmont核心,能夠利用板載16GB 3D RAM和384GB DDR4記憶體。此外,英特爾還通過大量的收購,建立了一個完整的人工智慧產業集群。
Xeon Phi是英特爾在人工智慧和深度學習方面最重要的硬體產品之一。
英特爾全新的Knights Mill Xeon Phi將帶來更強悍的性能。
除了在硬體上作準備外,英特爾在資本市場上也開始逐步發力。其中包括以162億美元收購Altera公司、以153億美元收購Mobileye,以及收購Saffron Technology、Movidius和Nervana等創業企業。通過對這些企業的並購,英特爾得以快速切入人工智慧市場,不但開拓了全新的領域,也大大加強了自己的實力,開始準備和英偉達正面廝殺。
在人工智慧市場上,如果說英偉達是自然生長並一步步做大的話,那麼英特爾就是通過並購“合縱連橫”、“強行進入”的—充足的現金流和先進的製造技術給了英特爾談判的底氣,而快速的收購也讓英特爾得以在最短時間內切入市場。下面,本文就簡單介紹一下英特爾在人工智慧市場上至關重要的三次收購。
收購Altera:獲得FPGA
Altera是一家以FPGA為主要產品的公司。所謂FPGA,就是現場可程式設計閘陣列,它是一種半定制化的積體電路,主要應用在固定計算任務和目標的場合。和一般的通用型處理器不同,FPGA特別擅長處理某一類任務,因為它的電路和晶片設計就是特別針對某一種程式進行優化的。這使得FPGA在固定應用場合非常受到用戶歡迎。
目前深度學習的熱門發展方向中,FPGA是不可或缺的一環。
從傳統意義的市場來說,FPGA和CPU這樣的通用產品還沒有開始搶飯碗,但是在深度學習市場上,深度學習高度依賴於演算法,FPGA在這裡有一定的用武之地,而且計算架構可重構特性也能滿足用戶對深度學習應用的需求。此外,FPGA和異構計算的關係也密不可分,英特爾也正是看中了Altera在深度學習和異構計算上的優勢,才最終下手將其收入囊中。
收購Mobileye:進入自動駕駛市場
至於收購Mobileye,就更顯得理所應當了。Mobileye是來自于以色列的創新公司,早期Mobileye為特斯拉提供車載智慧駕駛模組,並且實現了特斯拉的半自動化駕駛功能。業內一度將Mobileye看作是英偉達的競爭對手。不過Mobileye存在自己的缺陷,那就是晶片設計能力弱。
Mobileye EyeQ4產品架構圖,實際上也是利用深度學習來實現自動駕駛功能。
作為一個創業型公司,Mobileye之前沒有晶片設計經驗,其2016年發佈的EyeQ5晶片選擇了意法半導體作為製造的合作夥伴,並且出貨時間定在了2020年。這樣的行為讓業內不少人感到震驚:沒有產品,依靠PPT就開發佈會,這並不是晶片行業的行規。
Mobileye設計的EyeQ5晶片在2020年可能實現4~5級別的自動駕駛,不過工藝等問題還是最大的桎梏。
從這一點來說,Mobileye本身需要將自己的演算法和資料更好的和硬體結合。在這一點上,英特爾恰好能給予其這樣的支持,英特爾擁有深厚的晶片設計功力和獨步業內的製造能力,能夠很好地進行演算法和晶片的協同設計,這樣的強強聯合,英特爾獲得了進入自動駕駛市場的門票,Mobileye也加強了自身。
收購Nervana,掌控深度學習演算法
除了高達百億級別的大型收購合作外,英特爾還將目標瞄準了一些小型企業,比如Nervana,這家企業由三名神經學家創立,其主要研究的內容就是如何讓電腦更有效率地類比人腦的思維方式來進行深度學習計算,Nervana也曾指出GPU運行深度學習演算法實際上並非最高效率的做法,因為GPU還是面向圖形設計的,部分內容對神經網路來說不是必須的,甚至Nervana在考慮自行設計神經網路計算晶片來實現最高效能的計算。
收購Nervana後,英特爾擁有了現成的深度學習演算法。
這裡有一個小趣事:在英特爾向Nervana發出收購要約後,Nervana曾詢問英偉達是否願意並購自己,畢竟自家的深度學習軟體Neon也能夠非常高效地運行在GPU上。不過英偉達當時沒有對這項收購表現出興趣,直到英特爾和Nervana已經簽署協議後,英偉達才開始接觸Nervana,但是此時除非英偉達支付一筆賠償費用,否則Nervana和英特爾聯姻便成定局,所以最終還是英特爾搶先一步“抱得美人歸”。
通過多次收購,英特爾完成了由量變到質變的積累過程:從一個PC和製造行業的巨頭轉身進入高速發展的人工智慧行業,並直接切入到利潤最高和最有希望快速商業化的智慧駕駛市場。
經過多次收購,英特爾在人工智慧上的佈局逐漸完成。
在完成了大量道收購 後,英特爾在人工智慧方面已經有了一整套佈局,包括不同行業的解決方案、工具和平臺(包括Saffron、Movidius和Nervana等公司,以及英特爾的深度學習SDK)、英特爾的優化型開放框架(提供對Spark、Caffe、CNTK等深度學習框架的支援)、英特爾免費的庫/語言(比如英特爾數學核心函式程式庫、英特爾資料分析加速庫、英特爾Python發行版本等)、英特爾酷睿、Xeon和Xeon Phi、FPGA等產品的支援等。通過這些軟體和技術,英特爾能夠從軟體到硬體、從行業到個人、從學校到工廠,提供全面的人工智慧、深度學習解決方案。
雙“英”領銜,人工智慧未來更為精彩
從上文的介紹可以看出,英特爾和英偉達兩個技術巨頭,在人工智慧市場上紛紛佈局,希望在未來能夠獲得更大的份額和利益。英偉達的風格比較自我,通過搭建自家的軟硬體生態,不斷涉足更多領域來擴大市場影響力並獲取利潤。英特爾則利用並購快速進入市場,並形成完整的產業佈局。在未來很長一段時間,隨著人工智慧技術的發展,英偉達和英特爾還將帶來更多新鮮的技術和全新的體驗。本刊也會在往後就它們在人工智慧領域上的具體產品、技術進行深度解析,盡請關注。