雷鋒網按:2016是人工智慧爆發的一年,各種層出不窮的新技術、新概念讓人眼花繚亂。很多人都分不清人工智慧(Artificial Intelligence,簡稱AI)、機器學習(Machine Learning,簡稱ML)以及深度學習(Deep Learning,簡稱DL)概念之間的不同。本文重點解釋了機器學習和深度學習的差別。
本文作者為Intuition Machine聯合創始人Carlos Perez ,由雷鋒網編譯,未經允許不可轉載。
由於AI的大熱,媒體上關於AI的文章狂轟亂炸,人工智慧似乎已經成為遊戲的改變者,企業們也紛紛下注。對於AI領域的從業者來說,人工智慧、機器學習和深度學習之間的差別應該非常清楚。
人工智慧是一個大概念,從有效的老式人工智慧(GOFAI)到聯結主義結構,無所不包。而機器學習則是人工智慧領域的一個小分支,如果說AI是一個合集,那麼ML就是AI的子集。
任何通過資料訓練的學習演算法的相關研究都屬於機器學習,包括很多已經發展多年的技術,比如線性回歸(Linear Regression)、K均值(K-means,基於原型的目標函數聚類方法)、決策樹(Decision Trees,運用概率分析的一種圖解法)、隨機森林(Random Forest,運用概率分析的一種圖解法)、PCA(Principal Component Analysis,主成分分析)、SVM(Support Vector Machine,支持向量機)以及ANN(Artificial Neural Networks,人工神經網路)。而人工神經網路則是深度學習的起源。
一些之前接觸過人工神經網路的機器學習從業者對深度學習的第一印象很可能是:這不過就是多層結構的人工神經網路而已。此外,深度學習成功的主要原因是大量可用的資料以及像GPU這樣更強大的計算引擎的出現。這當然是事實,深度學習的出現基本要歸因於這兩方面的進展。但是,如果就此下結論說深度學習不過是比支持向量機或者決策樹更好的演算法而已,那就真的是一葉障目,不見泰山了。
借用Andreesen的話“軟體正在佔領全世界”,那麼深度學習就正在取代機器學習。
兩篇來自不同機器學習領域的從業者很好的解釋了為什麼深度學習正在佔領全世界。神經語言程式學(NLP)的專家Chris Manning這樣形容“深度學習海嘯”:
深度學習的浪潮在幾年前就已經抵達計算語言學的海岸,但是2015似乎是這場海嘯全面衝擊各大自然語言處理(NLP)會議的一年。一些專家預言,最終的衝擊將會更大。
Nicholas Paragios則寫了一篇名為“電腦視覺研究:大蕭條”的文章,以下是文章節選:
在高度複雜以及很大程度由圖片的自由度決定的問題上,深度學習一旦被賦予大量被標記的資料以及不可想像(直到最近)的計算能力,就能解決所有的電腦視覺問題。如果是這樣的話,那麼深度學習佔領業界,電腦視覺研究成為邊緣學科並走上電腦圖形的老路(學術研究的活躍度和數量)將只是時間問題。
這兩篇文章都強調了深度學習相對機器學習是有顛覆性的意義的。當然,深度學習在商用領域也具備同樣的顛覆性。但是讓人震驚和困惑的是,就連Gartner也沒能分清機器學習和深度學習之間的差別。這裡是Gartner於2016年8月份發佈的發展規律週期圖(Hyper Cycle),深度學習甚至沒有被提及:
儘管被Gartner忽視了,深度學習依然持續火熱。目前對深度學習的炒作主要是:我們已經擁有了可以商用的機器,只要給它們足夠多的資料和足夠長的時間,它們就能夠自己學習。這要麼是誇大了深度學習的現有技術水準,要麼就是將深度學習的實踐過於簡化了。在過去的幾年裡,深度學習產生了大量的想法和技術,這些在以前要麼是未知的,要麼是站不住腳的。起初,這些概念是碎片化而且毫無關聯的,但是隨著時間的推移,大量的模式和方法開始湧現,深度學習設計模式這一領域也變得熱鬧起來。
今天的深度學習不僅僅是具備多層架構的感知器,而是一系列能夠用來構建可組合可微分的體系結構的技術和方法。
這些具有超強能力的機器學習系統只不過是我們目前所能看到的冰山一角。關鍵在於,雖然深度學習目前看起來像點金術,但是總有一天我們會學會如何像操控化學一樣操控它。有了這個基礎,我們將能夠更好的預測機器學習未來所能具備的能力。
via
Medium
對深度學習感興趣的初學者,可以查看雷鋒網的另一篇報導《
AI 初學者入門指南:深度學習的五級分類
》。