淘新聞

初學者 AI 入門指南:深度學習的五級分類

編者按:目前 AI 被籠統劃分為“弱人工智慧”、“強人工智慧”、“超人工智慧”三個類別。甚至在很多業內專家(比如洪小文)眼中,只有“強”、“弱”AI 的區別,因為“超人工智慧”離我們實在還很遠,難以捉摸。這樣的籠統分類顯然不利於大眾對於各項 AI 技術進行認識和理解。因此,一些專家開始提出基於技術難度和 AI 智慧水準的分類、分級方法。其中,美國學者 Arend Hintze 提出了對 AI 的四級分類, 而最近,Intuition Machine 聯合創始人 Carlos Perez 又提出了針對深度學習的五級分類。這些分類方法對各層次 AI 技術進行了簡單的歸類,有助於初學者更好地認識 AI 。

上個月,密西根州立大學副教授 Arend Hintze 發表了一篇很有價值的短文章《理解 AI 的四種類別:從回應式機器到有自我意識的存在》( “Understanding the four types of AI, from reactive robots to self-aware beings” )。文中,他提出了對 AI 的四級分類:

響應式

這是最基本的 AI 類型,無法產生記憶,不能利用過去的經驗做決策。它們是“專才”而非“通才”,為完成特定任務所設計,不能勝任其他任務。

有限記憶

當前行為能夠參考剛剛發生的事件。但記憶是暫態的——無法用於未來決策。

心智理論( Theory of mind)

這是一個心理學術語,意思是能根據他人行為,推導、並理解他們的想法和動機。這一類型的 AI 能夠歸納出周圍環境、和與之交互的其他代理的“表徵”( representations,AI 術語,詳見“表示學習”)。

自我意識

AI 的終極課題。目前對於它的描述大都是猜想。

對此,AI 專家 Carlos Perez 表示,他喜歡這個四分類法遠遠超過目前廣泛使用的“強人工智慧 vs 弱人工智慧”二分類法(ps:或者再加上“超人工智慧”成為第三個類別)。Arend Hintze 的方法把弱 AI 分為三個類別(回應式,有限記憶,心智理論),這給了我們更多概念,來區分不同的 AI 應用。但 Carlos Perez 又評論道,該分類法似乎來自於 “GOFAI” 思路(老式 AI),潛臺詞是它已經過時了;另外,從有限記憶、能夠使用部分過去記憶做決策到心智理論,這步子邁得太大了。

於是,Carlos Perez 提出了他自己的 AI 分類方式,按能力把 AI 劃分為五個級別。他表示,

該分類法主要針對深度學習

,希望對 AI 從業者來說更細緻、更有用。它能幫我們看清楚 AI 目前在哪個階段,以及將來會走向何方。

Perez 表示:“對當前 AI 技術進行評估,我們缺少一個好的概念框架。這可能只是由於大多數 AI 評論人無法跟上最新的深度學習進展——需要讀的東西太多,而且最新發現不停刷新我們現在對 AI 的理解。”

我們來看看 Perez 針對深度學習能力的 AI 分類:

1. 只能分類的系統(ANNs/DL) Classification Only

該級別包含全連接神經網路( fully connected neural network ,FCN),卷積神經網路(convolution network,CNN)和它們之間的各種組合。這些系統把一個高維度向量作為輸入,得到單個結果,一般是對輸入向量的分類。

你可以把這些系統看成無狀態函數,意味著它們的行為只是一個針對當前輸入的函數。一個熱門研究領域——生成模型,就屬於該類別。簡單來講,這些系統憑它們自己是十分強大的。

2. 使用記憶分類的系統 Classification with Memory (CM)

這個級別包含 “C 層”網路中整合的記憶因素。LSTM 就是一個例子:記憶單位嵌入在 LSTM 節點中。其它類似的變形還有,神經圖靈機器 (NMT) 和 DeepMind 的可微分神經電腦(DNC)。在對行為進行計算時,這些系統會維持狀態恒定。

3. 使用知識分類的系統 Classification with Knowledge (CK)

該級別與 CM 有些相似。但 C 層網路能獲取的資訊不是原始記憶體,而是符號化的知識庫(symbolic knowledge base)。雷鋒網獲知,事實上 Carlos Perez 就發現了三種符號化整合:1. 轉移學習方式( transfer learning approach);2. 自上而下方式 ;3. 自下而上方式。第一種方式用一個符號化系統作為正則化矩陣(regularizer)。第二種方式在神經表徵底層的最上層加入了符號化元素。第三種方式跟這相反,C 層網路直接與符號化知識庫關聯。

4. 使用有限知識的分類 Classification with Imperfect Knowledge (CIK)

在這個級別,系統直接建立在 CK 之上,但是,它已能夠使用不完美的資訊做推理。這類系統的代表是 Alpha Go。只是 Alpha Go 採用的不是 CK 而是 CM 級別的能力。正如 Alpha Go,這類系統能通過與自身的對抗模擬來訓練自己。

5. 能使用有限知識協作分類的系統 Collaborative Classification with Imperfect Knowledge (CCIK)

這個級別和 Arend Hintze 的“心智理論”類別十分近似,多個代理神經網路聯合起來解決問題。這些系統被設計來完成多項目標。我們其實可以在對抗網路中運行它的原始版本:與判別器和生成網路一起學習歸納。在博弈論驅動的、能戰略戰術性解決多重問題的網路上應用該概念,就能得到高度靈活的系統。但是,我們現在還達不到這個水準,前面那些級別仍需要很多研究來完善。

Perez 五級分類法的根據:

每一層級別,都帶來了上個級別沒有的新能力。

比方說,C 層系統只能預測反因果關係(anti-causal relationships)。 CM 級別的系統能完成不錯的翻譯。CIK 級別系統能玩戰略遊戲。

我們可以看出,除了沒有“自我意識”級別,這個分類法和 Hinzte 四級分類高度相似。在這些“基礎”級別全部達到之前,Carlos Perez 不準備探討自我意識。這個分類同樣沒有提到零樣本學習(zero-shot learning)、一步學習(one-shot learning)或者無監督學習。據雷鋒網所知,後者仍然是 AI 基礎挑戰之一。正如 大牛 Yann LeCun 所形容:

“假設機器學習是一個蛋糕,強化學習是蛋糕上的一粒櫻桃,監督學習是外面的一層糖衣,無監督學習則是蛋糕糕體。我們知道怎麼做糖衣和櫻桃,但不知道怎麼把糕體做出來。”

在最近的演講裡,Yann LeCun 開始用預測學習(predictive learning)來替代無監督學習。這是一個很有意思的轉變:它展示出 LeCun 在如何做蛋糕這個問題上,觀點發生了微妙變化。在他眼裡,這是 AI 技術大幅進步所必需的基礎。換句話說,在建設好預測學習的地基之前,在現有監督學習的基礎上加入更多記憶、知識庫、協作代理這些能力會十分困難。

雷鋒網獲知,在最近的 NIPS 2016 大會上,LeCun 展示了這幅 PPT:

這列出了 AI 進步的主要障礙:

機器需要學習世界運作的方式

AI 要學習海量背景知識

機器需要能夠感知環境的狀況

機器需要更新並記憶環境的狀況

機器需要學習和計畫

智慧和常識等於:感知+預測模型+記憶+推理和計畫

這些能力在反饋回路裡用到時,都利用了加速器技術。我們其實在現在的研究中看到過這類元學習(meta-learning)或是學習優化(learning to optimize)。元學習技術帶來的主要啟示是:

當我們能訓練機器找出用其它方法找不出的解決方案,研究方法會變得更強大。

這就是為什麼,即便深度學習研究有許多難題,我們也無法確定技術進步的速度。但在預測學習領域發生重大突破之前,Perez 的五級分類法應該已經夠用了。至於 AI 業內人士如何看待這個新提出的分類法,雷鋒網會繼續關注。

via 

kdnuggets