楊強教授PPT解密:如何在人工智慧浪潮中少走彎路|CCF—Gair
編者按:近兩年人工智慧技術的研究與應用驟然增速,產業界,無論是身經百戰的科技巨頭,抑或是默默無聞的中小企業,都想要抓住這一難得的機遇,在業內嶄露頭角。但是,如何將人工智慧與自身原始的商業模式相結合,實現產業創新,很多企業都還在“摸著石頭過河”,難免遇到迷茫期。
在2016 年GAIR大會上,楊強教授深入淺出地為大家分享了自己多年來的智慧與經驗總結——人工智慧要取得成功應當具備的五個必要條件,這五個條件將成為推動人工智慧長足發展的動力源泉。
楊強,香港科技大學電腦與工程系教授, IEEE Fellow,IAPR Fellow, AAAS Fellow 和ACM傑出科學家。,第四范式首席科學家、機器學習領域國際學術帶頭人,主要研究領域為機器學習、資料採擷和自動規劃。到目前為止,楊教授在學術研究中碩果累累,在人工智慧和資料採擷方面,已發表了超過了200篇的學術文章,還組織籌辦了多個人工智慧和資料採擷的國際會議。
當下人工智慧在圖像識別、語音辨識和大規模的產品推薦方面取得了巨大的成功,那麼人工智慧的成功應用究竟取決於哪些條件?
為什麼只在我們這個時代迎來了人工智慧發展的高峰期?
對於這兩個備受關注的問題,楊教授從人工智慧的科學與應用兩個方面著手,娓娓道來。
人工智慧的科學與應用——相輔相成
人工智慧技術的發展大體可以分為兩個方面:
人工智慧的科學與人工智慧的應用
。
從科學層面談及人工智慧要回歸到該研究領域最根本的問題:
機器能夠思維嗎?
這個問題最早起源于人工智慧之父圖靈,之後經過60多年的努力,電腦科學家及各行各業對人工智慧感興趣的人士都競相研發計算能力更強的電腦,彙聚更多的資料,提出更高級的演算法,致力於回答這個最基本、也是最重要的問題。
談到應用層面,除去人工智慧已經為我們的生活帶來的便利,我們更關心
它對人類未來生活將產生什麼樣的影響
。要將人工智慧技術成功地應用於商業領域,既要站在科學前沿,也要具備一定的商業頭腦,兩者兼備才能在商業浪潮中立於不敗之地。
人工智慧取得成功的五個必要條件
會上,楊教授言簡意賅為我們分享了決定
人工智慧成功的五個必要條件
:
清晰的目標(商業模式)
高品質的大資料 (持續回饋)
清晰的問題定義和領域邊界
懂人工智慧的跨界人才(擅長應用和演算法)
計算能力
首先,
要有 “清晰的目標”,即清晰的商業模式
,這就好比遊戲中明確規定何為贏,何為輸,延伸到人工智慧在商業領域的應用,即要確定明確的運行模式和運行目的。
其次,
高品質的大資料資源是人工智慧成功的核心條件
。楊教授特別強調,高品質的資料要求收集到的資料能夠具備持續性、回饋性,且回饋的方式與內容要與具體的演算法相匹配。有人會覺得,在某個領域擁有了幾千萬個資料樣本便具備從事人工智慧的條件了,楊教授認為,這種觀點是站不住腳的,原因如下:首先,已收集的資料樣本可能無法與某個特定的演算法相匹配;其次,所用到的演算法可能不具備可持續性;最後,得到的回饋方式與內容不一定與期望相符。
第三,
清晰的問題定義和領域邊界
。要求在應用人工智慧技術時要對所遇到的問題有清晰的理解與定義,就像下棋一樣,在有限定的領域裡完成特定的行為操作。
第四,
人工智慧成功的核心競爭力在於懂人工智慧的跨界人才(擅長應用和演算法)
,即我們需要一個既精通人工智慧,又在商界遊刃有餘的人才。當然,很多人會質疑:我們到哪裡去找這樣的人才?楊教授號召我們做生活中的有心人,善於關注身邊會學習的人,著重培養其跨領域才能,這樣的人才將具備把兩個看似不同的垂直領域聯繫在一起的能力,在未來能夠做出突出的成就。
最後,楊教授提出,
強大的計算能力是人工智慧技術在各領域成功應用的硬實力
。在計算能力方面,我們有雲計算、平行計算、GPU,這都為人工智慧的發展奠定了堅實的基礎。
人工智慧已經取得的成就——強化學習與遷移學習
此外,楊教授提到,人工智慧已經在機器學習領域已經取得了突出的成就,特別是在深度學習方面,此外,還特別強調了強化學習與遷移學習的應用前景。
強化學習
楊教授講到,
強化學習的優點在於它不僅能夠學習人的行為,而且能夠更好地使用延遲回饋功能
。以Google DeepMind採用的強化學習流程為例,我們可以將這個
流程圖
理解為一個電腦內部的表達形式,一個向量,這個向量與我們得到的回饋資訊相結合,將有助於改進我們採用的策略。流程圖中的策略,簡單來講,就是我們平常的行為規劃,工作規劃,就好比遊戲中的一個動作就對應一個策略,這個策略再返回來,產生一個新的介面,如此我們便能夠進行持續學習。在這個迴圈過程中,我們只有到最後才能夠獲得回饋,稱之為延遲的回饋。就好比我們投資一檔股票,過了很長時間才知道收益如何。
但是,這個迴圈暴露出強化學習的一個局限性:人們永遠無法準確定義這個策略裡的空間,我們稱之為“狀態空間”,即強化學習的結果具有不可預測性。說到這裡,楊教授以Google DeepMind的第二個目標——
端到端的深度學習
為例。當該有的狀態預先在學習器內表達好後,就形成了一種從輸入端到輸出端的端到端的深度學習模型,經過幾百次的訓練學習後,機器將能夠學會如何更好地玩一個遊戲。
以下各個圖對應不同遊戲的學習效果。圖中橫軸表示隨著遊戲輪數越來越多,機器的自學習效果不斷提升,直至達到上限。
遷移學習
遷移學習
是深度學習與強化學習的結合體,
能夠將適用於大資料的模型遷移到小資料上
,實現
個性化遷移
,這樣一來能夠避免
資料寡頭
的出現。
楊教授提出一點:
大資料設計出來的模型用於小資料上,它的副產品就是個性化。這就是遷移學習的目的。
運用遷移學習把在一個資料領域已經建立的非常好的模型,應用到另一個領域,這樣既節省了資源,又能夠節省時間,效果又好。
楊教授談到,我們人很自然就具備這種舉一反三的遷移能力,比如我們學會騎自行車後,學騎摩托車就很簡單了;會打羽毛球,再學打網球也就沒那麼難了。
在演講中,楊教授總結了
遷移學習的四種實現方式
,每一種方式都很直觀。
第一種為
樣本遷移
,就是在資料集(源領域)中找到與目標領域相似的資料,把這個資料放大多倍,與目標領域的資料進行匹配。樣本遷移的特點是:1)需要對不同例子加權;2)需要用資料進行訓練。
第二種為
特徵遷移
,就是通過觀察源領域圖像與目標域圖像之間的共同特徵,然後利用觀察所得的共同特徵在不同層級的特徵間進行自動遷移。
第三種為
模型遷移
,其原理時利用上千萬的圖像訓練一個圖像識別的系統,當我們遇到一個新的圖像領域,就不用再去找幾千萬個圖像來訓練了,可以原來的圖像識別系統遷移到新的領域,所以在新的領域只用幾萬張圖片同樣能夠獲取相同的效果。模型遷移的一個好處是我們可以區分,就是可以和深度學習結合起來,我們可以區分不同層次可遷移的度,相似度比較高的那些層次他們被遷移的可能性就大一些。
第四種為
關係遷移
,比如社會網路,社交網路之間的遷移。
遷移學習的最終目的就是實現AI for Everyone。
比如我們利用一個由訓練三萬個的對話模式獲得的大對話模型可以遷移到個人的小型對話中,這種基於強化學習所獲取的個性化效果非常具有實用性,因為我們不用繁瑣地問用戶很多同樣的問題。此外,
楊教授在會上曾提到一個願景——利用遷移學習,即使是自身沒有條件獲得大量訓練資料的小公司也可以按照自己的需要應用大公司訓練出來的模型,從而普及AI的應用,從而克服資料“寡頭”現象。
不論怎樣,遷移學習是一種極具潛力的解決方案,將在未來大顯身手。
運用“魔鏡對話系統”實例闡釋人工智慧成功的五個必要條件
此外,楊教授用一個
人工智慧技術應用的熱點
——
對話系統
,清晰地闡明上述五個條件對人工智慧技術發展所產生的推動性作用。
現有對話系統的應用原理
一般來講,市場上現有的對話系統可以分為兩類:
閒聊類與功能類
。
在上圖中,我們可以看到:60年代的Eliza與微軟的小冰屬於閒聊類對話系統,百度的小度與微軟的Cortana介乎閒聊類與功能類之間,Facebook的M與HKUST最新的Magic Mirror系統屬於功能類對話系統。楊教授講到,我們大家應該都有體驗,微軟小冰很幽默,但是也只能止於閒聊;功能類對話系統則給我們的生活帶來了很多便利,例如,我們打電話到酒店預定房間,在銀行辦理個人業務,不過,在一定程度上,目前的功能類對話系統依然存在一些不太便利的地方,例如,在使用過程中,我們要根據系統提醒依次按服務鍵,這可能導致用戶體驗下降。
從
技術層面上
進行分析,楊教授提到
對話系統可以大致分為兩種:基於原則的系統與基於學習的系統
。最早的對話系統是基於原則的,有很多專家來制定這些規則,其優點在於準確性高,但是卻難以擴展,與資料無關,對資料的靈敏度不高。此外,
基於原則的對話系統的由於無法擴展
,通常情況下不能應對不同的意外事件,所以現在
大家關注較多的是基於機器學習演算法研發的對話系統
。
三層結構演算法模型將為對話系統帶來革新
楊教授透露說,香港科技大學實驗室正在研究如何運用新技術來改進現有的對話系統。在大會上,楊教授向我們展示了
一個三明治式的三層結構演算法模型
:
第一層是我們熟知的
深度學習神經網路——遞迴深度神經網路(RNN)
第二層是
一個策略學習器——強化學習(RL)
第三層是
遷移學習(TL)
在演講中,楊教授特別強調了強化學習(RL)中最難的階段:人工智慧機器人只能部分觀察周圍的世界,研究者用一個奇怪的名字來描述這種現象——基於部分觀察的瑪律可夫決策過程。遷移學習(TL),正如在前面講到的,能夠將一個已經做好的模型遷移應用到一個新的領域中。
楊教授講到,希望利用這樣一個三層結構賦予對話系統以下功能,比如說閒聊、推薦、引導、提醒、學習,如果一個對話系統能夠具備這些功能,它就像一個真人一樣
。
但是,如何達到這個目的呢?
根據楊教授的觀點,首先,
對話系統應當具備基本的對話功能,即自然語言生成能力
,這種能力主要依賴
RNN
來實現。
其次,我們
需要一個策略
,用這個策略引導對話的物件來完成一個特定的任務,即
對話控制
,主要通過
RL
實現。
最後,
要實現個性化
,滿足使用者不同的需求指令,主要依靠
TL
實現。
為此,楊教授給我們提供了一個實例,香港科技大學現在和一個O2O的公司合作,用真是的資料訓練這個對話系統,
上圖
中綠色代表用戶所提的問題,白色代表系統的回答,該系統的中文名字叫做“
魔鏡系統
”,就是童話故事白雪公主裡面的魔鏡,當然這是一個好的魔鏡。
“魔鏡系統”是個性化學習的一個實例。
在這個系統中,我們是把整個對話系統放置在一個機器人裡面,讓機器人通過語音的方式與使用者對答,實際上,這個系統可以在手機上與人進行交流。楊教授的研究團隊將“魔鏡系統”與大家熟悉的一些對話系統作對比,
下圖
中,綠色代表用戶的問題,黃色是小冰的回答,可以看到相比之下,小冰的回答多富有調侃性,準確度很低,而之前“魔鏡系統”的回答更容易滿足用戶的需求。此外,我們還可以看到siri(灰色)的回答很多都是“抱歉沒有找到匹配”,因為siri是基於搜索的對話系統。
楊教授表示,他們之所以對這種對話系統進行研究,歸根到底是對背後的系統感興趣,即我們在剛開始講到的——
人工智慧成功的五個必備條件
。
在對該對話系統背後的原理進行剖析,可以發現,其研究團隊具有很明確的目標,有很好的回饋,有不斷到來的資料,有跨界人才,此外,和O2O公司有聯絡。
談及清晰的問題定義與領域邊界這個必要條件,楊教授表示,我們不一定像在下圍棋一樣,要確定明確的邊界,在這裡我們可以考慮說當我們現在的談話進行到這裡時,到底離我們的目標還有多遠,這就好像在下棋裡面一樣,我們對當前的盤面有一個估算,同時我們可以接著往下問不同的問題,就像我們下面要下的棋子一樣,所以對話系統的問題定義與領域邊界問題實質上與Alphago的思維很相像。
楊教授講到,
同深度學習、強化學習及遷移學習一樣,這個三層結構演算法模型也具有通用性
。比如楊教授的學生就把這種模型應用到大家公認的很難的領域中——預測股市走勢。
下圖
所示為A股裡面的某個股票,用過去十年的資料訓練該模型。首先,運用資料之間的連接,產生不同的狀態,讓各個狀態之間能夠互相遷移。其次,不同狀態之間將發生變化,我們運用用一個強化學習器模擬這種變化。最後。我們發現深度學習的隱含層裡面會自動產生幾百個狀態,基本就能夠對這十年來的經濟狀況做出一個很完善的總結。所以,運用這種三層結構演算法模型可以很好地對股市走勢作出預測,對此,我們也做了一些相關測試。
楊教授表示,這個例子只是在金融領域的一個小小的試驗。不過,一旦我們對一個領域有了透徹的瞭解,並掌握更多的高品質資料,就可以將人工智慧技術遷移到這個領域來,在應用過程中對所遇到的問題作清晰的定義,最終能夠實現通用型人工智慧的目的。
總結
在演講接近尾聲時,楊教授對所講的內容做出總結:通過同大家分享穀歌DeepMind的應用實例,講解強化遷移學習和三層結構演算法模型,及個性化學習,最終我們都要回歸到
人工智慧成功的五個必要條件
——清晰的商業模式(明確的目標)、高品質的大資料、清晰的問題定義和領域邊界、懂人工智慧的跨界人才及計算能力,這五個條件相互影響,缺一不可,是人工智慧技術長足發展的動力機。
2016 GAIR峰會連結
本文由雷鋒網獨家編寫,未經許可拒絕轉載!