淘新聞

《機器學習》作者Tom Mitchell:人工智慧如何向人類大腦學習 | GMIC 2017

雷鋒網按:4月27日,GMIC 2017(全球移動互聯網大會)北京站開幕。內基梅隆大學電腦科學學院機器學習系主任Tom Mitchell發表了“突破人類和機器的邊界”的主題演講。Tom Mitchell認為,通過對人類大腦的模仿,電腦在變得越來越強。隨著機器智慧和腦科學的進一步發展,未來兩個學科之間應該有更多的交集,並互相學習和借鑒。

Tom Mitchell:卡內基梅隆大學電腦科學學院機器學習系主任、教授,美國工程院院士,美國科學進展學會(AAAS)成員,人工智慧進展學會(AAAI)成員,美國《Machine Leaming》雜誌、國際機器學習年度會議(ICML)的創始人。他在機器學習、人工智慧、認知神經科學等領域卓有建樹,撰寫了機器學習方面最早的教科書之一《機器學習》,是機器學習領域的著名學者。

以下是演講全文,雷鋒網做了不改變原意的整理:

人工智慧與腦科學的進展

今天在這裡,我想和大家探討一個問題,那就是我們的智慧如何從物理材料中實現突破,這是科學界還未解答的問題。目前有兩種研究途徑,首先是研究大腦,因為大腦是有智慧的,第二是努力打造一種具有智慧的機器。這是兩種學習智慧的方法,已經進行了很長時間了。

我今天想說的是,這兩個領域相互之間沒有交集,每個領域的專家對另外一個領域都不太瞭解,我們需要投入更多的資源來進行兩者之間的交叉研究。首先講的是第一點,這兩個研究領域在過去十年裡面取得了很大的進展;第二點,我們現在已經對兩個維度都進行相應的實例研究,兩者之間的確出現了一些交集,可以互相學習和借鑒。

所以我會對這方面進行一些探討,希望進一步啟動兩者之間的交集。首先可以看一下,我們的人工智慧在過去的十幾年裡取得了重大進展,最近人工智慧已經戰勝了人類圍棋的冠軍,而且國際象棋、德州撲克也已經被人工智慧攻下,現在我們看到的則是無人駕駛汽車,比如Uber就在進行這樣的測試。

在過去的十年裡,電腦視覺技術的進展很快,機器識別的準確率從過去的60%上升到95%左右。在語音方面也實現了突破,去年10月,微軟的對話語音辨識技術在產業標準Switchboard語音辨識基準測試中實現了詞錯率(word error rate, 簡稱WER)低至5.9%的突破 ,創造了當時該領域內錯誤率的最低紀錄。

比如前面講到了下圍棋、下象棋,人工智慧在這一領域突破非常快,背後主要是依靠深層次的機器學習。另外我們在腦科學方面的發展也非常迅猛,在過去十幾年的時間裡,有很多先進的技術和設備,使得我們可以採用無創或者微創的方法進入到人的大腦,進行毫米級地觀察,而且在毫秒內就可以對幾千張影像進行分析,觀察人腦的活性。此外,動物大腦的研究更加令人歡心鼓舞,通過基因方面的研究,在基因上進行相應的工程,對老鼠和其他動物相應的神經元進行修飾、改變,這樣可以更好的對人的神經活動進行一些管理和控制。

通過這樣一些腦科學的發展,腦科學領域的一些理論和假設都取得了突破。比如老鼠在一個迷宮中行走的時候,老鼠對自己在迷宮中的位置的感覺到底是怎樣的,這就可以通過觀測它的神經元放電來找到。不同的情況下,大腦各個區會域進行相應的振盪,因此可以在不同的時間點進行觀測,當人們在社交的時候,大腦當中管社交的部分會得到同步的啟動,不過有自閉症的人和正常人的狀況也不一樣。總之,無論是人工智慧還是腦科學,都取得了令人矚目的巨大進展。

人工智慧與腦科學的結合

所以就出現了這樣一個問題:為什麼不將兩者結合起來呢?在研究方面,無論時腦科學還是人工智慧都在進行交叉的研究。首先是電腦視覺,神經網路的確使得電腦的視覺發生革命性的改變,這樣的一個神經網路,可以用來預測人腦當中的神經元的活動,包括它的視覺皮層相應的活動,這是一個深層次的神經網路。我們可以來看一些細節,左上方是單個神經網路當中的單元,通過輸入輸出可以看到相關的情況。我們可以對它的輸入進行研究,觀察它到底是怎樣的組合,右下圖展現的是這些單個神經元組成的網路,一個輸出成為另外一個輸入的情況,我們可以對這樣深層次的網路進行訓練,比如把輸入的影像通過輸出展現出這個影像到底是什麼,然後進行相應的深度學習。

這個時候我們就可以對網路當中滯後的階段進行探測,看一下成為條件的時候它是怎麼編碼的。在2014年的時候,有人做了一些實驗,他們訓練了不同的網路,在訓練了這些神經網路之後,把同樣的影像給這些神經網路看,通過FMI的掃描器,觀察人的大腦當中相應的神經活動,來更好地進行預測,這是令人稱奇的的結果。現在人工的神經網路可以被我們用來訓練,做一些相應的預測,也就是說我們現在可以建立一種橋樑,對大腦當中的腦神經的活動進行預測,這樣就打開了無限的可能,可以回答很多有趣的問題。

比如人的視覺到底是怎樣形成的,以及可以用怎樣的設備設計更好的人工神經網路,説明我們做這樣的預測。一層一層進行輸入、輸出,這樣可以進一步推動人工的神經網路。我們知道大腦當中的確是不一樣的,大腦當中是有前輸和後輸的,在這個橋樑當中可以進行研究,人工的大腦和人的大腦到底有什麼區別,然後相互借鑒、促進。

這裡有另外一個例子,也是來自於最近的一個研究,是自然語言處理領域的研究成果,那就是穀歌的自動翻譯系統的能力得到了很大的提升,比之前更精確了,這是為什麼呢?主要是深層次的神經網路,更可能是由於網路裡有一些儲存。通過對大腦的研究,我們觀測大腦怎樣用神經活動來解釋不同單詞相應的詞義,這些詞義給了我們更好的回答方式。對這些細節進行研究,我們會產生一種模型或者理論,來説明我們對大腦的活動進行預測,通過這樣一個模型結構,來對應任何輸入。

比如說電話,首先這個模型產生一個代碼,用它預測神經活動,大腦當中有兩萬個不同的位置被預測出來。然後進一步通過向量來進行預測,比如這裡是芹菜和飛機的兩個向量,兩個向量的特徵都和相應的詞對應。對應芹菜可以看到和芹菜相關聯的字數,口味是和芹菜相應的一個關聯度;對飛機來說,則會出現很多的動詞,可以看到相關的一些詞就出現了。

通過這樣的一些模型當中的編碼,可以很好的複現一些皮層當中出現的詞,我們對模型進行訓練。我們看到在下面對任何詞的神經活動,比如芹菜,把這些語義的特徵組合起來,通過模型的學習,把這些特徵進行關聯,可以發現,“吃”這個詞和芹菜這個詞的關聯度是最高的。通過這樣的研究很有意義,給到一個新詞,比如說之前沒有訓練過,在對它的預測分析分析當中我們發現,在83%的情況下有兩個新的詞,哪個是第一關聯,哪個是第二關聯,有50%的可能性是正確的,有的詞從來沒有出現過,也會有很高的識別率,也就是說,神經的活動對詞義的表達,是用了我們向量表達法來進行詞義解釋。這是技術的表達,在人工智慧和人腦當中存在一個橋樑的關係。

第三個例子是我們講的強化學習,這個是現在非常流行的,比如相關的培訓當中會出現一些強化學習的演算法。很多時候對動物的一些獎勵學習,也屬於強化學習的方式。比如發一些糖給猴子吃,猴子認為這是獎勵,所以大腦裡有放電的現象,然後就可以找到對應的神經元。

這樣的一種神經元放電代表什麼呢?可能對這個獎勵,也就是這個糖有所感應,所以放電了。通過這樣的實驗來訓練這些猴子,給到猴子糖以後,後一秒就開始閃光,這個時候我們可以看到的情況就是給了猴子糖以後,猴子的神經元沒有任何反應,而是當閃光以後,猴子的神經元才放電,說明猴子的神經元並不是因為給了糖才反應,而是對獎勵這個事情本身放電,這是很酷的研究。

還有一種情況,沒有給糖,只是閃光,猴子怎麼反應?沒有給糖,沒有任何獎勵,這個神經元就會怎麼樣來表達呢?閃光之後,猴子發現並沒有給糖,這是一種抑鬱,而不是獎勵了,這是和強化學習直接相關的。這樣的一個情況,很好地解釋了我們看到的猴子的神經元的表現,因此在人工智慧演算法和我們人的大腦之間或者動物的大腦之間,有這樣一種橋樑的關係,因此強化學習的演算法對機器人的控制是可以用的,比如可以用於打敗人類冠軍的Alpha Go的訓練。因此通過這樣的一些對大腦行為的觀測和檢測可以説明我們進行人工神經網路的訓練。

通過這些方式,我們剛才也講了向量的應用和強化學習的方式,這樣一些人工智慧的演算法,在我們的大腦當中,觀測到了神經元活動的關聯,因此我覺得,現在人的腦科學和人工智慧方面到了可以有更多交集的好時機,我們應該在人工智慧和腦科學之間搭建更多的橋樑。

我前面也舉出了一些實例,希望大家可以進一步研究,儘管人的大腦不是由矽組成的電腦,但是有可能任何產生智慧的物理方式都是有一些資訊的約束條件的,這樣的一種結構可以進行深層次的學習。我們可以從人工智慧和人腦當中找到更多的答案幫助推進科學的進步,再次感謝各位。

雷鋒網相關文章:《

吳甘沙對話Tom Mitchell:人工智慧如何顛覆我們的城市 | GMIC 2017