Alphabet利用新演算法 讓AI擁有記憶去學習
對於人工智慧來說,雖然它們越來越像人的大腦了。但它們還有不及人類大腦的地方,比如說:記憶。人工智慧的神經網路通常需要學習它們需要知道的所有事情,但是它們的學習並不能像真正的大腦那樣建立在現有的經驗之上。Alphabet 的 DeepMind 團隊希望能解決這個問題,他們製作了一個演算法,讓神經網路能“記住”過去的知識並加以運用。這種方法類似于人類的思維活動,它甚至可以做到洞察人類思維的功能。
DeepMind 將這種演算法稱之為 “彈性權重鞏固”(Elastic Weight Consolidation,EWC)。一直以來,電腦程式從來都不會記得自己曾經做過什麼事情。DeepMind 決定改變電腦傳統的學習法則,讓程式在學習新任務時也不忘掉舊任務。這就要把相關資料一股腦地塞給電腦,讓電腦的深度神經元變得多才多藝。
目前的電腦程式遇到了一個很大的瓶頸——“災難性忘卻”。在輸入神經網路後,數位神經元會與輸出方案之間建立聯繫,而當它學習新事物時,神經網路不得不重新建立新的聯繫,同時還會覆蓋掉舊的聯繫。這樣的情況被稱之為 “災難性忘卻”(catastrophic forgetting),也就是俗稱的“學東忘西”。與深度神經網路相比,人類大腦的工作方式就大不相同。我們可以漸進式的學習,一次掌握一些技巧,在學習新技巧時,此前的經驗還能提高我們的學習效率。不過 “彈性權重鞏固”可以攻破“災難性忘卻”這個瓶頸,為了實驗“彈性權重鞏固”的可行性,DeepMind 還讓智慧程式不斷嘗試玩 Atari 遊戲,最後得出的結果令人滿意。
DeepMind 相信,未來這項研究結果能成為電腦程式通往靈活高效學習的敲門磚。