用《塞爾達:野之息》調教AI 這群科學家是認真的!
自AlphaGO圍棋大戰後,不少人已經瞭解到人工智慧AI和深度學習的威力。 當它們有大量的樣本、資料支援的狀態下,在遊戲上要戰勝專業人士也是可能的事。同時,人工智慧能夠通過每次學習來提升相應的能力,達到所需的研究目的。
為此,有不少人工智慧研究團隊選擇通過“玩遊戲”的方式,讓人工智慧進行深度學習。但他們這次不是要和棋牌界的大神們比拼,而是要去攻略電子遊戲。
根據彭博社的報導,麻省理工大學的人工智慧研究團隊,就在今年2月份發佈了相關的論文。在測試過程中,他們讓AI去攻略一些較早期的遊戲,例如超級馬里奧、太空侵略者,又或者是憤怒的小鳥等簡單的手機遊戲。研究者用這種方式,來提升人工智慧的能力。 研究者Vlad Firoiu表示,遊戲能夠讓AI面對一些接近現實的難題。通過攻略遊戲中的成千上萬次運算,AI在應付不確定狀況的能力上會有提升,能解決的也會變得更多。只有這樣循序漸進地做下去,AI才能夠達到你所需要的層面。 當然,AI運算性能提升是一個方面。通過攻略遊戲這個行為,AI能夠產生大量的資料,這些對於其他問題的研究也有作用。
DeepMind Technologies的首席執行官Demis Hassabis在接受彭博社訪問的時候表示: AI攻略遊戲這個行為,能夠產生大量的資料。同時,遊戲本身就是一個模擬環境,無需要人為建立。這就為AI研究提供了環境。不過,現時的演算法還未能完全支援這種研究。這還需要再進一步的提升。 現在有不少遊戲是以真實環境做模擬的。這裡包括之前推出的GTA5,還有最近廣受好評的大作《塞爾達傳說:荒野之息》,這些真實程度極高的遊戲。 AI在遊戲世界中運作,要做的並不是簡單的預判和策略謀劃,而是要針對遊戲中各個細節去攻略,才能完成。這裡需要用人一樣的思考模式去運算,工程量很大。所以,研究者目前都是以遞進的方式來進行研究,遊戲也從簡單到深入開始變化。
當然,也會有團隊根據自己所需要的目標,來選擇研究的遊戲。涉足無人駕駛的Uber Technologies,就選擇了GTA5作為攻略對象。遊戲中的駕駛資料,有助於行車研究。而在遊戲中研究行車,絕對比讓AI在路上開要安全得多。 總的來說,選擇用遊戲來輔助研究,讓AI和專業人士競技,這一些都是以資料為最主要的著眼點。通過這種方法獲得的資料,能夠説明人類用AI去解決現實問題。
微軟的首席執行官Satya Nadella在去年9月份的開發者大會上提出這個觀點:這些研究的目標,並不是要讓AI來擊敗人類。我們要做的,是通過這些實驗讓AI進步,以幫助我們去解決目前最迫切的問題。 在未來,這種研究將會越來越普遍。有樂觀主義者預測,未來人類可能會通過遊戲和AI結合開發出的新產品,可以幫助人類去對抗疾病。