通過這套對抗性演算法 機器人竟然也玩起了“左右互搏術”
看過《神雕俠侶》的人都知道,周伯通發明創造的那套“左右互搏術”除了周伯通本人,只有小龍女能玩得溜溜的。不過現在穀歌和卡內基梅隆大學的開發者研發出了一套機器學習演算法,讓機器人通過“左右互搏”搶東西來提升抓取的穩定性。
說起來這套機器學習演算法的原理,其實就跟我們小時候搶兄弟姐妹的玩具零食一樣,雖然不會次次都贏,但通過對弈次數的增加,不斷瞭解對方的套路和章法。從而來提供成功率,這當然是我們人類與生俱來的學習能力。而現在,機器人就要通過載入這套演算法來學習如何提升抓取物體的穩定性。
機器人一隻機械手臂抓著一個圓柱形物體,而另一隻機械手臂去搶。在沒有載入這套演算法前,基本上去搶東西的那只手可以非常輕鬆的就把東西給搶過來,但載入了演算法並通過幾次訓練後,進攻的那只機械手臂居然失敗了,而防守方則可以更牢固的抓住東西不被進攻方所搶奪。而且,經過鍛煉後的那只機械手臂,在獨立工作時也能夠更穩定的抓住物體了。
據負責該專案的Lerrel Pinto博士表示,這種對抗性演算法有助於機器人更好的實現自主學習,同時可以快速適應到新的工作環境中去。而這種採用了深層學習技術的洞察力演算法,隨著時間的推移,機器人將會變得越來越聰明,但他們會不會有一天開始研究起人類的缺點,從而對抗人類呢?