當年和圍棋世界冠軍李世石一戰成名的AlphaGo又回來了,帶著大師的名頭,和一身的新本領。閉關修行後的AlphaGo棋力大漲,化身網路棋手“Master”,一舉挫敗當今棋壇60名頂尖高手,氣吞萬里如虎,無人能擋。
鑒於可能還有不少網友對這次AlphaGo重出江湖的來龍去脈不太熟悉,只是從間或的報導中瞭解了部分細節,IT之家這裡不妨為大家先簡單梳理一下。
事情起源於2016年12月29日,一個名為“Master(大師)”的帳號出現在弈城圍棋網上,號稱韓國九段“網路棋手”,不斷向其他九段的高手發起挑戰。不過,這個名不見經傳的棋手一開始並沒有獲得高手們的回應,也在情理之中。
由於未能獲得直接和頂級高手過招的機會,Master開始改變策略,從一些段數稍低一些的對手打起,以此來引起注意。結果也正如其所願,Master輕鬆掃滅各路棋手,其中包括謝爾豪四段、孟泰齡六段、於之瑩五段等,首日打出了一波10:0的小高☆禁☆潮。對手雖不是世界頂級,但也畢竟有足夠的分量,於是Master引起了棋手們的注意。
30日,剛剛展露頭角的Master再次上線,這一天它迎來了10位對手,然而這10位最終都成為它刷成績的“棋子”,其中甚至包括當今韓國圍棋屆第一人樸廷桓,這一戰讓Master名聲大躁,同時,成績刷新為20:00。
31日,各路高手被Master的戰績吸引過來,紛紛與之對戰,其中包括新科百靈杯冠軍陳耀燁九段、羋昱廷九段、唐韋星九段,以及此前戰敗的樸廷桓。但高手們連番轟炸似乎並沒有對劇情的走向產生影響。當天,Master的戰績刷新為30:00。似乎是有組織有預謀的,一天10盤,不多不少,這時候,大家都開始猜測這位神秘的Master究竟是何方神聖?
跨年之後,Master開始轉戰另一個平臺野狐網。1月1日,它的對手更加重量級,但這些都無法終止它連勝的紀錄。而到了1月3日,Master已經獲得了50場連勝,這第50盤的對手正是當今世界排名第一的柯潔,結果是
柯潔中盤投子認輸
。
1月4日,神秘選手Master在第54場對局中迎來了“棋聖”聶衛平,引發外界極大的關注。而這一次,
棋聖也沒能阻止Master
,雙方交戰至253手,聶衛平執白7目半負Master。而Master在對局結束後打出繁體字“謝謝聶老師”。
到這裡,看起來已經沒有人能夠阻擋Master的腳步了,相比這個,大家更關心的是Master真實的身份,當時聲音最多的是“Master”其實就是AlphaGo的馬甲,不少與之對局的棋手也堅稱此觀點。當然,現在我們已經知道,“Master”就是AlphaGo的升級版,那個4:1擊敗過世界冠軍的機器人。
整個事件是不是頗有一番武俠小說的味道?“絕世高手化名街頭豎子,六十回合掃遍天下豪傑”……60回合,要知道這可不比當年對戰李世石的4:1,60場不敗,說明AlphaGo確實內力大漲,那麼究竟漲在哪裡了?
這目前還沒有詳細的答案,但我們可根據AlphaGo分析一番。AlphaGo背後的核心技術是使用了兩種深度學習神經網路,即
“策略網路”和“價值網路”。
AlphaGo採用“蒙特卡洛樹搜索”演算法將“策略網路”和“價值網路”綜合起來決定走哪一步。
稍微深入一些,其實AI下圍棋這件事,本質問題就是從一個19*19的空棋盤開始,每走一步,將當前的棋局看做一個盤面,在這個盤面中,考慮所有合法的落子點,然後從這些點中搜索出最佳的節點,每一個節點帶有兩個參數:訪問次數和品質度。其中品質度和當前落子點可能的獲勝概率有關,背後有複雜的演算法。
可以想像,從開始到下完,AI會形成一個非常龐大的樹狀搜索網路,
這是AI下圍棋和象棋相比難度差異巨大的關鍵所在。
當然,整個網路的寬度(落子的節點數)和深度(一步一步往下走的盤面數)十分龐大,AI在思考的時候不能遍歷完全,這就需要“策略網路”和“價值網路”來減少遍歷的寬度和深度,只針對最適合的幾個節點進行考慮。
▲象棋遍歷網路
▲圍棋遍歷網路
“策略網路”首先通過輸入人類棋譜資料進行大量的訓練(SL落子策略),
不過這個學習更多是孤立的
,只針對每一步而言如何模仿人類的走法,而不以贏棋為目的。然後進行強化訓練(RL落子策略),
自己和自己下棋進一步完善參數
,這裡就要以勝利為目標了,如果勝利了,那麼這個勝利過程中所有落子點都會獲得正面的評價。另一方面,“價值網路”
主要負責對整體局面的評估
,通過判斷整體局面的勝率來輔助落子。
在此基礎上,結合蒙特卡羅搜尋樹框架下構成的一個系統,大體上就是的機制。那麼Master究竟漲在哪裡了,目前還沒有更多的消息透露,但從穀歌公告的隻言片語可以看出,Master可能完全沒學過棋譜,也就是說,Master可能完全是靠自己和自己對局成長起來的,之前說過,這個策略下,Master更多以勝利為目標,可能會出現一些讓人開始無法理解的走法,但最終目的是勝利。
IT之家視點:
無論Master是否屬於穀歌,無論Master實力究竟漲在哪裡,這短短時間裡人工智慧AlphaGo的進步都是令人驚歎的。AI在未來的應用場景細思之下已經可以讓人倒吸一口氣,
值得我們長期關注。
但
借此開始盲目熱炒人工智慧也是不可取的
,AI完全取代人類的路還很長,與其現在開始炒作,
不如認真思考人類應該如何應對AlphaGo們的時代吧
。