不是為了輸贏！柯潔 VS AlphaGo 大戰之前，你需要知道的幾大看點

分類＼手機
時間＼2017-05-22

雷鋒網按：AlphaGo 終於又來了。5 月 23 日，也就是明天，曾在去年以一己之力將 “人工智慧” 浪潮帶到新層次的圍棋人工智慧 AlphaGo 就將再次出馬。在這次為期 5 天的活動當中，AlphaGo 將會與世界最頂尖圍棋選手柯潔展開正式對決，同時還會進行耳目一新的 “配對賽” 以及 “團體賽”。

目前雷鋒網瞭解到的具體賽程如下：

• 5 月 23 日，開幕式、柯潔 vs AlphaGo 三番棋第一場；

• 5 月 24 日，人工智慧論壇；

• 5 月 25 日，柯潔 vs AlphaGo 三番棋第二場；

• 5 月 26 日，配對賽，團隊賽（相談棋）；

• 5 月 27 日，柯潔 vs AlphaGo 三番棋第三場。

這次比賽核心目的只有一個——在公開場合驗證 AlphaGo 的實力，看是否已經打造出了在圍棋上超越所有人類的 “AI”。

作為國內最重要的科技媒體，雷鋒網也將全程跟蹤此次賽事。但在比賽正式開始前，有幾個問題你可能需要瞭解一下：

1. 這次的 “新 AlphaGo” 跟 “老 AlphaGo” 有什麼不同？

2. 柯潔能否戰勝 “新 AlphaGo”？

3. 比賽相關直播應該如何觀看？

新 AlphaGo：砍斷 “人類束縛”

作為一個從 2014 年發展至今的圍棋人工智慧項目，其實 AlphaGo 在發展歷程中使用過多個名字，比如最早期亦城圍棋上的 “DeepMind”，又或者是之前在野狐平臺上的 “Master”。那麼這次的 “新 AlphaGo” 是否也只是一個新名字？

答案必然是否定的，之前起新名字很可能有保密、個人喜好等原因，但這次新添加的 “新” 字只為了突出一點——這是 “機器自學” 為主的一版 AlphaGo。

這一點判斷的線索，來自於今年初，Master 在網路上一口氣橫掃 60 名人類棋手的時候。當時 Master 第二次戰勝柯潔之後，棋聖聶衛平曾表示:

Master 改變了我們傳統的厚薄理念，顛覆了多年的定式。圍棋遠不像我們想像的那麼簡單，還有巨大的空間等著我們人類去挖掘，阿法狗也好，Master 也罷，都是‘圍棋上帝’派來給人類引路的。

著名棋手古力在成為 Master 的第 60 個手下敗將，之後，也在微博發表了自己的感受：

作為第 60 個勇士，犧牲了。。。經過這幾天的對局，我深深的感受到圍棋的神秘，似乎 Master 給我們打開一道圍棋的神秘之門，不論勝負，人類與人工智慧共同探索圍棋世界的大幕即將拉開，新一次的圍棋革命正在進行著。。。

這種表現，與將近一年前的 “老 AlphaGo” 可謂天差地別。想要達成這樣的成績只有一種可能——DeepMind 尋找到了一種機制來擺脫圍棋中的 “人類束縛”。

迷之改進：一舉讓 AlphaGo 成為人類老師

作為一個極其特殊的棋類和任務，圍棋擁有數量極其龐大的可能性，總的局面數量達到 10^172，而可觀測宇宙範圍內的原子數量不過 10^80。這也意味著窮舉絕對不是一條明智的路線。

最終 DeepMind 給出了一套能夠 “模擬” 出人類頂尖高手的方案：深度學習 + 蒙特卡洛搜尋樹 + 自我進化。

這一套架構在 DeepMind 發佈在《自然》雜誌中的論文中已經有詳細敘述，

（https://www.nature.com/nature/journal/v529/n7587/full/nature16961.html）

如果你對其中的細節感興趣，推薦閱讀國內人工智慧創業公司彩雲 AI 創始人、CEO 袁行遠在知乎上的相應回答。

（https://www.zhihu.com/question/41176911/answer/90118097）

深度學習用以分析人類棋盤，蒙特卡洛搜尋樹用來減輕工作量，自我進化用來提升能力。但有限的運算能力還是給 DeepMind 出了一個不小的難題，後者最終想出了一個辦法：只對學習到的人類棋招進行蒙特卡洛搜尋樹運算，這恰如人類棋手依賴定式。

定式，又名定石，指的是人類下圍棋長久積累下來的一種經驗，對弈雙方在特定情況下會遵循固定下法。著名棋手吳清源則將簡單描述為 “在角部彼我棋子接觸時最合理的走法”。

這些定式被記載在各式各樣的棋譜當中，成為新手入門必看的書籍。

雖然定式是某種意義上是最合理的走法，但它卻是理想化條件下的產物，想要完整複現定式，意味著雙方都必須抱有同樣的理想化思路。而歷史上並不缺乏不遵守定式，或者用新定式打敗對方的事例。

問題來了，為什麼千變萬化的圍棋會出現定式？而且死守定式會輸，不學習定式也會輸。答案只有一個——人類需要定式來減少圍棋上面的變化，這樣進入中盤之後人類才能利用自身能力掌握棋局走向。

湊巧的是，這回我們遇到的是運算能力遠超人類的電腦，讓掌握更多乃至全部圍棋奧秘擁有了一絲可能。

但究竟新 AlphaGo 怎麼樣擺脫 “人類束縛”？參考之前 “老 AlphaGo” 的工作方式，排除運算過程中所有人類元素可能是最徹底的方法。但這樣一來就必須找到另外一種減輕運算壓力的策略。目前來看，這個秘密也只能等 DeepMind 方面稍後公開了。

人類敗局已定？

儘管去年人類代表是韓國選手，但明眼人都可以看出當下和去年圍棋人機比賽的熱度差別。這從另外一個側面也反映出了絕大部分觀眾的看法：這次人類要輸。而去年 3 月李世乭 1:3 扳回一局時，柯潔還曾在直播中表示：

我們必須承認穀歌就是了不起， AlphaGo 確實是超一流的水準，但是也沒有到不可戰勝的地步。

而在上個月的發佈會上，柯潔卻顯得尤為謙遜：

有點小緊張，但我不會輕易言敗，在阿爾法圍棋出現之前，我以為計算力是 AI 的優勢，後來讓我震驚的是他的大局觀，AI 的宏觀思維讓我很佩服。AlphaGo 圍棋讓我們重新思考，這麼下是不是錯的，會給我們很多啟發，輸的痛苦是外界無法想像的，我會不惜一切去追求勝利。

“輕易言敗” 這樣的措辭與其在央視節目上的慷概激昂形成了強烈對比。客觀公正地說，柯潔的勝算很小，三番棋中哪怕有一盤能夠獲勝都是成功。

而另外兩場比賽（配對賽、團隊賽）同樣值得認真關注，這兩場比賽中，人類棋手將首先與 AlphaGo 配對比賽、然後再 “群毆”AlphaGo。這不僅體現了 DeepMind 的自信，同時也再次突出本次本次圍棋峰會的主題：

頂尖棋手以賭局開創性的方式為世人帶來精彩絕倫的棋藝展示，挑戰人類智慧的極限。同時 AlphaGo 與世界最優秀的棋手相互啟發，共同探索圍棋背後的深遠奧秘。

換句話說，別再糾結人類和機器誰輸誰贏了，趕緊認真感受科技帶來的巨大改變、預見未來吧！