柯潔為何說“輸得沒脾氣”！8個問題解讀人機大戰第一局

分類＼手機
時間＼2017-05-24

雷鋒網消息，經過四個多小時的對弈，柯潔以四分之一子之差敗給了AlphaGo。

比賽後，曾參與訓練AlphaGo的棋手樊麾，與圍棋九段常昊一同回顧了整個對弈過程。柯潔也與Deepmind創始人Demis Hassabis，以及AlphaGo的主程序員David Silver一同接受了媒體採訪，談及對比賽的感想。

AlphaGo注重整體局勢的發展

樊麾提到，在經過年初Master的60局比賽後，很多棋手也在嘗試用點三三這種下法。而柯潔也模仿了這種開局。

常昊在分析中表示，對整個棋局印象最深的，是白棋在開局後不久第24手的大飛，這顯示出AlphaGo更更注重中央勢力的發展，對厚薄和棋局的發展有更多注重，因為這一步在未來棋局中的效率會更高。

AlphaGo另一個令人印象深刻的也是在開局後不久，在棋局的左上方，採取了一步斷。在斷之前，黑棋（柯潔）看起來很厚，但之後白棋（AlphaGo）也變得厚了。常昊稱，“這是走的一步後手，但卻留下了很多餘味。”

第24手“大飛”，第54手“斷”

“這一步帶給了我們新的想法，有些棋不是不能下，下了以後還會有新的思路。它提供了一種思路的創新，我們可以共同去研究，為圍棋的下法帶來更多發展。”

雖然被圍棋圍住的4個字看起來已經沒救了，但AlphaGo依然會更多利用這4個子，它會想把棋盤上所有子的價值都利用起來。

柯潔：輸得沒脾氣

柯潔在回顧比賽時也對第54手的斷，表示了肯定。他稱，“很震驚，這在人類的下法中是不能有的”。在斷之後，它把自己的腳步實地化，變得更厚，一石二鳥。

柯潔感歎道，“實在下得太出色了，輸得沒什麼脾氣。”

Demis Hassabis在賽後表示，這是一場非常精彩的比賽，他非常尊敬柯潔，這一戰的表現令人佩服。他認為柯潔表現出了頑強與精彩的實力，在賽前也做了很多戰前的準備。

“柯潔同時做了戰略和戰術的準備，比如點三三（這種策略），這是他從年初Master的60場比賽中的總結。他有自己的戰略，有好幾手都是非常漂亮的。第24手是全盤皆活的一手。接下來還有很多場比賽，我非常尊敬柯潔，讓AlphaGo也必須用全力以赴對付你。”

比賽的結果雖然有了，但外界對AlphaGo和柯潔的好奇心沒有滿足。在採訪中，雙方也回答了很多大家關心的問題。

比賽後柯潔為什麼笑了？

柯潔稱，這是苦笑，不是很開心的笑。

“很早就知道自己會輸。AlphaGo的每一步棋都是勻速的，到最後時已經知道會輸多少了。”

對於自己的評價，柯潔稱，“AlphaGo下得很精彩，但我自己也盡了全力。它下得太好了，有很多地方值得棋手去學習和探索。它對圍棋的理念帶來了衝擊，在改變我們最初對圍棋的下法，沒什麼棋是不能下的。對AlphaGo的想法也有改變，我們可以大膽去創新，開拓自己的思維，可以自由地去下棋。今天也是大膽地開拓了自己的思維。”

柯潔還曾想用AlphaGo的策略來對付它。“我的印象中AlphaGo是會非常貪戀實地的，比如點三三的方法，今天我也是在使用這種策略。但這種意圖被AlphaGo打敗了，完全進入了它的調子中。它真的下得非常的好。”

柯潔認為，AlphaGo的棋與去年完全是兩個人。第一次時它很接近人的，但現在越來越像“上帝”。

AlphaGo有弱點嗎？

柯潔認為，弱點暫時沒有看見。以前還是有弱點的，但現在AlphaGo對棋的理解與判斷已經遠勝於我們人類了，贏的話只能找一些bug出來。

但他同時說，“對自己永遠要有信心。”

Hassabis稱，在李世石後再次參加比賽，就是希望棋手們能找到AlphaGo的弱點，找到它跟自己對弈時不知道的缺陷。

“李世石當時在第4局找到了這個缺口，後來我們改善了體系。當然還會有新的領域，我們和AlphaGo都不知道，所以才會參加比賽。”

David Silver解釋稱，AlphaGo的做法是將它的獲勝的概率最大化，而不是接近式贏得比賽。它會尋找一些確定的路線，實現少風險的獲勝機會。這也是一個取捨問題，要決定如何擴大勝利的比例。當然，它還有一些其它目標，比如將勝利的步伐邁得更大，如果重點只是放在獲勝上，它可能會降低風險，即使很小的風險也會去關注。

對圍棋的影響？

Hassabis認為，圍棋是一個非常有意思的主題，它有無限的可能性。通過比賽，可以改進對於圍棋的理解，這是我們可以用的工具，讓偉大的棋手發現更多圍棋的奧妙。

AlphaGo完全不依賴棋手的訓練嗎？

David Silver解釋稱，AlphaGo一開始就是跟人類來學習的，它通過自身對弈來學習時，也必須要跟人類專家對弈才行，因為與頂尖的棋手對決才能改善。新版本是更多與自身對弈來學習，實現自我的搜索，對人類資料的依賴更小了。而DeepMind的目標是讓它的規則超越圍棋，應用到其它領域。

戰勝位於圍棋頂端的柯潔後，AlphaGo是否就此隱退？

對這一問題，Hassabis沒有正面回應，只是表示，本周晚些時候會宣佈下一步怎麼做。像第一版在學術期刊上發佈了技術細節一樣，他們以後也會發佈更多新版本的細節，會披露更多技術細節，讓其它團隊與實驗室做自己的版本。

技術細節？多少個TPU？單機版？

這次比賽的AlphaGo是新版本，它改善了新的演算法，主要進步是計算量少了十倍，自我對弈更強。

Hassabis稱，在比賽中程式是在一個單一的機器上運作的，這與去年不一樣，當時是分散式的。這次有更強大的演算法，運作起來更簡單也更好，獲得的速度更快。

Hassabis表示，計算力可以“在Google雲中獲得，用的是TPU，十個處理單位，少了十倍的計算量”。簡單點說，這次的AlphaGo是單機版。

柯潔再也不與人工智慧比了？

賽前，柯潔發微博表示，這次比賽是最後三場與人工智慧的比賽。賽後，他對這一決定再次做了確認。

“考慮了很久，AlphaGo進步太快了，每一步都是巨大的進步，在以後會更加完美，而人與它的差距不是靠自己的努力就能去彌補的。我相信科技的力量，未來是人工智慧的。對圍棋來說，我還是喜歡和人來下，因為機器與人的差距會越來越大，人贏的概率會越來越小，這樣下棋太痛苦了，一盤都贏不了。”

他表示，以後也不會去訓練機器了，這是最後的三盤棋。

“希望以後還是下人類的棋，對軟體把它當作一個老師，一個學習的物件去看待。”

他表示，對自己的表現也有點不滿意，覺得自己可以做得更好，但有時候無論怎麼努力都無法做到。所以這最後一次，他希望不留遺憾，下出讓自己滿意的棋局。

“令AlphaGo的主機發燙也好。”

那如果人類棋手不想和AlphaGo打了怎麼辦？

Hassabis表示，從他們的角度來說，想要AlphaGo作為圍棋的工具，能為人類所用，所以會有架構知識的分享，讓大家知道它。也希望它能走進尋常百姓家，在醫學與科學找到應用場景。