柯潔為何說“輸得沒脾氣”！8個問題解讀人機大戰第一局

雷鋒網消息，經過四個多小時的對弈，柯潔以四分之一子之差敗給了AlphaGo。

比賽後，曾參與訓練AlphaGo的棋手樊麾，與圍棋九段常昊一同回顧了整個對弈過程。柯潔也與Deepmind創始人Demis Hassabis，以及AlphaGo的主程序員David Silver一同接受了媒體採訪，談及對比賽的感想。

AlphaGo注重整體局勢的發展

樊麾提到，在經過年初Master的60局比賽後，很多棋手也在嘗試用點三三這種下法。而柯潔也模仿了這種開局。

常昊在分析中表示，對整個棋局印象最深的，是白棋在開局後不久第24手的大飛，這顯示出AlphaGo更更注重中央勢力的發展，對厚薄和棋局的發展有更多注重，因為這一步在未來棋局中的效率會更高。

AlphaGo另一個令人印象深刻的也是在開局後不久，在棋局的左上方，採取了一步斷。在斷之前，黑棋（柯潔）看起來很厚，但之後白棋（AlphaGo）也變得厚了。常昊稱，“這是走的一步後手，但卻留下了很多餘味。”

第24手“大飛”，第54手“斷”

“這一步帶給了我們新的想法，有些棋不是不能下，下了以後還會有新的思路。它提供了一種思路的創新，我們可以共同去研究，為圍棋的下法帶來更多發展。”

雖然被圍棋圍住的4個字看起來已經沒救了，但AlphaGo依然會更多利用這4個子，它會想把棋盤上所有子的價值都利用起來。

柯潔：輸得沒脾氣

柯潔在回顧比賽時也對第54手的斷，表示了肯定。他稱，“很震驚，這在人類的下法中是不能有的”。在斷之後，它把自己的腳步實地化，變得更厚，一石二鳥。

柯潔感歎道，“實在下得太出色了，輸得沒什麼脾氣。”

Demis Hassabis在賽後表示，這是一場非常精彩的比賽，他非常尊敬柯潔，這一戰的表現令人佩服。他認為柯潔表現出了頑強與精彩的實力，在賽前也做了很多戰前的準備。

“柯潔同時做了戰略和戰術的準備，比如點三三（這種策略），這是他從年初Master的60場比賽中的總結。他有自己的戰略，有好幾手都是非常漂亮的。第24手是全盤皆活的一手。接下來還有很多場比賽，我非常尊敬柯潔，讓AlphaGo也必須用全力以赴對付你。”

比賽的結果雖然有了，但外界對AlphaGo和柯潔的好奇心沒有滿足。在採訪中，雙方也回答了很多大家關心的問題。

比賽後柯潔為什麼笑了？

柯潔稱，這是苦笑，不是很開心的笑。

“很早就知道自己會輸。AlphaGo的每一步棋都是勻速的，到最後時已經知道會輸多少了。”

對於自己的評價，柯潔稱，“AlphaGo下得很精彩，但我自己也盡了全力。它下得太好了，有很多地方值得棋手去學習和探索。它對圍棋的理念帶來了衝擊，在改變我們最初對圍棋的下法，沒什麼棋是不能下的。對AlphaGo的想法也有改變，我們可以大膽去創新，開拓自己的思維，可以自由地去下棋。今天也是大膽地開拓了自己的思維。”

柯潔還曾想用AlphaGo的策略來對付它。“我的印象中AlphaGo是會非常貪戀實地的，比如點三三的方法，今天我也是在使用這種策略。但這種意圖被AlphaGo打敗了，完全進入了它的調子中。它真的下得非常的好。”

柯潔認為，AlphaGo的棋與去年完全是兩個人。第一次時它很接近人的，但現在越來越像“上帝”。

AlphaGo有弱點嗎？

柯潔認為，弱點暫時沒有看見。以前還是有弱點的，但現在AlphaGo對棋的理解與判斷已經遠勝於我們人類了，贏的話只能找一些bug出來。

但他同時說，“對自己永遠要有信心。”

Hassabis稱，在李世石後再次參加比賽，就是希望棋手們能找到AlphaGo的弱點，找到它跟自己對弈時不知道的缺陷。

“李世石當時在第4局找到了這個缺口，後來我們改善了體系。當然還會有新的領域，我們和AlphaGo都不知道，所以才會參加比賽。”

David Silver解釋稱，AlphaGo的做法是將它的獲勝的概率最大化，而不是接近式贏得比賽。它會尋找一些確定的路線，實現少風險的獲勝機會。這也是一個取捨問題，要決定如何擴大勝利的比例。當然，它還有一些其它目標，比如將勝利的步伐邁得更大，如果重點只是放在獲勝上，它可能會降低風險，即使很小的風險也會去關注。

對圍棋的影響？

Hassabis認為，圍棋是一個非常有意思的主題，它有無限的可能性。通過比賽，可以改進對於圍棋的理解，這是我們可以用的工具，讓偉大的棋手發現更多圍棋的奧妙。

AlphaGo完全不依賴棋手的訓練嗎？

David Silver解釋稱，AlphaGo一開始就是跟人類來學習的，它通過自身對弈來學習時，也必須要跟人類專家對弈才行，因為與頂尖的棋手對決才能改善。新版本是更多與自身對弈來學習，實現自我的搜索，對人類資料的依賴更小了。而DeepMind的目標是讓它的規則超越圍棋，應用到其它領域。

戰勝位於圍棋頂端的柯潔後，AlphaGo是否就此隱退？

對這一問題，Hassabis沒有正面回應，只是表示，本周晚些時候會宣佈下一步怎麼做。像第一版在學術期刊上發佈了技術細節一樣，他們以後也會發佈更多新版本的細節，會披露更多技術細節，讓其它團隊與實驗室做自己的版本。

技術細節？多少個TPU？單機版？

這次比賽的AlphaGo是新版本，它改善了新的演算法，主要進步是計算量少了十倍，自我對弈更強。

Hassabis稱，在比賽中程式是在一個單一的機器上運作的，這與去年不一樣，當時是分散式的。這次有更強大的演算法，運作起來更簡單也更好，獲得的速度更快。

Hassabis表示，計算力可以“在Google雲中獲得，用的是TPU，十個處理單位，少了十倍的計算量”。簡單點說，這次的AlphaGo是單機版。

柯潔再也不與人工智慧比了？

賽前，柯潔發微博表示，這次比賽是最後三場與人工智慧的比賽。賽後，他對這一決定再次做了確認。

“考慮了很久，AlphaGo進步太快了，每一步都是巨大的進步，在以後會更加完美，而人與它的差距不是靠自己的努力就能去彌補的。我相信科技的力量，未來是人工智慧的。對圍棋來說，我還是喜歡和人來下，因為機器與人的差距會越來越大，人贏的概率會越來越小，這樣下棋太痛苦了，一盤都贏不了。”

他表示，以後也不會去訓練機器了，這是最後的三盤棋。

“希望以後還是下人類的棋，對軟體把它當作一個老師，一個學習的物件去看待。”

他表示，對自己的表現也有點不滿意，覺得自己可以做得更好，但有時候無論怎麼努力都無法做到。所以這最後一次，他希望不留遺憾，下出讓自己滿意的棋局。

“令AlphaGo的主機發燙也好。”

那如果人類棋手不想和AlphaGo打了怎麼辦？

Hassabis表示，從他們的角度來說，想要AlphaGo作為圍棋的工具，能為人類所用，所以會有架構知識的分享，讓大家知道它。也希望它能走進尋常百姓家，在醫學與科學找到應用場景。

柯潔為何說“輸得沒脾氣”！8個問題解讀人機大戰第一局

寶寶手指長倒刺，說明他可能存在3個問題

人機大戰：金立代言人柯潔將對阿爾法狗

第二次人機大戰揭開帷幕柯潔能否一勝？

“人機大戰”一觸即發，金立鼎力支持柯潔挑戰AlphaGo

AlphaGo再下一城：人機大戰柯潔三局全敗

人機大戰結束柯潔落淚不敵AlphaGo

人機大戰最後一役今日開戰柯潔能否挽回尊嚴

人機大戰第二季今日上演柯潔大戰阿爾法狗

人機大戰第二局：柯潔執白迎戰AlphaGo

【速報】人機大戰第二局：柯潔主動認輸，再負AlphaGo

阿爾法狗勝利柯潔：我輸得沒脾氣

人機大戰：柯潔負于阿爾法狗，人類真輸？

柯潔為何說“輸得沒脾氣”！8個問題解讀人機大戰第一局

寶寶手指長倒刺，說明他可能存在3個問題

人機大戰：金立代言人柯潔將對阿爾法狗

第二次人機大戰揭開帷幕 柯潔能否一勝？

“人機大戰”一觸即發，金立鼎力支持柯潔挑戰AlphaGo

AlphaGo再下一城：人機大戰柯潔三局全敗

人機大戰結束柯潔落淚不敵AlphaGo

人機大戰最後一役今日開戰 柯潔能否挽回尊嚴

人機大戰第二季今日上演 柯潔大戰阿爾法狗

人機大戰第二局：柯潔執白迎戰AlphaGo

【速報】人機大戰第二局：柯潔主動認輸，再負AlphaGo

阿爾法狗勝利 柯潔：我輸得沒脾氣

人機大戰：柯潔負于阿爾法狗，人類真輸？

第二次人機大戰揭開帷幕柯潔能否一勝？

人機大戰最後一役今日開戰柯潔能否挽回尊嚴

人機大戰第二季今日上演柯潔大戰阿爾法狗

阿爾法狗勝利柯潔：我輸得沒脾氣