您的位置:首頁>手機>正文

純棋局探討:柯潔僅負1/4子,是否意味著還有翻盤希望?

雷鋒網按:本文作者劉利,自學圍棋多年,弈城8D水準,曾獲重慶大學圍棋賽冠軍,重慶市高校聯賽冠軍,重慶市首屆周日圍棋賽冠軍。雷鋒網經授權獨家首發,未經許可不得轉載。

苦等兩個月的的人機大戰終於如期舉行了。基於賽前的預測,多數觀點認為,柯潔在三盤棋中能贏至少一盤的概率僅為 10%,甚至更加悲觀,很多人更是開玩笑說,只要柯潔能贏一盤,就要吃棋盤電腦翔啥的,或者讓自己身上的零件少點啥的,更是認定了柯潔能贏一盤的概率無限趨近於零。但第一盤的結果下來,柯潔只輸了 1/4 子,是不是又讓人看到勝利的希望了呢?

首先值得一提的是這次比賽的獎金,如果柯潔獲勝,將會獲得 150 萬美元,而無論勝負,柯潔會獲得 30 萬美元的出場費,這個數字對圍棋界來講確實是一個天文數字,多年以來,世界各大賽中獎金最高的四年一屆的應氏杯,冠軍獎金才不過 40 萬美元。一方面反映出對世界等級分排名第一的柯潔的尊重,另一方面也反映出柯潔獲勝的概率極小。

DeepMind 團隊不打無把握之仗,早在去年 3 月,人機大戰的第一季,DeepMind 團隊選中了十年來獲得世界冠軍頭銜最多,人氣極高的韓國選手李世石作為挑戰對象。據賽後的爆料,其實 AlphaGo 的自評實力已經遠高於李世石的等級分。李世石五盤中的唯一一勝其實是擊中了 AlphaGo 程式計算中的軟肋——

在有限的算力下,為了保證計算的深度,需要對一些不太可能的變化進行剪枝。

李世石的神之一手,雖然事後看並不成立,卻正是圍棋中的盲點,在 AlphaGo 的眼中,這一手出現的概率僅有萬分之四,因而並沒有太多考慮。突然出現的這一手,使得所有變化都得重新計算,因而犯下大錯。DeepMind 團隊事後也積極的想策略解決這一問題,但看得出,他們賽前其實對拿下李世石是很有信心的。然而,4:1 的比分畢竟使得人工智慧已經完全征服圍棋這一長期難題的結論不那麼使人信服,所以有了今年的柯阿之戰。

一是因為,柯潔是當前的世界第一人,早在人機大戰第一季結束的時候就發出了「就算 AlphaGo 戰勝了李世石,但它贏不了我」的豪言壯語。

二是 DeepMind 公司在修復了 AlphaGo 的程式 BUG 之後,總想有再次找高手試手的興奮。

三是看看一年多以後,科技到底能讓 AlphaGo 進步到了何種程度。

其實早在今年年初,去年年底, AlphaGo 就悄悄地出來試水了,化身「Master」 的阿法狗在弈城圍棋和野狐圍棋上各下了 30 盤棋,取得了 60:0 的戰績。從中我們可以看出 AlphaGo 的一些「性格」:大多數棋局在 100 手以前就已取得了壓倒性的優勢,優勢後的 AlphaGo 顯得保守和謙讓,後半盤尤其是小官子經常犯錯,這是職業棋手很難犯錯的領域。不過最終的結果,反正是 AlphaGo 不管大勝小勝,最終全部都贏下來了,最少的贏了 0.5 目。真不知道是幸運還是早有成算。因為畢竟只勝 0.5 目的盤數並不多,並不能做為結論。而且根據 AlphaGo 論文所開發出的各個 AI,目前都有收官弱項的共同毛病。

再來回顧一下今天的這盤棋,早上 10 點半,比賽正式開始,柯潔猜到黑棋,不知道對壓力山大的柯潔的心理有沒有影響。目前的棋界普遍是願意下白棋的,尤其是中國規則下。中國規則黑棋貼 3 又 3/4 子,可能是偏向白棋一方了。從 AlphaGo 的自評勝率中執黑也是勝率稍差,對柯潔本人近年來的戰績來看,執白的勝率也是明顯比執黑要好的。筆者開著免費棋軟 LEELA 最新版 0.10.0,靜靜的欣賞這盤棋。柯潔顯然是有備而來,小目大飛守角加一個三 3,然後第 7 手,點對手星星下的三 3,很徹底的表明先撈後洗的策略,先撈足實地,然後和電腦比大型死活。

筆者還是很認可這一策略的,最近在野狐上很火的驪龍 AI(絕藝老版),大殺四方,偶爾輸棋,基本也只吃大型死活偶爾犯錯這一招了。 AlphaGo 是不是也有這樣的弱點呢?

由於黑棋的位置低,第 5 手黑棋的勝率從開局的 48% 降到 46%,看來電腦並不認可三 3 這手棋。黑棋第 7 手點右下角三 3 至 22 手征掉一子告一段落,不知道柯潔此時有沒有後悔左上角是三 3。如果左上角是星位,那麼 22 是征不掉黑子的。

24 是極其出乎筆者意料的一手, AlphaGo 果然是高者在腹。

這手棋如果按筆者的理解叫中途半端,是要被老師批評的,沒有撥掉一子那麼乾淨,對二路的夾也沒有補到。柯潔看到這手棋時的表情也非常有意思,一下笑了,然後直起身子,不停的摸自己的頭。考慮良久之後,拆了一個邊,限制的外勢。白棋 26 打入進入戰鬥,面對柯潔的 29、31 兩記重拳, AlphaGo 都沒有應,讓筆者想起了太極高手的閃轉騰挪。這狗也太靈活了,這讓人怎麼下? 好在後面的進程還算正常,到 46 告一段落,黑棋勝率 45%。50,54 刺和斷,又是出乎人類棋手的意料!人類棋手不會在四顆子還有跑的可能的時候,去讓刺和黑拐頭相交換,讓四子徹底死掉,也不會在大場還那麼多的時候花一手斷來換取一點點的借用的。 AlphaGo 大師真乃神出鬼沒!它會走在哪你真是猜不到的。

黑 55 被動得來的先手,柯潔沒有選擇拆邊加強自身,而是選擇了繼續打入破空,堅決貫徹自己的戰略意圖。

至 65,黑棋在左下又成功掏掉一個角,不過勝率下降到 39%。

後面便是 AlphaGo 穩如泰山的表演了,先攻擊兩子,再洗掉上邊。局面的差距越拉越小,黑勝的機率卻越來越小,真是一個怪圈!其中不乏 AlphaGo 有一些勸降的招數,比如第 200 手的提,最終黑棋輸了 1/4 子。

回顧整盤棋,進程和年初的 MASTER 贏棋的過程非常類似。如果說年初下快棋,人類棋手來不及思考,犯了很多低級錯誤導致輸棋,那麼今天這盤棋,時間很充裕,可以說沒有什麼低級錯誤了。筆者很難確定究竟哪幾步是壞棋,導致了棋局的落後,只能說是 AlphaGo 憑藉神經網路技術訓練出的棋感確實比人類選點更精確。如果說輸的多少不能認為是實力的差距,那麼從 ELO GO-RATINGS 等級分的差距可以大致的預測一下。等級分比對手高 300 分的話,每盤棋勝率在 85% 左右,比對手高 600 的話,勝率在 97% 左右。柯潔的等級分大約在 3600-3700 之間,去年戰勝李世石版本的 AlphaGo 自評等級分在 4500 左右。而經過了一年多之後, AlphaGo 的等級分進步到多少我們不得而知,但至少不會比去年的版本低。所以,如果找不到 AlphaGo 一些未知弱點的話,人類幾乎可以說是一勝難求。

柯潔認為,Alphago 的棋與去年完全是兩個人。第一次時它很接近人的,但現在越來越像「上帝」。所以,雖然只是 1/4 子,其實是人類棋手無法逾越的一條鴻溝。在冰冷的資料面前,再如何說讓柯潔繼續努力的話,都顯得蒼白無力,接下來的比賽,讓我們就期待精彩的過程吧。

喜欢就按个赞吧!!!
点击关闭提示