您的位置:首頁>正文

人工智慧在麻將領域能夠戰勝人類嗎?非常容易

OFweek機器人網訊:AlphaGo的馬甲Master近日取得了60連勝,震動棋壇。而有好事網友戲稱AI未必能在打麻將上戰勝人類,對此,網易科技在去年3月“人機大戰”曾發文,說明人工智慧在麻將上戰勝人類很容易。
很高興能借著AlphaGo的東風,和大家分享一下麻將AI研究的現狀。
一. 麻將和圍棋有什麼不同?
從博弈論的角度來講,圍棋是完全資訊動態博弈,而麻將屬於非完全資訊動態博弈。圍棋中對局雙方所掌握的資訊是對稱的,而麻將中各對局者間所掌握的資訊不對稱。雖然大家都能看到每位牌手打過什麼牌,但你不知道我的手牌是什麼,我也不知道你的手牌是什麼。這種資訊不對稱的產生的根本原因是牌牆的隨機性。
圍棋與麻將(或者說棋與牌,弈與博)的上述區別,決定了它們獲勝策略的根本不同。棋類項目本質上就是蒙特卡洛樹,獲勝策略就是選擇或迫使對手選擇一個分支,這個分支下面所有的結局都是自己勝。只不過由於棋類變化很多,連AlphaGo也遠不可能遍歷整個樹,所以AlphaGo會通過價值網路來估計某一分支下勝結局的概率。其實人類的思維也是類似的,在圍棋裡平白被對手屠掉一條大龍,或者在象棋裡平白送給對手一個車總是不好的——在這些分支下,勝結局的概率大大降低了。
而牌類的獲勝策略在於盡可能增大自己的得分期望(EV)。我並不知道我接下來要摸什麼牌,或我的對手有什麼牌,但所有可能的情形組成一個概率空間,我只需做出一個選擇,使得自己的得分函數的期望最大。牌類策略的難點在於,影響這一概率空間的因素過多,且具體影響很難確定,比如對手打牌的習慣。
下圖選自《科學化麻雀》,閑家愚形聽牌打10% 危險度的牌對攻,x軸為自己和牌時得分,y軸為牌局巡次,z軸為自己的得分期望。
二. 何謂「獲勝」?
選手的競技水準如何衡量?麻將是否是「運七技三」的遊戲?其實無論圍棋還是麻將,區分選手的競技水準都不可能只靠一局,就好比AlphaGo和李世乭要進行五番棋對決,AlphaGo贏第一盤時大家並不覺得AlphaGo一定比李世乭強一樣。圍棋有三番、五番、十番棋,對於競技麻將(國標麻將、日本麻將)而言,區分頂尖選手的競技水準至少需要2000 10000手牌(如果採用類似橋牌的複式賽制,這一數字會大幅降低)。
喜欢就按个赞吧!!!
点击关闭提示