5月23日下午,今天,世界圍棋第一人柯潔與DeepMind旗下的AlphaGo進行了一場長達4個半小時的圍棋對戰,最終柯潔僅以1/4子的差距惜敗AlphaGo,這場從上午10點半開始的鏖戰終於告一段落。未來幾天柯潔與AlphaGo還將展開數場“戰爭”,具體安排如下
今天的比賽是本次圍棋大賽中柯潔對戰AlphaGo三場比賽中的頭一場,柯潔執黑先行。與年初披著“Master”馬甲的連勝60場時不同,這次“柯Go大戰”下的是每方時長3小時的慢棋,而不是每手30秒快棋,對人類有著一定優勢。
理論上本輪比賽將持續3+3=6小時,但最終柯潔幾近耗盡3小時,AlphaGo僅用了1個多小時。比賽後期柯潔頻頻有咬嘴唇、抓頭髮等焦慮的小動作,看得觀眾也不禁緊張起來。在最終只剩十幾分鐘、敗局已定時,柯潔仍堅持下完全局。
其實,柯潔與AlphaGo的這場比賽開始前,勝率並不被多少人看好。就連柯潔本人在四月初的發佈會上,也用上了“懷有必死的信念,不會輕易言敗”這種情懷悲壯的詞語,昨夜11點半更是在微博發佈了一條名為《最後的對決》的賽前感言。
▲ 昨夜11點半柯潔所發微博
但是柯潔年剛20血氣方剛,下的熱血沸騰。強烈的求勝欲望渲染了整個棋局,最終AlphaGo也只是微弱優勢勝利。
AlphaGo並不是DeepMind唯一項目,也不是最大的項目。DeepMind的最終目標是智慧助手、醫療和機器人等。Scott Beaumont曾經在4月初的發佈會上表示,儘管AlphaGo只是針對圍棋開發的系統,但其原理可以被應用到現實問題中,比如醫療中的癌症檢測、機器人訓練等。 與單純的深度學習應用不同,AlphaGo在系統中加入了增強學習的部分。增強學習不一定為機器設定特殊明確的行為,機器試探性地做一個行動後,觀察“世界”會有怎樣的反應(獎賞還是懲罰),最終逐步形成對刺激的預期,產生能獲得最大利益的習慣性☆禁☆行☆禁☆為。這個方法具有普適性,因此在其他許多領域都有研究,但比較集中在步驟可能性較少、任務行為較窄的領域(比如圍棋、簡單物理運動等)。英偉達CEO黃仁勳在月初的GTC大會上就宣佈了一款名為ISAAC的增強學習世界模擬器,創造出一個完全虛擬的、專為訓練機器人而打造的世界,用來訓練機器人執行打冰球、打高爾夫等動作。
相信很多人尤其是圍棋界和愛好者們,都不願意在棋盤未展之時就早早接受這樣的事實。筆者之所以寫下這篇文章,也絕不是為了預測柯潔與Alphago2.0對弈的勝負,而是通過人工智慧在國際象棋、圍棋上對人類智慧的壓倒性優勢,在高考作文上和人類智慧無法類比的表現,認清一個事實:即當今所謂的人工智慧,其實還是基於海量資料的大資料分析和概率統計,無論機器的運算能力有多強,其終究還只是電腦,充其量只是一台運算能力越來越強大的超級電腦。博主無法預知未來人工智慧以何種方式、多大程度上接近人類智慧,但認為可以預見的是,人工智慧在某些領域(如記憶、計算、棋類、操作技能等)趕超人類是可期的,而人工智慧全面超越人類智慧、甚至機器人替代人類成為未來地球的主宰、機器人奴役人類的擔心則純屬杞人憂天!