▲AlphaGo幕後推手黃士傑。(圖/記者林信男攝)
記者林信男/台北報導
為AlphaGo設計「腦」,並在舉世矚目的「人機對弈」大戰中,擔任AlphaGo棋手的黃士傑,18日現身Google台灣辦公室!他表示,圍棋有3,000年歷史,具備深度學習能力的AlphaGo,能從20、30萬筆棋譜資料中,判斷最好的前20個棋步,「AlphaGo吸取了前人所有成果,是人類千年心血的結晶!」
熱愛圍棋、曾當過圍棋老師的黃士傑說,圍棋的複雜度很高,因此在1997年,IBM深藍擊敗西洋棋棋王Garry Kasparov後,圍棋就成了人工智慧的首要挑戰目標。
「下圍棋,一要直覺、二要計算。」黃士傑解釋,因為強調直覺,所以對電腦來說,下圍棋是很困難的事情,至於計算,如果1盤棋有150步,總盤面會是10的360次方,「要計算天文數字」;在研究初期,就算人類讓電腦先下25顆子,還是可以大獲全勝。
AlphaGo同時具備「策略網路」(policy network)和「值網路」(value network)。在「策略網路」方面,黃士傑說,AlphaGo有深度學習能力,可從20、30萬個棋譜中,學習在1個盤面裡,判斷前20個最好的棋步。
至於「值網路」,黃士傑說明,AlphaGo懂得判斷盤面、找出優勢,AlphaGo下了3步棋之後,就會判斷當前局面是對自己有利,或對對手有利,「如果走了3步就輸,那(AlphaGo)就不用再想了。」
對於AlphaGo會不會「投降」?黃士傑指出,AlphaGo只要研判自己的勝率低於20%,就會投降。
他也強調,在和南韓棋王李世乭對弈前,並未對AlphaGo做特訓,「它和任何人下棋(表現)都一樣。」
讀者迴響