迎向電腦勝人腦的新世界
號角月報加拿大版 二零二四年六月
職業棋手可名利雙收
中學時期讀到金庸的武俠小説說《天龍八部》提到圍棋的奧妙。真正有機會學習下棋已經到了大學,當時哲學系不少老師都喜歡下圍棋。一位師姐教我下圍棋,可能為了鼓勵我,第一盤就讓我贏了,自此我在這方面也花了不少時間;甚至在大班上課時,用一本有小格子的算術簿,畫出了19乘19的棋盤,用一支紅筆和藍筆跟旁邊的同學下棋。由於沒有請教名師、沒有參考棋譜,每次下棋也沒有覆盤,所以進步不大,只維持在「勝固欣然,敗亦可喜」的階段。圍棋源於中國春秋時代,唐朝時傳入日本。由於日本明治維新以來經濟發達,民間有資源設立棋院培養棋手,職業棋手可藉賽事名利雙收;每年有比賽決定誰獲得「本因坊」及「名人」的頭銜。其餘國家地區的選手只能靠天賦往日本發展,或長駐棋院磨練自己的棋藝。二戰時期出名的台灣棋士吳清源(1914-2014)、70年代林海峰(1942-)都是在日本成名的;以後有中國的聶衛平(1952-)、南韓的趙治勳(1956-)、李昌鎬(1975-)均在世界圍棋棋壇出人頭地。21世紀韓國的李世乭(1983-)更被形容為80後21世紀高手。
1985年IBM在以電腦出名的卡立基梅隆大學(Carnegie Mellon University)發展深藍(Deep Blue)人工軟件,1989年與當時國際象棋世界冠軍蘇聯的Garry Kasparov 下了六局,電腦輸四比二;1997年以更先進的軟件贏兩局和三局。電腦可以在國際象棋戰勝人腦的世界冠軍,對於更複雜的圍棋又怎樣呢?國際象棋只有64個方格,棋子分為國王、皇后、城堡/車、主敎/象、騎士/馬及卒,各有行走的規則,故此變化有限,每盤下到三十幾手可定輸贏。圍棋有361點,黑白棋子可以任意放置,變化的可能性遠勝於國際象棋,一盤要下到200手才能分勝負。故此勝過世界國際象棋冠軍的電腦,在日後的十多年仍然沒法打敗圍棋的職業棋手。
電腦擊敗韓棋藝高手
隸屬谷歌的倫敦深心靈(DeepMind)科技團隊接受挑戰,發展以AlphaGo為名的人工智能軟件專攻圍棋。Go就是日文圍棋的名稱,團隊由 David Silver和有華裔血統的 Demis Hassabis領導,不少軟件工程師成員年輕時均為出色國際象棋或圍棋棋手。軟件收錄過往專家的棋譜,輸入三千萬步棋,即時可以評估每一手的勝算,計算每一手棋之後的五十步可能有的回應。2016年3月與世界圍棋冠軍李世乭於首爾四季酒店進行五盤比賽,雙方各有兩小時考慮時刻,勝方可以獲得100萬美元獎金。賽前大家都看好人腦會勝過電腦,因為在幾個月前的比賽中,電腦只贏過歐洲冠軍二段棋手樊麾,李世乭是職業九段選手,贏過18項世界冠軍,賽前充滿信心可以擊敗電腦。結果電腦勝人腦四比一,李世乭贏得第四盤,這是AlphaGo 與人腦74場比賽中唯一的一次勝出。錯中學習不重複犯錯
第二盤電腦下的第37手,令評論人員大惑不解,這是很怪的一手,正常人都不會下這一手。結果證明電腦是有理解能力、有創意,甚至類似人類的直覺,不會只模仿以往輸入的步驟;這一手神來之筆改變了戰局,令電腦取得勝利。電腦下了看來愚蠢的37手,結果被認為是導致勝利的高招;當然李世乭也是會從錯誤中學習的高手,在第四盤來了出人意表的78手,令電腦不知所措,結果贏得唯一的一盤,事後電腦工程師補救這一手帶來的困惑。電腦的強項就是能夠從錯誤中學習,不重複犯錯。一年後AlphaGo Master 挑戰中國的世界冠軍柯潔(1997-),三盤全勝,獲得中國圍棋協會頒授職業九段證書。已經找不到人類的對手,AlphaGo 和 DeepMind 團隊解散,完成了這個階段的歷史任務。有學習能力的電腦不但有創意,在棋藝方面勝過人腦。Hassabis遂向更靈活的人工智能發展雙子星軟件Gemini,最近在即時翻譯、撰寫會議紀錄的比試中,曾經領先世界的雙子星Gemini 1.5 Pro竟然輸給後浪 Open AI ChatGPT4o,看來我們都要準備生活在電腦勝過人腦的新世界了。
江大惠(多倫多)