迎向電腦勝人腦的新世界

號角月報加拿大版二零二四年六月

迎向電腦勝人腦的新世界

迎向電腦勝人腦的新世界

職業棋手可名利雙收

中學時期讀到金庸的武俠小説說《天龍八部》提到圍棋的奧妙。真正有機會學習下棋已經到了大學，當時哲學系不少老師都喜歡下圍棋。一位師姐教我下圍棋，可能為了鼓勵我，第一盤就讓我贏了，自此我在這方面也花了不少時間；甚至在大班上課時，用一本有小格子的算術簿，畫出了19乘19的棋盤，用一支紅筆和藍筆跟旁邊的同學下棋。由於沒有請教名師、沒有參考棋譜，每次下棋也沒有覆盤，所以進步不大，只維持在「勝固欣然，敗亦可喜」的階段。

圍棋源於中國春秋時代，唐朝時傳入日本。由於日本明治維新以來經濟發達，民間有資源設立棋院培養棋手，職業棋手可藉賽事名利雙收；每年有比賽決定誰獲得「本因坊」及「名人」的頭銜。其餘國家地區的選手只能靠天賦往日本發展，或長駐棋院磨練自己的棋藝。二戰時期出名的台灣棋士吳清源（1914-2014）、70年代林海峰（1942-）都是在日本成名的；以後有中國的聶衛平（1952-）、南韓的趙治勳（1956-）、李昌鎬（1975-）均在世界圍棋棋壇出人頭地。21世紀韓國的李世乭（1983-）更被形容為80後21世紀高手。

1985年IBM在以電腦出名的卡立基梅隆大學（Carnegie Mellon University）發展深藍（Deep Blue）人工軟件，1989年與當時國際象棋世界冠軍蘇聯的Garry Kasparov 下了六局，電腦輸四比二；1997年以更先進的軟件贏兩局和三局。電腦可以在國際象棋戰勝人腦的世界冠軍，對於更複雜的圍棋又怎樣呢？國際象棋只有64個方格，棋子分為國王、皇后、城堡/車、主敎/象、騎士/馬及卒，各有行走的規則，故此變化有限，每盤下到三十幾手可定輸贏。圍棋有361點，黑白棋子可以任意放置，變化的可能性遠勝於國際象棋，一盤要下到200手才能分勝負。故此勝過世界國際象棋冠軍的電腦，在日後的十多年仍然沒法打敗圍棋的職業棋手。

電腦擊敗韓棋藝高手

隸屬谷歌的倫敦深心靈（DeepMind）科技團隊接受挑戰，發展以AlphaGo為名的人工智能軟件專攻圍棋。Go就是日文圍棋的名稱，團隊由 David Silver和有華裔血統的 Demis Hassabis領導，不少軟件工程師成員年輕時均為出色國際象棋或圍棋棋手。軟件收錄過往專家的棋譜，輸入三千萬步棋，即時可以評估每一手的勝算，計算每一手棋之後的五十步可能有的回應。2016年3月與世界圍棋冠軍李世乭於首爾四季酒店進行五盤比賽，雙方各有兩小時考慮時刻，勝方可以獲得100萬美元獎金。賽前大家都看好人腦會勝過電腦，因為在幾個月前的比賽中，電腦只贏過歐洲冠軍二段棋手樊麾，李世乭是職業九段選手，贏過18項世界冠軍，賽前充滿信心可以擊敗電腦。結果電腦勝人腦四比一，李世乭贏得第四盤，這是AlphaGo 與人腦74場比賽中唯一的一次勝出。

錯中學習不重複犯錯

第二盤電腦下的第37手，令評論人員大惑不解，這是很怪的一手，正常人都不會下這一手。結果證明電腦是有理解能力、有創意，甚至類似人類的直覺，不會只模仿以往輸入的步驟；這一手神來之筆改變了戰局，令電腦取得勝利。電腦下了看來愚蠢的37手，結果被認為是導致勝利的高招；當然李世乭也是會從錯誤中學習的高手，在第四盤來了出人意表的78手，令電腦不知所措，結果贏得唯一的一盤，事後電腦工程師補救這一手帶來的困惑。電腦的強項就是能夠從錯誤中學習，不重複犯錯。

一年後AlphaGo Master 挑戰中國的世界冠軍柯潔（1997-），三盤全勝，獲得中國圍棋協會頒授職業九段證書。已經找不到人類的對手，AlphaGo 和 DeepMind 團隊解散，完成了這個階段的歷史任務。有學習能力的電腦不但有創意，在棋藝方面勝過人腦。Hassabis遂向更靈活的人工智能發展雙子星軟件Gemini，最近在即時翻譯、撰寫會議紀錄的比試中，曾經領先世界的雙子星Gemini 1.5 Pro竟然輸給後浪 Open AI ChatGPT4o，看來我們都要準備生活在電腦勝過人腦的新世界了。

江大惠（多倫多）