李子敬,田鈞友,顧振宇
?
用統(tǒng)計(jì)方法確定圍棋布局的好壞*
李子敬,田鈞友,顧振宇
(上海對外經(jīng)貿(mào)大學(xué),上海 200336)
本項(xiàng)目將人類棋手以往的棋譜作為數(shù)據(jù),以中國流為例,把勝負(fù)設(shè)為0-1變量,進(jìn)行Logistic回歸,考察對局的規(guī)定用時、白棋應(yīng)對方式、雙方棋手風(fēng)格與中韓規(guī)則對勝負(fù)的影響。最后得出兩種迷你中國流有優(yōu)勢,中國流布局適合進(jìn)攻型下法的棋手,中國流布局適合針對下法保守的對手,規(guī)定用時與白棋應(yīng)對方式對勝率影響不顯著這4個結(jié)論。同樣的,這個研究方法可以在研究其他圍棋布局中使用,對棋手進(jìn)行指導(dǎo)。
圍棋;中國流;Logistic回歸;棋手
隨著谷歌公司AlphaGo的研發(fā),近年來圍棋這項(xiàng)智力運(yùn)動受到人們越來越多的關(guān)注。圍棋是世界上變化最多的一種棋類運(yùn)動,AlphaGo卻另辟蹊徑,采用機(jī)器學(xué)習(xí)的方法讓計(jì)算機(jī)成為了圍棋大師,擊敗了所有人類棋手。在這個過程中,AlphaGo下出了很多聞所未聞的走法,并靠著這樣的走法贏棋。因此,很多已有的圍棋走法(布局、定式等)已經(jīng)被打破。按理說,這對于棋手是一件好事,因?yàn)橛懈鼜?qiáng)的高手跟他們切磋。但同時也出現(xiàn)了一個問題:人們有時候看不懂AlphaGo的棋(它的算法并非窮局,因此不會列出之后沒下出的招法)。棋手們知其然而不知其所以然,這就是本項(xiàng)目的出發(fā)點(diǎn),即對人類的棋法進(jìn)行總結(jié),找出不同下法的優(yōu)劣。
布局是本項(xiàng)目的研究對象,是圍棋這項(xiàng)棋類運(yùn)動開始的50手的下法,可以說定下了全盤的戰(zhàn)略部署。由于圍棋棋盤由縱橫各十九條等距離、垂直交叉的平行線構(gòu)成,構(gòu)成361個交叉點(diǎn),因此圍棋中布局的可能性也是最多的。在這種情況下,黑方的主動與白方的應(yīng)對如果足夠得當(dāng),那可以稱為兩分:即黑白雙方平分秋色。圍棋歷史悠久,所以有很多布局是由無數(shù)先人總結(jié)出來的被認(rèn)為雙方都不吃虧的下法?!爸袊鳌辈季肿?0世紀(jì)60年代由中國的圍棋大師陳祖德九段創(chuàng)立以來,通過無數(shù)實(shí)戰(zhàn)檢驗(yàn),被認(rèn)為是兩分的,并且有多種變種(高中國流、迷你中國流等)。本項(xiàng)目以此為例,得出“中國流”布局多種下法的優(yōu)劣,看看它們是否真如前人認(rèn)為的那樣兩分,以及其在不同情況下對勝率的影響。
本項(xiàng)目使用python爬取了“弈城圍棋”“tom圍棋道場”“新浪圍棋”等幾個棋譜的數(shù)據(jù)庫,得出了6種中國流棋譜的數(shù)據(jù)(勝負(fù)、雙方棋手、規(guī)定時長、圍棋規(guī)則、中國流的類型、白方應(yīng)對方式)。本項(xiàng)目為減少異常值,選取的棋譜都是專業(yè)棋手所下。
本項(xiàng)目的響應(yīng)變量為勝負(fù),即0-1型變量(黑棋勝則為1,黑棋敗則為0)。而預(yù)測變量則設(shè)置了“規(guī)定的對局時間(短、中、長)”“白棋的應(yīng)對方式(二連星、星小目)” “中國流的類型(包括中國流、高中國流、迷你中國流1、迷你中國流2)”“黑棋棋風(fēng)(進(jìn)攻、均衡、保守)”“白棋棋風(fēng)(進(jìn)攻、均衡、保守)”“圍棋規(guī)則(中國規(guī)則黑貼七目半、韓國規(guī)則黑貼六目半)”。
需要補(bǔ)充的是:
第一,規(guī)定的對局時間:①短,30 s一步,10次一分鐘讀秒;②中:每方1 h,讀秒一分鐘一次;③長:雙方2 h40 min,5次一分鐘讀秒。
第二,白棋應(yīng)對方式中的星小目,小目朝向?yàn)樽约旱男俏?,而非黑棋的星位或者小目,因?yàn)楹笳呤墙^對吃虧的,在此不做討論。
第三,本項(xiàng)目對于棋手的棋風(fēng)歸類是根據(jù)本人(業(yè)余五段)的判斷,例如常浩為均衡型、古力為力戰(zhàn)型、木谷實(shí)為保守型,而對于那些難以界定棋風(fēng)的棋手,這里省略,不納入研究。
使用R語言建立Logistic回歸模型,y為勝負(fù),x1為規(guī)定的對局時間,x2為白棋的應(yīng)對方式, x3為中國流的類型,x4為黑棋棋風(fēng),x5為白棋棋風(fēng),x6為中國規(guī)則還是韓國規(guī)則。發(fā)現(xiàn)x1(對局用時)和x2(白棋應(yīng)對方式)不顯著(>0.05)。去除這兩個變量,重新擬合模型,得到表1.
注意到x4的系數(shù)為負(fù),這是因?yàn)楹诘谋J仫L(fēng)格會對黑棋的勝利有負(fù)的影響,符合圍棋棋理。而其他預(yù)測變量的系數(shù)都為正,符合棋理。此外,注意到x6的系數(shù)很大,為0.682,可見中國規(guī)則與韓國規(guī)則所差的一目的貼目對勝率的影響非常大,超過了下法和棋風(fēng)的影響。
新模型的每一個回歸系數(shù)都非常顯著(<0.05)。使用anova函數(shù)進(jìn)行新舊模型的比較,使用卡方檢驗(yàn)得到結(jié)果的卡方值不顯著(=0.805 5),x1(對局用時)和x2(白棋應(yīng)對方式)并不會顯著增加方程預(yù)測精度,因此使用更簡單的模型。
運(yùn)用predict函數(shù)觀察各個預(yù)測變量在各個水平下對結(jié)果概率的影響,結(jié)果見表2.
表1 Logistic回歸模型
EstimateStd.Errorz valuePr(>∣z∣) (Intercept)﹣0.894 10.016 1﹣55.580.000 0 x30.029 50.002 810.610.000 0 x4﹣0.030 20.003 8﹣7.950.000 0 x50.033 20.003 88.730.000 0 x60.682 00.006 2109.810.000 0
表2 各個預(yù)測變量在各個水平下對結(jié)果概率的影響
x3x4x5x6forcast 11.0002.0002.0001.5000.541 22.0002.0002.0001.5000.548 33.0002.0002.0001.5000.556 44.0002.0002.0001.5000.563
4種中國流中,2種迷你中國流勝率(0.556,0.563)比較高。比較令人驚訝的是,高中國流的勝率(0.548)比中國流(0.541)來得高。這不符合圍棋常識,判斷可能是因?yàn)檫x用高中國流的人較少,所以白棋應(yīng)對起來有困難。
類似的,通過predict函數(shù),在對局雙方的棋風(fēng)上,可以看出黑棋為進(jìn)攻型棋風(fēng)時最占優(yōu),均衡型其次,保守型最末。而當(dāng)黑棋是進(jìn)攻型,白棋是保守型的時候,勝率為最大值0.568;但黑棋是進(jìn)攻型,白棋是穩(wěn)健型時,勝率為第二大值0.560;而當(dāng)黑棋為穩(wěn)健型,白棋為保守型時,勝率為第三大值0.559.綜上,中國流適合進(jìn)攻型棋手,且適合對付保守型棋手。
計(jì)算得到過度離勢值為1.34,可以判斷基本沒有過度離勢,模型擬合充分。
為研究圍棋中中國流布局在不同的對局用時、白棋的應(yīng)對方式、對局雙方棋風(fēng)等條件下的勝率,本文運(yùn)用Logistic回歸方法,最后得到規(guī)定用時和白棋應(yīng)對方式對勝率影響不顯著,兩種迷你中國流有優(yōu)勢,中國流布局適合進(jìn)攻型下法的棋手,中國流布局適合針對下法保守的對手的結(jié)論。
中國流只是一個例子。同樣的,這個方法也能應(yīng)用到其他布局上,例如“三連星”“平行型”等常見布局。這給圍棋研究提供了一個新的視角。
[1]周明明.基于專家系統(tǒng)和蒙特卡羅方法的計(jì)算機(jī)圍棋博弈的研究[D].南京:南京航空航天大學(xué),2012.
[2]湯銀才.R語言與統(tǒng)計(jì)分析[D].北京:高等教育出版社,2008.
[3]尹劍,陸程敏,楊貴軍.判別分析與Logistic回歸組合分類[J].數(shù)理統(tǒng)計(jì)與管理,2014,33(02):256-265.
[4]余磊,劉錦高.一種圍棋中盤問題的計(jì)算機(jī)求解方法[J].華東師范大學(xué)學(xué)報,2008(01):89-93.
2095-6835(2018)21-0138-02
C81
A
10.15913/j.cnki.kjycx.2018.21.138
本項(xiàng)目成果受“2018年度上海大學(xué)生創(chuàng)新創(chuàng)業(yè)訓(xùn)練計(jì)劃示范?!苯ㄔO(shè)經(jīng)費(fèi)資助
〔編輯:辛霞〕