余培
(安徽工業(yè)大學計算機學院,安徽馬鞍山243000)
RoboCup(即機器人世界杯)是一項在世界機器人競賽領(lǐng)域中具有重大影響的專業(yè)競賽,該比賽的設(shè)想首先是由加拿大教授Alan Mackworth 在論文[1]中提出的。1993 年6 月,日本研究人員Mi?noru Asada 和Hiroaki Kitano 決定啟動RoboCup J錦標賽,后來擴展為國際項目,正式更名為機器人世界杯,簡稱RoboCup,因其融合多門學科的研究成果,現(xiàn)已成為當今科研的熱點問題[2]。RoboCup仿真2D組是RoboCup下的一個分支項目,主要考察人工智能和團隊策略的應(yīng)用。
近年來很多學者將數(shù)據(jù)挖掘與建模的思想引入對RoboCup 比賽日志文件的研究中,均取得了很多成就,但對于邊界球這一分支的研究較少。本文基于數(shù)據(jù)挖掘的思想,對日志文件中的邊界球信息進行挖掘分析,為球隊的決策改良做出理論指導。本文將球場劃分為四個區(qū)域,解析日志文件,將比分差作為因變量,將四個區(qū)域內(nèi)兩支隊伍邊界球數(shù)目的差值分別作為四個不同的自變量,使用逐步回歸的方式剔除不顯著的兩個自變量,并得出剩下兩個顯著的自變量與因變量之間的多元線性回歸模型,由此得出能夠?qū)η蜿牄Q策進行理論指導的結(jié)論。
RoboCup的日志文件通常被用來回放比賽內(nèi)容,也可被當作數(shù)據(jù)源挖掘具有潛在價值的信息?;诒荣惾罩疚募耐诰蚍治?,前人曾做過有關(guān)傳球、球員跑位、球員陣型等方面的研究,例如學者陳梅利用密度峰值聚類算法對球隊陣型進行研究[3];學者田杰挖掘出比賽日志文件中的傳球信息,采用偏最小二乘法探究對勝負影響最大的傳球類型[4];學者聶亮通過挖掘日志文件探索更高效的進攻跑位策略[5]。
邊界球在足球比賽中十分常見,比賽中一旦足球被踢出界,將由對方球員在出界點將球擲回場內(nèi)。基于日志文件挖掘的邊界球技術(shù)研究是前人研究中關(guān)注度較低的一個分支,這方面的研究成果幾乎是空白。比賽中與邊界球相關(guān)聯(lián)的因素有很多,例如對方的傳球失誤、鏟球壓力等,本文選取邊界球分布和比分之間的關(guān)系作為研究對象。
本文主要使用逐步回歸的方法搭建多元線性回歸模型,配合使用相關(guān)系數(shù)、擬合優(yōu)度檢驗、F檢驗和t檢驗等方法。
一般使用回歸分析研究某一個隨機變量與一個或幾個變量之間的數(shù)量關(guān)系,所得到的回歸方程依據(jù)所含的變量的數(shù)目不同,可被分為一元回歸方程和多元回歸方程[6]。在很多實際情況下,一種現(xiàn)象常常和多種因素連接在一起,即因變量的確定在很多情況下都是和多個自變量密切相關(guān)的。多元回歸模型的應(yīng)用場景十分廣泛,例如學者付鳳玲利用多元回歸模型通過玉米苗期各項指標的耐旱系數(shù)預測其耐自交系的耐旱性[7];學者林高用使用多元回歸分析方法探究各金屬的含量與合金耐腐蝕性的關(guān)系[8]。
設(shè)隨機變量y與一般變量之間滿足以下線性關(guān)系:是p+1 個未知參數(shù),0β被稱為回歸常數(shù)
式(1)中被稱為回歸系數(shù)。y即因變量又稱為被解釋變量是p個自變量,被稱為解釋變量,ε是隨機誤差。大多數(shù)情況下采用普通最小二乘法計算多元線性回歸方程的未知數(shù)
通常使用皮爾遜(Pearson)相關(guān)系數(shù)來衡量兩個連續(xù)變量之間的線性相關(guān)程度,用r來表示,它的計算公式為:
式(2)中的n代表樣本容量,和分別代表自變量和因變量的均值。相關(guān)系數(shù)r的取值范圍為1≤r≤1 ,其中r>0 代表所研究的兩個連續(xù)變量存在正的線性相關(guān)關(guān)系,r<0 代表這兩個變量存在負的線性相關(guān)關(guān)系;|r|≤ 0.3 表示兩個變量幾乎不存在線性相關(guān),0.3 <|r| ≤0.5 表示兩個變量具有中等程度的線性相關(guān)[9],0.5 <|r|≤ 0.8 表示顯著線性相關(guān),而|r|> 0.8 則代表最為理想的高度線性關(guān)系。
多元線性回歸模型的檢驗方式主要有擬合優(yōu)度檢驗、F檢驗和t檢驗,各種不同的檢驗方式有其各自的優(yōu)劣之處。
2.3.1 擬合優(yōu)度檢驗
一般使用擬合優(yōu)度R2來檢驗多元線性回歸方程的擬合程度,其公式為:為回歸平方和
其中為原始數(shù)據(jù)yi的總變異平方和。2R的取值在[0,1]之間,越接近1表示擬合的效果越好,但若2R過高需警惕過擬合現(xiàn)象。
2.3.2 多元線性回歸模型的F檢驗
在多元回歸分析中,通常使用F檢驗來檢驗所有的解釋變量從整體上對因變量是否有明顯的影響,建立F檢驗統(tǒng)計量如下:式(4)中的指殘差平方和。當認為在顯著水平α下,y和有顯著的線性關(guān)系,反之認為它們之間沒有顯著的線性關(guān)系。多元回歸分析的F檢驗反映模型整體的顯著性,而無法檢驗單個自變量的顯著性。
2.3.3 多元線性回歸模型的t檢驗
與F檢驗不同,t檢驗可反映單個自變量和因變量之間的顯著性,有時候會存在以下情況,即多元線性回歸模型符合F檢驗,但其中的某些自變量無法通過t檢驗,這就說明當前所得到的模型并不是最優(yōu)的,需要進行變量的篩選。
對于一個實際求解多元線性回歸模型的問題,獲得了n組觀測數(shù)據(jù)(則線性回歸模型可表示為:
將式(5)轉(zhuǎn)換成矩陣形式為:y=X β+ε,其中
由此構(gòu)造的t檢驗統(tǒng)計量如下:
ie為iy的殘差為多元線性回歸模型中的xj系數(shù)。確定顯著水平α,若認為該自變量顯著,否則認為該自變量不顯著。
首先將球場劃分為若干區(qū)域使得邊界球的橫坐標離散化,再通過解析日志文件提取出左右兩支隊伍在各區(qū)域的邊界球數(shù)目之差和比分差,由此構(gòu)造解釋變量與被解釋變量。
3.1.1 球場的劃分
仿真2D 的球場總長度105 m,總寬度68 m。邊界球的縱坐標是固定值,橫坐標是連續(xù)型變量,為了將其離散化,將球場劃分為不同區(qū)域。劃分球場的依據(jù)有均勻劃分和基于信息熵劃分等方式,這里為了簡化模型,采用均勻劃分的方式。依照習慣可將球場劃分為四個區(qū)域、六個區(qū)域或八個區(qū)域,在后續(xù)實驗中由于劃分為六個區(qū)域或八個區(qū)域會使得各個解釋變量的顯著性太差,最終選擇將球場劃分為四個區(qū)域。如圖1所示將球場平均劃分為四個區(qū)域,區(qū)域名分別是和x4,被劃分的球場區(qū)域以及其每個區(qū)域的橫坐標范圍如表1所示:
圖1 球場區(qū)域劃分
表1 球場區(qū)域劃分范圍
3.1.2 日志文件的解析
RoboCup的日志文件由比賽中的系統(tǒng)自動生成,分為rcg文件和rcl文件。rcg文件由當前周期、球的信息和球員信息等部分組成;其中球的信息顯示了在當前周期球的橫縱坐標以及沿x軸和y軸的速度;球員信息包含了球員標識以及各種參數(shù)信息。rcl 文件則包含具體的裁判命令信息。
在比賽狀態(tài)發(fā)生改變的時候,rcg文件內(nèi)會由單獨成行的playmode后面的內(nèi)容提示當前比賽的新狀態(tài),通常有play_on,corner_kick,foul_charge,goal,kick_in 等 等。其 中kick_in 代 表 邊 界 球,kick_in_l 代表右方球員踢球出界,由左方球員取得球權(quán)在邊界發(fā)球。反之kick_in_r則代表右方球員在邊界發(fā)球。
本文選取安徽工業(yè)大學的YuShan 和其他三支不同隊伍總共80 場比賽的日志文件作為數(shù)據(jù)源,為獲取比賽雙方在不同區(qū)域的邊界球數(shù)目,使用Python語言解析rcg文件,提取比賽雙方在四個區(qū)域的邊界球數(shù)以及比分。例如解析某一場比賽,其結(jié)果如表2所示:
表2 某場比賽的解析結(jié)果
3.1.3 變量的構(gòu)造
為了研究邊界球分布與比賽得分的關(guān)系,將每場比賽雙方隊伍在各區(qū)域的邊界球數(shù)與比分作差。將結(jié)果寫入xls 文件中,得到的部分xls 文件如表3所示:
表3 部分xls文件
表3 中的第一列id 表示比賽的編號,從1 開始;第二到第五列分別為雙方球隊在各個區(qū)域的邊界球數(shù)之差值,分別用解釋變量x1,x2,x3和x4表示;第六列為左右隊的分差,為因變量y。
利用Python計算出四個解釋變量與因變量之間的皮爾遜(Pearson)相關(guān)系數(shù)矩陣,結(jié)果如表4所示:
表4 解釋變量和因變量的相關(guān)系數(shù)矩陣
從表4 中可以看出,存在和因變量之間的相關(guān)系數(shù)非常低的自變量,例如 3x和y之間的相關(guān)系數(shù)僅有0.048 532,即并非所有的自變量都對y有很顯著的影響,這就需要篩選出符合條件的自變量。
多元回歸模型自變量篩選的方法有前進法、后退法和逐步回歸法,文獻[10]提出現(xiàn)階段最受推崇的變量篩選方法是逐步回歸法。與之相比,前進法無法反映引進新自變量后的當前自變量的顯著情況,即有可能引入新的自變量后原本顯著的某一自變量變得不顯著,但是沒有機會將其剔除;后退法則存在開始計算量太大等問題。逐步回歸法吸收了前進法和后退法的優(yōu)點,克服了它們的不足。具體方法是在引入一個新的變量后重新對模型進行F檢驗和t檢驗,剔除掉其中不顯著的變量,直到?jīng)]有顯著的自變量被引入和不顯著的自變量被剔除為止,故逐步回歸法最后一步得到的模型是最優(yōu)模型。
引入與y的相關(guān)系數(shù)絕對值最高的2x作為多元線性回歸模型的第一個自變量,使用最小二乘法計算出的回歸模型一以及各項參數(shù)如表5所示,并選取擬合優(yōu)度R2和F檢驗對該模型進行檢驗。
表5 模型一及各項檢驗參數(shù)
該表的第二列表示該模型各變量的系數(shù)及該模型的常量,第三列表示t檢驗統(tǒng)計量的絕對值第四、第五列分別表示該模型的擬合優(yōu)度R2和F檢驗的統(tǒng)計量。其中F值為1 1.500 >F0.01(1,78) ≈ 6.85,在α= 0.01的顯著水平下顯著,但R2很低。接下來在x2的基礎(chǔ)上引入相關(guān)系數(shù)次高的x1,計算出的回歸模型二以及各項參數(shù)如表6所示:
表6 模型二及各項檢驗參數(shù)
模型二計算出的F值為11.186,大于F0.01(2,77) ≈ 4.79,故在α=0.01 的顯著水平下模型二顯著;x1,x2的t值分別為3.099 和3.317,均大于t0.005(77) ≈ 2.617,可以得出在α=0.01 的顯著水平下,x1,x2依然顯著,故不需要剔除任何一個變量。
下面考慮x3,4x變量,依次引入它們,重新計算回歸模型三和模型四,它們的系數(shù)、常量與各項參數(shù)分別如表7和表8所示:
表7 模型三及各項檢驗參數(shù)
表8 模型四及各項檢驗參數(shù)
從表7和表8可以看出:模型三和模型四的F值均大于F0.01(3,76) ≈ 3.95,故模型三和模型四均顯著,但是兩個模型中x3和x4的均小于故x3,x4在模型三和模型四中均不顯著,應(yīng)被剔除,最終所得到的結(jié)果是模型二。
綜上所述,模型二為最優(yōu)的多元線性回歸模型,其表達式為:
式(7)為通過逐步回歸法得到的邊界球坐標和比分差之間最優(yōu)的多元線性回歸模型。令y> 0,得出下式:
式(8)即為球隊獲得勝利的邊界球分布模型,由前文中對該模型F檢驗的結(jié)果可得,在α=0.01 的顯著水平下可以基本認為,邊界球分布特征符合該模型的球隊擁有較高的勝率。
通過各解釋變量的系數(shù)可以看出,站在左隊的視角,隊伍落在[-52.5,-26.25)區(qū)域內(nèi)的邊界球數(shù)目越少或落在[-26.25,0)區(qū)域內(nèi)的邊界球數(shù)目越多,獲勝的可能性越大。聯(lián)系實際比賽,是由于對方球隊在[-52.5,-26.25)區(qū)域的攻擊普遍較強,導致我方的邊界球易被對方截取甚至進球;而對方球隊在[-26.25,0)區(qū)域的防守較弱,易被我方邊界球突破得分。比賽中鏟球和邊界球密切相連,是造成邊界球的主要原因,故一支隊伍的邊界球很大程度依賴于對方的鏟球,這啟示我們在比賽中應(yīng)加強[-52.5,-26.25)區(qū)域的界外鏟球,提高防守能力;并加強[-26.25,0)區(qū)域以得分為目的的進攻,使得x2區(qū)域的鏟球盡可能多地鏟向 3x區(qū)域,避免出界,以此達到在不同區(qū)域增加或減少對方邊界球數(shù)的目的,從而影響邊界球數(shù)目的差值,提高比賽的勝率。
本文使用多元線性回歸模型,以數(shù)據(jù)挖掘為主要思想,探究邊界球分布和比分之間的數(shù)學關(guān)系。該回歸模型對于實際比賽的啟示是,站在左隊的視角,在球場[-52.5,-26.25)區(qū)域內(nèi)的鏟球應(yīng)該盡可能地出界,而在[-26.25,0)區(qū)域內(nèi)的鏟球應(yīng)該鏟向球場右半場。下一步工作是在球隊的代碼中運用該結(jié)論,有意識地控制不同區(qū)域鏟球的方向和位置,以控制邊界球的數(shù)目差,從而達到提升隊伍勝率的目的。