賀佳圓
(中國(guó)農(nóng)業(yè)大學(xué),北京 100083)
在所有的體育比賽中,棒球無(wú)疑是最突出智力競(jìng)賽的項(xiàng)目之一。棒球運(yùn)動(dòng)是一項(xiàng)以跑、跳、投、打、接等技術(shù)動(dòng)作構(gòu)成的、在特定技術(shù)和戰(zhàn)術(shù)基礎(chǔ)上進(jìn)行的團(tuán)隊(duì)體育運(yùn)動(dòng)[1]。它在世界上影響較大,被譽(yù)為“競(jìng)技與智慧的結(jié)合”。棒球運(yùn)動(dòng)在美國(guó)、日本尤為盛行,被稱為“國(guó)球”。早期中國(guó)棒球主要受美國(guó)棒球影響較多,之后逐漸轉(zhuǎn)向日本學(xué)習(xí),中國(guó)棒球與美國(guó)、日本的交流多以技術(shù)動(dòng)作為主,涉及力量訓(xùn)練方面比較少[2]。雖然棒球在中國(guó)并不普及,但卻是一項(xiàng)體力與智力高度結(jié)合的運(yùn)動(dòng):棒球運(yùn)動(dòng)不僅能夠發(fā)展體能素質(zhì),還可以促進(jìn)智力發(fā)育,培養(yǎng)集體主義精神,非常適合在當(dāng)代青年中普遍開(kāi)展。
在一場(chǎng)棒球賽中,棒球球員分為進(jìn)攻、防守兩方。場(chǎng)上投球手是防守方,擊球手是進(jìn)攻方。進(jìn)攻方的目的就是通過(guò)揮棒打出投球手投出的球從而得分,防守方的目的就是阻止進(jìn)攻方得分。無(wú)論是哪個(gè)角色,想要在棒球運(yùn)動(dòng)中取得勝利,除了對(duì)項(xiàng)目特征有深刻認(rèn)識(shí)、進(jìn)行力量和技巧訓(xùn)練以外,還要懂得通過(guò)博弈論來(lái)制定最優(yōu)策略。
我們知道,如果一件事情的結(jié)果只依賴于一個(gè)參與者,這叫做決策論。在此基礎(chǔ)上,如果結(jié)果依賴于多于一個(gè)參與者的決策,便為博弈論。在棒球比賽中,比賽的結(jié)果不僅取決于投球手的投球技術(shù)和策略,也取決于擊球手的擊球技術(shù)和策略,因此棒球比賽的過(guò)程也是博弈的過(guò)程。
在棒球比賽中,投球手希望以智取勝擊球手。對(duì)某個(gè)擊球手,投球手的最佳策略可能總是投出快球,但對(duì)于另一個(gè)擊球手,投球手可能總是投出弧線球更好。而對(duì)于第三個(gè)擊球手,投球手的最佳策略可能是以某種隨機(jī)的方式混合地投出快球和弧線球。
擊球手可以猜測(cè)投球手要么投出快球,要么投出弧線球。如果他預(yù)計(jì)投球手投出快球,按照投球手實(shí)際擲出的是快球或是弧線球,他擊球?qū)⒎謩e得到0.400或是0.200分;如果他預(yù)計(jì)是弧線球,按照投球手實(shí)際擲出的是快球或是弧線球,他擊球?qū)⒎謩e得到0.100或是0.300分。在這個(gè)例子中,投球手希望使擊球手的平均得分最小,而擊球手希望自己的平均得分最大,因此投球手和擊球手的沖突是完全的,沒(méi)有參與者在不傷害其他參與者的前提下能夠使自己得到改善,投球手和擊球手之間注定是一個(gè)完全沖突博弈的關(guān)系。
可以看出在這種情況下,如果擊球手預(yù)計(jì)是快球,那么投球手應(yīng)該擲出弧線球。如果擊球手預(yù)計(jì)是弧線球,那么投球手應(yīng)該擲出快球。正如表1中所示,投球手需要采用兩種策略,即快球和弧線球。從擊球手的角度看,如果投球手總是投出快球,擊球手將轉(zhuǎn)換到總是預(yù)計(jì)快球的策略,而如果投球手總是投出弧線球,擊球手將轉(zhuǎn)換到總是預(yù)計(jì)弧線球的策略。擊球手也需要采用兩種策略,這意味著一個(gè)參與者總是可以通過(guò)單方面改變策略使得自己得到改善,投球手和擊球手的較量沒(méi)有純策略解,兩人都沒(méi)有占優(yōu)策略。那么,對(duì)擊球手和投球手而言,最佳混合策略是什么?
我們首先考慮擊球手的決策,他希望選擇猜測(cè)快球或者弧線球的組合,使擊球平均分最大。令x表示擊球手猜測(cè)是快球的比例,1-x表示猜測(cè)是弧線球的比例,我們有EV(投球手投快球)=0.400x+0.100(1-x),EV(投球手投弧線球)=0.200x+0.300(1-x),令它們相等并求解,得到0.400x+0.100(1-x)=0.200x+0.300(1-x),解得x=0.5。因此,擊球手應(yīng)該猜測(cè)50%的快球和50%的弧線球。我們可以通過(guò)計(jì)算投球手采用快球策略或者弧線球策略時(shí)對(duì)應(yīng)的擊球手的期望值來(lái)確定擊球平均分:EV(投球手投快球)=0.400x+0.100(1-x)=0.400*0.5+0.100*0.5=0.250。這表明,如果擊球手50%的時(shí)間猜測(cè)快球,無(wú)論投球手采用純快球策略還是純弧線球策略,他都能得到0.250的分?jǐn)?shù)。令y表示投球手?jǐn)S出快球的比例,1-y表示投球手?jǐn)S出弧線球的比例,由于無(wú)論投球手?jǐn)S出快球還是弧線球,結(jié)果分?jǐn)?shù)都是0.250,所以我們有擊球平均分的期望值:A=0.250y+0.250(1-y)=0.250,因此,無(wú)論投球手采用何種策略,只要擊球手采用自己的最優(yōu)策略,他都能得到0.250的分?jǐn)?shù)。
我們?cè)賮?lái)考慮投球手的決策,他希望選擇擲出快球或者弧線球的某種組合,使擊球平均分最小。同理,我們給出擊球手的策略的期望值,EV(擊球手采用快球策略)=0.400y+0.200(1-y),EV(擊球 手 采 用弧線 球策略)=0.100y+0.300(1-y),令它們相等并求解,得到0.400y+0.200(1-y)=0.100y+0.300(1-y),解得 y=0.250。因此,投球手應(yīng)該擲出25%的快球和75%的弧線球,與前面一樣,擊球平均分0.250,這可以通過(guò)計(jì)算期望值驗(yàn)證,EV(擊 球 手 采用 快 球 策 略)=0.400y+0.200(1-y)=0.400*0.25+0.200*0.75=0.250。無(wú)論擊球手采用純快球策略還是純弧線球策略,擊球平均分都是0.250,如果擊球手采用混合策略而投球手堅(jiān)持25%的時(shí)間擲出快球,75%時(shí)間擲出弧線球,擊球平均分的期望值都是A=0.250x+0.250(1-x)=0.250,所以,無(wú)論擊球手采用何種策略,只要投球手采用自己的最優(yōu)策略,他都能使擊球平均分是0.250,投球手的結(jié)果不再依賴于擊球手的策略。
我們可以將上述博弈過(guò)程一般化,得到一個(gè)適用于任何簡(jiǎn)單情形的博弈模型。我們假設(shè)擊球手預(yù)計(jì)投球手投出快球,按照投球手實(shí)際擲出的是快球或是弧線球,他擊球?qū)⒎謩e得到a或是b分;如果他預(yù)計(jì)是弧線球,按照投球手實(shí)際擲出的是快球或是弧線球,他擊球?qū)⒎謩e得到c或是d分。我們按照前文的思路,可以得到EV(投球手投快球)=ax+c(1-x),EV(投球手投弧線球)=bx+d(1-x),令它們相等并求解,得到x=(d-c)/(a-b+d-c),因此,擊球手應(yīng)該猜測(cè)(d-c)/(a-b+d-c)的快球和[1-(d-c)/(a-b+d-c)]的弧線球。對(duì)于投球手而言,EV(擊球手采用快球策略)=ay+b(1-y),EV(擊球手采用弧線球策略)=cy+d(1-y),令它們相等并求解,得到y(tǒng)=(d-b)/(a-c+d-b),因此,投球手應(yīng)該擲出(d-b)/(a-c+d-b)的快球和[1-(d-b)/(a-c+d-b)]的弧線球。這個(gè)博弈模型適用于投球手和擊球手在知道擊球手的預(yù)判和投球手實(shí)際投出的球所對(duì)應(yīng)的得分時(shí),能夠自動(dòng)形成雙方的最優(yōu)策略。
在這場(chǎng)投球手和擊球手的較量中,需要注意的一點(diǎn)是,即使對(duì)手并不通過(guò)推理得到其最優(yōu)解,你也需要知道他策略的最優(yōu)混合方式,以便你能從他的草率行為中占到最大的便宜[3]。
我們注意到保密是很重要的,在前文的例子中,擊球手必須猜測(cè)投球手以50%的概率混合擲出快球和弧線球,但投球手沒(méi)有必要弄清楚擊球手的擊球模式。擊球手可能會(huì)利用時(shí)鐘或者隨機(jī)數(shù)發(fā)生器來(lái)決定什么時(shí)候猜測(cè)是快球。例如他利用時(shí)鐘的秒針,每當(dāng)秒針位于0-30秒時(shí),就猜測(cè)是快球。
從前面的分析中,我們看到擊球手從他的最優(yōu)解中得到了有用的信息,即他可以通過(guò)一個(gè)策略保證他希望得到的結(jié)果,無(wú)論他面對(duì)的投球手采用什么樣的策略,這是一種很重要的“保證能夠得到的結(jié)果”的想法,在日常生活中也有著極為廣泛的應(yīng)用。但是我們也從前面的分析中得出,如果觀察到投球手希望最小化擊球手的擊球平均分,擊球手可能會(huì)從這個(gè)有用的信息中得到啟示從而確定投球手的最優(yōu)策略,如果投球手采用了最優(yōu)策略,擊球手不可能得到比他所能保證的擊球平均分更好的分?jǐn)?shù),在我們上面的舉例中就是0.250的平均分。但是如果投球手不采用最優(yōu)策略,擊球手就可以通過(guò)改用他的純快球策略或者純弧線球策略來(lái)增加自己的分?jǐn)?shù),以從投球手的草率行為中占到最大的便宜。從這個(gè)意義上講,投球手的最優(yōu)策略代表了擊球手的一個(gè)臨界點(diǎn),如果投球手不采用最優(yōu)策略,擊球手也可以不采用他的最優(yōu)混合策略,從而使得自己的擊球平均分超過(guò)0.250,這是他所能保證得到的分?jǐn)?shù)。最重要的一點(diǎn)在于,投球手并不一定是一個(gè)理性的參與者(即自身利益最大、持續(xù)地有意圖的行動(dòng)、不對(duì)動(dòng)機(jī)妄加猜測(cè)、不考慮道德問(wèn)題、只研究合法問(wèn)題、盈利函數(shù)有多重標(biāo)準(zhǔn)的參與者),因此擊球者可以從非理性的投球者身上占到便宜。
在實(shí)際中,每個(gè)參與者的球技肯定會(huì)發(fā)生變化。例如,針對(duì)某個(gè)特定的擊球手,如果所有的投球手的最優(yōu)混合策略是只擲出弧線球,那么這個(gè)擊球手很可能會(huì)改進(jìn)他擊打弧線球的能力,這就會(huì)使投球手對(duì)應(yīng)的擊球手的最優(yōu)混合策略發(fā)生改變,相應(yīng)的擊球平均分也會(huì)發(fā)生變化。
每個(gè)參與者的策略可能會(huì)有拓展,比如與不同的投球手(力量型投球手、技巧型投球手、策略型投球手等)博弈,擊球手采用不同策略的得分是不同的。除此之外,投球手還可能投出快球、叉指快速球、弧線球、變速球等,擊球手知道這些投球方式,且必須為這些投球方式做好適當(dāng)準(zhǔn)備。當(dāng)每個(gè)參與者的策略增多時(shí),我們可以建立線性規(guī)劃的模型,找出最優(yōu)解來(lái)得到投球手和擊球手的策略。
投球手和擊球手的較量是一個(gè)有混合策略的完全沖突博弈,棒球賽的魅力就表現(xiàn)在投球手與擊球手在較量時(shí)發(fā)生的智力對(duì)策上,這也是吸引我研究這次博弈的原因。在棒球賽中,巧妙運(yùn)用博弈模型可以使自身的優(yōu)勢(shì)放大,得分的可能性增加,為本隊(duì)獲勝提供有利條件。同時(shí),這種博弈的思想和最優(yōu)策略的計(jì)算方法對(duì)于其他體育比賽以及經(jīng)濟(jì)、生活等方方面面也具有極大地適用性。