馬晨昊 宋舒嫻 李潤(rùn)含
(1、大連海事大學(xué)信息科學(xué)技術(shù)學(xué)院,遼寧 大連116000 2、大連海事大學(xué)航海學(xué)院,遼寧 大連116000)
“穿越沙漠”游戲規(guī)定為:每名玩家在游戲開(kāi)始時(shí)都會(huì)收到一定數(shù)額的資金與闖關(guān)地圖,分別用來(lái)購(gòu)買行進(jìn)過(guò)程中必要的生活用品和規(guī)劃全局路線,途中經(jīng)過(guò)村莊可以用來(lái)補(bǔ)給資源,經(jīng)過(guò)礦山并采礦能獲得固定資金,玩家在探險(xiǎn)途中還可能會(huì)遇到惡劣天氣。在系統(tǒng)指定的時(shí)間內(nèi)從起點(diǎn)處穿越沙漠到達(dá)終點(diǎn)即為通過(guò),剩余的資金與資源越豐富獲得優(yōu)勝的機(jī)會(huì)越大。
要在未知天氣狀況下建立模型制定玩家的通關(guān)策略。
首先我們對(duì)影響最終結(jié)果的所有可能進(jìn)行分析得到玩家出發(fā)當(dāng)天遇到高溫天氣做出的選擇不確定性最大,為對(duì)游戲進(jìn)行仿真模擬我們建立基于熵權(quán)法的TOPSIS 多因素概率模型得到高溫天氣下玩家傾向選擇概率,并結(jié)合行走時(shí)間對(duì)其做出動(dòng)態(tài)分析。
其次我們使用基于動(dòng)態(tài)步長(zhǎng)的逐天模擬算法結(jié)合兩幅不同地圖對(duì)所有最佳路線進(jìn)行仿真,此算法特點(diǎn)主要有兩點(diǎn):一是對(duì)于天氣狀況的生成具有隨機(jī)性;二是大量模擬結(jié)果使得每種情況最終值精確。
基于熵權(quán)法的TOPSIS創(chuàng)新應(yīng)用的多因素概率模型:
玩家在未知情況下遭遇高溫天氣時(shí)的選擇會(huì)對(duì)最終結(jié)果產(chǎn)生很大影響。例如我們假設(shè)高溫狀態(tài)下玩家一律選擇呆在原地休整,等到晴天時(shí)才往下一個(gè)目的地出發(fā),這樣造成的結(jié)果可能為未在規(guī)定時(shí)間內(nèi)到達(dá)終點(diǎn)任務(wù)通關(guān)失敗,或者是在礦山挖礦時(shí)間短收益小導(dǎo)致最終總體浪費(fèi)資源過(guò)多;當(dāng)假設(shè)玩家在高溫狀態(tài)下持續(xù)行走不做停留,造成的結(jié)果可能會(huì)是中途玩家擁有物資短缺不足以支撐到下一個(gè)目的地。為解決此類問(wèn)題我們需對(duì)玩家在高溫天氣下選擇停留的概率進(jìn)行分析。
TOPSIS(優(yōu)劣解距離法)為C.L.Hwang 與K.Yoon 在1981 年提出的一種綜合評(píng)價(jià)方法,在已知原始數(shù)據(jù)信息的情況下評(píng)價(jià)結(jié)果能精確反應(yīng)各評(píng)價(jià)方案之間的差距,是應(yīng)用于多目標(biāo)決策分析中的一種有效方法,具有過(guò)程簡(jiǎn)單,處理靈活方便等特點(diǎn),適用于對(duì)玩家在不同情況下選取特定概率。
我們將玩家的每個(gè)選擇視為對(duì)象,物資消耗與收獲資金視為指標(biāo),已知各個(gè)指標(biāo)對(duì)應(yīng)的具體信息。對(duì)指標(biāo)的權(quán)重賦值有很多方法如專家評(píng)判,但其主觀性較強(qiáng),不同評(píng)判會(huì)對(duì)結(jié)果產(chǎn)生很大影響,采用熵權(quán)法來(lái)盡可能利用數(shù)據(jù)信息對(duì)指標(biāo)進(jìn)行客觀權(quán)重賦值。
下面我們利用基于熵權(quán)法的TOPSIS 模型對(duì)玩家面對(duì)不同情況選擇概率進(jìn)行具體求解。
3.1 統(tǒng)一指標(biāo)類型。資源消耗為極小型指標(biāo),消耗越多對(duì)選擇越不利;爭(zhēng)取資金為極大型指標(biāo),掙取越多對(duì)結(jié)果越有益。采用差值法對(duì)數(shù)據(jù)進(jìn)行正向化處理,我們采用如下公式:maxi-Xi(1)
其中S軌i∈[0,1],為歸一化后的概率得分,通過(guò)求解我們得到玩家在第三關(guān)遭遇高溫天氣選擇停留的概率為0.7672;在第四關(guān)遭遇高溫天氣選擇停留的概率為0.5753。
前面已經(jīng)利用TOPSIS 法對(duì)玩家在遭遇高溫天氣時(shí)選擇停留進(jìn)行客觀評(píng)價(jià)并求解出具體概率數(shù)值,但真實(shí)情況往往更為復(fù)雜。在游戲開(kāi)始后不久玩家遇到高溫天氣時(shí)會(huì)以一定概率選擇是否繼續(xù)行走,當(dāng)游戲進(jìn)程時(shí)間越靠近截止日期時(shí)玩家的心境會(huì)從理性變?yōu)榻辜保谠浇咏螒蚪Y(jié)束日期時(shí)會(huì)出于節(jié)省時(shí)間的考慮傾向于高溫天繼續(xù)行走這一選擇。
指數(shù)函數(shù)通常適合用來(lái)描述兩關(guān)聯(lián)因素之間的規(guī)律變化特征,對(duì)其進(jìn)行修改得到玩家在高溫天氣選擇停留的概率與時(shí)間變化的關(guān)系,我們?cè)O(shè):P=pie1-ti(i=1,2) (11)
其中i=1,2 分別代表第三關(guān)與第四關(guān)兩種情況;P 為玩家在不同時(shí)間內(nèi)遇到高溫天氣選擇停留的概率;pi為關(guān)卡內(nèi)游戲開(kāi)始第一天為高溫天氣時(shí)玩家選擇停留的概率,p1=0.7672,p2=0.5753;ti為從游戲開(kāi)始到遇到高溫的時(shí)間數(shù),t1∈[1,10],t2∈[1,30]。
當(dāng)i=1 即處于第三關(guān)時(shí),假設(shè)玩家在第一天遇到高溫,此時(shí)選擇原地停留休整的概率最大,即為p1;當(dāng)t1不斷增大時(shí)選擇概率不斷緩慢下降最終趨于0,因此公式(9)能完整、合理地描述概率隨時(shí)間動(dòng)態(tài)變化過(guò)程。
三個(gè)天氣因素中高溫的不確定性最大,因此玩家需要重點(diǎn)考慮高溫天氣下是否做出停留選擇,當(dāng)時(shí)間充裕時(shí)玩家出發(fā)當(dāng)天為高溫天以一定概率在原地休整,來(lái)減少資源消耗量(如果在礦山遇到高溫天以更大的概率停留下來(lái)挖礦);當(dāng)玩家所剩時(shí)間不多時(shí),為保證自己能夠按時(shí)到達(dá)終點(diǎn),在除沙暴天外玩家盡可能趕路,最終到達(dá)終點(diǎn)。
根據(jù)生成的當(dāng)局天氣(晴天與高溫)決定下一次的行動(dòng)結(jié)果,特點(diǎn)為大量隨機(jī)模擬利用Matlab 采用以上述步驟進(jìn)行仿真,得到如圖1-2 所示結(jié)果。
在5 種情況下的通關(guān)最大資金量對(duì)比圖,分析圖3-4 中信息我們得到:隨著晴朗天數(shù)的增多,各情況在到達(dá)終點(diǎn)處的剩余資金呈單調(diào)上升趨勢(shì);晴天天數(shù)增加對(duì)循環(huán)兩次的路線影響更加明顯,對(duì)情況1 的影響最為薄弱;圖中最大交叉點(diǎn)處位于第25 天,為情況1 與情況4 的交叉點(diǎn);當(dāng)晴朗天數(shù)幾乎為0 時(shí),除循環(huán)兩圈的情況時(shí)終點(diǎn)剩余資金最少外,其余情況大多分布在6000 到8000 元之間。
接下來(lái)利用分析得到的信息對(duì)羅列出的所有情況進(jìn)行篩選:在一定時(shí)間范圍內(nèi)隨著晴朗天數(shù)的增加,循環(huán)一遍的剩余最大資金總是高于循環(huán)兩遍的最大資金,合理推測(cè)循環(huán)三圈收獲的效益會(huì)更低,因此我們排除循環(huán)多次的情況只考慮循環(huán)一圈的路線。
圖1 五種情況下最大剩余資金量對(duì)比圖
圖2 所有天氣狀況下的最多剩余資金
圖3 穩(wěn)定性評(píng)價(jià)
圖4 先后經(jīng)過(guò)村莊剩余資金量對(duì)比圖
最后分析可知隨著晴天天數(shù)的增加,先經(jīng)過(guò)礦山后經(jīng)過(guò)村莊獲得的收益總是大于先經(jīng)過(guò)村莊后經(jīng)過(guò)礦山的收益。