李 敏,楊亞鋒,雷 宇,李麗紅
(1.華北理工大學(xué) 理學(xué)院 河北 唐山 063210;2.河北省數(shù)據(jù)科學(xué)與應(yīng)用重點實驗室 河北 唐山 063210;3.唐山市數(shù)據(jù)科學(xué)重點實驗室 河北 唐山 063210;4.華北理工大學(xué) 電氣工程學(xué)院 河北 唐山 063210)
三支決策是在粗糙集的基礎(chǔ)上提出的,是一種處理不確定性決策的數(shù)學(xué)方法,姚一豫等[1]基于各個領(lǐng)域中三支決策的共性及特征,提出三支決策理論框架。自提出以來,三支決策備受學(xué)者關(guān)注,從不同角度進(jìn)行深入研究。針對勾股模糊三支決策概率閾值難以確定的問題,文獻(xiàn)[2-3]給出概率閾值確定方法和基于勾股模糊集評價的三支決策方法,同時結(jié)合直覺模糊集理論提出一種基于直覺模糊相似度的三支決策方法;薛占熬等[4]通過研究粒度重要度的構(gòu)造方法,提出一種新的基于粒度重要度的三支決策模型將證據(jù)理論引入三支決策中,分析延遲信任區(qū)間可能包含的可變語義;陳玉金等[5]構(gòu)建基于證據(jù)理論的確定和可變?nèi)Q策模型;岳文琦等[6]在混合決策信息系統(tǒng)中,提出一種模糊效用三支決策模型;張春英等[7]在深入研究PS-粗糙集模型特點的基礎(chǔ)上,提出一種基于PS-粗糙集的動態(tài)三支決策算法。此外,三支決策模型在水資源承載力、垃圾郵件過濾、圖像分割等領(lǐng)域[8-11]得到廣泛的應(yīng)用。
“可拓集”從變換的角度研究對象具有某種性質(zhì)的程度及其變化,并用關(guān)聯(lián)函數(shù)進(jìn)行定量化描述[12]。隨著可拓學(xué)研究的深入,關(guān)聯(lián)函數(shù)成為重點。文獻(xiàn)[13]對可拓集無量綱一維關(guān)聯(lián)函數(shù)進(jìn)行研究,為進(jìn)一步研究多維關(guān)聯(lián)函數(shù)奠定基礎(chǔ)。楊春燕等[14]介紹可拓集中初等關(guān)聯(lián)函數(shù)構(gòu)造的進(jìn)展并進(jìn)一步深入研究。在單評價特征基元可拓集基礎(chǔ)上,楊春燕[15]研究了多評價特征基元可拓集的構(gòu)造方法及其關(guān)聯(lián)函數(shù)的建立方法,為解決不相容問題提供了理論依據(jù)。胡寶清等[16]從實際出發(fā),研究區(qū)間論域上的可拓集及其關(guān)聯(lián)函數(shù)。還有學(xué)者利用可拓集進(jìn)行可拓評價,解決實際問題。安永林等[17]為綜合評價服役隧道結(jié)構(gòu)健康狀況,利用可拓法進(jìn)行評估并有針對地給出不同的策略。李倩倩等[18]以山東半島藍(lán)色經(jīng)濟(jì)區(qū)為研究對象,基于熵權(quán)可拓模型對城鎮(zhèn)化發(fā)展水平進(jìn)行評價。郭嘉偉等[19]基于熵權(quán)可拓物元模型對會寧縣水資源承載力進(jìn)行評價。文獻(xiàn)[20-21]將可拓集方法應(yīng)用于水資源承載力的評價。
三支決策模型大多以條件概率作為評價函數(shù)進(jìn)行決策,而可拓集中關(guān)聯(lián)函數(shù)表示事物具有或不具有某種性質(zhì)的程度,可對同一域中的元素進(jìn)行優(yōu)劣排序,因此將可拓集應(yīng)用于三支決策,不僅可以實現(xiàn)域的劃分,同時能夠挖掘決策優(yōu)化方向,進(jìn)而制定系統(tǒng)狀態(tài)提升策略?;诖?,本文利用可拓關(guān)聯(lián)函數(shù)的方法,定義關(guān)聯(lián)度比,構(gòu)建一種基于關(guān)聯(lián)度比的三支決策模型,并對哈爾濱市水資源承載力系統(tǒng)給出優(yōu)化方向與建議。
三支決策的提出為決策粗糙集的正域、負(fù)域、邊界域賦予合理的語義解釋,分別對應(yīng)接受、拒絕和延遲決策,符合人類的決策思想。
貝葉斯理論是風(fēng)險型決策方法之一,其思想是以期望損失最小為決策依據(jù),選擇合適的決策方案[22]。三支決策是基于貝葉斯理論進(jìn)行的決策,規(guī)則如下。
設(shè)狀態(tài)空間Θ={Di,Di},表示對象x是否屬于集合Di,行動集A={aP,aB,aN}表示對一個對象x進(jìn)行分類決策時采取的行動。aP、aB、aN分別表示對象確定屬于、不一定屬于和一定不屬于集合的行動,不同狀態(tài)下對應(yīng)不同行動的代價函數(shù)如表1所示。
表1 損失代價函數(shù)
λPP、λBP、λNP分別表示x本屬于Di而采取行動aP、aB、aN時的損失;λPN、λBN、λNN分別表示x本不屬于Di而采取行動aP、aB、aN時的損失。P(Di|[x])是條件概率,對于特定x,采取一個決策行動時的期望代價為
P)如果T(aP|[x])≤T(aB|[x])且T(aP|[x])≤T(aN|[x])成立,則x∈POS(X),
B)如果T(aB|[x])≤T(aP|[x])且T(aB|[x])≤T(aN|[x])成立,則x∈BND(X),
N)如果T(aN|[x])≤T(aP|[x])且T(aN|[x])≤T(aB|[x])成立,則x∈NEG(X)。
由于P(Di|[x])+P(Di|[x])=1,且λPP≤λBP≤λNP,λNN≤λBN≤λPN,則決策規(guī)則可簡化為
P)如果P(Di|[x])≥α成立,則x∈POS(X),
B)如果β
N)如果P(Di|[x])≤β成立,則x∈NEG(X),
若x∈POS(X),則表示接受x;若x∈BND(X),則表示對x延遲決策;若x∈NEG(X),則表示拒絕x。
定義1[23](可拓集合) 設(shè)U為論域,u為U中任一元素,k是U在實數(shù)R的一個映射,T(TU,Tk,Tu)是給定的變換,稱
(1)
定義2[13](正域為有限區(qū)間的關(guān)聯(lián)函數(shù)) 若正域X0=[a,b]為有限區(qū)間,節(jié)域X(X≠R)為實數(shù)域上任何區(qū)間且X0?X,非端點x0∈X0,記X0和X的公共端點為xv(若無公共端點,則為空),則對任意實數(shù)x≠xv,則x關(guān)于X0和X且在X0的非中點x0取得最大值的一般關(guān)聯(lián)函數(shù)為
(2)
其中:D(x,X0,X)為x關(guān)于X0和X的一般位置值。
定義3[13](正域為無限區(qū)間的關(guān)聯(lián)函數(shù)) 設(shè)無限區(qū)間X0為正域,節(jié)域X(X≠R)為實數(shù)域上任何區(qū)間且X0?X,非端點x0∈X0,則對實數(shù)域上的任意點x關(guān)于無限區(qū)間套X0和X且在點x0取最大值的關(guān)聯(lián)函數(shù)為
(3)
其中:D(x,X0,X)為x關(guān)于區(qū)間套X0和R的一般位置值。
三支決策是在概率粗糙集的基礎(chǔ)上提出的,為粗糙集的三個域提供合理語義解釋,三支決策中評價函數(shù)的選取直接影響決策結(jié)果,因此評價函數(shù)的選取至關(guān)重要。可拓關(guān)聯(lián)度是可拓評價與決策的主要工具,其大小關(guān)系著決策的結(jié)果。因此,關(guān)聯(lián)函數(shù)是一種重要而有效的評價函數(shù)。由于關(guān)聯(lián)度值大部分為負(fù),而且取絕對值后大于1,評價函數(shù)會影響決策,因此結(jié)合模糊集中隸屬函數(shù)的思想,定義可拓關(guān)聯(lián)度比如下。
定義4設(shè)Kj(Vi)為評價指標(biāo)j關(guān)于等級i的關(guān)聯(lián)度,則評價指標(biāo)j關(guān)于等級i的關(guān)聯(lián)度比為
(4)
由于關(guān)聯(lián)度比的取值范圍為(0,2),所以需要對關(guān)聯(lián)度比進(jìn)行歸一化處理。由關(guān)聯(lián)度比的定義可知,指標(biāo)關(guān)于等級的關(guān)聯(lián)度比和非關(guān)聯(lián)度比的和為1。故歸一化的關(guān)聯(lián)度比適合作為三支決策的評價函數(shù)來進(jìn)行決策。
將表1的代價函數(shù)作為損失,將關(guān)聯(lián)度比作為評價函數(shù)構(gòu)建三支決策模型。
對于特定對象j,采取一個決策行動時的期望代價為
(5)
(6)
從式(6)可知,代價目標(biāo)函數(shù)T(aP|j)、T(aB|j)、T(aN|j)的幾何意義是以Pi(Kj)為變量,相關(guān)代價函數(shù)組合為斜率和截距的線性函數(shù),因此三支分類的閾值α、β可以看作是上述三個代價目標(biāo)線性函數(shù)之間交集的橫坐標(biāo)Pi(Kj)的取值。顯然α、β可以看作是T(aP|j)與T(aB|j)、T(aB|j)與T(aN|j)交點的Pi(Kj)處取值,T(aP|j)與T(aN|j)的交點記為γ,如圖1所示,圖中的TP、TB、TN分別代表式(6)中的T(aP|j)、T(aB|j)、T(aN|j),T*表示TP、TB、TN中的任意量。
圖1 TP、TB、TN之間的關(guān)系示意圖
根據(jù)貝葉斯風(fēng)險決策過程,最小代價決策規(guī)則如下。
P)如果T(aP|j)≤T(aB|j)且T(aP|j)≤T(aN|j)成立,則j∈POS(X);
B)如果T(aB|j)≤T(aP|j)且T(aB|j)≤T(aN|j)成立,則j∈BND(X);
N)如果T(aN|j)≤T(aP|j)且T(aN|j)≤T(aB|j)成立,則j∈NEG(X)。
由于0≤β<γ<α≤1,則決策規(guī)則可簡化為
P)如果Pi(Kj)≥α成立,則j∈POS(X);
B)如果β 步驟1確定待評物元、經(jīng)典域和節(jié)域。將給定數(shù)據(jù)集的指標(biāo)根據(jù)以往研究進(jìn)行分級,并確定每個等級具體取值范圍。經(jīng)典域是每個等級中每個指標(biāo)具體取值范圍,節(jié)域表示所有等級中每個指標(biāo)的取值范圍,待評物元表示需要評價的物元,根據(jù)分級確定經(jīng)典域和節(jié)域。 式中:Cj表示c1,c2,…,cn這n個指標(biāo)的集合;Voj表示(aoj,boj),j=1,2,…,n的集合;而(aoj,boj)為等級t中樣本關(guān)于第j個指標(biāo)的取值范圍。 式中:Cj表示c1,c2,…,cn這n個指標(biāo)的集合;Vpj表示(apj,bpj),j=1,2,…,n的集合,而(apj,bpj)為所有等級中樣本關(guān)于第j個指標(biāo)的取值范圍。 建立客史檔案,把握顧客需求。市場營銷理論告訴我們,只有真正把握顧客的需求,才能提供令賓客滿意的服務(wù),才能提高酒店的競爭力。因此,酒店必須要建立起獨一無二的客史檔案。那么酒店該從哪些方面建立客史檔案呢?首先,酒店要從收集顧客資料著手,全程跟蹤,完整準(zhǔn)確的建立??蜋n案;其次,要應(yīng)用計算機(jī)進(jìn)行數(shù)據(jù)技術(shù)開發(fā),建立詳盡而細(xì)微的顧客需求檔案,最終建立顧客信息庫。 式中:Cj表示c1,c2,…,cn這n個指標(biāo)的集合;Vi表示x*(i,j),j=1,2,…,n的集合;x*(i,j)為待評樣本i關(guān)于第j個指標(biāo)的取值。 步驟2根據(jù)關(guān)聯(lián)度公式計算各指標(biāo)的關(guān)聯(lián)度。 (7) 式中:Kj(xi)表示第i個樣本、第j個指標(biāo)的關(guān)聯(lián)度,各個指標(biāo)值到各評價等級范圍值的距離為 步驟3由可拓關(guān)聯(lián)度比公式(4)計算每個指標(biāo)關(guān)于每個等級的關(guān)聯(lián)度比,并做歸一化處理。 步驟4由熵權(quán)可拓評價法計算城市所屬等級。 1)由于各指標(biāo)的計量單位并不統(tǒng)一,而且正向指標(biāo)和負(fù)向指標(biāo)表示的含義不同,正向指標(biāo)數(shù)值越高越好,負(fù)向指標(biāo)數(shù)值越低越好,因此,對于正向、負(fù)向指標(biāo)采用不同的運算進(jìn)行數(shù)據(jù)標(biāo)準(zhǔn)化處理。同時為使后面計算的指標(biāo)熵值有意義,即標(biāo)準(zhǔn)化后的指標(biāo)值不為0,故標(biāo)準(zhǔn)化時后面要加1,取值范圍為[1,2]。 式中:x*(i,j)表示第i個樣本第j個評價指標(biāo)值;xmax(i,j)=max{x(1,j),x(2,j),…,x(n,j)},即所有樣本中第j個評價指標(biāo)的最大值;xmin(i,j)=min{x(1,j),x(2,j),…,x(n,j)},即所有樣本中第j個評價指標(biāo)的最小值。 3)確定所屬等級。城市關(guān)于眾指標(biāo)的綜合關(guān)聯(lián)度用公式(8)計算 (8) 若 (9) 則待評樣本的等級為io。式中:Kio(d0)表示待評樣本的關(guān)聯(lián)度;maxKt(xi)表示待評樣本關(guān)于所有等級關(guān)聯(lián)度的最大值。 步驟5結(jié)合數(shù)據(jù)集特點,經(jīng)過多次實驗,并根據(jù)不同閾值劃分后每個域中元素個數(shù)情況,可得選取閾值α=0.28、β=0.22比較合適,因此選取α=0.28、β=0.22作為閾值。由基于關(guān)聯(lián)度比的三支決策的決策規(guī)則,對每個等級的指標(biāo)進(jìn)行域的劃分,得到基于每個等級的三個域劃分。 步驟6分析域的劃分結(jié)果,對城市水資源承載力系統(tǒng)給出優(yōu)化方向與建議。 步驟1中確定待評物元時,用到兩層for循環(huán),一層步長為指標(biāo)數(shù)n,一層步長為樣本數(shù)m,最終得到每一待評樣本關(guān)于所有指標(biāo)的取值,其時間復(fù)雜度為O(mn);步驟2、3中計算各指標(biāo)的關(guān)聯(lián)度與關(guān)聯(lián)度比時,也用到步長分別為m和n的兩層for循環(huán),其時間復(fù)雜度也均為O(mn);步驟4中仍通過步長為m和n的兩層for循環(huán)計算出正、負(fù)項指標(biāo)及屬性權(quán)重,其時間復(fù)雜度也為O(mn);因此最終得到的時間復(fù)雜度為O(mn)。 選取黑龍江省13市水資源承載力數(shù)據(jù),包括水土資源和承載力兩個指標(biāo)體系,共19個指標(biāo),利用本文模型對哈爾濱市水資源承載力進(jìn)行評價,并給出優(yōu)化建議。 步驟1根據(jù)黑龍江省13市的水資源承載力數(shù)據(jù),結(jié)合以往研究和專家經(jīng)驗,將指標(biāo)承載力等級設(shè)定為4級,即Ⅰ(強(qiáng))、Ⅱ(一般)、Ⅲ(弱)、Ⅳ(很弱)。各等級的經(jīng)典域和節(jié)域為 其中:Dt矩陣表示經(jīng)典域矩陣;Dp矩陣表示節(jié)域矩陣。 步驟2由關(guān)聯(lián)度公式(7)及關(guān)聯(lián)度比公式(4)計算哈爾濱市各指標(biāo)關(guān)于每個等級的關(guān)聯(lián)度及關(guān)聯(lián)度比,見表2。 表2 哈爾濱市各指標(biāo)關(guān)于每個等級的關(guān)聯(lián)度及關(guān)聯(lián)度比 步驟3由公式(8)~(9)計算可得,目前哈爾濱市水資源承載力處于Ⅱ級。 步驟4由決策規(guī)則得每個等級指標(biāo)三個域的劃分為 步驟5給出指標(biāo)優(yōu)化方向與建議。由熵權(quán)可拓評價法可知哈爾濱市目前水資源承載力處于Ⅱ級水平,根據(jù)每個等級指標(biāo)三個域的劃分以及水資源承載力現(xiàn)狀可知,哈爾濱市需要優(yōu)化指標(biāo)有城鎮(zhèn)化率、人口自然增長率、Remanenko潛在蒸發(fā)量、干燥度、人均生活用水量、GDP總量、人均GDP、GDP增長率、森林覆蓋率。而在這些指標(biāo)中,城鎮(zhèn)化率、人口自然增長率的關(guān)聯(lián)度比的值較大,在Ⅰ級正域中所處層次較高,所以應(yīng)先優(yōu)化這些指標(biāo),這為政府決策和管理提供依據(jù)。 本文將可拓集與三支決策結(jié)合建立基于關(guān)聯(lián)度比的三支決策模型并應(yīng)用于決策哈爾濱市水資源承載力。第一,基于關(guān)聯(lián)度比構(gòu)建三支決策模型,為三個域的構(gòu)造提供合理的解釋,豐富三支決策和可拓評價理論;第二,模型可以在每一級上劃分三個域,定量給出評級改變時各指標(biāo)的變化,并根據(jù)關(guān)聯(lián)度比的值,可以量化同一域中屬性的重要程度,使屬性分出層次,既實現(xiàn)動態(tài)決策,又細(xì)化決策;第三,將模型應(yīng)用于哈爾濱市水資源承載力評價中可知,若希望承載力由原來的Ⅱ級提升為Ⅰ級,則應(yīng)優(yōu)化城鎮(zhèn)化率、人口自然增長率等指標(biāo),這為決策與管理提供理論依據(jù)。在閾值變化時,關(guān)于每個等級三個域如何變化,以及建立自適應(yīng)的閾值計算方法將成為今后研究的重點。2.3 模型步驟
2.4 算法分析
3 案例分析
4 結(jié)論