龔艷冰,戴靚靚,胡娜
(河海大學(xué)企業(yè)管理學(xué)院,江蘇常州213022)
在預(yù)測(cè)評(píng)價(jià)與決策等領(lǐng)域,回歸分析方法是一個(gè)重要且常用的研究方法,但是傳統(tǒng)回歸往往依賴于精確的統(tǒng)計(jì)數(shù)值及二值邏輯。在社會(huì)經(jīng)濟(jì)活動(dòng)中,部分或者全部的觀測(cè)數(shù)據(jù)常常是不精確或者用語(yǔ)言值描述的數(shù)據(jù),使得經(jīng)典線性回歸模型受到限制。人們常常使用自然語(yǔ)言值表示定性概念,例如大概、溫度不高、相當(dāng)小等,恰恰是人們賴以識(shí)別分析乃至決策的重要依據(jù)。針對(duì)現(xiàn)實(shí)世界語(yǔ)言值的模糊性,日本學(xué)者Tanaka等[1]首次提出模糊線性回歸模型,主要用于反映自變量和因變量的模糊關(guān)系。經(jīng)典回歸模型把真實(shí)數(shù)據(jù)和估計(jì)值之間的偏差認(rèn)為是觀測(cè)誤差,而模糊回歸模型將這種誤差視為系統(tǒng)結(jié)構(gòu)自身的模糊性,并把數(shù)據(jù)和其估計(jì)值之間的偏差視為系統(tǒng)參數(shù)的模糊性,從而由參數(shù)模糊化來(lái)解決這一問(wèn)題[2]。國(guó)內(nèi)外許多學(xué)者對(duì)模糊線性回歸模型的參數(shù)估計(jì)方法進(jìn)行了大量研究[3-11],并在系統(tǒng)預(yù)測(cè)、評(píng)估和決策等方面開展了大量應(yīng)用研究[12-15]。
現(xiàn)有估計(jì)參數(shù)方法主要是最小二乘或最小一乘回歸模糊數(shù)截集距離方法。模糊截集距離方法一旦隸屬度被選擇,“硬化”成精確數(shù)字,關(guān)于概念的所有不確定性都消失了,并且計(jì)算較復(fù)雜。針對(duì)上述方法的不足,本文試圖通過(guò)引入模糊數(shù)的COWA可能性期望,僅僅考慮模糊數(shù)的可能性期望區(qū)間,并對(duì)期望區(qū)間信息進(jìn)行COWA算子集結(jié),從COWA算子期望距離最小的角度估計(jì)回歸模型的參數(shù)。本文方法通過(guò)決策中偏好期望的形式反映人的主觀模糊性,在某種程度上提升了模糊回歸模型的靈活性和合理性。
定義1:設(shè)模糊數(shù)A的隸屬函數(shù)為:
則稱A=(a,α,β)為三角模糊數(shù),其中α,β稱為三角模糊數(shù)的左右擴(kuò)展。根據(jù)Zadeh的擴(kuò)展原理,可得三角模糊數(shù)A=(a,α1,β1)和B=(b,α2,β2)的算術(shù)運(yùn)算法則為[9]:
A+B=(a+b,α1+α2,β1+β2)
定義2[16]:設(shè)模糊數(shù)A的γ截集為A(γ)=[al(γ),au(γ)],則模糊數(shù)A的可能性區(qū)間期望為:
定義3[17]:設(shè)a=[a-,a+]為區(qū)間數(shù),且
其中,Q:[0,1]→[0,1]是具有下列性質(zhì)的函數(shù):①Q(mào)(0)=0;②Q(1)=1;③若x>y,則Q(x)>Q(y),則稱f為連續(xù)區(qū)間數(shù)據(jù)OWA算子,簡(jiǎn)稱為COWA算子。Q稱為基本的單位區(qū)間單調(diào)(BUM)函數(shù)。由文獻(xiàn)[17]可知,若令表示決策者的主觀偏好,則COWA算子可以表示為:
因此,由定義2和定義3,可以給出模糊數(shù)A的偏好期望值為:
特別的,如果模糊數(shù)A=(a,α,β)是三角模糊數(shù),則A的偏好期望值為:
考慮自變量和因變量都為模糊數(shù)的線性回歸模型,即:
其中,xi=(1,x1i,x2i,…,xpi)表示模糊數(shù)自變量向量,yi表示模糊數(shù)因變量,bj,j=0,1,2,…,p為回歸系數(shù)。為方便起見,本文以三角模糊數(shù)為例并令三角模糊數(shù)xji=(aji,αji,βji)(=0,1,2,…,p;i=1,2,…,n),則模型(7)的模糊數(shù)據(jù)回歸模型可改寫成:
由于模型本身的模糊性,上述三角模糊線性回歸模型要成立,并不需要對(duì)于任意截集都成立,只需要模型(7)的期望值成立,即對(duì)于給定的偏好系數(shù)λ(0≤λ≤1),模型(7)可以轉(zhuǎn)化為傳統(tǒng)回歸模型:
為了估計(jì)上述模型的參數(shù),本文給出COWA算子期望距離的概念,即模糊數(shù)A和B的距離可以定義為:
特別的,令λ=k/m(k=0,1,2,…,m),可以得到離散化的COWA算子期望距離:
結(jié)合離散化的偏好期望距離公式(11),可將模糊因變量估計(jì)值與觀測(cè)值間的誤差表示為:
將式(7)代入式(12)可得期望誤差為:
根據(jù)最小二乘法令:
和
通過(guò)求解上述線性方程組(14)和(15)可得到模糊線性回歸模型(7)的回歸系數(shù)的估計(jì)值,我們稱這種最小二乘參數(shù)估計(jì)方法為COWA期望距離最小二乘方法(COWA-EDLS)。
為了有效評(píng)估上述模糊線性回歸模型的性能,需要對(duì)模型的誤差進(jìn)行估計(jì)。傳統(tǒng)的回歸分析是針對(duì)觀測(cè)值與擬合值的距離進(jìn)行比較,利用點(diǎn)對(duì)點(diǎn)的差距來(lái)評(píng)價(jià)擬合結(jié)果。本文將擬合值與實(shí)際值之間的偏好期望距離差作為誤差估計(jì)的檢驗(yàn)依據(jù),當(dāng)回歸方程擬合出來(lái)的模糊回歸模型具有較小的E值,則說(shuō)明該模型應(yīng)該是不錯(cuò)的模型。
為了說(shuō)明本文方法的可行性,以Chen等[3]給出的人員績(jī)效評(píng)估的例子進(jìn)行實(shí)證研究。人員績(jī)效評(píng)估是企業(yè)人力資源管理中一項(xiàng)重要的功能,顯然,由于人員績(jī)效評(píng)估的主觀性,通常采用語(yǔ)言值來(lái)描述評(píng)估值,科學(xué)合理的評(píng)估結(jié)果將影響到人力資源管理功能的整體表現(xiàn)。根據(jù)人力資源管理的相關(guān)理論,考慮工作績(jī)效(因變量y)的四個(gè)主要影響因素(自變量)包括[3]:工作能力(x1)、抗壓性(x2)、拖延頻率(x3)和溝通和協(xié)調(diào)能力(x4)。假定影響因素評(píng)估論域均為[0,100],樣本容量為30,并且語(yǔ)言值用三角模糊數(shù)表示,如下頁(yè)表1所示。
應(yīng)用Matlab軟件,選取偏好參數(shù)λ=0,0.1,0.2,…,1,即m=10,將上述數(shù)據(jù)代入線性方程組(14)和(15)可得下列線性方程組:
表1 績(jī)效評(píng)估自變量和因變量三角模糊數(shù)樣本
22181.5b0+1482402b1+1554375.7b2+1402096.9b3+1165618.3b4=1150361.2
20163b0+1329906.8b1+1402096.9b2+1366366.8b3+1026775.4b4=1015677.4
17138b0+1125334.7b1+1.165618.3b2+1026775.4b3+1040556.7b4=898216.9
求解上述線性方程組,可得回歸系數(shù):
b0=10.5671,b1=0.8681,b2=-0.170,b3=-0.1489,b4=0.0882
則三角模糊線性回歸方程為:
y(xi)=10.5671(1,0,0)+0.8681(a1i,α1i,β1i)-0.1705(a2i,α2i,β2i)-0.1489b3(a3i,α3i,β3i)+0.0882(a4i,α4i,β4i)
從上述回歸模型看到工作能力(x1)對(duì)員工工作績(jī)效的影響是最大的,溝通和協(xié)調(diào)能力(x4)對(duì)員工工作績(jī)效也存在正面影響,弱抗壓性(x2)和拖延頻率(x3)這兩個(gè)變量對(duì)工作績(jī)效產(chǎn)生負(fù)面影響但影響力度不大,這與實(shí)際情況是相一致的。
根據(jù)三角模糊數(shù)的算術(shù)運(yùn)算法則,計(jì)算上述回歸模型的預(yù)測(cè)值yci,并按照距離公式(10)計(jì)算預(yù)測(cè)值yci=(y1i,α1i,β1i)與實(shí)際值yi=(y0i,α0i,β0i)之間的偏好期望距離差:
將其作為誤差估計(jì)的檢驗(yàn)依據(jù),結(jié)果如表2所示。結(jié)果表明,本文的COWA期望距離最小二乘估計(jì)方法是可行的,與傳統(tǒng)最小二乘方法和截集距離最小二乘方法比較誤差也相對(duì)較小。
表2 擬合效果與距離誤差測(cè)度表
最小二乘估計(jì)方法是模糊線性回歸模型中常用的參數(shù)估計(jì)方法,考慮到三角模糊數(shù)的普遍性,針對(duì)數(shù)據(jù)輸入、輸出為三角模糊數(shù)的模糊線性回歸模型,引入模糊數(shù)的COWA算子可能性期望值的概念,在此基礎(chǔ)上,定義COWA算子期望距離,提出了模糊線性回歸模型的參數(shù)估計(jì)方法,并對(duì)模型進(jìn)行了誤差分析。通過(guò)員工績(jī)效的實(shí)例計(jì)算和其他模型的比價(jià)結(jié)果表明,本文的方法具有良好的擬合效果,且計(jì)算簡(jiǎn)單。
[1]Tanaka H,Uejima S,Asai K.Linear Regression Analysis With Fuzzy Model[J].IEEE Transactions on Systems Man,and Cybernetics,1982,(12).
[2]柏林,房勇.基于模糊回歸分析的投資組合選擇模型[J].系統(tǒng)工程理論與實(shí)踐,2015,35(7).
[3]Chen L H,Hsueh C C.Fuzzy Regression Models Using the Leastsquares Method Based on the Concept of Distance[J].IEEE Transactions on Fuzzy Systems,2009,(17).
[4]Farhadinia B.Sensitivity Analysis in Interval-valued Trapezoidal fuzzy Number Linear Programming Problems[J].Applied Mathematical Modelling,2014,(38).
[5]Wan S P,Dong J Y.Possibility Linear Programming With Trapezoidal Fuzzy Numbers[J].Applied Mathematical Modelling,2014,(38).
[6]Ebrahimnejad A,Tavana M.A Novel Method for Solving Linear Programming Problems With Symmetric Trapezoidal Fuzzy Numbers[J].Applied Mathematical Modelling,2014,(38).
[7]任燕,郭嗣琮.基于結(jié)構(gòu)元最小二乘序的模糊線性回歸[J].模糊系統(tǒng)與數(shù)學(xué),2015,29(1).
[8]李俊紅,曾文藝.基于梯形模糊數(shù)的模糊最小一乘回歸模型[J].系統(tǒng)工程理論與實(shí)踐,2015,35(6).
[9]石苗,王達(dá)布希拉圖.基于LR模糊數(shù)據(jù)的線性回歸模型[J].廣州大學(xué)學(xué)報(bào):自然科學(xué)版,2014,13(2).
[10]彭宇文,郭莉莎,毛超.基于改進(jìn)模擬退火算法的模糊回歸參數(shù)估計(jì)[J].統(tǒng)計(jì)與決策,2014,(1).
[11]岳立柱.系數(shù)為一般模糊數(shù)的多元線性回歸模型[J].統(tǒng)計(jì)與決策,2015,(3).
[12]任麗麗,陸秋君.基于模糊線性回歸的電子商務(wù)交易額預(yù)測(cè)[J].統(tǒng)計(jì)與決策,2013,(3).
[13]趙建有,周孫鋒,崔曉娟,王高青.基于模糊線性回歸模型的公路貨運(yùn)量預(yù)測(cè)方法[J].交通運(yùn)輸工程學(xué)報(bào),2012,12(3).
[14]張轉(zhuǎn),常安定,王媛英,王曉晨.基于正態(tài)模糊線性回歸確定河流橫向擴(kuò)散系數(shù)[J].長(zhǎng)江科學(xué)院院報(bào),2015,32(8).
[15]邵良杉,趙琳琳,溫廷新,孔祥博.基于模糊多元線性回歸模型的巖石可爆性評(píng)價(jià)[J].中國(guó)安全科學(xué)學(xué)報(bào),2015,25(7).
[16]Carlsson C,Fullér R.On Possibilistic Mean Value and Variance of Fuzzy Numbers[J].Fuzzy Sets and Systems,2001,(122).
[17]Yager R R.OWA Aggregation Over a Continuous Interval Argument With Application to Decision Making[J].IEEE Transactions on Systems Man and Cybernetics-Part B,2004,(34).