鄭建鋒,王應(yīng)明
福州大學(xué) 經(jīng)濟(jì)與管理學(xué)院,福州350108
在管理學(xué)中,效率是指在特定的時間內(nèi),一個組織投入與產(chǎn)出的比值關(guān)系,能夠反映這個組織在各個方面的能力,進(jìn)行效率分析顯得尤為重要。效率分析是對各個組織的效率進(jìn)行測度與評價的一種方法,在目前國內(nèi)外研究中,主要是利用數(shù)據(jù)包絡(luò)分析(DEA)或者將數(shù)據(jù)包絡(luò)分析與其他模型結(jié)合等方法對效率進(jìn)行評價。效率評價在近幾十年的發(fā)展,已經(jīng)發(fā)展得越來越成熟了,然而對效率進(jìn)行預(yù)測仍停留在探索階段。李果等人[1]用神經(jīng)網(wǎng)絡(luò)的方法進(jìn)行DEA 有效預(yù)測,證實了效率預(yù)測的可行性。之后的幾年,一些學(xué)者通過DEA 和神經(jīng)網(wǎng)絡(luò)的方法對各個不同行業(yè)的效率進(jìn)行評價并預(yù)測,如體現(xiàn)在物流聯(lián)盟伙伴選擇[2],不同高校科研能力評估[3],美國鐵路性能測量和預(yù)測[4],基坑施工評價[5]等方面。可見DEA 與神經(jīng)網(wǎng)絡(luò)模型在效率評價與預(yù)測能力上,具有科學(xué)性、廣泛性。但是由于評估某個決策單元的效率時,受到許多因素的影響,除了投入與產(chǎn)出之外,還有很多復(fù)雜的環(huán)境因素,所以增加了效率準(zhǔn)確預(yù)測的困難。區(qū)間預(yù)測就解決了點預(yù)測給決策者帶來的不確定性。區(qū)間預(yù)測是在收集到的數(shù)據(jù)基礎(chǔ)之上,通過一系列的學(xué)習(xí)優(yōu)化,給出的一個參數(shù)范圍。本文在前人研究的基礎(chǔ)上,繼續(xù)沿用DEA 與神經(jīng)網(wǎng)絡(luò)結(jié)合對效率進(jìn)行評級與預(yù)測的方法,提出效率置信區(qū)間預(yù)測模型。首先,利用DEA方法,對決策單元的效率進(jìn)行評價,得出各個單元的效率值;其次,對BP 神經(jīng)網(wǎng)絡(luò)進(jìn)行模型參數(shù)修改,結(jié)合student 學(xué)生式分布得到預(yù)測區(qū)間模型,詳見第1 章模型構(gòu)建。對決策單元的效率進(jìn)行區(qū)間預(yù)測,并按區(qū)間進(jìn)行分類,然后采用預(yù)測區(qū)間覆蓋率(Prediction Interval Coverage Probability,PICP)、歸一化平均預(yù)測區(qū)間寬度(Normalized Mean Prediction Interval Length,NMPIL)和區(qū)間分?jǐn)?shù)(Interval Score,IS)等指標(biāo)對預(yù)測結(jié)果進(jìn)行評價,根據(jù)最后不同類別的決策單元分析原因。
數(shù)據(jù)包絡(luò)分析(Data Envelopment Analysis,DEA),是交叉了包括數(shù)學(xué)、管理科學(xué)、系統(tǒng)工程學(xué)等學(xué)科,而形成的一個新的領(lǐng)域[6],是由Charnes等人[7]于1978年提出并命名的。DEA是使用線性規(guī)劃等數(shù)學(xué)規(guī)劃模型對具有多輸入和多輸出的決策單元(DMU)進(jìn)行效率評估的。關(guān)于對DEA 的研究,已經(jīng)有上千位學(xué)者對它進(jìn)行了深入的研究,并把DEA 用來評估供應(yīng)商、銀行、保險公司、高校等地方的效率。在對DEA的研究中,許多學(xué)者將DEA 與其他模型結(jié)合起來,對決策單元的效率進(jìn)行評估。實證結(jié)果表明,這些結(jié)合起來的模型,在評估效率時表現(xiàn)出比單純使用DEA 來評估,具有更好的性能,特別是當(dāng)遇到比較復(fù)雜、比較大的數(shù)據(jù)量的問題時。DEA進(jìn)行效率評價時,有著自身獨(dú)特的優(yōu)點,可以在很大程度上避免了人為因素的干擾,使評價的結(jié)果更加客觀、科學(xué)。但是DEA也存在不足的地方,如不能實現(xiàn)進(jìn)一步的預(yù)測和仿真效率值。
本文先采用DEA 對決策單元進(jìn)行效率評價,DEA方法主要有兩個基本模型:CCR 模型和BCC 模型。這兩者方法之間主要的區(qū)別是CCR 假設(shè)規(guī)模收益不變,而BCC 是假設(shè)存在規(guī)模收益可變。1978 年,Charnes等[7]給出了第一個DEA 模型CCR。CCR的基本原理是假設(shè)共有n個決策單元DMU,每個決策單元中具有m種投入和s種產(chǎn)出,評價第j個決策單元(DMUj,1 ≤j≤n)的技術(shù)有效與規(guī)模有效,在CCR模型基礎(chǔ)之上加上就得到BCC 模型[8]。在BCC 模型中技術(shù)有效決策單元是在最優(yōu)前沿面上的,但BCC 模型卻不考慮規(guī)模報酬變化。在實際的應(yīng)用中,DEA 模型往往是以CCR 模型為基礎(chǔ),基于投入型CCR 模型可得出不同DMU 的效率值。含有非阿基米德無窮小的CCR 模型線性規(guī)劃對應(yīng)的對偶規(guī)劃表示為:
(3)如果θ0<1,被評價的決策單元無效。
人工神經(jīng)網(wǎng)絡(luò)(ANN)是模擬大腦活動,是對人的大腦中神經(jīng)網(wǎng)絡(luò)的基本特性進(jìn)行抽象和模擬,具有非線性逼近、分布式并行信息處理、自訓(xùn)練學(xué)習(xí)、自組織等能力[9]。
人工神經(jīng)網(wǎng)絡(luò)在組合優(yōu)化、預(yù)測等領(lǐng)域得到了廣泛地應(yīng)用。BP神經(jīng)網(wǎng)絡(luò)是一種多層網(wǎng)絡(luò)學(xué)習(xí)的誤差發(fā)現(xiàn)傳播算法,在目前對人工神經(jīng)網(wǎng)絡(luò)的研究中,有80%~90%的模型采用BP 神經(jīng)網(wǎng)絡(luò)或者它的變形形式[10]。因此,采用BP神經(jīng)網(wǎng)絡(luò)進(jìn)行預(yù)測研究具有可操作性。
圖1 顯示了簡單的BPNN 模型,典型的BPNN 模型具有多層結(jié)構(gòu),包括輸入層、隱含層、輸出層。
圖1 三層BPNN模型
如圖1所示,相鄰的兩個層中的神經(jīng)元通過高度互連的權(quán)重連接在一起。wni是指從輸入層單元到隱含層單元的權(quán)重,wij是指從隱含層到輸出層的權(quán)重。輸入層的加權(quán)輸入總和,作為第i個隱含層的輸入,通過傳遞函數(shù)的作用轉(zhuǎn)化成隱含層的輸出,激活函數(shù)選擇常用的Sigmoid函數(shù),則有接著輸出層的輸出單元輸出先是由隱含層單元Hi的加權(quán)總和,然后通過再一次的傳遞函數(shù)(Sigmoid 函數(shù))得到。在神經(jīng)網(wǎng)絡(luò)模型中,需要訓(xùn)練網(wǎng)絡(luò)來確定最佳的權(quán)重,達(dá)到滿足訓(xùn)練數(shù)據(jù)的基本特征。反向傳播算法通過使所有訓(xùn)練集中的目標(biāo)輸出gJ與實際輸出yJ之間的誤差項最小化,得到下面的公式:
盡管神經(jīng)網(wǎng)絡(luò)相對于其他傳統(tǒng)的回歸技術(shù)具有優(yōu)越性,但是在進(jìn)行預(yù)測時,調(diào)試誤差的精度仍是一個難點;另一方面,神經(jīng)網(wǎng)絡(luò)的點預(yù)測性能隨著數(shù)據(jù)來源的復(fù)雜性和不確定性的增加而顯著下降。因此,本文采用構(gòu)造置信區(qū)間的技術(shù)來進(jìn)行神經(jīng)元模型的區(qū)間預(yù)測。
對于給定的輸入為x,輸出為y的系統(tǒng),系統(tǒng)模型用來表示。其中,θ*代表系統(tǒng)模型中參數(shù)θ的真實值。假設(shè)誤差ε是系統(tǒng)的實際輸出與觀測輸出的差值,并且誤差ε服從于均值為0,方差為σ2的正態(tài)分布,該分布表示為:ε~(0,σ2)。所以系統(tǒng)可以表示為:
通過公式(4),來使得誤差最小化,得到θ*的最小二乘估計量為。
通過使用公式(2)、(6)、(7),來計算真實值y與預(yù)測值之間的差值,公式(8)表示的是差值之間的期望:
置信區(qū)間用t-分布表示為:
代替?zhèn)鹘y(tǒng)的驗證模型,如平均百分比誤差(MAPE)、均方誤差(MSE)的傳統(tǒng)標(biāo)準(zhǔn),本文使用預(yù)測區(qū)間概率和預(yù)測區(qū)間平均寬度來驗證預(yù)測結(jié)果。對于每個點輸出的預(yù)測區(qū)間,本文將通過計算區(qū)間的概率和寬度來進(jìn)行預(yù)測區(qū)間改正,而不是僅僅通過減少基于誤差的度量。根據(jù)文獻(xiàn),將預(yù)測區(qū)間覆蓋概率PICP定義為[11]:
同樣,歸一化平均預(yù)測區(qū)間寬度NMPIL定義為[11]:
其中,tmax、tmin分別是樣本中的最大值和最小值。如果NMPIL的值足夠大時,則可以包含所有的真實值,但是這樣就完全沒有意義了。所以構(gòu)造預(yù)測區(qū)間的驗證標(biāo)準(zhǔn)是在PICP足夠大的前提下,NMPIL足夠小。然而,在理論上這兩個目標(biāo)函數(shù)是有沖突的,概率越高區(qū)間寬度自然會越大;區(qū)間寬度越小概率自然越小。為了解決這個問題,提出綜合評價指標(biāo)(Coverage Lengthbased Criterion,CLC)[12]:
其中,μ=1-α,η稱為懲罰參數(shù),綜合評價指標(biāo)CLC越小越好。
以“一帶一路”經(jīng)濟(jì)帶沿途的中國18個省市為決策單元。所有的評價指標(biāo)來源于2017 年的《中國統(tǒng)計年鑒》《中國建設(shè)統(tǒng)計年鑒》《中國旅游統(tǒng)計年鑒》,目的是針對這18 個省市的旅游效率評估。參考已有的文獻(xiàn)[13],選用3 個輸入指標(biāo)、2 個輸出指標(biāo)進(jìn)行評價。通過模型(1)計算,結(jié)果如表1所示。
從表1 的第8 列θ值的結(jié)果可以看出,只有3 個省市(上海、福建、海南)的旅游效率是DEA 有效的,而剩下的省市的旅游效率全部都是無效,為了分析無效的原因,首先要對這些省市進(jìn)行分類。文獻(xiàn)[14]認(rèn)為可以將DEA 得出的效率分為4 類:S1∈(0.98, ]1 為強(qiáng)相對有效,這一類中的單元只要稍微修改,就能達(dá)到最佳的組合配置;S2∈(0.8, ]0.98 為相對有效,這一類的單元除了需要修改資源的利用,還需要花上一點的時間;為相對低效區(qū)間,這一類的單元需要重新調(diào)整資源配置或者產(chǎn)出標(biāo)準(zhǔn),同時需要一段時間來適應(yīng);S4∈(0, ]0.5 為非常低效區(qū)間,這一區(qū)間內(nèi)的單元,需要大幅度地修改投入和產(chǎn)出,還要投入大量的時間進(jìn)行不斷調(diào)整。
由于DEA 計算的結(jié)果屬于后評價的范圍,評價的結(jié)果不能夠完全說明結(jié)果,要想準(zhǔn)確地將結(jié)果進(jìn)行分類,需要通過神經(jīng)網(wǎng)絡(luò)模型進(jìn)行區(qū)間預(yù)測,如果預(yù)測的結(jié)果正好完全落在Si中,可以認(rèn)為該單元屬于這個區(qū)間;如果預(yù)測結(jié)果部分落在某個Si中,可以通過公式判斷。以分別落在S1、S2區(qū)間的預(yù)測區(qū)間為例。
表1 18個省市旅游效率結(jié)果
表2 真實值與預(yù)測區(qū)間比較
基于1.3 節(jié)的相關(guān)模型和相關(guān)公式,利用Matlab編程求解,并且令置信水平分別為80%、90%、95%、99%。圖2 顯示了BP 神經(jīng)網(wǎng)絡(luò)經(jīng)過多次訓(xùn)練好的預(yù)測圖。在置信水平為80%的置信區(qū)間內(nèi),共有15 個樣本點落在置信區(qū)間內(nèi)。當(dāng)置信水平為90%、95%、99%時,預(yù)測的結(jié)果明顯比置信水平為80%的結(jié)果差很多,主要原因是樣本的容量較少,但在一定程度上能夠說明BP神經(jīng)網(wǎng)絡(luò)在效率區(qū)間預(yù)測上的可行性。
圖2 BP神經(jīng)網(wǎng)絡(luò)預(yù)測區(qū)間結(jié)果
旅游效率為無效的省市效率點轉(zhuǎn)化為效率區(qū)間的結(jié)果如表2所示,一共有15個樣本點。
所有樣本點的預(yù)測區(qū)間,利用公式(15)~(17)進(jìn)行驗證檢驗,結(jié)果如表3 所示。結(jié)果顯示,CLC 的值低于0.5,具有較好的預(yù)測性能,所以可以利用區(qū)間數(shù)來說明樣本的效率值。根據(jù)公式(18)對12個落在預(yù)測區(qū)間內(nèi)的樣本進(jìn)行分類,結(jié)果如表4 所示,真實值和預(yù)測區(qū)間之間分類的結(jié)果會存在少量的差異。
表3 驗證模型結(jié)果
表4 真實值與預(yù)測區(qū)間的分類結(jié)果
可以發(fā)現(xiàn),如果按真實的效率值和預(yù)測區(qū)間進(jìn)行分類,結(jié)果是存在差異的,主要因為樣本系統(tǒng)的復(fù)雜性和不確定性造成。對于這樣的差異,該選擇哪一種分類方式,本研究通過分析差異點來探討此問題,同樣以這些點為例分析無效點改進(jìn)的方法。由結(jié)果可以看出,M7為樣本的差異點。
M7代表著是黑龍江省。黑龍江省作為中國最北的省份,被大家譽(yù)為“冰雪之城”。但是哈爾濱商業(yè)大學(xué)的研究團(tuán)隊在做黑龍江省的旅游業(yè)景氣指數(shù)研究時[15],指出黑龍江省旅游行業(yè)的許多問題:經(jīng)營項目雷同、旅行社不正當(dāng)競爭、宰客現(xiàn)象嚴(yán)重等一系列問題。這就導(dǎo)致通過訓(xùn)練得出M7的預(yù)測區(qū)間下限到達(dá)非常低的位置,導(dǎo)致預(yù)測區(qū)間劃分到S4,本文認(rèn)為可以將M7劃分到S4集合中。
對于落在S4中黑龍江省的旅游效率問題,提出以下幾點建議:(1)根據(jù)表1 的計算結(jié)果本文認(rèn)為,可以減少或者停止對土地要素和資本要素的投入,即減少綠地面積和住宿業(yè)、餐飲業(yè)的投入,同時管控住宿業(yè)和餐飲業(yè)亂收費(fèi)的現(xiàn)象,讓旅客且真實地感受旅游市場的公平;(2)大力構(gòu)建旅游品牌,增強(qiáng)旅游競爭力,吸引游客的流入;(3)拓寬國際旅游業(yè)務(wù),由于黑龍江的地理位置優(yōu)越,位于中國邊境地帶,可以推進(jìn)境外游,吸納境外游客來黑龍江旅游。分析結(jié)果表明黑龍江的旅游效率比較低,需要黑龍江省投入大量的時間和精力來改善現(xiàn)狀。
本文研究的主要目的是找出一個最佳的神經(jīng)網(wǎng)絡(luò)模型進(jìn)行效率區(qū)間預(yù)測,雖然神經(jīng)網(wǎng)絡(luò)模型不是一個新的概念,但還是有很多問題沒有解決,這也對本文的模型精度產(chǎn)生了影響。隨機(jī)過程和復(fù)雜系統(tǒng)的不確定性的不斷積累會導(dǎo)致神經(jīng)網(wǎng)絡(luò)點預(yù)測的性能,特別是在進(jìn)行效率預(yù)測時。針對此問題,本文假設(shè)樣本真實值與預(yù)測值的誤差成正態(tài)分布,采用Delta 方法對每一個點預(yù)測構(gòu)建預(yù)測區(qū)間。因為在訓(xùn)練神經(jīng)網(wǎng)絡(luò)時,只需要計算一次雅可比矩陣,所以計算難度大大下降。在驗證預(yù)測區(qū)間結(jié)果方面,采用新的測度模型,比傳統(tǒng)的驗證標(biāo)準(zhǔn)更具有說服力[11]。最后在利用18 個省市的旅游效率進(jìn)行預(yù)測,驗證結(jié)果誤差較小,包括有效點在內(nèi)總有15個樣本真實值點在預(yù)測區(qū)間內(nèi),誤差為16.7%,CLC 低于0.5,說明了預(yù)測區(qū)間具有較好的可靠性。由于本文所給的樣本數(shù)量少,指標(biāo)選擇具有主觀性等問題,所以本文研究仍需要進(jìn)一步的改進(jìn)。
未來研究改進(jìn)方向:(1)在保證精度的前提下,考慮加入含有噪聲的統(tǒng)計數(shù)據(jù);(2)將本文的模型用于更加復(fù)雜、模糊的系統(tǒng)中,對其效率進(jìn)行區(qū)間預(yù)測。