賴祥宇
(西南交通大學計算機與人工智能學院,成都 610031)
隨著云計算、大數(shù)據(jù)、物聯(lián)網(wǎng)等新一代信息科學技術(shù)產(chǎn)業(yè)的創(chuàng)新發(fā)展,整個現(xiàn)代科技服務業(yè)的生態(tài)體系處于不斷進化的過程中。由專業(yè)科技服務和綜合科技服務構(gòu)成科技服務解決方案也在現(xiàn)代產(chǎn)業(yè)中展現(xiàn)出愈發(fā)重要的地位[1]。綜合科技服務云平臺是國內(nèi)領先的科技服務平臺,它顛覆了傳統(tǒng)供應鏈的線性協(xié)作關(guān)系,為客戶提供極具創(chuàng)新型的科技服務,能夠有效降低應用企業(yè)的經(jīng)營成本、顯著提升企業(yè)的管理水平和決策分析能力,達到增加企業(yè)經(jīng)濟效益的目的。
在傳統(tǒng)的服務生產(chǎn)模式下,科技服務交易大多以單純原始數(shù)據(jù)“粗加工”為主,數(shù)據(jù)挖掘預測、決策支持等服務的交易并未大規(guī)模展開,數(shù)據(jù)資源自身價值體現(xiàn)不明顯[2]。隨著基于資源池的服務交易技術(shù)的成熟和合作生產(chǎn)模式的形成,科技服務云平臺使以上問題進行了改善,并且在利用資源池整合多個資源提供方的科技資源的基礎上,有效解決了從服務產(chǎn)品的篩選檢索、價格談判、簽約支付到實施驗收、售后咨詢等整個流程上的效率和管理問題[3]。研究和建立科學的、符合實際的收益分配策略,無論是對于平臺還是資源提供方,都具有極為重要的現(xiàn)實意義。
對于合作生產(chǎn)模式下的收益分配問題,目前存在一些相關(guān)研究成果。如陳偉斌等人主要采用DELPHI法和AHP方法確定影響分配的指標權(quán)重,創(chuàng)建了基于集值統(tǒng)計的收益分成率計算方法[4]。李軍主要在Shapley值模型的基礎上,綜合考慮了創(chuàng)新資源投入、創(chuàng)新創(chuàng)造收益和創(chuàng)新承擔風險等因素,使用AHP方法對模型進行了改進[5],優(yōu)化了協(xié)同創(chuàng)新聯(lián)盟的利益分配問題。孫紅霞等人引入三角模糊數(shù)將市場需求函數(shù)和企業(yè)單位成本模糊化,用模糊Shapley值在各局中人之間分配優(yōu)先聯(lián)盟在競爭中取得的最優(yōu)模糊利潤[6]。金明華等人在各主體的合作程度、承擔風險以及技術(shù)創(chuàng)新能力等方面上進行思考,運用Delphi-AHP相結(jié)合方法,建立影響利益分配的指標體系,通過改進Shapley值法對產(chǎn)業(yè)鏈主體利益分配問題做出了解析[7],并證明了各主體在合作交易模式下取得更多的收益。
前人的研究成果主要具有以下特點:一是現(xiàn)有模型絕大多數(shù)是在Shapley值模型的基礎上,采用AHP法進行改進,更偏重于定性分析,效果難以滿足日益增長的企業(yè)需求;二是現(xiàn)有的研究對象主要是針對實體經(jīng)濟聯(lián)盟的,即使采用定量的分配研究方法仍可能存在人為主觀因素。綜上所述,本文開展了基于資源池的合作生產(chǎn)模式下的科技服務收益分配研究,以網(wǎng)絡平臺的資源交易數(shù)據(jù)為支撐,通過人工智能方式確定各成員的資源價值投入,并對Shapley值模型進行改進,以實現(xiàn)對平臺資源供方收益的科學合理分配。
科技服務是云平臺的資源池中的各類科技資源在融合處理后所形成的一種高品質(zhì)服務,因此各資源供方的資源價值投入是保證聯(lián)盟收益分配公平性的一個主要因素之一。各資源供方企業(yè)由于其投入資源的特質(zhì)因素和市場因素等方面的不同,導致了其對于用戶使用的價值也存在差異化,每個聯(lián)盟成員都有權(quán)利根據(jù)自身資源價值的投入來獲取對等的回報。
在綜合科技服務云平臺歷史運行經(jīng)驗的基礎上,考慮到各影響因素的使用頻率和相關(guān)變量的可獲得性,本文基于資源的視角,將各資源供方的資源價值投入作為其收益分配方案的主要影響因素,首先采用GA-BP神經(jīng)網(wǎng)絡對其投入的資源價值進行評估,并在此基礎上展開進一步研究。
BP神經(jīng)網(wǎng)絡算法是Rumelhart于1985年在誤差反向傳播理論的基礎上提出的學習算法,它構(gòu)建于多層前饋網(wǎng)絡的基礎上,由輸入層、輸出層和隱藏層組成,具備強大的數(shù)據(jù)識別能力和模擬能力,在解決非線性系統(tǒng)問題上具有明顯優(yōu)勢[8]。然而,隨著其應用和普及的不斷深入,其自身存在的缺點也逐漸暴露,主要表現(xiàn)為學習過程中誤差收斂速度慢、容易陷入局部最優(yōu)等[9]。
遺傳算法(genetic algorithms,GA)是一種模擬生物在自然環(huán)境中的遺傳和進化過程而形成的自適應全局優(yōu)化概率搜索算法,它遵循優(yōu)勝劣汰、適者生存的原則,通過選擇、交叉、變異三個基本遺傳算子保留適應能力強的最優(yōu)個體,從而在全局搜索下尋找到最優(yōu)解[10]。
由于BP神經(jīng)網(wǎng)絡的初始權(quán)值和閾值一般都設定為某個范圍內(nèi)的隨機值,該值選取的不當,往往是導致網(wǎng)絡學習時間過長、陷入局部最優(yōu)而非全局最優(yōu)的主要原因。而遺傳算法的全局尋優(yōu)能力正是很好地彌補了這點,因此,將遺傳算法與BP神經(jīng)網(wǎng)絡相結(jié)合,通過遺傳算法來優(yōu)化網(wǎng)絡隱藏層、輸出層閾值以及輸入層與隱藏層、隱藏層與輸出層連接權(quán)值,使得它們更加逼近全局最優(yōu)的初始值,可以得到更好的擬合效果。
本文以評估合作聯(lián)盟中各資源供方所提供的資源價值為目標,通過以下步驟建立基于GA-BP神經(jīng)網(wǎng)絡的價值評估模型[11-12]:
(1)根據(jù)相關(guān)文獻閱讀和專家咨詢,并結(jié)合平臺可獲得資源數(shù)據(jù)的方式,將影響資源價值的因素歸納為6類指標[13-14],其具體描述如表1所示。
表1 資源價值影響指標描述
續(xù)表1
將采集到的資源數(shù)據(jù)進行清洗篩選,劃分訓練集和測試集,并對輸入輸出指標作歸一化處理。
(2)初始化BP神經(jīng)網(wǎng)絡的輸入層、輸出層、隱藏層節(jié)點個數(shù)、學習率、迭代次數(shù)以及訓練目標最小誤差等參數(shù),以確定網(wǎng)絡的拓撲結(jié)構(gòu)。
(3)定義遺傳算法所需參數(shù),包括種群個體數(shù)、代溝、最大遺傳代數(shù)、交叉概率、變異概率等。
(4)以二進制編碼的形式初始化種群,將其作為BP神經(jīng)網(wǎng)絡的初始權(quán)值和閾值。
(5)將訓練后網(wǎng)絡獲得的測試樣本的誤差作為適應度函數(shù),適應度越小的個體越為優(yōu)秀。
(6)在未達到最大遺傳代數(shù)前,根據(jù)優(yōu)勝劣汰的原則選擇適應性更優(yōu)的個體進行保留,并對這些個體進行交叉、變異操作。
(7)將處理好的種群重新作為BP神經(jīng)網(wǎng)絡的初始權(quán)值和閾值展開訓練,根據(jù)結(jié)果重新計算每個個體的適應度。
(8)判斷最優(yōu)個體適應度是否達到優(yōu)化終止條件或最大遺傳代數(shù),若未滿足,則返回步驟(6),否則繼續(xù)執(zhí)行下一步。
(9)將最終得到的最優(yōu)個體作為BP神經(jīng)網(wǎng)絡的初始權(quán)值和閾值,使用訓練集訓練神經(jīng)網(wǎng)絡,直到達到預設的期望指標。最后利用訓練好的神經(jīng)網(wǎng)絡,輸入測試集評估資源價值評估的準確率。
由L.S.Shapley于1953年提出的Shapley值法是一種用于解決n人合作對策問題的方法模型。當一個合作聯(lián)盟中的n個成員從事具有經(jīng)濟效益的活動后都會獲得不同的利益,但是當每個成員通過不同方式組成聯(lián)盟后獲得的利益要大于單獨工作的利益之和時,Shapley值法可以對利益聯(lián)盟中各成員的利益分配按照成員對聯(lián)盟總目標的貢獻程度進行計算[15]。
設合作聯(lián)盟N={1,2,…,n},那么根據(jù)Shapley值法得到的合作聯(lián)盟收益分配策略可以表示為:
其中:?i(v)表示在合作聯(lián)盟N下第i個成員的分配所得,Si表示集合N中所有包含了成員i的子集,S即可看作其中一個包含了成員i的子聯(lián)盟,|s|表示子聯(lián)盟S中所包含的成員個數(shù),n代表合作聯(lián)盟N中的成員總數(shù),ω(|s|)所計算出來的是成員i的權(quán)重系數(shù),v(s)是子聯(lián)盟S所獲得的效益,v(si)是子聯(lián)盟S除去成員i后可獲得的收益,?(v)則是合作聯(lián)盟的總收益。
從公式中可以發(fā)現(xiàn),Shapley值法為強調(diào)收益分配的平等性而把合作聯(lián)盟中各參與成員的邊際成本都看作1/n,忽略了聯(lián)盟中各企業(yè)成員在資源價值投入等方面的加權(quán)因素。
在Shapley值法基本模型下,考慮的是每個聯(lián)盟成員在資源價值投入均等的理想條件下所獲得的收益分配為?i(v),也就是說各成員投入的資源價值比例為:L=1/n。假設在實際環(huán)境中各成員的資源價值投入比例為Li,則顯然有合作聯(lián)盟成員i在實際環(huán)境中的價值投入同理想條件下的差值?Li,我們將其稱為資源價值投入修正因子[16]:
假設通過基于GA-BP神經(jīng)網(wǎng)絡的資源價值評估模型獲得的各成員資源價值投入的總值為Ri(i=1,2,…,n),很容易得到:
具體的修正方案可以表述為:當?Li≥0時,表示該成員在實際合作聯(lián)盟中提供的資源價值比理想條件更高,應當給予其更多的收益分配,其實際應當所得為:
否則應當扣除其部分所得:
很顯然地有:
本文實驗所采用數(shù)據(jù)來源于部分國內(nèi)較大的在線數(shù)據(jù)資源交易平臺,采用爬蟲軟件采集了200余條涵蓋電商運營、交通地理、金融服務、醫(yī)療衛(wèi)生、知識產(chǎn)權(quán)、房地產(chǎn)等行業(yè)的用于交易的資源信息數(shù)據(jù)。每條數(shù)據(jù)包含了10類信息:交易資源數(shù)據(jù)名稱、交易價格、用戶瀏覽量、用戶收藏量、用戶下載量、資源數(shù)據(jù)格式、資源數(shù)據(jù)量、資源數(shù)據(jù)大小、資源數(shù)據(jù)發(fā)布時間、資源數(shù)據(jù)來源平臺。對于采集到的數(shù)據(jù),若在某個關(guān)鍵字段缺失數(shù)值,則直接刪除;若數(shù)據(jù)大小單位為MB,則統(tǒng)一轉(zhuǎn)換為KB。同時還將CSV、SQL、PDF等格式信息統(tǒng)一用數(shù)值表示,將數(shù)據(jù)發(fā)布時間轉(zhuǎn)換為距今的天數(shù)。最后利用公式xi=(xixmin)/(xmax-xmin)將這些輸入輸出指標歸一化到[0,1]范圍內(nèi)的數(shù),以加快網(wǎng)絡訓練的收斂速度[17]。最終選取了200條可用實驗數(shù)據(jù),將其中160條作為訓練集,40條作為測試集。
BP神經(jīng)網(wǎng)絡的輸入層神經(jīng)元節(jié)點數(shù)即數(shù)據(jù)集中影響資源價值的輸入指標,這里設定為7。輸出層神經(jīng)元節(jié)點數(shù)為1,即資源數(shù)據(jù)的交易價格,用于評估資源價值。隱藏層只有一層,通過經(jīng)驗公式和實驗效果確定其神經(jīng)元節(jié)點數(shù)為9。設置網(wǎng)絡的訓練次數(shù)為1 000,訓練目標為0.01,學習速率為0.1。用于優(yōu)化神經(jīng)網(wǎng)絡的遺傳算法初始種群數(shù)設定為40,最大遺傳代數(shù)為50,交叉概率設定為0.7,變異概率設定為0.01。
本文以MATLAB R2016a作為實驗軟件,為了更好評估訓練模型的適用性,根據(jù)預設的參數(shù)分別進行了BP神經(jīng)網(wǎng)絡和GA-BP神經(jīng)網(wǎng)絡的構(gòu)建、訓練和測試,并通過均方根誤差(RMSE)、平均絕對百分比誤差(MAPE)等指標進行比較。
結(jié)合表2和圖1可以發(fā)現(xiàn),運用BP神經(jīng)網(wǎng)絡和GA-BP神經(jīng)網(wǎng)絡構(gòu)建的模型都能夠大致評估出資源價值及其走勢變化,表明了BP神經(jīng)網(wǎng)絡是一種可以用來評估資源價值投入的有效工具。兩種模型對比來看,BP神經(jīng)網(wǎng)絡的評估效果與實際值的差距更大,存在值得優(yōu)化的地方;而GA-BP神經(jīng)網(wǎng)絡得到的評估值和實際值更加接近,評估效果更好。
表2 部分測試集結(jié)果
圖1 兩種網(wǎng)絡的價值評估數(shù)值擬合圖
本文將評估值與實際值的差值矩陣的2-范數(shù)作為誤差標準,由于計算的是歸一化的評估結(jié)果,因此顯示誤差值較小。由圖2可以看出,隨著遺傳算法的加入和遺傳代數(shù)的增加,評估結(jié)果的誤差呈現(xiàn)出階梯狀下降的趨勢,在達到最大遺傳代數(shù)的停止條件時,其最小誤差達到了0.2557,且仍存在繼續(xù)減小的趨勢。該結(jié)果證明了遺傳算法能夠有效優(yōu)化BP神經(jīng)網(wǎng)絡的評估效果,且迭代次數(shù)越高,越容易逼近神經(jīng)網(wǎng)絡全局最優(yōu)的初始權(quán)值和閾值。除此之外,BP神經(jīng)網(wǎng)絡和GA-BP神經(jīng)網(wǎng)絡均方根誤差分別為250.2208和166.0310,平均絕對百分比誤差分別為1.3430和0.9209。很顯然這也再一次說明了遺傳算法的加入使得資源價值投入評估效果得到了顯著改善,訓練得到的該網(wǎng)絡可以用于評估合作聯(lián)盟中各供方所提供的資源價值。
圖2 遺傳算法的進化過程
表3 神經(jīng)網(wǎng)絡效果評價
目前綜合科技服務云平臺為用戶提供科技服務所使用的資源主要來源于由A、B、C三家企業(yè)所形成的合作聯(lián)盟,根據(jù)平臺資源池中收集的資源信息,通過上文中訓練好的神經(jīng)網(wǎng)絡評估其所提供的資源價值投入總量分別為:7.92萬、9.43萬、8.25萬。假設在平臺運行的某段時間內(nèi),由A、B、C三家資源提供服務可獲得總收益v(A∪B∪C)=20萬元,而僅由企業(yè)A資源提供服務可獲得收益v(A)=4萬元,僅由企業(yè)B資源提供服務可獲得收益v(B)=7萬元,僅由企業(yè)C資源提供服務可獲得收益v(C)=5.5萬元,由企業(yè)A、B資源提供服務可獲得收益v(A∪B)=12.5萬元,由企業(yè)A、C資源提供服務可獲得收益v(A∪C)=10萬元,由企業(yè)B、C資源提供服務可獲得收益v(B∪C)=13.5萬元。
由Shapley值法基本模型對A、B、C的收益分配進行計算,計算過程如下表所示。
表4 Shapley值法計算過程
將最后一行相加,即可得A分配收益?A(v)=5.167萬元。同理也可計算得?B(v)=8.417萬元,?C(v)=6.417萬元,將三者收益相加,忽略分數(shù)轉(zhuǎn)小數(shù)時產(chǎn)生的誤差,顯然有?A(v)+?B(v)+?C(v)=v(A∪B∪C)=20。
上述分配結(jié)果僅考慮各成員對合作聯(lián)盟所產(chǎn)生的基本經(jīng)濟效益,具有一定的片面性。接下來根據(jù)各資源供方的資源價值總投入并結(jié)合前文所總結(jié)公式,得到各成員的資源價值投入修正因子:?LA=-0.024,?LB=0.035,?LC=-0.011,再進一步計算可得:
顯然同樣有?A'(v)+?B'(v)+?C'(v)=20,證明該分配方案可行。
表5 兩種分配方案對比
上兩種方案對比可知,相較于Shapley值基本模型,引入修正因子的收益分配模型更加客觀地反映了各資源供方的資源價值投入情況,對企業(yè)A和C而言,他們因為資源在價值貢獻方面的不足而受到了少量的分成扣除,而企業(yè)B因為其提供的更多高價值資源而得到相應的價值投入獎勵??偟膩碚f,修正后的模型使得收益分配方案更加合理、客觀和公正,同時也激勵合作聯(lián)盟中的各資源供方向資源池中投入更多高價值資源,為綜合科技服務云平臺的服務質(zhì)量提升添加動力。
基于資源池的科技服務收益分配問題是綜合科技服務云平臺在服務交易方面的關(guān)鍵問題,一個科學合理的收益分配方案既有利于加強資源提供合作聯(lián)盟的協(xié)同發(fā)展,也有利于平臺自身的穩(wěn)定運營。本文在借鑒前人文獻中提供的研究方法基礎上,主要做出了以下創(chuàng)新研究:①基于資源的視角考慮了資源價值投入對于科技服務收益分配的影響,結(jié)合Shapley值法模型,選取可量化的評估指標進行了研究,打破了前人在模型改進過程中存在的分配影響因素主觀化、難以量化的困境,為今后進一步的收益分配研究提供了參考價值。②提供了一種基于科技資源的特質(zhì)因素和市場因素評估其價值的智能化方法,不僅為收益分配的調(diào)整方案提供了依據(jù),還可為網(wǎng)絡交易環(huán)境下的科技資源定價、高價值資源篩選提供了基礎。
同樣地,本文的研究也存在著一些不足:①受可獲取到的實驗數(shù)據(jù)的限制,只選取了7個可能影響資源價值評估的指標,實際環(huán)境中仍存在其他影響因素可用于研究。②研究所采用的數(shù)據(jù)來源于多家在線數(shù)據(jù)交易平臺,數(shù)據(jù)樣本依然較少,實驗效果可能存在一定的誤差。
未來相關(guān)研究主要可以從下面兩方面來開展:一是深入優(yōu)化基于神經(jīng)網(wǎng)絡的資源價值評估方法,例如對遺傳算法中各參數(shù)的確定進行改進,或是嘗試神經(jīng)網(wǎng)絡與模擬退火、蟻群算法等更多優(yōu)化算法結(jié)合的可行性;二是繼續(xù)從更多角度深入研究不同類型的因素對科技服務收益分配結(jié)果的影響,例如基于科技服務的反饋和基于資源供方的信用等,從而形成更為科學準確的收益分配方案。