黨雪寧 李明,2
(1.廣西科技大學經(jīng)濟與管理學院 廣西柳州 545000;2.廣西科技大學廣西工業(yè)高質量發(fā)展研究中心 廣西柳州 545000)
近年來,互聯(lián)網(wǎng)產業(yè)迅猛發(fā)展,數(shù)據(jù)資源比重不斷提高,同時數(shù)據(jù)挖掘、數(shù)據(jù)分析技術的發(fā)展加快了數(shù)據(jù)資源價值的評估,從而能夠最大程度地發(fā)揮數(shù)據(jù)資產的效用。數(shù)據(jù)資產評估研究存在數(shù)據(jù)資源龐大難以有效利用、數(shù)據(jù)資產不能合理評估造成互聯(lián)網(wǎng)行業(yè)發(fā)展緩慢、數(shù)據(jù)資產本身特性造成評估困難等問題。因此,我們需要觀察行業(yè)發(fā)展現(xiàn)狀,充分考慮衡量數(shù)據(jù)資產價值的因素,構建適用于數(shù)據(jù)資產價值的評估模型,從而提高數(shù)據(jù)資產價值評估的精確性。
孟小峰、慈祥(2013)[1]提出大數(shù)據(jù)具有規(guī)模大、多樣性、高速性的特點;張興旺等(2019)[2]認為數(shù)據(jù)資源經(jīng)過加工處理實現(xiàn)價值增值后形成數(shù)據(jù)資產。具體特征包括:控制、可變現(xiàn)、可計量、可估值、可流通。基于此,將數(shù)據(jù)資產的特征歸納為非實體性、類型多樣性、可變性、權屬不清晰等四個方面。對不同行業(yè)來說,影響數(shù)據(jù)資產價值的因素也不同;黃萃(2014)[3]提出不同的定價策略及定價方法的選擇會受到獲取公共信息的目的、價值估算、成本及融資、市場競爭狀況及社會信息公平等五個因素的影響;吳江(2015)在探討數(shù)據(jù)交易時,數(shù)據(jù)產權、數(shù)據(jù)的有用性數(shù)據(jù)交易成本、交易機制等會對數(shù)據(jù)資產價值造成影響。通過總結不同學者的觀點,本文認為數(shù)據(jù)資產與質量、稀缺性、效用等息息相關。
BP神經(jīng)網(wǎng)絡由三部分構成,分別是輸入層、隱藏層、輸出層。神經(jīng)網(wǎng)絡的每一層由若干個神經(jīng)元組成,神經(jīng)元作為BP神經(jīng)網(wǎng)絡的感知器,經(jīng)過激活函數(shù)的處理完成傳播過程。BP神經(jīng)網(wǎng)絡由輸入、權重、偏置、激活函數(shù)、輸出等組成。BP神經(jīng)網(wǎng)絡包含正向傳播和反向反饋。BP神經(jīng)網(wǎng)絡的正向傳播通過激活函數(shù)來實現(xiàn),將訓練樣本作為輸入層,與權重計算加上偏置,經(jīng)過激活函數(shù)的處理,得到的輸出結果作為下一次節(jié)點的輸入,將輸出結果與期望值進行比較,結果達不到期望值,不斷調整迭代得到滿意的結果,將最終的結果進行測試,并應用于適用領域。
遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡分為BP神經(jīng)網(wǎng)絡結構確定、遺傳算法優(yōu)化和BP神經(jīng)網(wǎng)絡預測3個部分。其中,BP神經(jīng)網(wǎng)絡的結構確定部分根據(jù)擬合函數(shù)的輸入輸出參數(shù)個數(shù)確定BP神經(jīng)網(wǎng)絡結構,進而確定遺傳算法個體的長度。遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡的權值和閾值,種群中的每個個體都包含一個網(wǎng)絡所有的權值和閾值,每個個體通過適應度函數(shù)計算適應度值,遺傳算法通過選擇、交叉、變異操作找到最優(yōu)的適應度值對應的個體。
百度公司于2000年1月1日由李彥宏攜“超鏈分析”搜索引擎專利技術在中關村科技園創(chuàng)建,這一技術專利使百度成為國內高科技企業(yè),掌握了世界尖端科學核心技術,也使中國躋身于全球包括美國、俄羅斯、韓國在內僅有的4個具有搜索引擎核心技術的國家之列。百度互聯(lián)網(wǎng)服務用戶達10億,每天響應數(shù)十億次搜索請求,已成為100余個國家和地區(qū)上網(wǎng)民眾接收中文信息和服務的重要途徑。
百度搜索引擎價值受網(wǎng)站內在技術、用戶角度等多方面影響,通過搜索引擎統(tǒng)計網(wǎng)站,我們盡可能較多的搜集影響搜索引擎數(shù)據(jù)資產價值的因素,從網(wǎng)站了解到用戶因素占了較大的部分,因此本文主要從用戶角度出發(fā)對搜索引擎價值進行預測,以流量指標作為評價標準,選取瀏覽量、訪客數(shù)、IP數(shù)、跳出率、平均訪問時長、轉換次數(shù)6個指標作為百度搜索引擎數(shù)據(jù)資產的價值影響因素。
本文將百度搜索引擎包括瀏覽量、訪客數(shù)、IP數(shù)、跳出率、平均訪問時長、轉換次數(shù)6個指標作為百度搜索引擎數(shù)據(jù)資產的價值影響因素,將6個指標數(shù)值歸一化處理作為神經(jīng)網(wǎng)絡輸入層。搜集了百度搜索引擎一個月的股票單價,根據(jù)股票單價和股數(shù)計算預測值,將預測值作為神經(jīng)網(wǎng)絡輸出層的訓練樣本,價值預測計算表達式如下:
其中:
V:百度搜索引擎市場價值;
C:百度搜索引擎價值預測當日股數(shù);
Smax:百度日最高股價;
Smin:百度日最低股價;
T:美元與人民幣換算匯率。
本文從百度統(tǒng)計網(wǎng)站統(tǒng)計了百度搜索引擎相關指標樣本值,選取2021年10月—11月共計32天的數(shù)據(jù),確定了3216個自變量樣本數(shù)據(jù)和32個因變量數(shù)據(jù)值進行后續(xù)的處理。
3.4.1 傳遞函數(shù)
神經(jīng)網(wǎng)絡的傳遞函數(shù)一般選purelin、tansig、logsig三種傳遞函數(shù),將其組合成9種不同形式,經(jīng)過程序處理得到相對應的均方誤差,均方誤差越小,BP神經(jīng)網(wǎng)絡學習的效果最優(yōu),因此選擇均方誤差最小的tansig、purelin的組合作為神經(jīng)網(wǎng)絡的傳遞函數(shù)。
3.4.2 神經(jīng)網(wǎng)絡層數(shù)
神經(jīng)網(wǎng)絡隱藏層個數(shù)決定了其結構的復雜程度,本文選擇一個相同的網(wǎng)絡結構,訓練迭代50次,比較網(wǎng)絡運行時間和結果精度,通過預測結果得出在誤差百分比相近的情況下,雙層網(wǎng)絡結構均方誤差和訓練時間最為合適。
3.4.3 各層神經(jīng)元節(jié)點數(shù)
本文選取了瀏覽量、訪客數(shù)、IP數(shù)、跳出率、平均訪問時長、轉換次數(shù)6個指標作為神經(jīng)網(wǎng)絡輸入層,即輸入層神經(jīng)元節(jié)點數(shù)為6。被解釋變量為百度輸出層節(jié)點數(shù)為1,表示百度搜索引擎數(shù)據(jù)資產的市值。神經(jīng)元隱藏層節(jié)點的多少決定了神經(jīng)網(wǎng)絡模型擬合的效果,因此確定合適的隱藏層節(jié)點數(shù)至關重要。最優(yōu)的隱藏層節(jié)點數(shù)確定方式公式如下:
其中:
l:隱藏層節(jié)點數(shù);
m:輸出單元神經(jīng)元數(shù);
n:輸入單元神經(jīng)元數(shù);
a:0~10的調節(jié)常數(shù);
本文經(jīng)過查閱相關文獻及測試,將第一層隱藏層神經(jīng)元個數(shù)設置為10,第二層神經(jīng)元個數(shù)設置為1。
3.4.4 學習率
本文將學習率初始值確定為0.001,在神經(jīng)網(wǎng)絡學習過程中,用梯度下降法不斷調整,直至收斂達到局部最優(yōu),得到最終的學習率。
3.5.1 聲明全局變量
(1)確定訓練集輸入數(shù)據(jù)p和訓練集輸出數(shù)據(jù)t
訓練集輸入數(shù)據(jù)選取樣本數(shù)據(jù)中前29組數(shù)據(jù),即確定一個629的矩陣p。訓練集輸出數(shù)據(jù)也就是預測的百度搜索引擎的市值,確定一個129的矩陣t。
(2)輸入層、隱藏層、輸出層神經(jīng)元的個數(shù)
輸入神經(jīng)元個數(shù)R=6,隱藏層神經(jīng)元個數(shù)S1=10,輸出神經(jīng)元個數(shù)S2=1。
(3)編碼長度
3.5.2 數(shù)據(jù)歸一化
根據(jù)歸一化數(shù)學原理,在Matlab R2018a中運用premnmx()函數(shù)進行初始數(shù)值的歸一化。表達如下:
其中:
3.5.3 確定種群個數(shù)并初始化種群
設定種群個數(shù)popu=50,初始化種群借用功能函數(shù)確定過程如下:
通過運行上述程序,得到最優(yōu)的權值和閾值如下:
3.5.8 計算隱藏層和輸出層的輸出
用A1表示隱藏層的輸出,A2表示輸出層的輸出
隱藏層tansig函數(shù)表達式為:
輸出層purelin函數(shù)表達式為:
將上述計算的具體數(shù)值帶入求解,即可得到輸出層的輸出值。
上述計算在Matlab中表示為:
運行后得出:A1為由1和-1組成的1029的矩陣,A2為129的矩陣。
3.5.9 計算誤差平方和
在Matlab中表示為:
運行得誤差平方和SE=5.7460*106。
3.5.10 計算適應度值
在matlab中運行得val=1.7403*10-7,適應度值越小,說明尋出來的結果越好,因此用遺傳算法優(yōu)化神經(jīng)網(wǎng)絡評估出來的值是可信的。
在Matlab中用postmnmx()函數(shù)將輸出的數(shù)據(jù)反歸一化得到預測數(shù)據(jù),同時輸出測試數(shù)據(jù)作為真實值,表示如下:
得出的預測值和真實值匯總如表1所示。
表1 預測值和真實值對比
通過表1中預測值和真實值的比較,計算的誤差百分比大部分在5%以內,說明GA-BP神經(jīng)網(wǎng)絡模型擬合效果良好,預測的結果可信,因此用該模型預測的結果作為百度搜索引擎數(shù)據(jù)資產的價值是可行的。
根據(jù)設置的參數(shù),在軟件MATLABR2018a中進行模型的構建和訓練,得出遺傳算法優(yōu)化神經(jīng)網(wǎng)絡的預測值與實際值效果如圖1所示。
圖1 GA-BP神經(jīng)網(wǎng)絡數(shù)據(jù)擬合圖
圖1反映兩種模型預測結果的大體走勢,本文給出了GA-BP神經(jīng)網(wǎng)絡模型評估百度搜索引擎31組數(shù)據(jù)資產價值的預測值和真實值,因百度公司目前市場份額及財務狀況較為穩(wěn)定,可將31組數(shù)據(jù)的平均值作為最終確定的搜索引擎數(shù)據(jù)資產預測的價值,最終計算確定的百度搜索引擎數(shù)據(jù)資產的價值為452.6萬元。通過計算我們可以看出最終確定的預測值與真實值的平均值差值較小,說明模型訓練的預測值和真實值的曲線圖的擬合效果較好,得出的結論真實可靠,具有較大的參考性。