賴 紅 清
(佛山職業(yè)技術(shù)學(xué)院 工商管理學(xué)院商貿(mào)系,廣東 佛山 528200)
隨著經(jīng)濟(jì)的發(fā)展,需要對(duì)企業(yè)二次創(chuàng)業(yè)金融數(shù)據(jù)進(jìn)行優(yōu)化聚類分析,通過(guò)提取企業(yè)二次創(chuàng)業(yè)金融數(shù)據(jù)的統(tǒng)計(jì)特征量,結(jié)合大數(shù)據(jù)信息處理和數(shù)據(jù)融合方法,將其進(jìn)行優(yōu)化聚類分析,以提高企業(yè)二次創(chuàng)業(yè)金融數(shù)據(jù)的模糊聚類能力[1]。對(duì)企業(yè)二次創(chuàng)業(yè)金融數(shù)據(jù)的分類是實(shí)現(xiàn)企業(yè)金融管理優(yōu)化的關(guān)鍵,相關(guān)的數(shù)據(jù)分類研究受到人們的極大關(guān)注[2]。對(duì)企業(yè)二次創(chuàng)業(yè)金融數(shù)據(jù)的聚類分析主要采用模糊聚類方法,結(jié)合統(tǒng)計(jì)數(shù)據(jù)分析,進(jìn)行數(shù)據(jù)分類處理,但傳統(tǒng)方法模糊度較大,分類的準(zhǔn)確性不好。針對(duì)上述問(wèn)題,提出基于邏輯回歸的企業(yè)二次創(chuàng)業(yè)金融數(shù)據(jù)分類方法,采用邏輯回歸分析方法將數(shù)據(jù)進(jìn)行融合聚類處理,結(jié)合模糊C均值聚類方法,實(shí)現(xiàn)數(shù)據(jù)分類的自適應(yīng)尋優(yōu)和收斂性控制。最后進(jìn)行仿真實(shí)驗(yàn)分析,展示了該方法在提高企業(yè)二次創(chuàng)業(yè)金融數(shù)據(jù)分類能力方面的優(yōu)越性能。
為了實(shí)現(xiàn)企業(yè)二次創(chuàng)業(yè)金融數(shù)據(jù)分類,采用自適應(yīng)無(wú)監(jiān)督學(xué)習(xí)方法進(jìn)行統(tǒng)計(jì)融合處理。首先構(gòu)建企業(yè)二次創(chuàng)業(yè)金融數(shù)據(jù)模糊決策樹(shù)模型,采用相空間重構(gòu)方法進(jìn)行模糊特征重構(gòu)[3],采用一個(gè)四元組(Ei,Ej,d,t)來(lái)表示特征分布權(quán)系數(shù),其中Ei,Ej是企業(yè)二次創(chuàng)業(yè)金融數(shù)據(jù)特征權(quán)重的實(shí)體集(即節(jié)點(diǎn)i和j),d為特征權(quán)重的交互性統(tǒng)計(jì)數(shù)據(jù),t為企業(yè)二次創(chuàng)業(yè)過(guò)程中的業(yè)績(jī)關(guān)聯(lián)數(shù)據(jù)特征集,采用企業(yè)內(nèi)部代理方法進(jìn)行統(tǒng)計(jì)特征分析,得到企業(yè)二次創(chuàng)業(yè)金融數(shù)據(jù)的量化集為
x(t)=(x0(t),x1(t),…,xk-1(t))T
(1)
采用一個(gè)1×N維的分布陣列進(jìn)行企業(yè)二次創(chuàng)業(yè)金融數(shù)據(jù)特征重構(gòu),確定模糊時(shí)間窗口值N,構(gòu)建多維信息熵分布矩陣。采用激勵(lì)機(jī)制建立企業(yè)二次創(chuàng)業(yè)金融數(shù)據(jù)的特征權(quán)重分析模型,建立窄時(shí)域窗TLX,TLY,得到企業(yè)二次創(chuàng)業(yè)金融數(shù)據(jù)特征權(quán)重的模糊特征提取模型為
(2)
式(2)中,Dx(x,y)表示特征提取最大范圍值,當(dāng)提范圍值小于等于窗口值N時(shí),進(jìn)行特征權(quán)重的模糊特征提??;當(dāng)超出窗口值N時(shí),不進(jìn)行提取。
設(shè)企業(yè)二次創(chuàng)業(yè)金融數(shù)據(jù)特征權(quán)重的模板特征分布為m,構(gòu)建Probit多元回歸分析模型[4],得到數(shù)據(jù)的有效性控制指數(shù)為Nj*,在進(jìn)行企業(yè)二次創(chuàng)業(yè)金融數(shù)據(jù)特征權(quán)重回歸分析的基礎(chǔ)上,得到企業(yè)二次創(chuàng)業(yè)金融數(shù)據(jù)的統(tǒng)計(jì)回歸分布為
(3)
根據(jù)企業(yè)二次創(chuàng)業(yè)金融數(shù)據(jù)特征權(quán)重進(jìn)行自適應(yīng)分類,構(gòu)建融資相關(guān)性決策模型,提高對(duì)數(shù)據(jù)的分類和統(tǒng)計(jì)決策能力。
構(gòu)建企業(yè)二次創(chuàng)業(yè)金融數(shù)據(jù)分布的不規(guī)則空間聚類模型,采用相空間結(jié)構(gòu)重組方法進(jìn)行模糊特征重構(gòu),采用決策樹(shù)模型進(jìn)行統(tǒng)計(jì)融合分類[5],得到企業(yè)二次創(chuàng)業(yè)金融數(shù)據(jù)的量化特征分布集為D,D={Si,j(t),Ti,j(t),Ui,j(t)},其中Si,j(t)表示特征權(quán)重的重復(fù)因素,Ti,j(t)表示融合分類的輸出量因素,Ui,j(t)表示相似度(相關(guān)性)模型,對(duì)企業(yè)二次創(chuàng)業(yè)金融數(shù)據(jù)特征權(quán)重關(guān)聯(lián)規(guī)則特征量進(jìn)行量化回歸分析,定義為
(4)
Ti,j(t)表示對(duì)企業(yè)二次創(chuàng)業(yè)金融數(shù)據(jù)特征權(quán)重檢測(cè)的相關(guān)性特征分布集,計(jì)算表達(dá)為
(5)
提取企業(yè)二次創(chuàng)業(yè)金融數(shù)據(jù)的關(guān)聯(lián)規(guī)則特征量,根據(jù)譜聚類結(jié)果,進(jìn)行自適應(yīng)篩選和優(yōu)化決策,建立關(guān)聯(lián)規(guī)則模型,輸出為
Ui,j(t)=exp[-b[zi(t)-zj(t)]2]
(6)
式(6)中,pi,j(t)為統(tǒng)計(jì)融合分類的互信息量;spi,j(t)為特征權(quán)重檢測(cè)的分叉度重復(fù)量;Δp(t)為增益系數(shù);zi(t),zj(t)表示為模糊度函數(shù),由此建立企業(yè)二次創(chuàng)業(yè)金融數(shù)據(jù)的特征提取和大數(shù)據(jù)融合聚類模型,采用模糊特征分析方法,進(jìn)行企業(yè)二次創(chuàng)業(yè)金融數(shù)據(jù)的模糊聚類處理,提高數(shù)據(jù)的分類挖掘和識(shí)別能力[6]。
在構(gòu)建企業(yè)二次創(chuàng)業(yè)金融數(shù)據(jù)優(yōu)化分類模型中,采用融資決策模型,進(jìn)行融合調(diào)度,提取關(guān)聯(lián)規(guī)則特征集進(jìn)行金融數(shù)據(jù)的自適應(yīng)分類,分析企業(yè)二次創(chuàng)業(yè)金融數(shù)據(jù)的離散空間調(diào)度模型,采用模糊控制方法[7],進(jìn)行融分段樣本檢驗(yàn),得到自適應(yīng)加權(quán)權(quán)重為
ωj=(ω0j,ω1j,…,ω(k-1)j)T
(7)
建立企業(yè)二次創(chuàng)業(yè)金融數(shù)據(jù)的模糊聚類模型,進(jìn)行特征分析,得到數(shù)據(jù)序列的統(tǒng)計(jì)特征序列為
(8)
式(8)中,k為企業(yè)二次創(chuàng)業(yè)金融數(shù)據(jù)的聚類空間分布權(quán)重。采用離散序列調(diào)度方法,構(gòu)建企業(yè)二次創(chuàng)業(yè)金融數(shù)據(jù)的特征匹配模型,根據(jù)多分類器融合結(jié)果進(jìn)行信息分類,實(shí)現(xiàn)企業(yè)二次創(chuàng)業(yè)金融數(shù)據(jù)的統(tǒng)計(jì)特征檢測(cè),得到檢測(cè)統(tǒng)計(jì)量為
(9)
(10)
構(gòu)建企業(yè)二次創(chuàng)業(yè)金融數(shù)據(jù)統(tǒng)計(jì)分布有限數(shù)據(jù)集模型,得到關(guān)聯(lián)特征為
(11)
(12)
在分散子空間中進(jìn)行企業(yè)二次創(chuàng)業(yè)金融數(shù)據(jù)實(shí)時(shí)檢測(cè),實(shí)現(xiàn)關(guān)聯(lián)規(guī)則特征提取[8]。
(13)
采用多隊(duì)列調(diào)度方法,建立企業(yè)二次創(chuàng)業(yè)金融數(shù)據(jù)的決策調(diào)度模型,得到特征訓(xùn)練集si={xj:d(xj,yi)≤d(xj,yl)},企業(yè)二次創(chuàng)業(yè)金融數(shù)據(jù)的顯著性特征權(quán)重為
MinWH=min{w(cc),h(cc)}
(14)
(15)
建立模糊度核函數(shù)模型,采用相空間結(jié)構(gòu)重組方法,得到Nj*的幾何鄰域NEj*(t),企業(yè)二次創(chuàng)業(yè)金融數(shù)據(jù)統(tǒng)計(jì)融合分類的模糊聚類中心為
U={μik|i=1,2,…,c;k=1,2,…,n}
(16)
在關(guān)聯(lián)規(guī)則聚類下,得到企業(yè)二次創(chuàng)業(yè)金融數(shù)據(jù)的模糊調(diào)度函數(shù)為
(17)
采用空間網(wǎng)格聚類方法得到優(yōu)化的企業(yè)二次創(chuàng)業(yè)金融數(shù)據(jù)特征權(quán)重聚類中心為
(18)
(19)
式(18)(19)中,m為企業(yè)二次創(chuàng)業(yè)金融數(shù)據(jù)統(tǒng)計(jì)融合分類的適應(yīng)度函數(shù),(dik)2為樣本xk與特征聚類中心與樣本Vi的測(cè)度距離。結(jié)合模糊C均值聚類方法,得到企業(yè)二次創(chuàng)業(yè)金融數(shù)據(jù)主成分分布為
(20)
構(gòu)建企業(yè)二次創(chuàng)業(yè)金融數(shù)據(jù)模糊聚類的回歸分析模型,根據(jù)特征分布進(jìn)行線性結(jié)構(gòu)重組,得到企業(yè)二次創(chuàng)業(yè)金融數(shù)據(jù)的多元決策模型,對(duì)其進(jìn)行分布式檢測(cè)和自適應(yīng)聚類分析,得到相關(guān)性概率密度特征為
(21)
在關(guān)聯(lián)規(guī)則特征分布集中,企業(yè)二次創(chuàng)業(yè)金融數(shù)據(jù)分類的互信息量為
(22)
建立企業(yè)二次創(chuàng)業(yè)金融數(shù)據(jù)的特征提取和大數(shù)據(jù)融合聚類分析模型,實(shí)現(xiàn)特征權(quán)重分類[10],得到企業(yè)二次創(chuàng)業(yè)金融數(shù)據(jù)統(tǒng)計(jì)分布序列特征矩陣,滿足:
(23)
根據(jù)上述分析,采用決策樹(shù)模型,構(gòu)建企業(yè)二次創(chuàng)業(yè)金融數(shù)據(jù)的空間聚類模型,結(jié)合統(tǒng)計(jì)特征分析方法,實(shí)現(xiàn)數(shù)據(jù)的均值聚類和自適應(yīng)分類識(shí)別方法,實(shí)現(xiàn)對(duì)企業(yè)二次創(chuàng)業(yè)金融數(shù)據(jù)分類的自適應(yīng)尋優(yōu)和收斂性控制,提高數(shù)據(jù)的分類檢測(cè)能力。
為了驗(yàn)證本文方法在實(shí)現(xiàn)企業(yè)二次創(chuàng)業(yè)金融數(shù)據(jù)分類中的應(yīng)用性能,進(jìn)行仿真實(shí)驗(yàn)分析。采用Matlab和C++進(jìn)行數(shù)據(jù)分類的算法設(shè)計(jì),對(duì)金融數(shù)據(jù)采樣的樣本數(shù)為1 200,控制權(quán)重系數(shù)為0.36,金融數(shù)據(jù)的模糊特征檢測(cè)迭代次數(shù)為800,采樣周期T=0.86 s,信息的擾動(dòng)強(qiáng)度為SNR=0~-20 dB,統(tǒng)計(jì)采樣率為fs=(10*f0) Hz=10 kHz,根據(jù)上述仿真環(huán)境和參數(shù)設(shè)定,進(jìn)行企業(yè)二次創(chuàng)業(yè)金融數(shù)據(jù)統(tǒng)計(jì)融合分類,得到大數(shù)據(jù)集采樣分布如圖1所示。
圖1 企業(yè)二次創(chuàng)業(yè)金融數(shù)據(jù)的大數(shù)據(jù)集采樣頻域分布Fig. 1 The sampling frequency distribution of the big data of the financial data for the secondary entrepreneurship of a firm
以圖1的數(shù)據(jù)為研究對(duì)象,構(gòu)建企業(yè)二次創(chuàng)業(yè)金融數(shù)據(jù)分布的不規(guī)則空間聚類模型,采用相空間結(jié)構(gòu)重組方法進(jìn)行模糊特征重構(gòu),得到企業(yè)二次創(chuàng)業(yè)金融數(shù)據(jù)的聚類中心分布如圖2所示。
圖2 企業(yè)二次創(chuàng)業(yè)金融數(shù)據(jù)的聚類中心分布Fig. 2 The clustering center distribution of the financial data
分析圖2得知,采用本文方法進(jìn)行企業(yè)二次創(chuàng)業(yè)金融數(shù)據(jù)分類的空間聚集性較好,聚類中心檢測(cè)的抗干擾能力較強(qiáng)。測(cè)試不同方法的企業(yè)二次創(chuàng)業(yè)金融數(shù)據(jù)的準(zhǔn)確性,得到收斂性測(cè)試結(jié)果如圖3 所示。
圖3 企業(yè)二次創(chuàng)業(yè)金融數(shù)據(jù)分類的收斂性結(jié)果Fig. 3 The convergence result of the financial data classification of the secondary entrepreneurship of a firm
分析圖3得知,采用本文方法進(jìn)行企業(yè)二次創(chuàng)業(yè)金融數(shù)據(jù)統(tǒng)計(jì)融合分類的準(zhǔn)確性較高,進(jìn)一步測(cè)試企業(yè)二次創(chuàng)業(yè)金融數(shù)據(jù)的誤分率,得到對(duì)比結(jié)果見(jiàn)表1。分析表1得知,本文方法進(jìn)行企業(yè)二次創(chuàng)業(yè)金融數(shù)據(jù)統(tǒng)計(jì)分類的誤分率較低。
表1 誤分率對(duì)比Table 1 Comparison of error rate
結(jié)合大數(shù)據(jù)信息處理和數(shù)據(jù)融合方法,進(jìn)行企業(yè)二次創(chuàng)業(yè)金融數(shù)據(jù)的優(yōu)化聚類分析,提高企業(yè)二次創(chuàng)業(yè)金融數(shù)據(jù)的模糊聚類能力。提出基于邏輯回歸的企業(yè)二次創(chuàng)業(yè)金融數(shù)據(jù)分類方法,采用自適應(yīng)無(wú)監(jiān)督學(xué)習(xí)方法進(jìn)行統(tǒng)計(jì)融合處理,構(gòu)建企業(yè)二次創(chuàng)業(yè)金融數(shù)據(jù)分布的不規(guī)則空間聚類模型,采用相空間結(jié)構(gòu)重組方法進(jìn)行模糊特征重構(gòu),采用邏輯回歸分析方法進(jìn)行融合聚類處理,結(jié)合模糊C均值聚類方法,實(shí)現(xiàn)對(duì)企業(yè)二次創(chuàng)業(yè)金融數(shù)據(jù)分類的自適應(yīng)尋優(yōu)和收斂性控制,實(shí)現(xiàn)分類優(yōu)化。研究得知,采用該方法進(jìn)行企業(yè)二次創(chuàng)業(yè)金融數(shù)據(jù)分類的準(zhǔn)確性較高,誤分率較低。