劉文昊
摘要:數(shù)學(xué)結(jié)構(gòu)作為客觀世界數(shù)量關(guān)系與空間形式的反映是有規(guī)律的。概率模型構(gòu)造法為證明解題提供了新的途徑。概率的研究起源于實(shí)際生活問題,目前廣泛應(yīng)用于各領(lǐng)域。概率論的發(fā)展凝結(jié)了數(shù)學(xué)家的心血。概率論在數(shù)學(xué)模型建立中有著重要的地位。
關(guān)鍵詞:概率預(yù)測(cè);網(wǎng)絡(luò)數(shù)學(xué)模型
一、預(yù)測(cè)模型的建立
交叉概率預(yù)測(cè)就是依據(jù)某些事件間的相互影響進(jìn)行分析,當(dāng)某一事發(fā)生時(shí)其他事件受影響發(fā)生變化的方法。事件間相互影響關(guān)系常用矩陣形式表達(dá),各事件變化程度用概率值描述。因此此法稱為交叉影響概率法。
移動(dòng)平均法是一種簡單的適應(yīng)模型,算術(shù)平均不能反映數(shù)據(jù)的變化趨勢(shì),原始數(shù)據(jù)可能是零散的。移動(dòng)平均法克服了上述弱點(diǎn)。以N=5為例:
移動(dòng)平均法重要的是移動(dòng)周期N的選擇,N為數(shù)據(jù)點(diǎn)數(shù)。
移動(dòng)平均修勻后方差隨N加大減少,N越大,對(duì)原始數(shù)據(jù)修勻力越強(qiáng)。
二、概率生成模型的網(wǎng)絡(luò)數(shù)據(jù)分類
本節(jié)描述網(wǎng)絡(luò)數(shù)據(jù)分類方法,探討網(wǎng)絡(luò)的概率生成模型,將未知類別節(jié)點(diǎn)的類別作為模型潛在變量,將網(wǎng)絡(luò)視為模型觀察變量,通過求解模型計(jì)算潛在變量取值,得到未知類別節(jié)點(diǎn)類別。
1.類別傳播分布
網(wǎng)絡(luò)概率生成模型是描述網(wǎng)絡(luò)生成的概率模型。網(wǎng)絡(luò)由節(jié)點(diǎn)間的邊組成,網(wǎng)絡(luò)概率生成模型需描述網(wǎng)絡(luò)中邊的生成過程,因此建立網(wǎng)絡(luò)模型生成關(guān)鍵是給出2點(diǎn)間邊的概率。
同質(zhì)性程度高的網(wǎng)絡(luò)中,大多相連節(jié)點(diǎn)類別相同。類別相同點(diǎn)間有邊的概率較大,可用2節(jié)點(diǎn)描述邊的概率。低同質(zhì)性網(wǎng)絡(luò)大多相連節(jié)點(diǎn)類別不同,2點(diǎn)間有邊概率不因類別相同增大。本文考慮2節(jié)點(diǎn)相鄰結(jié)論對(duì)2節(jié)點(diǎn)間有邊概率的影響。若點(diǎn)Vi鄰節(jié)點(diǎn)屬Lc,點(diǎn)Vi有與類別Lc節(jié)點(diǎn)相連的趨勢(shì)。Vi鄰點(diǎn)中,屬類別Lc的點(diǎn)越多趨勢(shì)越強(qiáng),本文用點(diǎn)Vi鄰點(diǎn)類別與點(diǎn)Vj描繪點(diǎn)Vi與點(diǎn)Vj有邊概率。點(diǎn)Vj類別是Lc,點(diǎn)Vi鄰點(diǎn)屬類別Lc點(diǎn)越多。點(diǎn)Vi與點(diǎn)Vj概率越大。
設(shè)有K各類別,點(diǎn)Vi有Ni鄰點(diǎn),Ni鄰點(diǎn)有Nic各點(diǎn)的類別是Lc,點(diǎn)Vi鄰點(diǎn)屬類別Lc比為Nic/Ni記θic,向量為點(diǎn)Vi 的類別傳播分布。記θi。
一點(diǎn)類別分布由點(diǎn)鄰點(diǎn)類別決定,點(diǎn)類別傳播分布表現(xiàn)點(diǎn)鄰點(diǎn)屬各類別的概率。點(diǎn)Vi類別傳播分布中類別Lc對(duì)應(yīng)分量θic大,說明Vi鄰點(diǎn)屬類別Lc概率大。如點(diǎn)Vj連類別是Lc,θic越大,點(diǎn)Vi與點(diǎn)Vj相連概率越大。本文就點(diǎn)Vi類別傳播分布與點(diǎn)Vj類別描述點(diǎn)Vi與點(diǎn)Vj間有邊的概率。點(diǎn)Vi與點(diǎn)Vj 間有邊概率為點(diǎn)Vi類別傳播分布在點(diǎn)Vj 類別的分量。
2.基于類別傳播分布網(wǎng)絡(luò)概率生成模型
網(wǎng)絡(luò)數(shù)據(jù)用無向圖G=
網(wǎng)絡(luò)概率生成模型是描述網(wǎng)絡(luò)生成過程的概率模型,網(wǎng)絡(luò)由點(diǎn)間邊組成,可將邊作模型觀察變量。通過描述網(wǎng)絡(luò)中邊的生成描述網(wǎng)絡(luò)生成。本文概率生成模型將類別傳播分布作模型參數(shù)。用類別傳播分布描述邊產(chǎn)生概率。點(diǎn)Vi與點(diǎn)Vj間邊概率為Vi的類別傳播分布在類別Lyj上的分量θiyj,2點(diǎn)間有邊概率依賴其中一點(diǎn)類別。網(wǎng)絡(luò)中存在部分未知類型的點(diǎn)。本文模型中將未知類別點(diǎn)類別作潛在變量。產(chǎn)生邊前通過均勻分布抽取潛在變量取值。得到未知類別點(diǎn)類別。利用類別分布描述邊生產(chǎn)概率。
在有N點(diǎn)與K點(diǎn)類別網(wǎng)中,從a為參數(shù)產(chǎn)生每點(diǎn)類別傳播分布。對(duì)每未知類別點(diǎn)從[0,K-1]上均勻分布中產(chǎn)生整數(shù),將其作該點(diǎn)類別索引。對(duì)點(diǎn)Vi與點(diǎn)Vj間邊,從伯努利分布中產(chǎn)生。參數(shù)為點(diǎn)Vi的類別傳播分布在類別Lyj上的分量θiyj
網(wǎng)絡(luò)生成過程
y表示未知類別點(diǎn)類別索引組成的集合。聯(lián)合概率分布為未知類別點(diǎn)是潛在變量,類別傳播分布是參數(shù),網(wǎng)絡(luò)中邊是觀察變量,模型求解即通過觀察變量計(jì)算潛在變量與參數(shù)取值。
用吉布斯采樣方法需得到潛在變量后驗(yàn)概率,本文模型后驗(yàn)概率為其中y-u表示除點(diǎn)Vu外所有點(diǎn)類別索引。
結(jié)論:本文提出給予概率生成模型網(wǎng)絡(luò)數(shù)據(jù)分類方法,提出傳播分布概念,用以表現(xiàn)節(jié)點(diǎn)相鄰點(diǎn)屬各類別概率,用類別傳播分布提出描述網(wǎng)絡(luò)生成過程的概率生成模型。通過求解模型得出未知類別點(diǎn)的類別。
參考文獻(xiàn):
[1]鄭煒,張科,汪芳等.概率預(yù)測(cè)的網(wǎng)絡(luò)數(shù)學(xué)模型及其應(yīng)用[J].計(jì)算機(jī)工程與應(yīng)用,2014.45(18):59-61,69.