摘要:隨著WWW的迅速擴(kuò)張和網(wǎng)絡(luò)用戶的急劇增加,準(zhǔn)確預(yù)測Web用戶的訪問行為對(duì)減少用戶的感知延時(shí)、提高網(wǎng)絡(luò)服務(wù)質(zhì)量具有重要作用。文章分析了傳統(tǒng)Markov模型的優(yōu)缺點(diǎn),針對(duì)低階Markov模型準(zhǔn)確率不高,而高階Markov模型狀態(tài)空間復(fù)雜度較高的缺點(diǎn),提出了一種新的K步Markov模型(K-Step Markov Model,K-SMM),并引入了偏愛度的概念,建立了基于偏愛度的多步Markov網(wǎng)頁預(yù)測模型(Preferred K-Step Markov Model,PKSMM)。實(shí)驗(yàn)結(jié)果表明,該模型可以獲得更高的預(yù)測準(zhǔn)確率與覆蓋率,并能有效地降低存儲(chǔ)復(fù)雜度。
關(guān)鍵詞:數(shù)據(jù)挖掘;Markov模型;偏愛度;瀏覽路徑預(yù)測;空間復(fù)雜度