彭行雄+肖如良
摘 要:針對(duì)仿真生成算法采用靜態(tài)分布模型生成Web日志,會(huì)造成與真實(shí)數(shù)據(jù)之間存在較大差異的問(wèn)題,提出一種基于用戶興趣遷移的Web日志仿真生成(WLSG)算法。該算法首先對(duì)Web日志與時(shí)間的關(guān)系進(jìn)行了建模;其次,模擬了用戶在不同時(shí)間訪問(wèn)文件時(shí)用戶的興趣遷移;最后,也模擬了用戶自適應(yīng)訪問(wèn)當(dāng)前時(shí)刻最感興趣的文件。相對(duì)于現(xiàn)有的采用靜態(tài)分布模型的仿真算法,所提算法能夠提高自相似性指標(biāo)約2.86%。實(shí)驗(yàn)結(jié)果表明,該算法通過(guò)用戶的興趣遷移來(lái)改變用戶的訪問(wèn)序列,能夠較好地模擬真實(shí)Web日志,有效地應(yīng)用于Web日志的仿真生成。
關(guān)鍵詞:興趣遷移;時(shí)間序列;日志分析;自相似;仿真生成
中圖分類號(hào):TP311
文獻(xiàn)標(biāo)志碼:A
文章編號(hào):1001-9081(2016)12-3476-05