一種基于狀態(tài)轉(zhuǎn)換圖的Ajax爬行算法

2009-12-31 00:00:00郭浩陸余良劉金紅

計(jì)算機(jī)應(yīng)用研究 2009年11期

摘要：傳統(tǒng)web爬蟲無法解決爬行Ajax應(yīng)用所面臨的Javascript執(zhí)行、狀態(tài)識別與切換、重復(fù)狀態(tài)檢測等問題。為此，首先定義Ajax應(yīng)用的狀態(tài)轉(zhuǎn)換圖，并設(shè)計(jì)了一種基于狀態(tài)轉(zhuǎn)換圖的Ajax爬行算法，通過該算法可以獲取Ajax用狀態(tài)信息和后臺De印Web資源。為了提高Ajax爬行的準(zhǔn)確性、減少待爬行的狀態(tài)數(shù)目，使用Ajax指紋識別、DOM結(jié)構(gòu)過濾等方法改進(jìn)上述算法。實(shí)驗(yàn)結(jié)果表明了算法的有效性和性能。

關(guān)鍵詞：Ajax爬蟲；狀態(tài)轉(zhuǎn)換圖；Weh爬蟲；DeepWeb

中圖分類號：TP393

文獻(xiàn)標(biāo)志碼：A

文章編號：1001—3695(2009)11—4266—04

計(jì)算機(jī)應(yīng)用研究2009年11期

計(jì)算機(jī)應(yīng)用研究的其它文章: 下期要目; 基于Mean-Shifi和NMI特征的人眼跟蹤; 基于邊緣和模型的半色調(diào)圖像水印算法; 基于判別因子的指紋圖像質(zhì)量評估算法; 基于YIQ色彩空間的彩色圖像盲水印算法; 基于Penlin噪聲的海面仿真在Vega Prime中的應(yīng)用

亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

一種基于狀態(tài)轉(zhuǎn)換圖的Ajax爬行算法