大家都知道在網(wǎng)站優(yōu)化過程中需要進(jìn)行數(shù)據(jù)分析,而收錄指標(biāo)是眾多數(shù)據(jù)里尤為重要的一個(gè),并且很多時(shí)候我們不僅要查看網(wǎng)站每天更新的收錄情況,還要查看整個(gè)網(wǎng)站更新頁有哪些頁面沒有收錄,而通過百度站長平臺查看子欄目收錄量或通過在百度利用site+inurl 高級搜索只能查看更新欄目頁的收錄量,還是不能知道哪些沒收錄。一般情況下都是利用批量收錄查詢,但是這個(gè)問題來了,這個(gè)需要網(wǎng)址,大量的網(wǎng)址,如何快速獲得網(wǎng)站更新頁全部網(wǎng)址呢? 今天就給大家講一個(gè)方法。
一、打開火車采集器,新建一個(gè)名為“更新欄目網(wǎng)址”的任務(wù)。
二,點(diǎn)擊起始網(wǎng)址框的添加按鈕,如下圖,選擇“批量/多頁”。這一步是最重要的了,我以木木seo 博客為例,大家可以看到更新欄目頁一共12 頁,地址基本一樣,只不過是最后一個(gè)數(shù)字在等差遞增,所以可以利用通配符和等差關(guān)系按下圖進(jìn)行設(shè)置,大家的網(wǎng)站更新欄目也肯定是有這個(gè)規(guī)律的,仔細(xì)看一下就可以進(jìn)行設(shè)置。
三、點(diǎn)擊多級網(wǎng)址獲取的添加按鈕,選擇網(wǎng)址獲取選項(xiàng),按照頭尾從選定區(qū)域提取網(wǎng)址,這里我用的這樣的個(gè)頭尾,為什么?因?yàn)椴榭床┛驮创a可以發(fā)現(xiàn)更新頁的每頁所有文章的網(wǎng)址都位于這2個(gè)注釋代碼之間,你的網(wǎng)站也一樣,觀察網(wǎng)站源代碼,然后加入包含列表頁的頭尾代碼或其他特征文字,點(diǎn)擊保存。
四、到這里可以說就完了,我們不用設(shè)置內(nèi)容采集和發(fā)布,直接點(diǎn)擊測試網(wǎng)址采集,在彈出的框里面點(diǎn)擊導(dǎo)出一級節(jié)點(diǎn)就OK 了。
好了,到這里就完了,在圖上可以看到導(dǎo)出的一級節(jié)點(diǎn)網(wǎng)址,和博客總共的更新文章數(shù)量完全吻合。