李大為 王京春 趙兵兵
摘要:調(diào)研了目前網(wǎng)絡(luò)流量計(jì)量的發(fā)展?fàn)顩r,列舉了常用的流量指標(biāo)和應(yīng)用特點(diǎn),分析了Alexa網(wǎng)站排名的機(jī)制和提供的流量數(shù)據(jù),并使用實(shí)際數(shù)據(jù)驗(yàn)證了Alexa的排名。提出了數(shù)據(jù)的估算方式來分析中國地區(qū)的排名情況,對(duì)Alexa中國排名75~125名的流量指標(biāo)數(shù)據(jù)進(jìn)行歸納處理,提出排名處于該區(qū)間的網(wǎng)站的特點(diǎn),給出提升排名在數(shù)據(jù)指標(biāo)上應(yīng)達(dá)到的目標(biāo)和改進(jìn)建議,為新聞、門戶網(wǎng)站建設(shè)及網(wǎng)站評(píng)價(jià)提供參考,為網(wǎng)站提升Alexa排名提出建議。
關(guān)鍵詞:網(wǎng)站排名;流量指標(biāo);Alexa;數(shù)據(jù)分析
中圖分類號(hào):TP391.4文獻(xiàn)標(biāo)志碼:A文章編號(hào):1008-1739(2018)18-64-3
Analysis on Characteristics and Performance of Website Based on Alexa
LI Dawei, WANG Jingchun, ZHAO Bingbing
(China Science and Technology Museum, Beijing 100012, China)
0引言
隨著互聯(lián)網(wǎng)的不斷發(fā)展,各式各樣的網(wǎng)站層出不窮。網(wǎng)站作為一個(gè)展示信息的渠道和用戶交互的平臺(tái),已經(jīng)成為當(dāng)今最重要的媒體形式之一。作為媒體的網(wǎng)站,其目的是希望信息本身得到有效的傳播、擴(kuò)散及反饋,或者是希望借助用戶瀏覽信息而獲得大量的訪問,從而推動(dòng)其他業(yè)務(wù)的發(fā)展。而無論哪一種目的,其實(shí)現(xiàn)同樣都建立在用戶對(duì)網(wǎng)站的訪問這一基礎(chǔ)之上,因此作為網(wǎng)站的發(fā)布者,一個(gè)重要的關(guān)注點(diǎn)就是網(wǎng)站的外來訪問量,根據(jù)各頁面的訪問情況來改善網(wǎng)頁的內(nèi)容和質(zhì)量,并按照用戶的行為特點(diǎn)調(diào)整網(wǎng)站的結(jié)構(gòu)[1-2]。
和傳統(tǒng)媒體有所區(qū)別的是巨大的網(wǎng)站數(shù)量以及實(shí)時(shí)的更新速度使得網(wǎng)站提供的信息規(guī)模和涉及范圍十分龐雜。另一方面,網(wǎng)絡(luò)媒體又具有傳統(tǒng)媒體所不具有的靈活性,網(wǎng)站可以根據(jù)用戶的個(gè)人信息和瀏覽歷史呈現(xiàn)個(gè)性化的頁面,同時(shí)也提供記錄用戶訪問行為的能力。這些因素的綜合影響,使得網(wǎng)站的流量分析較之傳統(tǒng)媒體,在數(shù)據(jù)上有著規(guī)模、精度和時(shí)效上的優(yōu)勢(shì)。因此,網(wǎng)站是否覆蓋到了目標(biāo)用戶,以及信息是否被有效的訪問,這些問題的解答在網(wǎng)站流量分析中擁有更加堅(jiān)實(shí)的數(shù)據(jù)基礎(chǔ)。
1網(wǎng)站流量分析及排名
網(wǎng)站流量泛指網(wǎng)站的訪問量,可以使用多種指標(biāo)來描述[3]。網(wǎng)站流量分析是對(duì)網(wǎng)站訪客行為的統(tǒng)計(jì)學(xué)研究,包含選取指標(biāo)評(píng)價(jià)網(wǎng)站的流量和獲取有效指標(biāo)的數(shù)據(jù)。
1.1流量指標(biāo)
為了評(píng)價(jià)網(wǎng)站的流量狀況、活躍度和影響力,一系列的流量指標(biāo)被提出來[4-5]。①頁面瀏覽量(Page View,PV):就是服務(wù)器收到的頁面加載請(qǐng)求數(shù),通常每打開一次網(wǎng)頁就會(huì)被計(jì)入一次PV,同一個(gè)用戶在一定時(shí)間內(nèi)(一天)對(duì)同一個(gè)頁面的重復(fù)訪問可以僅計(jì)入一次PV。PV反映了網(wǎng)頁被瀏覽的頻次,從而體現(xiàn)了網(wǎng)站的活躍程度,但對(duì)于存在大量圖片頁面的情況會(huì)更有利,例如瀏覽組圖時(shí)可能每張圖片都是單獨(dú)的頁面。另外不同的時(shí)間可能造成訪客群體分布不同,進(jìn)而使PV產(chǎn)生較大的波動(dòng)。
②獨(dú)立訪客量(Unique Visitor,UV):是網(wǎng)站以IP地址或其他唯一標(biāo)識(shí)的網(wǎng)絡(luò)ID進(jìn)行區(qū)分的訪問者數(shù)。同一訪問者對(duì)所有網(wǎng)站的訪問僅計(jì)入一次UV。UV是衡量一個(gè)網(wǎng)站用戶數(shù)量的重要指標(biāo),反映了網(wǎng)站的影響力,但對(duì)于瀏覽行為頻繁和極少的用戶并不進(jìn)行區(qū)分考慮[6]。
1.2 Alexa排名機(jī)制
Alexa公布的排名計(jì)算方法依賴于UV(按照IP地址區(qū)分)和PV。Alexa會(huì)使用3個(gè)月的數(shù)據(jù)計(jì)算這段時(shí)間的排名。UV按照使用Alexa工具欄的用戶總數(shù)正規(guī)化,計(jì)算PV時(shí)剔除同一用戶在同一天內(nèi)對(duì)同一個(gè)頁面的重復(fù)訪問部分。正規(guī)化的UV和PV計(jì)算幾何平均值,依據(jù)該值進(jìn)行排名[7]。
幾何平均值意味著排名先后取決于2個(gè)網(wǎng)站正規(guī)化的UV和PV的相對(duì)比值,多1倍用戶訪問和多1倍頁面的瀏覽對(duì)于排名的影響是相同的。實(shí)際上Alexa排名的難點(diǎn)在于數(shù)據(jù)的獲取而非排名算法,正規(guī)化的UV和PV均由Alexa工具條用戶群體中相應(yīng)數(shù)據(jù)估算,即認(rèn)為在所有互聯(lián)網(wǎng)用戶中,存在著相同比例的用戶訪問該網(wǎng)站,并且網(wǎng)站間PV的倍數(shù)差距較之真實(shí)情況沒有明顯區(qū)別。
Alexa通過2種方式獲取互聯(lián)網(wǎng)網(wǎng)站的流量數(shù)據(jù):①Alexa工具條:收集用戶端瀏覽器的訪問數(shù)據(jù),它在用戶訪問每個(gè)Web頁面時(shí)都向Alexa后臺(tái)服務(wù)(data.alexa.com)發(fā)回一串代碼,代碼數(shù)據(jù)中包含十幾個(gè)核心信息參數(shù),這些參數(shù)包括當(dāng)前網(wǎng)頁地址、頁面打開時(shí)間、用戶端顯示分辨率及Alexa工具條版本號(hào)等。②Alexa網(wǎng)絡(luò)嗅探程序:收集網(wǎng)絡(luò)服務(wù)器的流量數(shù)據(jù),Alexa通過與網(wǎng)站和DNS服務(wù)方合作,部署分布式的嗅探程序主動(dòng)監(jiān)測(cè)分析Web和DNS服務(wù)器的流量信息,從而獲取網(wǎng)站被訪的統(tǒng)計(jì)數(shù)據(jù)。
2 Alexa實(shí)際數(shù)據(jù)分析
2.1數(shù)據(jù)選取
主要分析Alexa中國排名100名左右的網(wǎng)站,分析數(shù)據(jù)均取自Alexa中國排名75~125名,共計(jì)51個(gè)網(wǎng)站,網(wǎng)站及其排名如表1所示。
從Alexa上可以獲取到的網(wǎng)站數(shù)據(jù)包括全球排名、中國排名、美國UV、Visit、PV、美國訪客平均訪問數(shù)、訪問平均頁面瀏覽數(shù)、訪客平均頁面瀏覽數(shù)、各地區(qū)訪客占比和排名、蹦失率、訪客日均頁面瀏覽數(shù)、訪客日均瀏覽時(shí)間、搜索引擎流量數(shù)據(jù)、鏈入鏈出數(shù)據(jù)及訪客分布等。
雖然Alexa公布了網(wǎng)站的全球排名和各地區(qū)排名,但能夠取得UV和PV數(shù)據(jù)的僅限美國等幾個(gè)地區(qū),中國并不在列。對(duì)于上述網(wǎng)站,除了其中9個(gè)以外,都在美國有一定的訪問量,可以獲取到在美國區(qū)域排名以及UV和PV數(shù)據(jù)。通過美國的數(shù)據(jù)以及各地區(qū)訪客占比數(shù)據(jù),可以對(duì)這些剩余共計(jì)42個(gè)網(wǎng)站中國區(qū)域的UV和PV進(jìn)行粗略估算。
為了估計(jì)中國區(qū)域的UV,假定各地區(qū)訪客占比數(shù)據(jù)保持穩(wěn)定,可以直接通過美國和中國的訪客占比以及美國的UV,計(jì)算這42個(gè)網(wǎng)站在中國區(qū)域的UV。
在估計(jì)中國區(qū)域的PV時(shí),由于這42個(gè)網(wǎng)站中的38個(gè)網(wǎng)站的訪客幾乎全部來自中國,可以認(rèn)為訪客日均頁面瀏覽數(shù)和中國區(qū)域內(nèi)的數(shù)據(jù)相同,另外假定該數(shù)據(jù)保持穩(wěn)定,可以將估算的中國區(qū)域的UV和訪客日均頁面瀏覽數(shù)相乘再乘上30,作為過去一個(gè)月的PV估計(jì)值。按照Alexa說明的網(wǎng)站排名機(jī)制,名次與UV和PV的乘積應(yīng)當(dāng)呈現(xiàn)相關(guān)關(guān)系,UV和PV的乘積越大,排名越靠前[7]。
2.2 Alexa美國排名情況
在美國區(qū)域訪問數(shù)據(jù)的網(wǎng)站中,網(wǎng)站的Alexa美國排名范圍在3~35 967名,將其與美國區(qū)域的UV和PV乘積進(jìn)行比較??紤]到名次跨度較大,訪問量差距明顯,使用冪函數(shù)進(jìn)行擬合,相關(guān)系數(shù)達(dá)到0.939 2,可以認(rèn)為相關(guān)性顯著。
UV和PV的乘積并沒有嚴(yán)格按照網(wǎng)站排名遞減,原因可能來自排名計(jì)算使用的是最近3個(gè)月的數(shù)據(jù),而UV和PV值來自于最近1個(gè)月的數(shù)據(jù),部分網(wǎng)站在這段時(shí)間內(nèi)流量有所變化,導(dǎo)致分布有所波動(dòng)。
2.3 Alexa中國排名情況
38個(gè)有美國區(qū)域訪問數(shù)據(jù)且中國訪客占絕大多數(shù)的網(wǎng)站如圖1所示,估算的中國UV與PV乘積同中國排名的關(guān)系。圖中橫坐標(biāo)為網(wǎng)站的Alexa中國排名,范圍在75~120名,縱坐標(biāo)為中國區(qū)域的UV和PV乘積。
由于中國區(qū)域的UV和PV采取了大量假設(shè)和估計(jì),數(shù)據(jù)的波動(dòng)較大,而網(wǎng)站的中國排名又較接近,因此這些波動(dòng)可能導(dǎo)致某些網(wǎng)站之間的排名關(guān)系和UV與PV乘積關(guān)系不符。但使用周期為5的移動(dòng)平均線已經(jīng)可以看出明顯的相關(guān)趨勢(shì),基本可以說明Alexa排名確實(shí)是按照其宣稱的算法計(jì)算的。
2.4 Alexa中國排名網(wǎng)站流量分析
中國區(qū)域UV特征,如圖2所示。顯示了Alexa中國排名75~125名的網(wǎng)站估算的1個(gè)月內(nèi)的UV指標(biāo)數(shù)據(jù)??梢钥吹?,絕大部分網(wǎng)站都達(dá)到了1E+7量級(jí),即百萬量級(jí)的UV。
中國區(qū)域PV特征,如圖3所示。顯示了Alexa中國排名75~125名的網(wǎng)站估算的1個(gè)月內(nèi)的PV指標(biāo)數(shù)據(jù)??梢钥吹?,所有網(wǎng)站都達(dá)到了1E+9量級(jí),即億量級(jí)的PV,相當(dāng)一部分網(wǎng)站達(dá)到或接近十億量級(jí)的PV。
與百度的關(guān)聯(lián),如圖4所示。顯示了Alexa中國排名75~125名的網(wǎng)站最近的百度反鏈、收錄、索引的數(shù)量。圖中標(biāo)出了各項(xiàng)指標(biāo)的中值,反鏈中值1 710 000,收錄中值2 725 000,索引中值26 098 111.5。百度作為國內(nèi)份額最大的搜索引擎,對(duì)于流量的引導(dǎo)作用非常強(qiáng),以上3項(xiàng)值基本反映了這一排名區(qū)間的網(wǎng)站和百度的聯(lián)系程度。
3結(jié)束語
通過以上分析,可以發(fā)現(xiàn)Alexa中文排名75~125名的網(wǎng)站在某些重要的流量指標(biāo)上的特征。這一區(qū)間的網(wǎng)站的Alexa流量數(shù)據(jù)通常包括百萬量級(jí)的月累計(jì)UV、億量級(jí)甚至接近十億量級(jí)的月累計(jì)PV、訪客日均頁面瀏覽數(shù)及訪客日均瀏覽時(shí)間。除此之外,考慮到搜索引擎的流量情況,如果能夠達(dá)到逾百萬的百度反鏈和收錄條目,并擁有逾千萬的索引,對(duì)于網(wǎng)站獲得大量的入口流量進(jìn)而達(dá)到一定的Alexa排名也有很大的幫助。
參考文獻(xiàn)
[1]葉靈.網(wǎng)站網(wǎng)絡(luò)計(jì)量學(xué)實(shí)證研究———以35所高校網(wǎng)站為例[J].中國集體經(jīng)濟(jì),2015(7):51-52.
[2]程慧平.鏈接分析指標(biāo)在大學(xué)網(wǎng)站排名評(píng)價(jià)中的有效性分析[J].信息資源管理學(xué)報(bào),2012,2(3):46-51.
[3]林山.利用關(guān)鍵詞提升網(wǎng)站排名的方法[J].計(jì)算機(jī)與網(wǎng)絡(luò), 2014,40(23):45.
[4]張平.如何利用關(guān)鍵詞提升網(wǎng)站排名[J].計(jì)算機(jī)與網(wǎng)絡(luò), 2015,41(24):44-45.
[5]鐵生.網(wǎng)站排名不穩(wěn)定原因及解決辦法[J].計(jì)算機(jī)與網(wǎng)絡(luò), 2014,40(14):44.
[6]馬達(dá).網(wǎng)站數(shù)據(jù)分析中的誤區(qū)探討[J].硅谷,2013,6(11):165.
[7]馮濤.基于SEO技術(shù)提高網(wǎng)站訪問量的策略研究[J].網(wǎng)絡(luò)與信息,2010,24(12):40.