彭曉明 周紅 習(xí)李琴
摘要:隨著互聯(lián)網(wǎng)的迅速發(fā)展,通過網(wǎng)絡(luò)銷售已經(jīng)成為當(dāng)前趨勢(shì)之一,該平臺(tái)則基于用戶行為進(jìn)行有針對(duì)性的推廣,目的更明確,目標(biāo)更清晰。此外在設(shè)計(jì)上整體采用了三層架構(gòu)開發(fā)思想,同時(shí)結(jié)合 Ajax技術(shù)進(jìn)行數(shù)據(jù)的異步刷新,以增強(qiáng)用戶的體驗(yàn)效果。
關(guān)鍵詞:用戶行為;推廣平臺(tái);三層架構(gòu);異步刷新
中圖分類號(hào):F426.72;F724.6 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1007-9416(2017)04-0175-01
1 用戶行為和用戶行為信息
用戶行為指的是用戶在瀏覽推廣平臺(tái)時(shí)的狀況和動(dòng)作[1]。有研究發(fā)現(xiàn),不同的用戶在做某些事情的時(shí)候行為反應(yīng)是不盡相同的,行為和結(jié)果之間存在著某種聯(lián)系,因此,如何在海量的用戶行為中找出蘊(yùn)藏著有價(jià)值的信息和有用的知識(shí),并且再進(jìn)一步有效的利用這些信息成為眾多學(xué)者關(guān)心的問題。
用戶行為信息值得是用戶在瀏覽、檢索、評(píng)論和購買等行為時(shí)所留下來的信息,在傳統(tǒng)的Web數(shù)據(jù)挖掘中,依賴的是日志文件[2]。在現(xiàn)在的Web系統(tǒng)中,則可以通過各種方式,將用戶的信息更加詳盡的記錄下來,比如可以通過AJAX技術(shù)把用戶瀏覽某一頁面的頻繁程度[3];頁面跳轉(zhuǎn)的特點(diǎn);在某一頁面停留的時(shí)間和規(guī)律等行為以信息的形式記錄到數(shù)據(jù)庫中,以便后期對(duì)用戶在購買的行為進(jìn)行統(tǒng)計(jì)和分析得出該用戶的購物行為特點(diǎn)、喜好的領(lǐng)域。這個(gè)功能是整個(gè)推廣平臺(tái)內(nèi)的一項(xiàng)重要功能。只有根據(jù)用戶的購買特點(diǎn)和規(guī)律設(shè)計(jì)的推廣平臺(tái)才能更加擁有針對(duì)性,真正的提高物品的推廣針對(duì)性,提高銷售業(yè)績。
2 要統(tǒng)計(jì)的行為
在該平臺(tái)中主要統(tǒng)計(jì)以下行為,并對(duì)其進(jìn)行分析。首先是瀏覽時(shí)間,然后是訪問的資源名稱,第三是購買產(chǎn)品名稱。
2.1 總瀏覽時(shí)間
總瀏覽時(shí)間反應(yīng)用戶的總體購買時(shí)間長度,可以反應(yīng)該產(chǎn)品對(duì)于用戶來說的總體吸引度。也能間接的反應(yīng)推廣平臺(tái)的總體設(shè)計(jì)質(zhì)量。如果用戶的普遍瀏覽時(shí)間過長,超出預(yù)期的設(shè)想,說明平臺(tái)內(nèi)所提供的資源難度過大。如果普遍的瀏覽時(shí)間過短,則說明網(wǎng)站的產(chǎn)品資源深度在某種意義上不夠或者不好,需要改進(jìn)。
2.2 子頁面瀏覽時(shí)間
統(tǒng)計(jì)某一類產(chǎn)品或某一種產(chǎn)品的瀏覽時(shí)間可以挖掘用戶感興趣的產(chǎn)品類別或者某個(gè)具體產(chǎn)品,或者說瀏覽時(shí)感覺比較認(rèn)可的產(chǎn)品,通過對(duì)他的記錄可以挖掘平臺(tái)在不斷的建設(shè)當(dāng)中需要注意和強(qiáng)化的地方,做到產(chǎn)品投放和推送有的放矢。研究發(fā)現(xiàn):如果用戶在某一類別內(nèi)的瀏覽時(shí)間普遍長于其他類別,這說明該類別里推廣的產(chǎn)品對(duì)于該用戶有一定的喜歡(相對(duì)于其他產(chǎn)品)而這些產(chǎn)品通常是所有用戶所關(guān)注的地方,這種瀏覽時(shí)的關(guān)注程度和決定是否購買的決定點(diǎn)有著內(nèi)在的微妙的聯(lián)系。
2.3 子頁面瀏覽次數(shù)(按扭點(diǎn)擊次數(shù))
統(tǒng)計(jì)某一類產(chǎn)品的瀏覽頻率和統(tǒng)計(jì)某一類產(chǎn)品的瀏覽時(shí)間有相同的意義 ,通過對(duì)它的記錄可以挖掘推廣平臺(tái)在不斷的建設(shè)當(dāng)中需要注意和強(qiáng)化的地方,做到產(chǎn)品推廣的有的放矢[4]。通過研究發(fā)現(xiàn):如果用戶在某一產(chǎn)品類的瀏覽的頻率普遍高于其他類別,這說明類別里介紹的產(chǎn)品對(duì)于該用戶有一定的價(jià)值(相對(duì)于其他產(chǎn)品)而這些價(jià)值通常是產(chǎn)品本身所特別的地方。
2.4 鼠標(biāo)在某個(gè)產(chǎn)品上的點(diǎn)擊次數(shù)
對(duì)鼠標(biāo)在某個(gè)產(chǎn)品上的點(diǎn)擊次數(shù)的統(tǒng)計(jì)可以抽象的挖掘用戶的瀏覽產(chǎn)品行為特點(diǎn)??傊ㄟ^對(duì)上述數(shù)據(jù)的采集,進(jìn)行數(shù)據(jù)挖掘就可以得到一些看似抽象但是有價(jià)值的信息。
3 數(shù)據(jù)挖掘建立模型
構(gòu)建Microsoft決策樹和Microsoft神經(jīng)網(wǎng)絡(luò)模型以確定哪個(gè)算法生成最準(zhǔn)確的模型(通過將預(yù)測(cè)與測(cè)試集上產(chǎn)生的實(shí)際值進(jìn)行比較來測(cè)度)如圖1所示。構(gòu)建初始挖掘結(jié)構(gòu)和挖掘模型后(指定輸入和可預(yù)測(cè)屬性),分析軟件可以輕松地添加其他挖掘模型。(可以使用“添加挖掘模型”功能嘗試不同的算法。)
研究發(fā)現(xiàn)更改COMPLEXITY_PENALTY和MINIMUM_ SUPPORT的默認(rèn)值后,使用Microsoft決策樹算法可以獲得非常準(zhǔn)確的預(yù)測(cè)模型。使用COMPLEXITY_PENALTY=0.10。這可能導(dǎo)致較大(較詳細(xì))的決策樹。較大、較詳細(xì)的決策樹能夠更加準(zhǔn)確地對(duì)練習(xí)數(shù)據(jù)構(gòu)建模型,甚至某種程度上可以對(duì)練習(xí)數(shù)據(jù)中的“干擾”構(gòu)建模型。這種情況稱為“臃腫”,通常導(dǎo)致對(duì)提取的數(shù)據(jù)集或測(cè)試數(shù)據(jù)集的較差預(yù)測(cè)。另外,較大、較詳細(xì)的決策樹可能需要稍多的計(jì)算來進(jìn)行預(yù)測(cè)。
4 設(shè)計(jì)技術(shù)
在設(shè)計(jì)上,依據(jù)用戶瀏覽時(shí)的特點(diǎn),分析用戶瀏覽行為,在計(jì)算用戶的個(gè)性化知識(shí)需求度的基礎(chǔ)上綜合顯性行為和隱性行為,建立基于本體的用戶行為模型;進(jìn)而實(shí)現(xiàn)了個(gè)性化知識(shí)過濾和推薦,如圖2所示。
5 結(jié)語
推廣平臺(tái)個(gè)性化推送服務(wù)是提高平臺(tái)資源利用率、提升用戶黏度的有效手段,本文構(gòu)建了如何通過對(duì)推廣平臺(tái)用戶行為的產(chǎn)品分析,對(duì)顯性行為和隱性行為進(jìn)行綜合評(píng)價(jià),計(jì)算用戶個(gè)性化革新掛需求度,建立了基于用戶行為模型和個(gè)性化知識(shí)服務(wù)流程。
參考文獻(xiàn)
[1]張金增,孟小峰.移動(dòng)Web搜索研究[J].軟件學(xué)報(bào),2012,23(1):46-64.
[2]馬少平,劉奕群.中文搜索引擎用戶行為的演化分析[J].中文信息學(xué)報(bào),2011,25(6):90-97.
[3]余肖生,孫珊.基于網(wǎng)絡(luò)用戶信息行為的個(gè)性化推薦模型[J].重慶理工大學(xué)學(xué)報(bào)自然科學(xué)版,2013,27(1):47-50.
[4]陳吉榮,樂嘉錦.基于Hadoop生態(tài)系統(tǒng)的大數(shù)據(jù)解決方案綜述[J].計(jì)算機(jī)工程與科學(xué),2013,35(10): 25-35.
[5]Lu X,Islam N S,Wasi-Ur-Rahman M,et al. High-Performance Design of Hadoop RPC with RDMA over InfiniBand[C],Parallel Processing (ICPP), 2013 42nd International Conference on. IEEE, 2013:641-650.