亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于用戶數(shù)據(jù)的個(gè)性化推薦模塊的設(shè)計(jì)與實(shí)現(xiàn)

        2016-12-06 08:46:35張宇航
        關(guān)鍵詞:關(guān)鍵字日志云端

        張宇航

        (華中科技大學(xué) 軟件學(xué)院, 湖北 武漢 430074)

        基于用戶數(shù)據(jù)的個(gè)性化推薦模塊的設(shè)計(jì)與實(shí)現(xiàn)

        張宇航

        (華中科技大學(xué) 軟件學(xué)院, 湖北 武漢 430074)

        面對(duì)繁雜的信息海洋,從中獲取準(zhǔn)確的信息資源、提高信息利用率,是一個(gè)需要認(rèn)真考慮與解決的問(wèn)題.文章以云端趣碼網(wǎng)站數(shù)據(jù)為基礎(chǔ)設(shè)計(jì)個(gè)性化推薦模塊,分析用戶日常行為數(shù)據(jù),得到用戶關(guān)鍵字并存入數(shù)據(jù)字典;完成對(duì)其中數(shù)據(jù)和課程數(shù)據(jù)的矩陣映射處理,直觀地呈現(xiàn)出用戶對(duì)各種編程語(yǔ)言的偏好度;計(jì)算用戶和課程關(guān)鍵字之間的余弦相似度距離,得到用戶對(duì)各具體課程的感興趣程度,相似度越大感興趣程度越高;最后系統(tǒng)推薦相似度最高的課程.把云端趣碼平臺(tái)對(duì)用戶的提問(wèn)、回答和日志數(shù)據(jù)的處理,視為用戶數(shù)據(jù)并作為個(gè)性化推薦的基礎(chǔ),經(jīng)測(cè)試云端趣碼的個(gè)性化推薦模塊的性能及流程,驗(yàn)證了該模塊的可用性和有效性.

        用戶數(shù)據(jù);個(gè)性化推薦模塊;數(shù)據(jù)字典;余弦相似度

        隨著Web2.0技術(shù)的快速發(fā)展、互聯(lián)網(wǎng)信息大爆炸時(shí)代的到來(lái),每天出現(xiàn)覆蓋面廣、涉及各個(gè)領(lǐng)域、信息冗雜的大量數(shù)據(jù),如淘寶數(shù)十億的產(chǎn)品,亞馬遜數(shù)以百萬(wàn)計(jì)的書(shū)籍,F(xiàn)acebook數(shù)以億計(jì)的照片等[1].信息時(shí)代帶來(lái)便利的同時(shí),也不得不面對(duì)海量信息的煩惱,不管瀏覽要聞還是網(wǎng)站購(gòu)物及尋找問(wèn)題答案,從繁多的數(shù)據(jù)中無(wú)法捕捉、難以獲取真正的有用信息,反而對(duì)信息的利用變得更低.這種信息超載問(wèn)題,目前常用的解決方法是以搜索引擎為代表的信息檢索,典型的如百度、谷歌等,在幫助用戶獲取有效信息中發(fā)揮著重要的作用.但是,用戶對(duì)信息需求呈現(xiàn)多元化、個(gè)性化,搜索引擎提供的信息卻呈現(xiàn)大眾化,往往無(wú)法滿足每一個(gè)用戶的精確需要、解決信息的超載問(wèn)題.而個(gè)性化推薦則根據(jù)用戶的具體需求、特點(diǎn)、興趣愛(ài)好,通過(guò)相似度的合理計(jì)算,為使用者生成合適的推薦內(nèi)容.因此,筆者通過(guò)對(duì)云端趣碼的個(gè)性化推薦模塊的設(shè)計(jì)利用來(lái)實(shí)現(xiàn)用戶的個(gè)性化推薦,讓用戶更好更充分地享受高速網(wǎng)絡(luò)所帶來(lái)的便利.

        1 個(gè)性化推薦的技術(shù)基礎(chǔ)

        1.1 信息檢索技術(shù)

        信息檢索的一般過(guò)程:首先分析檢索內(nèi)容,根據(jù)相關(guān)數(shù)據(jù)選擇合適的檢索關(guān)鍵字,通過(guò)語(yǔ)言組織檢索語(yǔ)句[2],然后進(jìn)行信息檢索并得到目標(biāo)結(jié)果.早期信息檢索一般采用“標(biāo)準(zhǔn)布爾查詢”方法,但是,使用這種方式查詢會(huì)構(gòu)造一個(gè)合適的查詢?nèi)蝿?wù)推到用戶上去,文檔查詢結(jié)果只有匹配與不匹配兩種情況,導(dǎo)致布爾查詢的實(shí)際效率并不高.向量空間模型是通過(guò)檢索詞的加權(quán)來(lái)提高檢索效率,可以根據(jù)文獻(xiàn)相似度排序從而便于用戶選擇.

        1.2 推薦算法

        基于內(nèi)容的推薦算法 是以用戶操作內(nèi)容為基礎(chǔ)的推薦算法,不需要參考用戶對(duì)內(nèi)容的認(rèn)可程度,而是通過(guò)機(jī)械學(xué)習(xí)方式,在眾多內(nèi)容的特征事例中找到用戶關(guān)鍵字,即用戶感興趣的事物[3].在類似這種推薦過(guò)程中,會(huì)事先提煉出推薦內(nèi)容特征即用戶感興趣的點(diǎn),根據(jù)對(duì)用戶關(guān)鍵資料及相關(guān)課題的關(guān)鍵字資料的匹配程度進(jìn)行個(gè)性化推薦.確立用戶關(guān)鍵字模型主要取決于推薦模塊所采用的方法.該方法需要提供用戶的歷史操作內(nèi)容,用戶關(guān)鍵字隨著用戶而改變.如看了《生化危機(jī)》第一部,上述算法會(huì)推薦《生化危機(jī)》后續(xù)作品,其推薦內(nèi)容與之前的操作內(nèi)容 (共有很多關(guān)鍵詞)有很大的關(guān)聯(lián)性.該推薦算法的好處是避免了冷啟動(dòng),缺點(diǎn)是產(chǎn)生重復(fù)的推薦內(nèi)容.

        協(xié)同過(guò)濾推薦算法 是以用戶之前提供的偏好,再結(jié)合偏好相近用戶的選擇來(lái)進(jìn)行個(gè)性化推薦的算

        法.如圖1所示.協(xié)同過(guò)濾推薦算法用m×n的矩陣表示使用者對(duì)某一內(nèi)容的偏好情況,一般用打分表示用戶的喜好程度,數(shù)值越高則感興趣程度越高,0表示與某內(nèi)容沒(méi)有過(guò)交互[4].算法包括兩個(gè)步驟:1)預(yù)測(cè);2)推薦.預(yù)測(cè)用戶對(duì)未購(gòu)買過(guò)內(nèi)容的可能分?jǐn)?shù)值,推薦則是向用戶推薦預(yù)測(cè)數(shù)值最高的內(nèi)容.

        圖1 協(xié)同過(guò)濾算法

        推薦算法比較 基于內(nèi)容的推薦算法方便易用,能較好地解決冷啟動(dòng)推薦系統(tǒng)中存在的問(wèn)題;不需要用戶全部數(shù)據(jù),依據(jù)用戶資料得到的關(guān)鍵字進(jìn)行推薦,適用于數(shù)據(jù)繁雜的系統(tǒng)推薦.其缺點(diǎn)是不能為用戶貼心地推薦可能感興趣的內(nèi)容,只能在已有數(shù)據(jù)的基礎(chǔ)上完成相關(guān)推薦,易于重復(fù)產(chǎn)生推薦內(nèi)容.協(xié)同過(guò)濾算法的優(yōu)點(diǎn)在于能夠推薦諸如音樂(lè)、繪畫(huà)等一些機(jī)器無(wú)法自動(dòng)分析的內(nèi)容,具有創(chuàng)意性,給人耳目一新的感覺(jué);可以對(duì)如“品味”等難以用語(yǔ)言描述的概念進(jìn)行過(guò)濾.但是,協(xié)同過(guò)濾推薦算法對(duì)冷啟動(dòng)問(wèn)題未能有效解決,可拓展性也不高,隨著推薦內(nèi)容的增加性能會(huì)變得越來(lái)越低下.

        2 推薦系統(tǒng)分析與設(shè)計(jì)

        2.1 推薦系統(tǒng)功能需求

        本系統(tǒng)是基于云端趣碼網(wǎng)站的個(gè)性化推薦模塊,云端趣碼本質(zhì)上是一個(gè)提供課程、問(wèn)答、可在線編程的網(wǎng)站,可以邊學(xué)邊練在線編譯.個(gè)性化推薦模塊根據(jù)用戶的日常提問(wèn)、回答以及學(xué)習(xí)課程等日志,通過(guò)推薦算法分析為用戶貼心地推薦可能需要的內(nèi)容.

        輸入:用戶所寫(xiě)日志,提問(wèn)以及回答內(nèi)容.輸出:顯示推薦內(nèi)容.

        處理過(guò)程如圖2所示.個(gè)性化推薦模塊會(huì)根據(jù)使用者日常提問(wèn)、回答及日志等原始數(shù)據(jù),利用詞向量工具拓展用戶關(guān)鍵字詞,依據(jù)關(guān)鍵字詞計(jì)算出用戶可能感興趣的內(nèi)容并顯示推薦結(jié)果.

        圖2 個(gè)性化推薦模塊流程

        2.2 推薦系統(tǒng)性能

        1)時(shí)間性能:系統(tǒng)處理能力支持并發(fā)數(shù)50個(gè);響應(yīng)速度小于10s.2)系統(tǒng)開(kāi)放性:基于主流的在線編譯網(wǎng)站,具備良好的可移植性、功能和性能的可擴(kuò)展性.3)界面友好性:系統(tǒng)界面風(fēng)格一致、操作簡(jiǎn)潔、指令清楚、操作流清晰、布局大方.4)系統(tǒng)可用性:具有較高的數(shù)據(jù)準(zhǔn)確率和有效性,數(shù)據(jù)信息具有真實(shí)價(jià)值,避免冗余或無(wú)用數(shù)據(jù);較快的響應(yīng)速度(本地操作2s內(nèi),服務(wù)器操作5s內(nèi));5)系統(tǒng)健壯性:在系統(tǒng)出錯(cuò)時(shí)提供相應(yīng)的處理機(jī)制,避免當(dāng)機(jī)或程序崩潰.6)可管理性需求:系統(tǒng)開(kāi)發(fā)嚴(yán)格依據(jù)相關(guān)文檔,嚴(yán)格執(zhí)行需求控制和跟蹤.

        2.3 推薦系統(tǒng)設(shè)計(jì)

        云端趣碼系統(tǒng)主要由用戶模塊、課程模塊、問(wèn)答模塊、管理員模塊、在線編程模塊以及個(gè)性化推薦模塊構(gòu)成.本系統(tǒng)采用B/S三層架構(gòu)設(shè)計(jì):前端表示層、業(yè)務(wù)邏輯處理層、數(shù)據(jù)持久層.前端表示層的主要功能是向用戶顯示推薦內(nèi)容,只有少量用戶交互操作的界面元素,方便用戶使用系統(tǒng),主要由DIV,CSS控制和ASP.NET控件組件實(shí)現(xiàn).業(yè)務(wù)邏輯層主要負(fù)責(zé)用戶和管理員對(duì)網(wǎng)站操作的所有業(yè)務(wù)邏輯,主要由ASP.NET和JAVA語(yǔ)言實(shí)現(xiàn).數(shù)據(jù)持久層主要由SQL和服務(wù)器存儲(chǔ)來(lái)實(shí)現(xiàn)業(yè)務(wù)邏輯層和數(shù)據(jù)庫(kù)之間的數(shù)據(jù)交互,讓信息數(shù)據(jù)在頁(yè)面流通.

        2.4 個(gè)性化推薦模塊設(shè)計(jì)

        個(gè)性化推薦模塊從用戶的提問(wèn)、回答、日志中收集原始數(shù)據(jù).通過(guò)收集關(guān)鍵字得到相關(guān)用戶的關(guān)鍵字詞,再根據(jù)推薦算法實(shí)現(xiàn)個(gè)性化推薦.用戶通過(guò)交互界面提示操作得到相關(guān)推薦信息或訪問(wèn)數(shù)據(jù).個(gè)性化推薦模塊主要由3個(gè)小模塊構(gòu)成:用戶數(shù)據(jù)處理模塊、課程數(shù)據(jù)處理模塊、推薦模塊.

        用戶數(shù)據(jù)處理模塊 用戶通過(guò)賬號(hào)登錄云端趣碼網(wǎng)站進(jìn)入個(gè)性化推薦模塊,點(diǎn)擊用戶數(shù)據(jù)按鈕獲得包含

        用戶提問(wèn)關(guān)鍵字、用戶回答關(guān)鍵字、用戶日志關(guān)鍵字的表單.用戶數(shù)據(jù)處理模塊主要涉及用戶提問(wèn)、回答、日志等相關(guān)數(shù)據(jù).在用戶查詢時(shí),根據(jù)其固有的ID在數(shù)據(jù)庫(kù)中對(duì)提問(wèn)表、回答表以及日志表進(jìn)行查詢操作,并將得到的數(shù)據(jù)呈現(xiàn)出來(lái).用戶點(diǎn)擊表格中的提問(wèn)ID、回答ID以及日志ID來(lái)繼續(xù)下一步工作.

        課程數(shù)據(jù)處理模塊 用戶通過(guò)賬號(hào)登錄云端趣碼網(wǎng)站進(jìn)入個(gè)性化推薦模塊.點(diǎn)擊課程數(shù)據(jù)按鈕可獲得已經(jīng)錄入云端趣碼網(wǎng)站的課程名稱和關(guān)鍵字的表單;通過(guò)課程信息查詢得到的課程關(guān)鍵字表并獲取自己感興趣關(guān)鍵字的相關(guān)課程;經(jīng)過(guò)表單中的課程信息跳轉(zhuǎn)到相應(yīng)的課程界面了解相應(yīng)課程和學(xué)習(xí)操作.課程關(guān)鍵字主要包含了JAVA、C語(yǔ)言、C++、C#等,涵蓋了大部分用戶需求的學(xué)習(xí)內(nèi)容.

        推薦模塊 用戶通過(guò)賬號(hào)登錄云端趣碼網(wǎng)站進(jìn)入個(gè)性化推薦模塊.點(diǎn)擊推薦按鈕可獲得該個(gè)性化推薦模塊,通過(guò)對(duì)用戶數(shù)據(jù)及課程數(shù)據(jù)的分析得到推薦內(nèi)容.

        2.5 個(gè)性化推薦模塊的數(shù)據(jù)庫(kù)設(shè)計(jì)

        本系統(tǒng)對(duì)用戶數(shù)據(jù)(主要包括用戶的提問(wèn)、回答、日志)分析后,采用MySQL作為推薦模塊的數(shù)據(jù)庫(kù)來(lái)存儲(chǔ)系統(tǒng)數(shù)據(jù),為推薦算法的調(diào)用和新加入的用戶數(shù)據(jù)提供存儲(chǔ).數(shù)據(jù)庫(kù)設(shè)計(jì)包括基于用戶數(shù)據(jù)的用戶信息表和模塊推薦信息.

        基于用戶數(shù)據(jù)的用戶信息表 用戶日常產(chǎn)生的數(shù)據(jù)主要記憶在提問(wèn)、回答日志上,它們是推薦環(huán)節(jié)的信息來(lái)源,通過(guò)數(shù)據(jù)采集分析,向用戶推薦感興趣內(nèi)容的相近信息.用戶表、用戶問(wèn)題表、用戶回答表、用戶日志表、用戶關(guān)鍵字表如表1、表2、表3、表4、表5所示.

        表1定義用戶ID、用戶昵稱以及用戶名和密碼;表2定義用戶提問(wèn)ID、內(nèi)容、日期以及問(wèn)題標(biāo)題;表3定義用戶回答的ID、內(nèi)容、日期;表4定義用戶日志ID、內(nèi)容、日期;表5定義用戶關(guān)鍵字,Key字段類型為Char,內(nèi)容為課程名稱.

        模塊推薦信息 本模塊依據(jù)云端趣碼網(wǎng)站上的編譯系統(tǒng)及不同語(yǔ)言:C語(yǔ)言、C++、JAVA、C#、VC、SQL等,通過(guò)收集和整理日常用戶信息得到用戶關(guān)鍵字,利用用戶課程表得到用戶的推薦信息,向用戶推薦可能感興趣的內(nèi)容.用戶課程表設(shè)計(jì)如表6所示,其中課程ID是課程的唯一識(shí)別數(shù)據(jù),Ltype是課程語(yǔ)言關(guān)鍵字,通過(guò)這一關(guān)鍵屬性向用戶推薦相關(guān)課程.以上字段均根據(jù)相關(guān)含義分配相應(yīng)字段.總之,本模塊是通過(guò)比較用戶數(shù)據(jù)關(guān)鍵字以及課程信息關(guān)鍵字得到相關(guān)推薦信息;用戶字典是用戶關(guān)鍵字集合,課程字典是所有課程關(guān)鍵字集合.

        表1 用戶表

        表2 用戶問(wèn)題表

        表3 用戶回答表

        表4 用戶日志表

        表5 用戶關(guān)鍵字表

        表6 用戶課程表

        3 個(gè)性化推薦模塊的實(shí)現(xiàn)

        3.1 用戶數(shù)據(jù)處理模塊

        本模塊是云端趣碼的個(gè)性化推薦模塊,處理數(shù)據(jù)主要有3個(gè)方面:用戶提問(wèn)數(shù)據(jù);用戶回答數(shù)據(jù);用戶日志.本文采用的用戶數(shù)據(jù)處理方式,主要通過(guò)用戶ID在數(shù)據(jù)庫(kù)中查找其所有提問(wèn)數(shù)據(jù)、回答數(shù)據(jù)及日志數(shù)據(jù)的關(guān)鍵字得到一個(gè)用戶關(guān)鍵字詞表.

        3.2 課程數(shù)據(jù)處理階段

        本模塊是云端趣碼的個(gè)性化推薦模塊,將每個(gè)課程關(guān)鍵字即語(yǔ)言類型表示出來(lái),通常用0和1表示課程對(duì)應(yīng)的關(guān)鍵字,是則關(guān)鍵字標(biāo)為1,其余標(biāo)為0.該問(wèn)題用向量表示:a[]={0,0,0,1,0,…,0,0}.

        3.3 個(gè)性化推薦

        通過(guò)對(duì)用戶數(shù)據(jù)和課程數(shù)據(jù)的處理,可得到2組關(guān)鍵字?jǐn)?shù)據(jù),算法分為3步:1)為用戶構(gòu)造一個(gè)關(guān)鍵字資料;2)為課程構(gòu)造另一個(gè)關(guān)鍵字資料;3)計(jì)算用戶關(guān)鍵字資料與課程關(guān)鍵字資料的相似度,相似數(shù)值越高則用戶對(duì)該課程越感興趣,反之則越低.以本模塊為例,要向用戶推薦可能感興趣的課程,其影響用戶偏好程度的關(guān)鍵字就是語(yǔ)言類型.

        圖3 個(gè)性化推薦算法流程圖

        個(gè)性化推薦算法流程如圖3所示.由于課程關(guān)鍵字代碼無(wú)法用自然語(yǔ)言描述,因此構(gòu)造一個(gè)映射:首先構(gòu)造一個(gè)1×N維矩陣,N表示本模塊中課程語(yǔ)言類型的數(shù)量.將該矩陣的所有元素設(shè)置為0,可得到一個(gè)行向量:X=[0,0,0,..., 0]T,共有N個(gè)0.令行向量的第0個(gè)單元代表JAVA、第1個(gè)單元代表C語(yǔ)言、第2個(gè)單元代表C++、第3個(gè)單元代表C#、第4、5個(gè)單元分別代表VC和SQL.將自然語(yǔ)言描述的課程關(guān)鍵字映射到1×N維矩陣中,映射方式為包含該課程的語(yǔ)言標(biāo)記為1,其余為0.如JAVA教程在矩陣中的JAVA位置為1,其余為0.例如某課程的0,1矩陣是X=[0,1,...,0]T,由于矩陣的第0個(gè)元素代表JAVA,而對(duì)應(yīng)矩陣中第0個(gè)元素是0,因此JAVA不是該課程的關(guān)鍵字;同樣地,由于C語(yǔ)言對(duì)應(yīng)的矩陣中的第1個(gè)元素1,所以C語(yǔ)言是該課程中的關(guān)鍵字.但是僅僅通過(guò)對(duì)矩陣中0與1的映射,并不能直觀的反映用戶對(duì)具體課程的感興趣程度,于是設(shè)計(jì)用戶課程表如表7所示.

        表7 用戶課程表

        其中每個(gè)用戶對(duì)應(yīng)的課程數(shù)量可反映出用戶對(duì)該課程的感興趣程度,通過(guò)分析用戶提問(wèn)和回答中課程信息的出現(xiàn)次數(shù),可以直觀地表示用戶對(duì)該項(xiàng)課程的感興趣程度.

        不妨假設(shè)用戶ID為x,用a1,a2,a3,.....aN.來(lái)表示課程1,課程2一直到課程N(yùn)的感興趣程度.利用公式:(∑xi-Avg)/n算出x對(duì)這些課程的共同點(diǎn)的喜好程度.Avg是該公式中計(jì)算出來(lái)的平均值,n是所有涉及到該關(guān)鍵字的課程.通過(guò)上述公式計(jì)算出的值可用來(lái)表示用戶x對(duì)該關(guān)鍵字的感興趣程度.結(jié)合前面結(jié)論可以得到一個(gè)用戶x對(duì)于某種語(yǔ)言的最終感興趣程度矩陣圖.利用余弦相似度公式來(lái)計(jì)算給定的用戶U和課程關(guān)鍵字I之間的距離.余弦相似度的值越大說(shuō)明U越有可能喜歡I,余弦相似度的具體計(jì)算方法:.其中Ua表示用戶U對(duì)語(yǔ)言a的喜好值 (平均值公式計(jì)算出的值);Ia表示課程I是否與語(yǔ)言a相關(guān) (即課程關(guān)鍵字資料矩陣中對(duì)應(yīng)的數(shù)值0或者1).最后,模塊根據(jù)上述計(jì)算結(jié)果遍歷整個(gè)關(guān)鍵字?jǐn)?shù)據(jù)庫(kù),計(jì)算用戶同每一個(gè)課程間的相似度,推薦相似度最高的課程.

        4 推薦模塊測(cè)試

        4.1 功能測(cè)試用例

        單元測(cè)試 對(duì)軟件中最小的可測(cè)試單元進(jìn)行檢查和驗(yàn)證[5].單元測(cè)試中的單元合理解釋:如C語(yǔ)言中的一個(gè)函數(shù),或JAVA中的一個(gè)類.本模塊的單元測(cè)試核心是檢查模塊的子模塊設(shè)計(jì),通過(guò)實(shí)驗(yàn)找到有效的功能結(jié)果和模塊接口定義,發(fā)現(xiàn)不符合要求的模塊與產(chǎn)生的代碼錯(cuò)誤信息.

        網(wǎng)站啟動(dòng)測(cè)試 打開(kāi)一個(gè)瀏覽器,在網(wǎng)址對(duì)話框中輸入funchexi9.oicp.net:11298/Coding網(wǎng)址,進(jìn)入云端趣碼的主頁(yè)面.

        用戶數(shù)據(jù)查詢測(cè)試 1)在客戶端瀏覽器中輸入上述云端趣碼網(wǎng)址進(jìn)入該網(wǎng)站.2)用戶登錄:在登錄對(duì)話框輸入賬號(hào)密碼及驗(yàn)證碼.若密碼及驗(yàn)證碼正確就出現(xiàn)站點(diǎn)管理頁(yè),錯(cuò)誤則返回登錄框.3)點(diǎn)擊推薦模塊,即可進(jìn)入個(gè)性化推薦模塊.4)點(diǎn)擊用戶數(shù)據(jù)查詢按鈕,呈現(xiàn)該用戶的提問(wèn)、回答、以及日志ID和相應(yīng)關(guān)鍵字.

        4.2 性能測(cè)試用例與結(jié)果

        在測(cè)試系統(tǒng)并發(fā)性能時(shí),當(dāng)并發(fā)用戶達(dá)到300,絕大部分系統(tǒng)操作響應(yīng)時(shí)間均未超過(guò)5秒,系統(tǒng)資源

        占用率低于65%[6].在測(cè)試系統(tǒng)吞吐量過(guò)程中,當(dāng)系統(tǒng)并發(fā)用戶增加時(shí),系統(tǒng)請(qǐng)求響應(yīng)時(shí)間會(huì)增加,此時(shí)系統(tǒng)吞吐率隨著用戶數(shù)的增加而增大;當(dāng)并發(fā)用戶超過(guò)系統(tǒng)的最大處理能力時(shí),系統(tǒng)吞吐率下降,原因是請(qǐng)求過(guò)多會(huì)導(dǎo)致服務(wù)器阻塞.對(duì)于系統(tǒng)性能測(cè)試從壓力測(cè)試與并發(fā)處理測(cè)試展開(kāi),從10個(gè)最多遞增到100個(gè)線程,在系統(tǒng)運(yùn)行過(guò)程中模擬相應(yīng)數(shù)目的并發(fā)用戶;每個(gè)用戶循環(huán)發(fā)送請(qǐng)求50次,測(cè)試結(jié)果如表8所示.

        表8 壓力測(cè)試結(jié)果

        系統(tǒng)性能取決于兩個(gè)方面:一是系統(tǒng)設(shè)計(jì),業(yè)務(wù)處理、數(shù)據(jù)庫(kù)存儲(chǔ);二是系統(tǒng)的硬件設(shè)備部署.它們均可從硬件資源占用和請(qǐng)求應(yīng)答等方面表現(xiàn)出來(lái)[7].本系統(tǒng)采用25個(gè)客戶端連續(xù)訪問(wèn)8個(gè)小時(shí),從表8可知用戶響應(yīng)時(shí)間、CPU處理時(shí)間等信息.在25個(gè)用戶的高強(qiáng)度測(cè)試下,CPU響應(yīng)系統(tǒng)請(qǐng)求時(shí)間在40%左右;每秒鐘從硬盤(pán)調(diào)用頁(yè)面次數(shù)25次左右;硬盤(pán)為讀寫(xiě)請(qǐng)求提供服務(wù)所用時(shí)間30%左右.這些性能數(shù)據(jù)表明系統(tǒng)運(yùn)行良好,達(dá)到預(yù)期目的,系統(tǒng)可以進(jìn)入試運(yùn)行階段.

        測(cè)試結(jié)果表明,個(gè)性化推薦模塊需求分析中所要求的功能均基本實(shí)現(xiàn),系統(tǒng)運(yùn)行正常,能夠?yàn)橛脩籼峁┩扑]內(nèi)容.少數(shù)情況下出現(xiàn)頁(yè)面響應(yīng)較慢現(xiàn)象,一方面由于網(wǎng)絡(luò)原因?qū)е拢硪环矫婵赡苡捎谂c數(shù)據(jù)庫(kù)連接配置或安全性配置等問(wèn)題所致,接下來(lái)將一步測(cè)試和完善系統(tǒng)性能.

        本文以飛速發(fā)展的信息時(shí)代所產(chǎn)生的信息超載為基點(diǎn),提出個(gè)性化推薦系統(tǒng)方案來(lái)解決信息過(guò)量化導(dǎo)致的利用率降低的問(wèn)題,設(shè)計(jì)的個(gè)性化推薦模塊以云端趣碼網(wǎng)站數(shù)據(jù)為基礎(chǔ),對(duì)用戶日常行為數(shù)據(jù)進(jìn)行分析,得到用戶關(guān)鍵字存入數(shù)據(jù)字典中,完成對(duì)其中數(shù)據(jù)和課程數(shù)據(jù)的矩陣映射處理,直觀地表現(xiàn)出使用者對(duì)每種編程語(yǔ)言的偏好度.由計(jì)算用戶和課程關(guān)鍵字之間的余弦相似度距離得到用戶對(duì)每門(mén)具體課程的感興趣程度,從而生成相關(guān)推薦內(nèi)容.通過(guò)云端趣碼平臺(tái)對(duì)用戶提問(wèn)、用戶回答和用戶日志數(shù)據(jù)的處理,作為基于用戶數(shù)據(jù)的個(gè)性化推薦基礎(chǔ),經(jīng)過(guò)對(duì)云端趣碼的個(gè)性化推薦模塊的性能及流程的測(cè)試驗(yàn)證了該模塊的可用性和有效性.本研究是對(duì)個(gè)性化推薦的基礎(chǔ)設(shè)計(jì)與初步運(yùn)用,對(duì)推薦過(guò)程和結(jié)果的優(yōu)化完善有待于進(jìn)一步研究.

        [1]孟凡琦.基于查詢的論文參考文獻(xiàn)個(gè)性化推薦系統(tǒng)研究[D].天津:天津大學(xué),2014:1-7.

        [2]丁振國(guó),陳 靜.基于關(guān)聯(lián)規(guī)則的個(gè)性化推薦系統(tǒng)[J].計(jì)算機(jī)集成制造系統(tǒng),2003,9(10):891-893.

        [3]劉建國(guó),周 濤,郭 強(qiáng),等.個(gè)性化推薦系統(tǒng)評(píng)價(jià)方法綜述[J].復(fù)雜系統(tǒng)與復(fù)雜性科學(xué),2009,6(3):1-10.

        [4]劉建國(guó),周 濤,汪秉宏.個(gè)性化推薦系統(tǒng)的研究進(jìn)展[J].自然科學(xué)進(jìn)展,2009,19(1):1-15.

        [5]胡迎松,韓 蘋(píng),陳中新.一個(gè)基于Agent的個(gè)性化推薦系統(tǒng)[J].計(jì)算機(jī)應(yīng)用研究,2006,23(4):78-80.

        [6]賈忠濤.基于協(xié)同過(guò)濾算法的電影個(gè)性化推薦系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[J].軟件導(dǎo)刊,2015(1):86-88.

        [7]張錦歌,夏敏捷,樊銀亭.基于Android移動(dòng)圖書(shū)館個(gè)性化推薦系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[J].電腦編程技巧與維護(hù),2014(21):33-34.

        Design and Implementation of Personalized Recommendation Model Based on User Data

        ZHANG Yuhang
        (College of Software,Huazhong University of Science and Technology,Wuhan 430074,China)

        Nowadays,with the development of Internet technology,countless information flow is affecting our daily work and life.Consequently,to improve the utilization of information and access information resources which we need has become an urgent problem.With this question,the article implements a personalized recommendation module based on user data.Based on coding the clouds website,the article firstly sets up the database and data dictionary,which analyzes the user’s daily behaviors,and gets the user’s key words in the data dictionary.Then it mapped the user’s interest in the each keyword,calculated the distance between the user and keywords of the course.At last,this system recommended the courses with the highest similarity.By making full use of user’s daily questions and answers,we can obtain the foundation of personalized recommendation.Finally,the article figures out that this system is feasible and effective.

        User data;Personalized recommendation;Data dictionary;Cosine similarity

        TP317

        A

        2095-4476(2016)11-0026-05

        (責(zé)任編輯:陳 丹)

        2016-10-08;

        2016-10-25

        張宇航(1995—),男,湖北襄陽(yáng)人,華中科技大學(xué)軟件學(xué)院碩士研究生.

        猜你喜歡
        關(guān)鍵字日志云端
        履職盡責(zé)求實(shí)效 真抓實(shí)干勇作為——十個(gè)關(guān)鍵字,盤(pán)點(diǎn)江蘇統(tǒng)戰(zhàn)的2021
        一名老黨員的工作日志
        扶貧日志
        心聲歌刊(2020年4期)2020-09-07 06:37:14
        云端之城
        成功避開(kāi)“關(guān)鍵字”
        游學(xué)日志
        美人如畫(huà)隔云端
        行走在云端
        初中生(2017年3期)2017-02-21 09:17:43
        云端創(chuàng)意
        一種基于粗集和SVM的Web日志挖掘模型
        中文字幕av无码一区二区三区| 少妇高潮免费在线观看| 人妻精品久久中文字幕| 美女福利一区二区三区在线观看 | 午夜无遮挡男女啪啪免费软件| 久青草久青草视频在线观看| 女高中生自慰污免费网站| 国产一区二区三区小说| 粉嫩少妇内射浓精videos| 午夜a福利| 亚洲二区三区四区太九| 国产老熟女伦老熟妇露脸| 亚洲精品无码永久中文字幕| 中国妇女做爰视频| 精品少妇人妻av无码久久| 国产成人免费a在线视频| av蜜桃视频在线观看| 与最丰满美女老师爱爱视频 | 熟妇熟女乱妇乱女网站| 色视频www在线播放国产人成| 美女超薄透明丝袜美腿| 亚洲国产av午夜福利精品一区| 在线观看日本一区二区三区四区| 久久99热狠狠色精品一区| 男女野外做爰电影免费| 热re99久久精品国产66热6| 国产自拍一区二区三区| 女人无遮挡裸交性做爰| 中文日韩亚洲欧美制服| 2021国内精品久久久久精免费| 大红酸枝极品老料颜色| 日韩精品午夜视频在线| 97精品人妻一区二区三区蜜桃| 久久精品人人做人人爱爱| 男女车车的车车网站w98免费| 亚洲一级电影在线观看| 国产无套粉嫩白浆内精| 免费国产自拍在线观看| 老妇女性较大毛片| 亚洲国产欧美另类va在线观看| 久久国产精品男人的天堂av |