◎胡三寧
(河南科技大學 應用工程學院,河南 三門峽 472000)
個性化推薦技術在學習資源共享系統(tǒng)中的應用
◎胡三寧
(河南科技大學 應用工程學院,河南 三門峽 472000)
為解決互聯(lián)網(wǎng)上日益增多的學習資源造成的信息超載,提高用戶信息使用效率,設計并實現(xiàn)了基于推薦的學習資源共享系統(tǒng)。論文首先闡述了系統(tǒng)的設計目標及原則,進而介紹了邏輯模型架構與主要功能模塊的設計,結合標簽機制及社交網(wǎng)絡關系,提出了融合好友信任關系的混合推薦算法,并應用于資源推薦過程中。實驗表明,該算法具有一定的可行性,該系統(tǒng)可以提供有效的個性化推薦服務。
信息超載;標簽;信任關系;混合推薦
隨著信息技術的發(fā)展和網(wǎng)絡的進一步普及,網(wǎng)絡學習因其形式開放、時空不受限及資源豐富等優(yōu)勢,已逐漸成為教育教學體系中的重要組成部分[1]。經(jīng)歷函授、廣播電視教育及遠程教育后,MOOK等也逐漸進入人們的視野并被廣泛接受。但在全民學習如火如荼上演的同時,伴隨而來的是新的問題[2-4]:在終身學習熱潮不斷高漲的今天,如何避免“信息過載”,準確、有效地在浩瀚的“數(shù)據(jù)海洋”中獲得相關資源?在時代節(jié)奏較快的今天,如何在海量良莠不齊的資源間,高效的選擇優(yōu)質資源?
個性化推薦作為解決信息超載問題的有效途徑之一[3-5],已廣泛應用于電子商務領域。在網(wǎng)絡學習領域應用研究中,很多學者對此進行了大量有益的工作。文獻[6]提出了一種基于學習狀態(tài)匹配的相似學習者關聯(lián)發(fā)現(xiàn)算法,為社區(qū)學習者提供了有針對性的學習資源推薦;文獻[7]提出了一種基于決策樹和BP神經(jīng)網(wǎng)絡的混合推薦算法,按照學習模式進行后繼知識預測及推薦;文獻[8]基于多代理、并結合Agent技術構建混合推薦系統(tǒng);文獻[9]結合學習者特征及學習資源特征,采用協(xié)同過濾為學習者提供學習資源;文獻[10]通過構建知識結構圖,運用IRT分析學習者差異,提出以PSO算法為基礎的推薦方法完成學習資源推薦。
筆者針對目前網(wǎng)絡學習中“信息過載”與“信息孤島”間、“大眾式服務”與“個性化需求”間存在的矛盾,結合社交網(wǎng)絡中的好友及其之間的信任關系,利用社會化標簽標注,設計并實現(xiàn)了基于推薦的學習資源共享系統(tǒng)。論文章節(jié)安排如下:第1節(jié)討論了系統(tǒng)的設計目標,第2、3節(jié)分別給出了系統(tǒng)設計與實現(xiàn)的詳細過程,并在第4節(jié)給出系統(tǒng)測試,最后總結全文。
通過設計針對學習資源的共享系統(tǒng),利用用戶的貢獻來上傳資源,并采用統(tǒng)一的數(shù)據(jù)格式保存,以期于系統(tǒng)內匯聚大量的高質量的資源,方便資源管理的同時,減少用戶對目標資源的檢索時間,使得網(wǎng)絡學習更加高效。作為主動檢索的必要補充,結合聚類分析及推薦技術,向用戶提供個性化的資源推薦服務,一方面進一步提高了定位目的資源的準確性與高效性,另一方面可以作為興趣發(fā)現(xiàn)的輔助手段,在滿足學習者對于網(wǎng)絡學習的個性化需求的同時,發(fā)掘更多的用戶潛質,最大限度地促進個人發(fā)展。系統(tǒng)具體設計目標如下:
(1)實現(xiàn)對海量學習資源的統(tǒng)一管理。傳統(tǒng)的根據(jù)欄目或是分類進行的數(shù)據(jù)管理,無法應對海量資源的實時管理及面向興趣的推薦需求。故在此基礎上引入標簽及評價,使資源貢獻者成為管理者、資源使用者成為評價者,在統(tǒng)一管理資源的同時為資源推薦提供必要的基礎數(shù)據(jù)。
(2)實現(xiàn)對目標資源的快速、準確檢索。搜索引擎作為用戶發(fā)起的主動檢索行為,一定程度上反映了用戶近期的訴求,并對推薦具有較高的參考價值。而搜索引擎源于信息的全文檢索,依賴于文檔處理結果[11]。通過標簽功能的引入,不但為信息檢索提供了必要的關鍵詞,而且簡化了對非結構化數(shù)據(jù)特征提取的處理。
(3)實現(xiàn)有效的個性化推薦。作為信息過載的解決方案,準確的個性化推薦有助于用戶在過量信息中快速獲取對自己有用的部分,從而提高信息使用效率[5]。對系統(tǒng)而言,通過用戶及資源建模,進行興趣相似度計算,完成針對用戶興趣的個性化推薦服務,將被動檢索變主動推薦,最終提高用戶忠誠度,有助于建立長期穩(wěn)定的關系。
同時,系統(tǒng)設計應遵循的原則有:
(1)功能完備性:除了資源的統(tǒng)一管理、檢索服務及個性化推薦,系統(tǒng)還包括用戶及角色管理、權限管理、欄目管理、標簽管理等。
(2)操作簡便性:良好的交互體驗可以提高用戶滿意度,在維系用戶關系的同時,有利于更大的生態(tài)系統(tǒng)的構建。
(3)推薦準確性:個性化推薦旨在有針對性的滿足不同用戶的需求,而只有符合用戶興趣的推薦才是有意義的,即只有提高推薦準確率才能使用戶對推薦產(chǎn)生依賴[4]。
(4)系統(tǒng)安全性:通過安全的身份認證,保護用戶基礎數(shù)據(jù);結合角色及授權管理,實現(xiàn)不同功能模塊的權限管理。
(5)平臺開放性:支持多種硬件平臺及操作系統(tǒng),支持通用的數(shù)據(jù)類型,提供開發(fā)的數(shù)據(jù)接口以滿足二次開發(fā)。
2.1 系統(tǒng)總體設計
基于推薦的學習資源共享系統(tǒng)框架組織如圖1示:
圖1 系統(tǒng)框架示意
圖2 系統(tǒng)功能模塊
在數(shù)據(jù)層,采用XML技術及Database完成數(shù)據(jù)的存儲,并結合EF以對象方式操作抽象數(shù)據(jù);支持層實現(xiàn)資源的標注及評價,并提供用戶建模;在業(yè)務邏輯層,除傳統(tǒng)CURD操作外,主要進行用戶聚類分析與內容協(xié)同過濾,為推薦算法提供數(shù)據(jù)輸入;最終實現(xiàn)個性化推薦服務及系統(tǒng)管理。
2.2 主要功能設計
經(jīng)進一步整合,系統(tǒng)主要功能模塊如圖2示:
2.2.1 用戶管理模塊
該模塊主要實現(xiàn)對注冊用戶及后臺用戶的管理。對于后臺用戶,系統(tǒng)管理員可以進行添加、編輯、刪除用戶及修改密碼等操作。高級管理員除可添加(或刪除)低級管理員用戶外,也可針對低級用戶所屬的角色進行修改,以進行角色與權限管理。對于注冊用戶,管理員可針對其在系統(tǒng)內發(fā)言的合法性進行凍結及注銷等操作。
2.2.2 權限管理模塊
系統(tǒng)采用基于角色的用戶管理,故權限管理部分設計為面向“角色-模塊”二元組的權限分配。為更好地進行訪問控制及委托管理,系統(tǒng)引入了DETRBAC模型[12]進行工作流管理。
2.2.3 系統(tǒng)管理模塊
系統(tǒng)管理主要提供系統(tǒng)的備份還原、日志管理及常規(guī)系統(tǒng)設置等。
2.2.4 內容管理模塊
該模塊主要提供對資源、標簽及評價等內容的管理。系統(tǒng)內資源以分類組織,通過標注標簽作為資源關鍵詞,統(tǒng)一了結構化、半結構化及非結構化數(shù)據(jù)的特征提取。用戶貢獻資源的同時標注資源,該標簽從一定程度上反映了用戶興趣,并從側面為用戶興趣建模提供了基礎數(shù)據(jù)。
2.2.5 個性化推薦模塊
個性化推薦旨在提供滿足用戶興趣需求的有效資源。針對系統(tǒng)特點,本文在文獻[13]提出的混合推薦算法的基礎上,結合社交網(wǎng)絡中的好友及其之間的信任關系,充分利用社會化標簽標注機制,進行了個性化推薦方法設計與實現(xiàn),具體見第3節(jié)。
3.1 算法設計
文獻[13]提出了一種基于用戶興趣及標簽相似度的混合推薦算法HAS_Com:構建基于標簽的用戶興趣模型,進而通過計算與資源相似度可完成推薦,同時融合時間因素研究用戶興趣變化,提高了基于內容的推薦中相似度計算的準確率;根據(jù)用戶興趣相似度聚類用戶,通過興趣的協(xié)同推薦可減少對評分矩陣的依賴;結合用戶基本信息有望緩解冷啟動問題。HAS_Com獲取用戶興趣與資源特征間的相似度(S)的定義可具體描述為:
其中,Vres為資源的特征向量、Vu為用戶的興趣向量,Wj為用戶對標簽的興趣權重,Tagj反映了用戶興趣是隨時間的變化。Sim為采用互信息衡量標簽Tagi與Tagj間相似度:
而相關研究表明,用戶獲得的推薦往往是其信任網(wǎng)絡中與其距離較近的用戶評價較好的項目[14,15]。因此,系統(tǒng)在實現(xiàn)過程中,采用上述算法的同時,設計并實現(xiàn)了用戶間好友關系的維護,以融合社交網(wǎng)絡中好友間的信任關系,旨在提高推薦準確率。
定義Wf(resi,uj)為資源resi被用戶uj好友推薦的權重,即描述用戶uj之好友是否對該資源感興趣,具體通過計算該資源被其好友推薦的數(shù)量在其好友間所有感興趣資源中所占的比例,如式(3):
其中,CresiIn(Guj)指資源resi出現(xiàn)在用戶uj好友關系圖中的次數(shù);r為在該關系圖中所有用戶推薦的資源數(shù)目之和。
故對于資源的特征向量Vres={Tag1,Tag2,…,Tagn}及用戶興趣向量Vu={
其中,Sim(Tagi,Tagj)計算標簽Tagi與Tagj間相似度。
3.2 實驗分析
利用系統(tǒng)數(shù)據(jù),從正確推薦數(shù)C、準確率P、召回率R、推薦覆蓋率COV等[3,8]方面,給出算法HASR_Com與算法HAS_Com[13]的實驗對比結果,具體如下表:
Top20實驗結果表
由表可知,筆者提出的混合推薦算法在準確率、召回率等方面,有了一定的提高;在推薦覆蓋率上,通過融合好友及信任關系,較有效地解決了因用戶興趣聚類而造成的推薦多樣性較低的問題。
融合信任關系的學習資源共享系統(tǒng)實現(xiàn)如圖3所示:系統(tǒng)根據(jù)資源與用戶興趣的匹配度、發(fā)布時間及其熱度等,分別給出了 “推薦資源”、“最新資源”及“熱門資源”等三種資源推薦方案,可在個性化推薦的基礎上,通過“熱門資源”推薦作為傳統(tǒng)無差別推薦的補充,也可根據(jù)“最新資源”推薦進一步縮短新增資源被認可的周期。
圖3 學習資源推薦示意
筆者結合社會化標簽標注,利用社交網(wǎng)絡中的好友及其之間的信任關系對推薦有效性的影響,改進了協(xié)同過濾推薦算法,且實驗表明該方法具有一定的可行性。在該方法的基礎上,設計并實現(xiàn)了基于推薦的學習資源共享系統(tǒng),經(jīng)測試,該系統(tǒng)可以有效地進行資源推薦,達到了設計目標。
[1]唐國菊.網(wǎng)絡學習資源個性化推薦系統(tǒng)的設計與開發(fā)[D].西安:陜西師范大學,2012.
[2]王萍,張際平.云計算與網(wǎng)絡學習[J].現(xiàn)代教育技術,2008(11):81-84.
[3]朱郁筱,呂琳媛.推薦系統(tǒng)評價指標綜述[J].電子科技大學學報,2012(2):163-175.
[4]王國霞,劉賀平.個性化推薦系統(tǒng)綜述[J].計算機工程與應用,2012(7):66-76.
[5]許海玲,吳瀟,李曉東,等.互聯(lián)網(wǎng)推薦系統(tǒng)比較研究[J].軟件學報,2009(2):350-362.
[6]王志梅,楊帆.基于相似學習者發(fā)現(xiàn)的資源推薦系統(tǒng)[J].浙江大學學報(工學版),2006(10):1688-1691+1791.
[7]吳彥文,黃珍.混合算法用于學習資源的自動推薦[J].計算機應用與軟件,2008(12):202-203.
[8]吳兵,葉春明,陳信.基于多代理的個性化推薦學習系統(tǒng)[J].計算機工程,2010(15):256-258.
[9]葉樹鑫,何聚厚.協(xié)作學習中基于協(xié)同過濾的學習資源推薦研究[J].計算機技術與發(fā)展,2014,(10):63-66.
[10]楊超.基于粒子群優(yōu)化算法的學習資源推薦方法[J].計算機應用,2014(5):1350-1353.
[11]查大元.個性化推薦系統(tǒng)的研究和實現(xiàn)[J].計算機應用與軟件,2011(1):47-49.
[12]殷慧文,易俗.工作流系統(tǒng)中一種基于任務角色的委托模型[J].遼寧大學學報(自然科學版),2011(2):173-176.
[13]胡三寧.一種基于相似度的混合推薦方法[J].三門峽職業(yè)技術學院學報,2015(2):140-144.
[14]李慧,馬小平,胡云,等.融合社會網(wǎng)絡與信任度的個性化推薦方法研究[J].計算機應用研究,2014(3):808-810.
[15]羅辛,歐陽元新,熊璋,等.通過相似度支持度優(yōu)化基于K近鄰的協(xié)同過濾算法[C]//Ndbc中國數(shù)據(jù)庫學術會議論文,2010:1437-1445.
(責任編輯 卞建寧)
Application of Personalized Recommendation in Learning Resources Sharing System
HU Sanning
(Academic Affairs Office,Sanmenxia Polytechnic,Sanmenxia 472000,China)
TP311
B
1671-9123(2017)02-0140-05
2017-03-20
胡三寧(1983-),男,河南洛寧人,河南科學大學應用工程學院、三門峽職業(yè)技術學院講師。