柯秀文
文章編號(hào): 2095-2163(2018)03-0185-03中圖分類(lèi)號(hào): 文獻(xiàn)標(biāo)志碼: A
摘要: 關(guān)鍵詞: based on collaborative filtering technology
(Software College of Shangqiu Polytechnic ,Shangqiu 476001, Henan, China)
Abstract: Learning online based on "Internet +” technology is a new and effective way of learning, it is conducive to raise learners' knowledge and skills, but many learners finds it hard to choose the online course which they really need. Aiming at the existing problems, this paper designs an online course recommendation System based on collaborative filtering technology, and overcomes the shortcomings of collaborative filtering to provide well-directed course for learners , so as to promote the talents cultivation that based on "Internet +" technology.
Key words:
作者簡(jiǎn)介:
收稿日期: 引言
隨著信息技術(shù)的快速發(fā)展,數(shù)字課程資源建設(shè)日益豐富,基于“互聯(lián)網(wǎng)+”[1]技術(shù)的新型學(xué)習(xí)方式得到極大的普及和推廣,這種學(xué)習(xí)方式擺脫了傳統(tǒng)學(xué)習(xí)方式在空間和時(shí)間上的限制,具有課程內(nèi)容碎片化、教學(xué)方式趣味化、學(xué)習(xí)時(shí)間(場(chǎng)所)自由化、學(xué)習(xí)內(nèi)容自主化等特點(diǎn)。這些特點(diǎn)符合自由學(xué)習(xí)者對(duì)學(xué)習(xí)內(nèi)容和形式的要求,使學(xué)習(xí)者具有極大的學(xué)習(xí)自由度,也吸引了越來(lái)越多的學(xué)習(xí)者參與到這種學(xué)習(xí)形式中來(lái)。
隨著基于“互聯(lián)網(wǎng)+”技術(shù)線上學(xué)習(xí)的深入發(fā)展,新的問(wèn)題逐漸顯現(xiàn),學(xué)習(xí)者難以對(duì)自己的學(xué)習(xí)需要做出有效評(píng)估,面對(duì)課程平臺(tái)海量的學(xué)習(xí)資源,也難以選擇有效的方式尋找真正符合自己需要的的課程。不少學(xué)習(xí)者對(duì)線上課程的選擇出現(xiàn)了盲目性、隨意性,即通過(guò)參考別人選擇的課程隨機(jī)選擇課程,或者通過(guò)搜索引擎在課程網(wǎng)站搜索課程資源,然而這些課程選擇方式都難以保證學(xué)習(xí)者所選擇的課程真正符合自己的學(xué)習(xí)需求。
為了解決學(xué)習(xí)者線上課程選擇的問(wèn)題,本文提出一種基于協(xié)同過(guò)濾算法的推薦技術(shù),從技術(shù)手段上,幫助學(xué)習(xí)者從網(wǎng)絡(luò)課程平臺(tái)上選擇符合自己需求的課程資源。
1個(gè)性化推薦技術(shù)
1.1個(gè)性化推薦技術(shù)介紹
個(gè)性化推薦技術(shù)是一種可以根據(jù)用戶(hù)已有的相關(guān)信息,為用戶(hù)提供有效的、實(shí)時(shí)的、符合個(gè)性需求服務(wù)的技術(shù),該技術(shù)和傳統(tǒng)信息檢索方式相比具有顯著的優(yōu)勢(shì),在電子商務(wù)領(lǐng)域得到廣泛的應(yīng)用和推廣。目前,常用的個(gè)性化推薦算法主要有如下幾種:基于規(guī)則的推薦系統(tǒng)、基于內(nèi)容的推薦系統(tǒng)和基于協(xié)同過(guò)濾的推薦系統(tǒng)[2]。協(xié)同過(guò)濾算法在各類(lèi)電子商務(wù)網(wǎng)站商品推薦中得到廣泛應(yīng)用,并取得了良好的個(gè)性推薦效果,因此,針對(duì)不同的線上課程學(xué)習(xí)者,選擇協(xié)同過(guò)濾算法進(jìn)行線上課程個(gè)性化推薦是可行的。
1.2協(xié)同過(guò)濾技術(shù)介紹
1992年,Goldberg等人提出協(xié)同過(guò)濾( Collaborative Filtering,CF)技術(shù),本文研究推薦的協(xié)同過(guò)濾算法主要基于學(xué)習(xí)者對(duì)一些課程的評(píng)分進(jìn)行比較,如果學(xué)習(xí)者對(duì)一些課程的評(píng)分相似,那么學(xué)習(xí)者對(duì)其他課程的評(píng)分也相似。協(xié)同過(guò)濾算法分為獲取用戶(hù)信息、相似性比較、產(chǎn)生推薦3部分[3]。
1.3協(xié)同過(guò)濾技術(shù)的應(yīng)用
1.3.1獲取線上課程用戶(hù)信息
在線課程網(wǎng)站中,可以通過(guò)學(xué)習(xí)者注冊(cè)的信息及其行為記錄為其建立個(gè)性化的推薦。注冊(cè)信息一般是用戶(hù)初始登錄課程網(wǎng)站時(shí)要填寫(xiě)的相關(guān)個(gè)人信息,行為記錄方式總體上可以分為2種,一種是通過(guò)用戶(hù)對(duì)課程的評(píng)分直接獲得;另一種是通過(guò)用戶(hù)在課程頁(yè)面的停留時(shí)間、點(diǎn)擊次數(shù)轉(zhuǎn)化為評(píng)分間接獲得,2種方式各有優(yōu)缺點(diǎn)。把獲得的數(shù)據(jù)轉(zhuǎn)化為評(píng)價(jià)矩陣,見(jiàn)表1,Sij表示用戶(hù)i對(duì)課程j的評(píng)分。
3.2相似性比較
計(jì)算學(xué)習(xí)者目標(biāo)用戶(hù)的相關(guān)特征,并在學(xué)習(xí)者數(shù)據(jù)庫(kù)中找到與目標(biāo)用戶(hù)特征相似的用戶(hù)群,通過(guò)Pearson相關(guān)系數(shù)進(jìn)行用戶(hù)之間的相似度計(jì)算,計(jì)算公式如下:
sim(m,n)=
∑c∈Imn(Smc-Sm)(Snc-Sn)∑c∈Imn(Smc-Sm)2∑c∈Imn(Snc-Sn)2(1)
其中,sim(m,n)是2個(gè)用戶(hù)之間的相似度,Imn是2個(gè)用戶(hù)的共同評(píng)分。
1.3.3根據(jù)比較結(jié)果產(chǎn)生推薦
產(chǎn)生推薦即通過(guò)鄰居集對(duì)課程的評(píng)分來(lái)預(yù)測(cè)目標(biāo)用戶(hù)對(duì)課程的評(píng)分,從而把預(yù)測(cè)值較高的課程推薦給目標(biāo)用戶(hù)。其算法有平均加權(quán)法和評(píng)分頻度法[4]。在網(wǎng)絡(luò)課程個(gè)性化推薦中,可以根據(jù)不同的用戶(hù),靈活地選擇合適的算法實(shí)現(xiàn)更加精準(zhǔn)的推薦。
1.4實(shí)例分析
本文以中國(guó)大學(xué)MOOC網(wǎng)絡(luò)課程推薦的實(shí)例來(lái)說(shuō)明該算法的計(jì)算過(guò)程。表2示出了一個(gè)簡(jiǎn)易的學(xué)習(xí)者課程參與表,相關(guān)課程取自中國(guó)大學(xué)MOOC網(wǎng)(https://www.icourse163.org/),其中,1表示用戶(hù)參與了該課程的學(xué)習(xí),0表示用戶(hù)沒(méi)有參與該課程學(xué)習(xí);A、B、C、D表示4名學(xué)習(xí)者用戶(hù)。
1.4.1獲取用戶(hù)信息
在本事例中可以把學(xué)習(xí)者用戶(hù)參與的課程轉(zhuǎn)化為標(biāo)量表示,即A=(1,0,1,0,0);B=(0,0,0,0,1);C=(1,0,0,1,0);D=(1,1,1,0,0)。
1.4.2相似性比較
通過(guò)相似性公式計(jì)算得到A、B、C、D這4位學(xué)習(xí)者用戶(hù)的相似性結(jié)果,見(jiàn)表3。
4.3產(chǎn)生推薦
通過(guò)比較得出與用戶(hù)A最為相似的學(xué)習(xí)者用戶(hù)是D,因此,可以將學(xué)習(xí)者D學(xué)習(xí)的《Enterprise Accounting》課程推薦給學(xué)習(xí)者用戶(hù)A。
1.5協(xié)同過(guò)濾算法缺陷改進(jìn)思路
利用協(xié)同過(guò)濾技術(shù)可以方便地為學(xué)習(xí)者推薦個(gè)性化的線上課程資源[5]。協(xié)同過(guò)濾技術(shù)能夠?qū)崿F(xiàn)精準(zhǔn)推薦需要用戶(hù)有足夠多的評(píng)分基礎(chǔ),用戶(hù)評(píng)分?jǐn)?shù)據(jù)越多,其推薦結(jié)果越接近于用戶(hù)實(shí)際需要。該項(xiàng)技術(shù)在實(shí)際應(yīng)用中往往存在2個(gè)問(wèn)題:數(shù)據(jù)稀疏性問(wèn)題和冷啟動(dòng)問(wèn)題[6]。
數(shù)據(jù)稀疏性問(wèn)題即學(xué)習(xí)者用戶(hù)因?yàn)楦鞣N原因?qū)€上課程沒(méi)有足夠多的評(píng)分,當(dāng)評(píng)分?jǐn)?shù)量較少時(shí)很難進(jìn)行相關(guān)特征值的計(jì)算,導(dǎo)致推薦效果不理想。解決這一問(wèn)題,可以采用預(yù)測(cè)填充的方法,以用戶(hù)已有課程評(píng)分為依據(jù),預(yù)判一部分相似鄰居,根據(jù)鄰居對(duì)線上課程的評(píng)分來(lái)填充用戶(hù)自己未評(píng)分的項(xiàng)目,使學(xué)習(xí)者用戶(hù)的評(píng)分?jǐn)?shù)據(jù)足夠多,產(chǎn)生推薦課程推薦給學(xué)習(xí)者用戶(hù),并引導(dǎo)用戶(hù)對(duì)推薦課程進(jìn)行評(píng)分,逐步豐富用戶(hù)評(píng)分?jǐn)?shù)據(jù)庫(kù),解決數(shù)據(jù)的稀疏性問(wèn)題。
冷啟動(dòng)問(wèn)題一般是指新的學(xué)習(xí)者注冊(cè)用戶(hù),由于初始使用線上課程,就沒(méi)有任何課程評(píng)分?jǐn)?shù)據(jù),這樣導(dǎo)致無(wú)法對(duì)其匹配鄰居用戶(hù),無(wú)法進(jìn)行線上課程的推薦。解決冷啟動(dòng)問(wèn)題,可以借助課程網(wǎng)站平臺(tái),在學(xué)習(xí)者用戶(hù)初次注冊(cè)時(shí),讓其認(rèn)真填寫(xiě)符合自己特征的相關(guān)信息,如:調(diào)查其注冊(cè)目的、學(xué)習(xí)興趣、學(xué)習(xí)目標(biāo)等等,根據(jù)用戶(hù)注冊(cè)信息,就可以直接給學(xué)習(xí)者用戶(hù)推薦相應(yīng)分類(lèi)評(píng)分較高的課程。最后還要引導(dǎo)用戶(hù)對(duì)推薦課程進(jìn)行評(píng)分,獲得越來(lái)越多的真實(shí)評(píng)分?jǐn)?shù)據(jù),為更好的應(yīng)用協(xié)同過(guò)濾技術(shù)做準(zhǔn)備。
2線上課程個(gè)性化推薦系統(tǒng)模型
基于協(xié)同過(guò)濾技術(shù)的個(gè)性化課程推薦可使學(xué)習(xí)者在線上課程選擇時(shí)具有較高使用價(jià)值,可以有效地為學(xué)習(xí)者提供針對(duì)性較高的、符合個(gè)性化需求的、高質(zhì)量的線上課程。
圖1示出了基于協(xié)同過(guò)濾技術(shù)的線上課程個(gè)性化推薦系統(tǒng)設(shè)計(jì)圖。學(xué)習(xí)者用戶(hù)的相關(guān)數(shù)據(jù)信息和評(píng)分行為記錄存儲(chǔ)在數(shù)據(jù)庫(kù)中,需要推薦時(shí),算法根據(jù)用戶(hù)在數(shù)據(jù)庫(kù)中的信息判斷該用戶(hù)是老用戶(hù)、新用戶(hù)、還是數(shù)據(jù)稀疏型用戶(hù)。老用戶(hù)采用普通協(xié)同過(guò)濾算法計(jì)算推薦課程;新用戶(hù)以其注冊(cè)數(shù)據(jù)信息為依據(jù)進(jìn)行課程推薦;數(shù)據(jù)稀疏型用戶(hù)首先進(jìn)行預(yù)測(cè)評(píng)分,然后再執(zhí)行普通協(xié)同過(guò)濾算法進(jìn)行課程推薦。最后要求學(xué)習(xí)者用戶(hù)對(duì)推薦課程進(jìn)行評(píng)分,并錄入數(shù)據(jù)庫(kù),以方便系統(tǒng)為其他用戶(hù)提供更加精準(zhǔn)的推薦。
通過(guò)基于協(xié)同過(guò)濾技術(shù)線上課程個(gè)性化推薦系統(tǒng),課程網(wǎng)站可以根據(jù)學(xué)習(xí)者個(gè)性特征高效率、準(zhǔn)確地推薦符合其學(xué)習(xí)需要的網(wǎng)絡(luò)課程,解決了學(xué)習(xí)者線上課程個(gè)性化學(xué)習(xí)的問(wèn)題,提升了其學(xué)習(xí)效率和學(xué)習(xí)體驗(yàn)。此外,課程網(wǎng)站還可以利用個(gè)性化推薦系統(tǒng)為學(xué)習(xí)者組建學(xué)習(xí)小組或小型學(xué)習(xí)論壇。學(xué)習(xí)小組或小型學(xué)習(xí)論壇成員均為“相似鄰居“(基于用戶(hù)“相似鄰居”產(chǎn)生推薦),相互之間有著共同的學(xué)習(xí)興趣、學(xué)習(xí)愛(ài)好、學(xué)習(xí)課程等,這樣可以有效地促進(jìn)相似用戶(hù)之間的交流討論,提高學(xué)習(xí)者學(xué)習(xí)的興趣,達(dá)到更好的學(xué)習(xí)效果。
3結(jié)束語(yǔ)
本文介紹了線上課程學(xué)習(xí)者在課程選擇上存在的一些問(wèn)題,針對(duì)學(xué)習(xí)者難以實(shí)現(xiàn)課程個(gè)性化選擇的情況,改進(jìn)了協(xié)同過(guò)濾算法的缺陷,設(shè)計(jì)了一種基于協(xié)同過(guò)濾技術(shù)的線上課程推薦系統(tǒng),為學(xué)習(xí)者提供個(gè)性化的課程推薦。在線課程平臺(tái)在實(shí)際使用該系統(tǒng)過(guò)程中,要注重新用戶(hù)注冊(cè)數(shù)據(jù)和老用戶(hù)課程評(píng)分?jǐn)?shù)據(jù)的存儲(chǔ)和利用,以有效解決數(shù)據(jù)稀疏和冷啟動(dòng)問(wèn)題,不斷提高課程推薦精準(zhǔn)度。
參考文獻(xiàn)
[1] 中華人民共和國(guó)農(nóng)業(yè)部. "十三五"全國(guó)新型職業(yè)農(nóng)民培育發(fā)展規(guī)劃[DB/OL]. http://jiuban.moa.gov.cn/zwllm/ghjh/201701/t20170122_5461506.htm, 2017-1-22.
[2] 黃洋. 基于聚類(lèi)和項(xiàng)目類(lèi)別偏好的協(xié)同過(guò)濾推薦算法研究[D]. 浙江理工大學(xué),2014.
[3] You W, Shui-Sheng Y E. A Survey of Collaborative Filtering Algorithm Applied in E-commerce Recommender System[J]. Computer Technology & Development, 2006.
[4] 胡國(guó)強(qiáng),張旭虎. 基于協(xié)同過(guò)濾算法的MOOC個(gè)性化推薦系統(tǒng)[J]. 信息技術(shù),2017(6):99-103.
[5] 丁永剛,張馨,桑秋俠,等. 融合學(xué)習(xí)者社交網(wǎng)絡(luò)的協(xié)同過(guò)濾學(xué)習(xí)資源推薦[J]. 現(xiàn)代教育技術(shù),2016,26(2):108-114.
[6] 申輝繁. 協(xié)同過(guò)濾算法中冷啟動(dòng)問(wèn)題的研究[D]. 重慶大學(xué),2015.