宋明惠 陳俊華 朱晨笛 仝鎧溦
摘? 要:大類分流時專業(yè)的選擇決定了學生的就業(yè)方向,然而大多數(shù)學生并不能獨立地選擇合適的專業(yè),所以“智能專業(yè)推薦”是十分必要的。該文通過闡述和分析協(xié)同過濾算法的特點和不足,提出了一種改進的協(xié)同過濾算法用于專業(yè)推薦中,解決了冷啟動的問題,,提高了系統(tǒng)的可靠性。
關鍵詞:專業(yè)推薦? 大類分流? 協(xié)同過濾算法
中圖分類號:TP301.6? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?文獻標識碼:A? ? ? ? ? ? ? ? ? ? ? ? 文章編號:1672-3791(2019)03(b)-0216-02
近年來,“大類招生、分流培養(yǎng)”模式被越來越多的高校所采用,在這種新的培養(yǎng)模式下,專業(yè)分流是其中一個重要的環(huán)節(jié),選擇一個適合自己的專業(yè)對高校學生來說是一件十分重要的事情,用戶在進行專業(yè)選擇前會收集各方面資料,其中已經(jīng)經(jīng)歷過分流的用戶的建議和體會是未分流的用戶最想了解的,并且會將與自己的成績興趣等相近的用戶的專業(yè)作為重要的參考。該文使用協(xié)同過濾算法將與當前用戶相似度最高的用戶選擇的專業(yè)作為推薦專業(yè)。
1? 推薦算法
目前推薦算法廣泛應用于電子商務、社會網(wǎng)絡、數(shù)字化圖書館、視頻/音樂點播等領域,比較成熟的推薦算法主要有關聯(lián)規(guī)則、基于內(nèi)容的推薦、協(xié)同過濾和混合推薦[1]。這4種算法各有優(yōu)缺點,其主要優(yōu)缺點如表1所示。
根據(jù)表1所示的各類推薦算法的優(yōu)缺點,該文選擇協(xié)同過濾算法作為專業(yè)推薦的推薦算法。
2? 用戶相似度
用戶相似度即描述用戶之間是相似程度的度量,傳統(tǒng)的相似度有皮爾遜相關系數(shù)法、向量余弦法、調(diào)整的向量余弦法、約束的皮爾遜相關系數(shù)法、斯皮爾曼相關系數(shù)法等,在不同的應用領域中,選取不同的相似度計算方法。在電子商務中,用戶的相似度可以通過幾個用戶對同一件商品的打分情況(這里的分值可能表示真實的購買,也可以是用戶對商品不同行為的量化指標。例如,瀏覽商品的次數(shù),向朋友推薦商品、收藏、分享、或評論等。這些行為都可以表示用戶對商品的態(tài)度和偏好程度)來計算用戶之間的相似度。
3? 協(xié)同過濾算法
協(xié)同過濾的基本思想是:找到與當前用戶Ccur相似(比如興趣相似)的其他用戶Cjs,計算對象s對于用戶的效益值u(Cjs,s),利用效益值對所有s進行排序或者加權等操作,找到最適合Ccur的對象s*[2]。其基本思想非常易于理解,在日常生活中,我們往往會利用好朋友的推薦來進行一些選擇,在普遍的推薦系統(tǒng)中是基于其相似用戶對某一內(nèi)容的評價向目標用戶進行推薦,而在該系統(tǒng)中,只需找到最相似的用戶即可(見表2)。
根據(jù)上述內(nèi)容可知,協(xié)同過濾算法需要基礎用戶作為參考才能進行協(xié)同推薦,基礎用戶對該算法而言不可或缺。獲得基礎數(shù)據(jù),解決冷啟動問題是進行推薦的基礎。
4? 智能專業(yè)推薦的實現(xiàn)
根據(jù)霍蘭德人職匹配理論,人格一共被分為6種不同的類型,每一種類型的人格都有著不一樣的特點[3]?;诼殬I(yè)興趣測試的理論,查閱相關資料提取出15個區(qū)分度明顯的關鍵詞,依據(jù)15個關鍵詞設計了40道具有專業(yè)區(qū)分度的題目,形成調(diào)查問卷。向大類分流后的學生進行問卷調(diào)查,收集得到203份問卷結(jié)果。
將問卷結(jié)果的關鍵詞進行分值的統(tǒng)計,把計算機創(chuàng)新實驗班、計算機科學與技術、物聯(lián)網(wǎng)、網(wǎng)絡工程、數(shù)字媒體技術5個專業(yè)作為5個基礎用戶C,計算每個關鍵詞分值所占百分比,做為用戶C的屬性對象Si,形成向量集合S。當前用戶Ccur答題結(jié)束后,系統(tǒng)統(tǒng)計每個關鍵詞分值所占百分比,作為當前用戶Ccur的屬性對象S`i,形成向量集合S`。
通過公式(1)計算當前用戶Ccur和5個基礎用戶C的余弦相似度similarity,將similarity最小的用戶C作為推薦專業(yè),經(jīng)過測試得推薦結(jié)果精確度為67.3%。
通過公式(2)計算當前用戶Ccur和5個基礎用戶C的皮爾森相關系數(shù)r,將r最小的用戶C作為推薦專業(yè),經(jīng)過測試得推薦結(jié)果精確度為70.2%。
因此將公式(2)作為該系統(tǒng)的推薦計算方法。
5? 結(jié)語
該文通過對協(xié)同過濾算法的研究,將協(xié)同過濾算法應用到筆者學校的大類分流系統(tǒng)的智能專業(yè)推薦功能中,在大類分流階段為用戶提供了專業(yè)借鑒,得到了用戶的一致好評。并且隨著基礎用戶數(shù)據(jù)的增加,推薦的精確度不斷提高。
參考文獻
[1] 冷亞軍,陸青,梁昌勇.協(xié)同過濾推薦技術綜述[J].模式識別與人工智能,2014,27(8):720-734.
[2] 許海玲,吳瀟,李曉東,等.互聯(lián)網(wǎng)推薦系統(tǒng)比較研究[J].軟件學報,2009,20(2):350-362.
[3] 雷長青.淺談大學生職業(yè)規(guī)劃設計中霍蘭德人職匹配測試法的運用[J].現(xiàn)代經(jīng)濟信息,2018(14):445.
①基金項目:北京林業(yè)大學大學生創(chuàng)新創(chuàng)業(yè)項目—— 基于協(xié)同過濾的大類專業(yè)分流實時動態(tài)系統(tǒng)研建(項目編號:S201810022089)。