郭昌雨 林琳 徐高瑞 陳辰 盧青瑩
摘 要 隨著高校管理理念的發(fā)展和轉(zhuǎn)變,學(xué)生公寓從單向強(qiáng)制管理逐漸轉(zhuǎn)變?yōu)橐匀藶楸荆F(xiàn)有傳統(tǒng)的學(xué)生公寓系統(tǒng)不能夠?yàn)閷W(xué)生提供自助化、私人化、定制化的自選模式,這很容易造成統(tǒng)一個(gè)寢室矛盾紛爭等尷尬現(xiàn)象。為此,研究屬于自己學(xué)校私人定制式的新生公寓自選系統(tǒng)具有重要的實(shí)用價(jià)值。
關(guān)鍵詞 新生公寓自選 推薦算法 隱語義模型 協(xié)同過濾 矩陣分解
中圖分類號:TP391 文獻(xiàn)標(biāo)識碼:A
1傳統(tǒng)學(xué)生公寓系統(tǒng)的現(xiàn)狀分析
隨著高等教育的不斷改革和發(fā)展、高校管理理念的變化——從單向強(qiáng)制管理到以人為本的轉(zhuǎn)變,高校學(xué)生宿舍管理遇到很多新的課題,面臨著巨大的挑戰(zhàn)和機(jī)遇。其中比較突出體現(xiàn)在新生入學(xué)時(shí),學(xué)校對當(dāng)前宿舍資源的梳理,以及新生宿舍安排方面。具體表現(xiàn)在:
(1)宿舍資源的復(fù)雜化,導(dǎo)致很難及時(shí)掌握宿舍資源情況;
(2)后勤社會化導(dǎo)致宿舍教育管理功能弱化;
(3)住宿條件多樣化、學(xué)生住宿民主化,原有傳統(tǒng)分配方式已不能滿足。
由于學(xué)生公寓存在住宿條件和收費(fèi)標(biāo)準(zhǔn)多樣化,許多同學(xué)希望大學(xué)生自選寢室不僅是住在房間里面,而且是“為了找到志同道合者”的室友共同度過大學(xué)美好的時(shí)光?!叭绾文茏寣W(xué)生根據(jù)自己的情況選擇自己滿意的公寓和室友”是現(xiàn)階段熱門的話題。
目前,由于國外大部分是學(xué)生自行租房而且學(xué)校能夠提供的公寓很少,所以沒有可以借鑒的運(yùn)行模式和相應(yīng)的軟件。在國內(nèi),2013年以前,由于高校管理觀念等諸多問題,也沒有相關(guān)研究課題。隨著管理觀念的轉(zhuǎn)變,從2013年開始,溫州大學(xué)城市學(xué)院首次啟用“新生網(wǎng)上自選寢室系統(tǒng)”,新生可提出“有無早起午睡晚睡習(xí)慣”、“電腦使用時(shí)間”、“個(gè)人衛(wèi)生”、“興趣愛好”等要求,通過網(wǎng)絡(luò)自主選擇寢室和室友。隨后的幾年期間,四川電子科技大學(xué)、中國傳媒大學(xué)、華中師范大學(xué)、西北大學(xué)、電子科技大學(xué)、華中科技大學(xué)等高校陸續(xù)加入自研自制的行列,根據(jù)自己學(xué)校的實(shí)際情況,推出了根據(jù)學(xué)校自身需求相應(yīng)的新生宿舍自選系統(tǒng)。但是,當(dāng)前各個(gè)學(xué)校的新生宿舍自選系統(tǒng)都是根據(jù)學(xué)校自己管理模式、迎新流程、管理制度和相應(yīng)的宿舍管理制度等, 采取“私人定制”方式開發(fā)相應(yīng)的新生宿舍自選系統(tǒng),該系統(tǒng)還要與學(xué)校信息化各個(gè)子系統(tǒng)采取對接模式運(yùn)行,故該軟件在自己學(xué)校運(yùn)行沒有問題,但遷移到其他學(xué)校就可能存在諸多問題。
2基于隱語義推薦算法在新生公寓自選系統(tǒng)的設(shè)計(jì)
2.1推薦算法
自推薦系統(tǒng)出現(xiàn)以來,有很多學(xué)者或?qū)iT的研究人員致力于提高推薦的精確度,因此提出了很多優(yōu)秀的推薦算法,其中基于鄰域的算法是推薦系統(tǒng)中最基本的算法,該算法不僅在業(yè)界得到了廣泛應(yīng)用?;卩徲虻乃惴ǚ譃閮纱箢?,一類是基于用戶的協(xié)同過濾算法,令一類是基于物品的協(xié)同過濾算法。而從實(shí)際的應(yīng)用中表現(xiàn)來看,基于用戶的協(xié)同過濾推薦具有時(shí)效性,可以在短時(shí)間內(nèi)準(zhǔn)確的提供精確的推薦,而基于物品的協(xié)同過濾算法則需要不斷的收集用戶的歷史行為才能不斷的提高精確度從而完成準(zhǔn)確的推薦。
2.2基于用戶的協(xié)同過濾推薦算法
2.2.1基本概念
協(xié)同過濾推薦算法通過分析目標(biāo)用戶興趣,找到與其相似的用戶集合,將相似用戶集中的對象推薦給目標(biāo)用戶。在基于內(nèi)存的協(xié)同過濾中,按照過濾對象的不同,又分為基于用戶的協(xié)同過濾和基于項(xiàng)目的協(xié)同過濾。基于用戶的協(xié)同過濾推薦算法的流程分為3個(gè)階段:
(1)用戶行為數(shù)據(jù)的收集:將用戶過去的行為用一個(gè)m*n的矩陣R來表示,其中rab表示用戶a對物品b的評分;
(2)用戶相似對象集的建立(用戶鄰居的建立):通過用戶對物品的評分?jǐn)?shù)據(jù),計(jì)算出與目標(biāo)用戶相似的用戶集,稱之為鄰居用戶;
(3)產(chǎn)生推薦:從相似用戶集已評分的物品中選擇評分較高的物品推薦給目標(biāo)用戶。
2.2.2應(yīng)用設(shè)計(jì)
下面詳細(xì)介紹該算法在新生公寓自選系統(tǒng)中的設(shè)計(jì)思路。首先,前端需要收集有關(guān)學(xué)生興趣的信息,并將信息轉(zhuǎn)化為學(xué)生興趣-矩陣,假設(shè)收集到的數(shù)據(jù)為:目標(biāo)學(xué)生A對活動(dòng)A和D感興趣,學(xué)生B對活動(dòng)B和D感興趣,學(xué)生C對活動(dòng)A,D和C感興趣。通過相似度計(jì)算,將學(xué)生C作為學(xué)生A的鄰居,最后可以將學(xué)生C所在的寢室推薦給目標(biāo)學(xué)生A。
算法的具體流程為:
(1)學(xué)生對活動(dòng)評分?jǐn)?shù)據(jù)的收集。
在學(xué)生選擇床位之前,讓學(xué)生填寫個(gè)人興趣愛好以收集學(xué)生的信息,收集到學(xué)生對各種活動(dòng)的評分?jǐn)?shù)據(jù)后,要將其用一個(gè)m*n的矩陣R來表示,即學(xué)生-興趣矩陣。矩陣R中的行和列分別表示學(xué)生和興趣,R_ab表示學(xué)生a對活動(dòng)b的評分。評分可以是一個(gè)范圍內(nèi)的值,比如0至5,不同的數(shù)值代表著學(xué)生對活動(dòng)的喜好程度;也可以是0或1,表示學(xué)生喜歡或不喜歡該活動(dòng)。
(2)學(xué)生相似對象集的建立。
通常情況下需要找到與目標(biāo)學(xué)生最相似的k個(gè)學(xué)生。將目標(biāo)學(xué)生與所有的其他學(xué)生進(jìn)行相似度計(jì)算,比較目標(biāo)學(xué)生與其他學(xué)生的相似度,將前k個(gè)學(xué)生作為目標(biāo)學(xué)生的最近鄰居。協(xié)同過濾算法中計(jì)算相似度的方法有很多,其中皮爾遜相關(guān)系數(shù)、余弦相似度較為常用 。
皮爾遜相似系數(shù):用Ia表示學(xué)生a評分過的活動(dòng),即學(xué)生-興趣矩陣中第a行的非0項(xiàng),用表Ib示學(xué)生b評價(jià)過的活動(dòng),即學(xué)生-興趣矩陣中第b行的非0項(xiàng)。使用Iab表示學(xué)生a和學(xué)生b評價(jià)過的所有活動(dòng)的交集。
余弦相似性:使用該學(xué)生對所有活動(dòng)的評分來代表學(xué)生的偏好。對于未評分的活動(dòng),一般將其評分設(shè)置為0,填充該向量。則每個(gè)學(xué)生可以用一個(gè)長度為n的向量表示。
利用上面的相似度計(jì)算公式,就可以得到學(xué)生之間的相似性矩陣:
得到學(xué)生之間的相似度之后,就可以找到與目標(biāo)學(xué)生最相似的k個(gè)學(xué)生,然后將相似度從高到底排序,并從數(shù)據(jù)庫中查找這些學(xué)生所在的寢室,將這些寢室推薦給目標(biāo)學(xué)生。
這就是推薦系統(tǒng)應(yīng)用在新生公寓自選系統(tǒng)中的基本思路,為了提高系統(tǒng)的靈活性,可以不用強(qiáng)制填寫所有的興趣愛好。但這個(gè)時(shí)候會造成學(xué)生-興趣評分矩陣稀疏,如果評分的值只有0和1的話,那么可以將空缺的值填補(bǔ)為0。但是如果評分的值是一個(gè)范圍的話,就不能簡單的填寫一個(gè)值代替。為了解決這個(gè)問題,提出了在系統(tǒng)中加入隱語義模型,下面介紹隱語義模型的基本思路以及在系統(tǒng)中的應(yīng)用思想。
3基于隱語義模型的推薦算法在新生公寓自選系統(tǒng)中的應(yīng)用
3.1整體架構(gòu)
新生公寓自選系統(tǒng)的基本流程為,首先學(xué)生登錄系統(tǒng),如果是第一次登錄的話就會填寫一份調(diào)查問卷,主要是獲取該學(xué)生興趣愛好相關(guān)信息,然后根據(jù)該學(xué)生填寫的數(shù)據(jù),用推薦系統(tǒng)計(jì)算出與該生相似的學(xué)生,如果存在的話,則將那些學(xué)生所在的寢室推薦給該學(xué)生,否則就不推薦。系統(tǒng)的具體流程如圖1。
3.2系統(tǒng)應(yīng)用
前面已經(jīng)介紹了新生公寓自選系統(tǒng)的基本工作流程,推薦算法主要工作在選房頁面給目標(biāo)學(xué)生推薦寢室的這一環(huán)節(jié),前端獲取到該學(xué)生的興趣數(shù)據(jù)后,與已經(jīng)填寫后的學(xué)生一起構(gòu)成學(xué)生-興趣矩陣,然后使用算法對該矩陣進(jìn)行處理,找出與目標(biāo)學(xué)生相似的學(xué)生,然后從數(shù)據(jù)庫中查詢相似學(xué)生所在的寢室,從而推薦給目標(biāo)學(xué)生,推薦算法在新生公寓自選系統(tǒng)中應(yīng)用的具體流程如圖2。
首先,學(xué)生用戶填寫前端的調(diào)查問卷,該問卷主要是讓學(xué)生選擇其對各種活動(dòng)的感興趣程度,分為1到5共五個(gè)等級,其中5表示非常感興趣,1表示非常不感興趣。收集到該學(xué)生的興趣愛好情況后,就會和以前收集到的其他的學(xué)生的興趣愛好信息放在一起形成學(xué)生-興趣愛好矩陣。得到興趣-愛好矩陣后,對矩陣進(jìn)行分解,然后使用梯度下降最小化誤差,最后得到一個(gè)新的稠密的學(xué)生-興趣矩陣,使用這個(gè)矩陣,計(jì)算當(dāng)前學(xué)生與其他學(xué)生之間的相似度,得到與當(dāng)前學(xué)生最相似的k個(gè)學(xué)生,在數(shù)據(jù)庫中查詢這k個(gè)學(xué)生所在的寢室,將這些寢室推薦給當(dāng)前學(xué)生。
4系統(tǒng)評測
由于在新生公寓自選系統(tǒng)中使用的推薦方法和傳統(tǒng)的基于用戶的協(xié)同過濾推薦算法不同,因?yàn)樵谛律⒆赃x系統(tǒng)中只計(jì)算了學(xué)生與學(xué)生之間的相似度,并沒有像協(xié)同過濾推薦那樣給用戶推薦產(chǎn)品,因此沒有合適的直接對系統(tǒng)的評測方法,只能使用傳統(tǒng)的對基于用戶的協(xié)同過濾推薦算法的評測方法。評測推薦系統(tǒng)的方法有很多,最常用的是準(zhǔn)確率、回歸率、覆蓋率和流行度,下面是使用這四個(gè)指標(biāo)對推薦算法的評測(見圖3):
以上列出了基于用戶的協(xié)同過濾算法和基于LFM算法的準(zhǔn)確率、覆蓋率、召回率、流行度,在N超過10的時(shí)候準(zhǔn)確度超過了20,為一般情況下的標(biāo)準(zhǔn)準(zhǔn)確率。
5結(jié)束語
本文主要介紹了基于用戶的協(xié)同過濾算法以及隱語義模型在新生公寓自選系統(tǒng)中的應(yīng)用,簡單介紹了基于用戶的協(xié)同過濾推薦算法和隱語義模型的基本概念,然后詳細(xì)介紹了該算法在系統(tǒng)中的設(shè)計(jì)思想和應(yīng)用,并用MovieLens數(shù)據(jù)集對算法進(jìn)行評價(jià),其準(zhǔn)確率達(dá)到了推薦系統(tǒng)的平均以上的水平,效果顯著。
參考文獻(xiàn)
[1] 范玉強(qiáng).基于隱語義模型的推薦系統(tǒng)研究[D].貴陽:貴州大學(xué),2016.
[2] 魯凱.基于協(xié)同過濾音樂推薦研究[D].北京:中國科學(xué)院大學(xué),2012.
[3] 項(xiàng)亮.推薦系統(tǒng)實(shí)踐[M].人民郵電出版社,2012.