摘? 要:高校畢業(yè)生就業(yè)形勢(shì)嚴(yán)峻、競(jìng)爭(zhēng)異常激烈?!熬蜆I(yè)難”源于畢業(yè)生對(duì)于企業(yè)需求認(rèn)識(shí)不足和對(duì)自我的認(rèn)知不足,所以很多時(shí)候只能找一個(gè)專業(yè)不對(duì)口又不感興趣的工作,而企業(yè)又出現(xiàn)的“招人難”的現(xiàn)象,又造成了畢業(yè)生和企業(yè)雙方的損耗。協(xié)同過(guò)濾算法的個(gè)性化就業(yè)推薦系統(tǒng),能夠通過(guò)挖掘?qū)W生的興趣愛(ài)好、職業(yè)導(dǎo)向等多重信息,從而生成學(xué)生就業(yè)興趣模型,同時(shí)結(jié)合以往畢業(yè)生就業(yè)數(shù)據(jù),為畢業(yè)生提供適合自身的就業(yè)推薦導(dǎo)向。本文重點(diǎn)介紹了基于協(xié)同過(guò)濾算法的就業(yè)推薦概念及基于協(xié)同過(guò)濾算法實(shí)現(xiàn)高校個(gè)性化就業(yè)推薦系統(tǒng)是如何開發(fā)設(shè)計(jì)的。
關(guān)鍵詞:協(xié)同過(guò)濾算法;高校畢業(yè)生;個(gè)性化就業(yè)推薦系統(tǒng)
中圖分類號(hào):TP391.3? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):2096-4706(2019)15-0010-03
Research on Personalized Employment Recommendation System in
Colleges Based on Collaborative Filtering Algorithms
LIU Yan
(Software College of Hunan Vocational College of Science and Technology, Changsha? 410118,China)
Abstract:The employment situation of college graduates is severe and the competition is fierce. “difficult employment” is due to the lack of awareness of the needs of enterprises and self-awareness of graduates,so many times they can only find a job that is not suitable for your major? and not interesting ,and the phenomenon of “difficult recruitment” appears in enterprises,which results in the loss of both graduates and enterprises. Through the personalized employment recommendation system based on collaborative filtering algorithm,the model of students’interest in employment can be generated by mining multiple information such as students’interests,career orientation and so on. At the same time,combined with previous graduate employment data,it can provide graduates with suitable employment recommendation guidance. This paper focuses on the concept of employment recommendation based on collaborative filtering algorithm and how to develop and design the personalized employment recommendation system based on collaborative filtering algorithm.
Keywords:collaborative filtering algorithm;college graduates;personalized employment recommendation system
0? 引? 言
據(jù)統(tǒng)計(jì),2018年全國(guó)普通高校畢業(yè)生人數(shù)將近820萬(wàn)人,高校畢業(yè)生數(shù)量從2001年的114萬(wàn)增長(zhǎng)到2018年的820萬(wàn),主要緣于教育改革實(shí)行過(guò)后,高校的大規(guī)模擴(kuò)招。畢業(yè)生人數(shù)的不斷增加使得大學(xué)生的就業(yè)壓力年年增大,很多高校畢業(yè)生找不到工作,時(shí)時(shí)刻刻喊著“就業(yè)難”,同時(shí)企業(yè)卻出現(xiàn)了招不到可用人才的境遇。“就業(yè)難”一方面是因?yàn)槿瞬刨|(zhì)量培養(yǎng)質(zhì)量的下降和就業(yè)人數(shù)的不斷增加,另一方面則因?yàn)楫厴I(yè)生對(duì)于企業(yè)需求認(rèn)識(shí)不足和對(duì)自我的認(rèn)知不足。很多畢業(yè)生都存在著“高不成低不就”的現(xiàn)象,這使得就業(yè)難上加難。同時(shí),高校為了增加學(xué)生就業(yè)率,也積極為畢業(yè)生們開展就業(yè)指導(dǎo)、免費(fèi)為畢業(yè)生們提供雙選會(huì)招聘會(huì)等。但是在這個(gè)過(guò)程中,由于師資力量和專業(yè)水平等多方面的原因,高校的就業(yè)指導(dǎo)工作仍舊無(wú)法實(shí)現(xiàn)一對(duì)一的個(gè)性化推薦,所以畢業(yè)生們無(wú)法找到自己滿意的工作,而企業(yè)又找不到想要的人才。
互聯(lián)網(wǎng)的飛速發(fā)展和各種信息的爆炸式增長(zhǎng),使得人們?cè)絹?lái)越難以獲得有針對(duì)性的信息,在此基礎(chǔ)上個(gè)性化推薦系統(tǒng)應(yīng)運(yùn)而生。個(gè)性化推薦系統(tǒng)能快速幫助用戶在廣袤的信息海洋中尋找到有效信息,滿足用戶的個(gè)性化需求。這種個(gè)性化推薦系統(tǒng)無(wú)疑為高校畢業(yè)生的個(gè)性化就業(yè)推薦提供了有效的方法。每年的招聘信息數(shù)據(jù)和畢業(yè)生就業(yè)數(shù)據(jù)為高校畢業(yè)生的個(gè)性化就業(yè)推薦提供了大量信息支持。個(gè)性化就業(yè)推薦系統(tǒng)能夠通過(guò)挖掘?qū)W生的興趣愛(ài)好、職業(yè)導(dǎo)向等多重信息,從而生成學(xué)生就業(yè)興趣模型,同時(shí)結(jié)合以往畢業(yè)生的就業(yè)數(shù)據(jù),為應(yīng)屆畢業(yè)生提供適合自身的就業(yè)推薦導(dǎo)向。
1? 協(xié)同過(guò)濾推薦算法概述
個(gè)性化推薦系統(tǒng)中最核心的內(nèi)容是推薦算法模塊,常用的推薦算法有協(xié)同過(guò)濾算法、基于內(nèi)容的推薦算法、基于網(wǎng)絡(luò)結(jié)構(gòu)的推薦算法和混合推薦算法等,其中最為行之有效的就是協(xié)同過(guò)濾推薦算法。
協(xié)同過(guò)濾推薦(Collaborative Filtering Recommendation,簡(jiǎn)稱CFR)的概念是在1992年第一次提出來(lái)的,首次應(yīng)用于Tapestry系統(tǒng)。該方法主要是通過(guò)尋找相似度用戶為目標(biāo),根據(jù)用戶的喜好程度進(jìn)行預(yù)測(cè),協(xié)同過(guò)濾推薦在個(gè)性化、自動(dòng)化以及持久性等方面與之前方法相比都有了明顯提高。其計(jì)算原理為:利用用戶歷史數(shù)據(jù)判斷用戶的相似性,通過(guò)計(jì)算出來(lái)的相似性找到與用戶最相似的用戶集合,為用戶推薦喜歡的產(chǎn)品[1]。
1.1? 傳統(tǒng)的基于協(xié)同過(guò)濾算法的個(gè)性化就業(yè)推薦模型
采用協(xié)同過(guò)濾算法進(jìn)行個(gè)性化就業(yè)推薦,首先要建立畢業(yè)生就業(yè)模型,為了提高計(jì)算效率,縮小相似度的計(jì)算空間是重點(diǎn),本文采用K-means聚類對(duì)畢業(yè)生的就業(yè)選擇評(píng)分進(jìn)行分類,然后在各個(gè)分類中尋找評(píng)分相似的畢業(yè)生。
首先對(duì)數(shù)據(jù)模型進(jìn)行描述,構(gòu)造xy階矩陣,x代表畢業(yè)生數(shù),y代表不同類型的企業(yè)數(shù),R表示每個(gè)畢業(yè)生對(duì)不同類型企業(yè)的喜好評(píng)分合集,即R=(rij)xy,rij表示畢業(yè)生對(duì)不同類型企業(yè)的評(píng)分值,可以設(shè)定5級(jí)評(píng)分制(0級(jí)到4級(jí)),0表示不喜歡該企業(yè),4表示非常喜歡該企業(yè)。
其次對(duì)學(xué)生的評(píng)分進(jìn)行聚類,通過(guò)計(jì)算畢業(yè)生就業(yè)選擇評(píng)分,找出分?jǐn)?shù)相似的畢業(yè)生,在集合中選擇相似度最高的多個(gè)企業(yè)推薦給畢業(yè)生作為就業(yè)選擇。
1.2? 改進(jìn)的基于協(xié)同過(guò)濾算法的個(gè)性化就業(yè)推薦模型
高校畢業(yè)生的就業(yè)是一個(gè)雙向選擇問(wèn)題,傳統(tǒng)的基于協(xié)同過(guò)濾算法的個(gè)性化就業(yè)推薦模型雖然可以幫助畢業(yè)生更精準(zhǔn)的選擇適合自己的就業(yè)企業(yè),但是卻忽略了企業(yè)的擇人要求,因?yàn)楸疚奶岢龈倪M(jìn)的基于協(xié)同過(guò)濾算法的個(gè)性化就業(yè)推薦模型,個(gè)性化就業(yè)推薦模型不僅要考慮到畢業(yè)生的就業(yè)興趣和選擇,同時(shí)還要考慮企業(yè)的招聘需求和擇人標(biāo)準(zhǔn)。結(jié)合主客觀兩個(gè)方面來(lái)判斷畢業(yè)生的相似度,避免不相關(guān)的畢業(yè)生選擇對(duì)相似畢業(yè)生選擇的產(chǎn)生干擾,提高畢業(yè)生就業(yè)推薦系統(tǒng)的雙層次進(jìn)準(zhǔn)度。
2? 基于協(xié)同過(guò)濾算法實(shí)現(xiàn)高校個(gè)性化就業(yè)推薦系統(tǒng)研究
2.1? 推薦原理簡(jiǎn)述
實(shí)現(xiàn)高校畢業(yè)生個(gè)性化就業(yè)推薦的過(guò)程,其實(shí)就是要通過(guò)畢業(yè)生的個(gè)人興趣愛(ài)好、所學(xué)專業(yè)等因素找到和企業(yè)的具體需求相似度高的企業(yè)。所以基于高校本身往屆畢業(yè)生的數(shù)據(jù),采用相似性傳遞原理,首先找到與應(yīng)屆畢業(yè)生最為相似的往屆畢業(yè)生,然后把他們做一對(duì)一或一對(duì)多的對(duì)應(yīng),形成對(duì)應(yīng)集,把往屆畢業(yè)生選擇的企業(yè)推薦給應(yīng)屆畢業(yè)生,這樣建立起應(yīng)屆畢業(yè)生和企業(yè)之間的相似關(guān)系。例如,畢業(yè)生A和畢業(yè)生B相似,那么畢業(yè)生B喜歡的單位畢業(yè)生A很有可能會(huì)喜歡,畢業(yè)生B選擇的企業(yè)選擇畢業(yè)生A的機(jī)會(huì)也會(huì)更大,如圖1所示,相似畢業(yè)生的個(gè)性化就業(yè)推薦模型。
2.2? 基于協(xié)同過(guò)濾算法的高校個(gè)性化就業(yè)推薦系統(tǒng)用戶模型塑造
基于協(xié)同過(guò)濾算法的高校個(gè)性化就業(yè)推薦系統(tǒng)面向的對(duì)象是高校畢業(yè)生,而推薦系統(tǒng)的使用者主要是高?;蛘咂髽I(yè)人事或招聘網(wǎng)站。在系統(tǒng)的應(yīng)用目標(biāo)方面,高校主要是為了根據(jù)畢業(yè)生的特點(diǎn)為其推薦合適的崗位,增加就業(yè)率。企業(yè)人事或招聘網(wǎng)站主要是為了通過(guò)對(duì)往屆畢業(yè)生的招聘經(jīng)驗(yàn),找到最合適其工作崗位的應(yīng)屆畢業(yè)生。因而系統(tǒng)的第一步就是要塑造畢業(yè)生用戶模型,也就是要對(duì)畢業(yè)生的就業(yè)特征進(jìn)行提取。
2.2.1? 畢業(yè)生信息提取
首先是畢業(yè)生基本信息的提取,基本信息主要包括畢業(yè)生的性別、身高、體重等,這些信息的獲取可以從學(xué)生的畢業(yè)檔案中提取,收集畢業(yè)生基本信息是很重要的,因?yàn)楹芏鄭徫粚?duì)員工的自然情況是有一定要求的。
其次是影響畢業(yè)生就業(yè)選擇的其他因素,包括個(gè)人層面、家庭層面、學(xué)校層面和社會(huì)影響層面。個(gè)人層面,包括學(xué)生的專業(yè)、學(xué)歷、興趣愛(ài)好、生源地等;家庭層面包括父母的社會(huì)地位、經(jīng)濟(jì)狀況等因素;學(xué)校層面包括學(xué)校所以地、學(xué)校整理影響力、科研水平和課程體系等;社會(huì)影響層面包括社會(huì)法規(guī)、就業(yè)政策、落戶政策,人才市場(chǎng)需求等因素。
2.2.2? 畢業(yè)生就業(yè)特征權(quán)重值
權(quán)重值在算法中起到重要作用,因?yàn)槟軌蛟诋厴I(yè)生就業(yè)中起到作用的因素的重要性,并不是相同的,而是要有所側(cè)重的。可以從多個(gè)角度進(jìn)行分析與設(shè)計(jì),從企業(yè)人事或招聘網(wǎng)站角度來(lái)說(shuō),他們往往側(cè)重于學(xué)生的某幾項(xiàng)技能,因此這某幾項(xiàng)技能的權(quán)重值要相應(yīng)地有所增大,進(jìn)而實(shí)現(xiàn)企業(yè)用人的精準(zhǔn)化[2]。從學(xué)生角度來(lái)說(shuō),學(xué)生在學(xué)習(xí)和成長(zhǎng)過(guò)程中興趣愛(ài)好與就業(yè)取向是會(huì)發(fā)生變化的,從就業(yè)取向方面來(lái)說(shuō),新變化的往往才是學(xué)生目前真正想從事的工作,所以相對(duì)陳舊的就業(yè)意圖,重要性權(quán)重值設(shè)計(jì)時(shí)要高很多,才能真正體現(xiàn)學(xué)生的就業(yè)想法[3]。
2.3? 基于協(xié)同過(guò)濾算法的高校個(gè)性化就業(yè)推薦系統(tǒng)用戶模型的實(shí)現(xiàn)
根據(jù)畢業(yè)生信息的提取、就業(yè)特征權(quán)重值的推算辦法和K-means聚類法,構(gòu)建基于畢業(yè)生特征的協(xié)同過(guò)濾推薦算法,用X={X1,X2,…,Xn}代表往屆畢業(yè)生和應(yīng)屆畢業(yè)生的就業(yè)特征向量,Y={Y1,Y2,…,Yn}代表往屆畢業(yè)生和應(yīng)屆畢業(yè)生的就業(yè)興趣評(píng)分向量。然后對(duì)所有往屆畢業(yè)生的就業(yè)特征向量進(jìn)行聚類分析,直到最后聚類中心不變動(dòng)。隨后輸入每位應(yīng)屆畢業(yè)生的就業(yè)特征向量和就業(yè)興趣向量,找出計(jì)算得出的最小值對(duì)應(yīng)的聚類中心,那么應(yīng)屆畢業(yè)生就屬于這一類。這樣根據(jù)設(shè)定的推薦企業(yè)或推薦崗位把最相似的往屆畢業(yè)生的工作單位推薦給應(yīng)屆畢業(yè)生,實(shí)現(xiàn)基于協(xié)同過(guò)濾算法的高校個(gè)性化就業(yè)推薦。
3? 結(jié)? 論
對(duì)基于協(xié)同過(guò)濾算法的高校個(gè)性化就業(yè)推薦系統(tǒng)的研究,可以解決高校畢業(yè)生盲目就業(yè),招聘企業(yè)盲目招聘等問(wèn)題,它可以根據(jù)畢業(yè)生的興趣愛(ài)好、專業(yè)方向等實(shí)現(xiàn)畢業(yè)生的精準(zhǔn)就業(yè),也可以為招聘企業(yè)精準(zhǔn)招聘提供有力的依據(jù)。然而,一個(gè)系統(tǒng)的實(shí)現(xiàn)涉及到多領(lǐng)域多方面的知識(shí)點(diǎn),一個(gè)算法的實(shí)現(xiàn)和優(yōu)化也需要結(jié)合多領(lǐng)域多方面的知識(shí)點(diǎn)進(jìn)行研究和探討。在基于協(xié)同過(guò)濾算法的高校個(gè)性化就業(yè)推薦系統(tǒng)的實(shí)現(xiàn)過(guò)程中,還需要不斷的深入研究,以提升該模型的精準(zhǔn)度和實(shí)用性[4]。同時(shí),一個(gè)系統(tǒng)經(jīng)過(guò)設(shè)計(jì)與實(shí)現(xiàn)并不足以完全具備準(zhǔn)確性,還要經(jīng)過(guò)后期的測(cè)試和不斷地應(yīng)用,在應(yīng)用中不斷改進(jìn)和提升。
參考文獻(xiàn):
[1] 揭正梅.基于協(xié)同過(guò)濾的高校個(gè)性化就業(yè)推薦系統(tǒng)研究 [D].昆明:昆明理工大學(xué),2015.
[2] 隋占麗,李文,李影,等.面向大學(xué)生就業(yè)的協(xié)同過(guò)濾推薦算法與推薦系統(tǒng)研究 [J].山東農(nóng)業(yè)工程學(xué)院學(xué)報(bào),2017,34(4):3-4.
[3] 曹紅姣.基于情境感知的大學(xué)生就業(yè)推薦系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn) [D].武漢:華中師范大學(xué),2014.
[4] 郭韋昱.基于用戶行為分析的個(gè)性化推薦系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn) [D].南京:南京大學(xué),2012.
作者簡(jiǎn)介:劉艷(1982-),女,漢族,湖南長(zhǎng)沙人,講師,碩士,研究方向:移動(dòng)應(yīng)用、大數(shù)據(jù)。