金暉 譚文斌
摘? ?要:為解決準(zhǔn)大學(xué)生和在校大學(xué)生職業(yè)定位不清晰的問(wèn)題,文章提出了一種基于關(guān)聯(lián)規(guī)則的職業(yè)定位推理算法。通過(guò)對(duì)大學(xué)生個(gè)人性格特征、興趣愛(ài)好、特長(zhǎng)及知識(shí)結(jié)構(gòu)的職業(yè)定位推理計(jì)算,推理出準(zhǔn)大學(xué)生和在校大學(xué)生可能的職業(yè)方向,有效實(shí)現(xiàn)了對(duì)用戶職業(yè)定位的推理,有助于準(zhǔn)大學(xué)生和在校大學(xué)生及時(shí)找到自己的職業(yè)定位,明確發(fā)展方向。
關(guān)鍵詞:職業(yè)定位;關(guān)聯(lián)規(guī)則;性格特征;數(shù)據(jù)挖掘
當(dāng)前,隨著大學(xué)生人數(shù)的逐年增加,大學(xué)生的就業(yè)形勢(shì)也變得日趨嚴(yán)峻,每年的應(yīng)屆大學(xué)畢業(yè)生人數(shù)超過(guò)700萬(wàn)。本文對(duì)此作了大量的調(diào)查和研究[1-5],調(diào)查結(jié)果顯示,超過(guò)20%的大學(xué)生沒(méi)有自己的職業(yè)規(guī)劃,16%的大學(xué)生不清楚自己適合做什么工作、將來(lái)能做什么工作,7%的大學(xué)生在虛度光陰,對(duì)就業(yè)前景感到迷茫。對(duì)此,本文依托大數(shù)據(jù)分析技術(shù),提出了基于關(guān)聯(lián)規(guī)則的職業(yè)定位推理算法,構(gòu)建了推理模型,擬通過(guò)對(duì)大學(xué)生個(gè)人性格特征、興趣愛(ài)好、特長(zhǎng)以及知識(shí)結(jié)構(gòu)等數(shù)據(jù)的分析,推理出適合該大學(xué)生的職業(yè)發(fā)展方向。
近年來(lái),在基于關(guān)聯(lián)規(guī)則的數(shù)據(jù)挖掘方面,部分學(xué)者對(duì)此作了研究。王玲[6]提出了基于多維時(shí)態(tài)的關(guān)聯(lián)規(guī)則推理算法,實(shí)現(xiàn)了對(duì)時(shí)間序列的定量預(yù)測(cè)。亓文娟[7]提出了基于Apriori算法的航空設(shè)備故障關(guān)聯(lián)分析方法,以助于航空設(shè)備故障分析。劉莉萍[8]對(duì)增量式關(guān)聯(lián)規(guī)則挖掘算法進(jìn)行了研究,提出了提取頻繁項(xiàng)集的方法。陳秀秀[9]對(duì)基于Spark的并行關(guān)聯(lián)規(guī)則挖掘算法進(jìn)行了分類(lèi)和綜述,對(duì)并行關(guān)聯(lián)規(guī)則等算法的優(yōu)缺點(diǎn)和適用范圍進(jìn)行了總結(jié),以上研究為本文的研究工作提供了參考。
1? ? 職業(yè)定位推理算法的相關(guān)定義
基于上述分析,本文將重新構(gòu)建評(píng)論語(yǔ)句的相似度計(jì)算模型,為便于描述,本文對(duì)相關(guān)概念作如下定義。
定義1:個(gè)人性格特征和興趣集合Charac={CN,N=1,2,3,…},CN表示集合C中第N個(gè)特征。
定義2:職業(yè)集合Prof={PM,M=1,2,3,…},PM表示集合P中第M個(gè)職業(yè)。
定義3:設(shè)定集合X和集合Y,x屬于X中的元素,y屬于Y中的元素,X集合是由CN及其推理出來(lái)的結(jié)果集組成,Y集合是由PM及其推理出來(lái)的結(jié)果集組成。
定義4:規(guī)則集合R={RK,K=1,2,3,…},RK表示集合R中第K個(gè)規(guī)則,用表達(dá)式表示為XKYK。
定義5:最小支持度為S,表示集合X中的x和集合Y中的y同時(shí)存在的記錄數(shù)Count(x∪y)占記錄總數(shù)N的比例。通過(guò)該參數(shù)來(lái)反映所推理規(guī)則的有用性,其計(jì)算公式如式(1)所示:
S=Support(x→y)=Count(x∪y)/N? ? ?(1)
定義6:置信度Conf,表示集合X中的x和集合Y中的y同時(shí)存在的記錄數(shù)Count(x∪y)與集合X的總數(shù)Count(X)之比,其計(jì)算公式為:
Conf=Confidence(x→y)=Count(x∪y)/Count(X)? ? (2)
定義7:固定推理路徑集合I={IM,M=1,2,3,…},IM表示集合I中第M個(gè)固定規(guī)則,該規(guī)則集合中的元素滿足任意一個(gè)規(guī)則都具備滿足最小支持度S和最小置信度Conf,該規(guī)則為人工添加,通過(guò)查閱資料和統(tǒng)計(jì)數(shù)據(jù)獲得。
基于上述定義,對(duì)用戶輸入的特征及興趣集合C,將進(jìn)行職業(yè)定位算法運(yùn)算,以得到職業(yè)PM。
2? ? 算法描述
職業(yè)定位推理算法首先根據(jù)用戶輸入的性格和興趣特征描述,將其與規(guī)則庫(kù)里面的規(guī)則進(jìn)行匹配,推理出可能的職業(yè)定位方向,現(xiàn)將職業(yè)定位推理算法描述如下。
(1)讀取用戶個(gè)人性格特征和興趣數(shù)據(jù)集,得到集合C。
(2)根據(jù)步驟(1)中得到的數(shù)據(jù)集合,與集合R和I中的關(guān)聯(lián)規(guī)則進(jìn)行匹配和推理,得出用戶可能的職業(yè)方向,以供用戶選擇。
(3)根據(jù)步驟(2)中得到的可能職業(yè)方向,梳理出為實(shí)現(xiàn)該目標(biāo)所需要的知識(shí)和技能,以告知用戶實(shí)現(xiàn)各目標(biāo)的有效路徑。
基于以上描述,算法流程如下:
算法:職業(yè)定位算法
Input:個(gè)人性格特征和興趣集合Charac
Output:可能的職業(yè)方向
DEFINE? ?MID_SET
SCANF? Charac={CN,N=1,2,3,…}? ? //用戶輸入特征描述
FOR CN OR Characsubset? IN? Charac:
FOR? i? IN? R∪I:? ?//其中R={RK,K=1,2,3,…},I={IM,M=1,2,3,…}
IF? ?i? ?Matched? CN:
MID_SET? ?ADD? ?i
ENDIF
ENDFOR
ENDFOR
FOR? m? in? ?MID_SET:
EXTRACT END of m INTO? RESULT_SET
ENDFOR
Output? ?RESULT_SET
END
通過(guò)對(duì)用戶性格特征和興趣數(shù)據(jù)集的推理,實(shí)現(xiàn)對(duì)用戶職業(yè)方向的定位。
3? ? 算法實(shí)例
當(dāng)用戶輸入{待遇好、時(shí)間自由、喜歡編程、工作強(qiáng)度較大、數(shù)學(xué)較好}信息后,根據(jù)用戶輸入進(jìn)行推理,得到的結(jié)果如圖1所示,得出用戶可能的職業(yè)是技術(shù)工程師中的軟件開(kāi)發(fā)工作。
4? ? 結(jié)語(yǔ)
本文對(duì)關(guān)聯(lián)規(guī)則算法進(jìn)行了改進(jìn),通過(guò)查閱資料和統(tǒng)計(jì)數(shù)據(jù)獲得部分固定規(guī)則,共同組成了關(guān)聯(lián)規(guī)則集合,在此基礎(chǔ)上,構(gòu)建了職業(yè)定位算法。通過(guò)對(duì)用戶輸入的數(shù)據(jù)進(jìn)行推理,查找出用戶可能的職業(yè)方向,有效實(shí)現(xiàn)了對(duì)用戶職業(yè)定位的推理,有助于準(zhǔn)大學(xué)生和在校大學(xué)生及時(shí)找到自己的職業(yè)定位,明確發(fā)展方向。
[參考文獻(xiàn)]
[1]劉芷含.大學(xué)生就業(yè)壓力與主觀幸福感:雙向中介效應(yīng)[EB/OL].(2019-04-16)[2019-06-25].https://doi.org/10.16128/j.cnki.1005-3611.2019.02.034.
[2]張樹(shù)峰.當(dāng)前大學(xué)生就業(yè)問(wèn)題:外部環(huán)境變化與就業(yè)選擇理性[J].科教文匯,2019(4):7-8.
[3]李斯.新形勢(shì)下高校大學(xué)生創(chuàng)業(yè)孵化基地服務(wù)體系研究[J].河北軟件職業(yè)技術(shù)學(xué)院學(xué)報(bào),2019(1):30-32.
[4]賀娜.供給側(cè)改革視角下大學(xué)生就業(yè)競(jìng)爭(zhēng)力提升對(duì)策研究[J].黑河學(xué)刊,2019(2):12-14.
[5]吳長(zhǎng)城.“95后”高校畢業(yè)生就業(yè)壓力研究[J].信陽(yáng)農(nóng)林學(xué)院學(xué)報(bào),2019(1):145-148.
[6]王玲,孟建瑤,李俊飛,等.基于多維時(shí)態(tài)關(guān)聯(lián)規(guī)則的演化模糊推理預(yù)測(cè)算法[J].自動(dòng)化學(xué)報(bào),2018(8):1446-1459.
[7]亓文娟.增量式關(guān)聯(lián)規(guī)則挖掘算法的研究[J].安陽(yáng)工學(xué)院學(xué)報(bào),2018(6):47-49.
[8]劉莉萍,章新友,牛曉錄,等.基于Spark的并行關(guān)聯(lián)規(guī)則挖掘算法研究綜述[EB/OL].(2019-04-16)[2019-06-25].http://kns.cnki.net/kcms/detail/11.2127.TP.20190128.1804.009.html.
[9]陳秀秀,劉凱,馬雙濤,等.基于Apriori算法的航空設(shè)備故障關(guān)聯(lián)分析[J].山東師范大學(xué)學(xué)報(bào)(自然科學(xué)版),2019(1):48-53.
Research on reasoning algorithms of professional location based on association rules
Jin Hui, Tan Wenbin*
(Tongren University, Tongren 554300, China)
Abstract:In order to solve the problem of unclear career orientation of prospective and college students, a reasoning algorithm for career orientation based on association rules is proposed in this paper. By reasoning and calculating the career orientation of college students personality characteristics, hobbies, specialties and knowledge structure, the possible career orientation of prospective college students and college students can be inferred, and the reasoning of users career orientation can be effectively realized. It is helpful for prospective college students and college students to find their own career orientation in time and make clear the direction of development.
Key words:career orientation; association rules; personality characteristics; data mining