中圖分類(lèi)號(hào):TP393 文獻(xiàn)標(biāo)識(shí)碼:A DOI:10. 7535/hbkd. 2025yx03011
Multi-behavioral job recommendation integrating knowledge graph
LIU Bin 1,2 ,LEI Xiaoyu 1,2 ,LIU Gege 1,2 , ZHAN Shiyuan 1,2 ,GAO Xin 1,2, ,YANG Xiaoyan 1,2 (2 (1.School of Economicsand Management,Hebei Universityof Scienceand Technology,Shijiazhuang,Hebei O5oo18,China; 2. Research Center of Big Data and Social Computing,Hebei University of Science and Technology, Shijiazhuang,Hebei O50o18,China)
Abstract:Toimprove the accuracyof job recommendations,amulti-behavioral jobrecommendation integrating knowledge graph(MB-JRIKG)was proposed basedonthe implicit preference informationof both job seekers and recruiters inthe process of \"browsing job positions $$ submitting resumes $$ receiving feedback from recruiters\". This method constructed a knowledge graphof jobseeking basedonrealjobdata,andproposedamultibehaviorpreferencepropagationstrategybasedonpreference propagationtheory.\"Recruiterrecognition\"ineach stageof jobseekingwassetasthe targetbehavior,and theauxiliary behaviorsof job seekers browsing job positions and submiting resumes wereset tocomprehensively predict job seekers' preferences.Firstly,the user's historical records under diferent behaviors wereused as user-interested seed sets,and preference propagationwascarriedoutalong therelationshipsbetwee nodesinthe knowledgegraph toinfer theuser's potential preferences and enhanceuser representation;Then,the user representation vectorand positionrepresentatio vector were input intothe predictionfunction tocalculate the interactionprobabityof theuserundereach behaviortype,and the weightedsumwasusedastheinteractionprobabilityofthetargetbehavior.Finall,theclick-throughrateprediction experiment wasconductedusing thecompetition datasetof Alibaba'shuman job intellgent matching.Theresults showthat compared with the four benchmark models(MF,XGBost,KGCNandRippleNet),MB-JRIKG achievesa 0.014 5 improvementinAUCanda0.O288improvement in ACCover the sub optimal benchmark model RippleNet,verifying the effectivenessofthemodelandachievingfullutilizationofdata.Thismodelefectivelycombinestheinteractivebhaviorofboth parties seeking employmentfor recommendation,introduces atribute association of job knowledge graph,and has reference value for achieving personalized job recommendation.
Keywords:natural language procesing;jobrecommendation;knowledge graph;multiple behaviors;preference propagation
網(wǎng)絡(luò)招聘因其成本低、效率高、不受時(shí)空限制等特點(diǎn)而得到快速發(fā)展,相關(guān)平臺(tái)集聚了海量的簡(jiǎn)歷和職位信息,解決信息過(guò)載問(wèn)題、實(shí)現(xiàn)智能招聘是當(dāng)前的主要挑戰(zhàn)。推薦算法因其可以幫助用戶(hù)在海量?jī)?nèi)容中進(jìn)行高效遴選,提升了用戶(hù)體驗(yàn),從而廣泛應(yīng)用于電影[1]、音樂(lè)[2]、新聞資訊[3]、電商[4]等推薦場(chǎng)景,并成為產(chǎn)業(yè)界和學(xué)術(shù)界持續(xù)研究的重點(diǎn)領(lǐng)域。當(dāng)前主流的推薦算法主要包括基于協(xié)同過(guò)濾的推薦算法[5]、基于內(nèi)容的推薦算法[6]和混合推薦算法[7]。基于協(xié)同過(guò)濾的推薦算法能夠有效捕捉用戶(hù)偏好,并易于在多種場(chǎng)景下實(shí)現(xiàn),應(yīng)用較為廣泛。然而,數(shù)據(jù)稀疏性和冷啟動(dòng)問(wèn)題是推薦算法面臨的普遍性挑戰(zhàn),相關(guān)工作將背景信息融合進(jìn)推薦過(guò)程,如用戶(hù)-項(xiàng)目屬性[8]、社交網(wǎng)絡(luò)[9]等,并獲得了良好收益。知識(shí)圖譜作為一種以圖結(jié)構(gòu)表示的語(yǔ)義知識(shí)庫(kù),可以為推薦系統(tǒng)提供項(xiàng)目間豐富的語(yǔ)義信息和結(jié)構(gòu)關(guān)系,有助于挖掘其間的潛在聯(lián)系,提升推薦項(xiàng)目的有效性。
此外,與傳統(tǒng)的電商或社交推薦場(chǎng)景不同,求職者在網(wǎng)絡(luò)招聘平臺(tái)的求聘過(guò)程為“瀏覽崗位 -投遞簡(jiǎn)歷 -招聘者反饋”,求聘各環(huán)節(jié)行為存在遞進(jìn)關(guān)系,如該簡(jiǎn)歷和職位配對(duì)得到招聘者認(rèn)可的前提是求職者對(duì)該職位有瀏覽崗位并投遞簡(jiǎn)歷的行為。除了最終的目標(biāo)行為(招聘者認(rèn)可)外,其他輔助行為(瀏覽崗位、投遞簡(jiǎn)歷)的交互記錄同樣蘊(yùn)含著大量的求聘雙方偏好信息。然而,已有研究大多未考慮到求職者前序行為對(duì)后續(xù)求聘結(jié)果的影響。因此,本文將求聘各環(huán)節(jié)中“招聘者認(rèn)可\"視為目標(biāo)行為,求職者瀏覽崗位和投遞簡(jiǎn)歷視為輔助行為,綜合預(yù)測(cè)求職者的偏好。
基于以上思考,本文提出一種融合知識(shí)圖譜的多行為職位推薦模型(MB-JRIKG),利用職位知識(shí)圖譜作為輔助信息,緩解傳統(tǒng)推薦算法中的數(shù)據(jù)稀疏問(wèn)題,并提出多行為偏好傳播策略,在知識(shí)圖譜中傳播用戶(hù)的不同行為偏好以增強(qiáng)用戶(hù)表示。
1相關(guān)研究
1.1 職位推薦方法
推薦算法在職位推薦領(lǐng)域發(fā)展相對(duì)緩慢,大多數(shù)招聘網(wǎng)站采用的仍是傳統(tǒng)的協(xié)同過(guò)濾或基于內(nèi)容的推薦算法,所以推薦效果不盡如人意。隨著網(wǎng)絡(luò)招聘逐漸成為人力資源招聘的主要方式,越來(lái)越多的專(zhuān)家學(xué)者和技術(shù)人員開(kāi)始關(guān)注推薦算法在網(wǎng)絡(luò)招聘領(lǐng)域的研究。ALSAIF等[10使用自然語(yǔ)言處理技術(shù)來(lái)匹配簡(jiǎn)歷和職位描述之間的技能,以此來(lái)計(jì)算職位需求與求職者之間的相似性。YI等[1]采用了基于項(xiàng)目的協(xié)同過(guò)濾算法進(jìn)行職位推薦,并在偏好預(yù)測(cè)中加入了由職位描述計(jì)算的歷史投遞權(quán)重和由簡(jiǎn)歷信息計(jì)算的相似用戶(hù)權(quán)重2個(gè)影響因素。ZHOU等[12]首先對(duì)畢業(yè)生進(jìn)行群體劃分,然后根據(jù)群體的職位選擇記錄和畢業(yè)生對(duì)職位的偏好為畢業(yè)生推薦職位。丁健龍[13]建立了基于畫(huà)像的就業(yè)關(guān)聯(lián)知識(shí)庫(kù)的理論及方法體系,該體系由K -Means 聚類(lèi)算法構(gòu)建畫(huà)像、Apriori關(guān)聯(lián)規(guī)則算法獲取就業(yè)畫(huà)像關(guān)聯(lián)規(guī)則,并通過(guò)調(diào)用基于權(quán)重及興趣度模型的本體相容匹配算法實(shí)現(xiàn)就業(yè)推薦。張畫(huà)等[14]提出一種基于混合深度神經(jīng)網(wǎng)絡(luò)的就業(yè)推薦算法,將學(xué)生基本屬性、學(xué)生行為序列屬性、職業(yè)基本屬性、職業(yè)描述屬性的獨(dú)立嵌入作為模型輸入,使用多頭自注意力機(jī)制挖掘?qū)W生行為序列屬性與職業(yè)描述屬性中的序列特征。
1.2基于知識(shí)圖譜的推薦方法
知識(shí)圖譜是一種以異構(gòu)圖結(jié)構(gòu)表示的語(yǔ)義網(wǎng)絡(luò)知識(shí)庫(kù),通常以“頭實(shí)體-關(guān)系-尾實(shí)體\"或“實(shí)體-屬性-值”的三元組形式存在,可以存儲(chǔ)實(shí)體間的關(guān)系信息以及實(shí)體的屬性背景信息,在一定程度上能夠解決數(shù)據(jù)稀疏問(wèn)題,提高推薦準(zhǔn)確性和推薦結(jié)果可解釋性?;谥R(shí)圖譜的推薦方法主要包括:基于嵌人的方法[15]、基于路徑的方法[16]以及基于傳播的方法[17]。基于嵌入的方法將實(shí)體和關(guān)系表示為低維向量,進(jìn)而實(shí)現(xiàn)豐富語(yǔ)義信息的目的?;诼窂降姆椒ㄖ饕窃谥R(shí)圖譜中探索求職者和職位資源間的連通路徑,進(jìn)而預(yù)測(cè)其交互概率?;趥鞑サ姆椒ńY(jié)合了上述兩大思路,同時(shí)利用實(shí)體的語(yǔ)義信息以及路徑連接關(guān)系。RippleNet是第1個(gè)引人傳播概念的方法[18],該方法將每個(gè)用戶(hù)歷史交互過(guò)的實(shí)體作為種子集,沿著知識(shí)圖譜中的關(guān)系網(wǎng)絡(luò)擴(kuò)展用戶(hù)的潛在興趣。徐孟奇等[19]引人知識(shí)圖譜補(bǔ)全算法對(duì)RippleNet方法進(jìn)行改進(jìn),并應(yīng)用于人崗?fù)扑]系統(tǒng)上,證實(shí)了融合知識(shí)圖譜的思路可以取得較好的效果。
1.3 多行為推薦方法
多行為推薦方法充分利用了目標(biāo)行為以外的輔助行為,能夠更準(zhǔn)確地挖掘用戶(hù)的潛在偏好。早期的一些研究使用矩陣分解的方法從多種類(lèi)型的交互數(shù)據(jù)中挖掘用戶(hù)的潛在偏好。如DING等[20]引入了用戶(hù)瀏覽數(shù)據(jù),將瀏覽數(shù)據(jù)作為購(gòu)買(mǎi)和缺失數(shù)據(jù)之間的中間反饋。對(duì)購(gòu)買(mǎi)和瀏覽、瀏覽和未瀏覽交互之間的成對(duì)關(guān)系進(jìn)行建模,可以更好地區(qū)分用戶(hù)偏好。另一方面,研究者通常在訓(xùn)練時(shí)改進(jìn)采樣方法對(duì)模型進(jìn)行優(yōu)化,以充分利用多種類(lèi)型的交互數(shù)據(jù)。如LONI等[21]設(shè)計(jì)了一種擴(kuò)展的采樣方法,在訓(xùn)練時(shí)同時(shí)利用不同層次的單一類(lèi)型反饋,將不同層次的反饋映射到不同的級(jí)別,以反映每種類(lèi)型的反饋在訓(xùn)練階段的貢獻(xiàn)。近年來(lái),圖神經(jīng)網(wǎng)絡(luò)作為一種基于深度學(xué)習(xí)的圖表示技術(shù),在多行為推薦系統(tǒng)中顯現(xiàn)出優(yōu)越的性能。PENG等[22]提出了一種用于多行為推薦的注意力引導(dǎo)圖卷積網(wǎng)絡(luò)(MB-AGCN),利用注意力機(jī)制對(duì)用戶(hù)多行為關(guān)系進(jìn)行建模,并生成權(quán)重拒陣,指導(dǎo)圖神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)不同類(lèi)型用戶(hù)-項(xiàng)目交互中的復(fù)雜依賴(lài)關(guān)系,捕獲不同類(lèi)型行為之間的關(guān)系。XIA等[23]提出了一個(gè)圖神經(jīng)多行為增強(qiáng)推薦(GNMR)框架,探索了用戶(hù)-項(xiàng)目交互圖,通過(guò)設(shè)計(jì)一個(gè)關(guān)系聚合網(wǎng)絡(luò)來(lái)模擬用戶(hù)-項(xiàng)目交互的異質(zhì)性,以捕獲用戶(hù)多行為數(shù)據(jù)中的異構(gòu)協(xié)作信號(hào)。在求職招聘領(lǐng)域,SAITO等[24提出了動(dòng)態(tài)的多行為職位推薦模型(MBJ-DA),分為輔助行為學(xué)習(xí)模塊和目標(biāo)行為學(xué)習(xí)模塊,并提出了一種區(qū)分噪聲的方法。在后續(xù)研究中,,該學(xué)者又提出了一種同時(shí)使用輔助行為數(shù)據(jù)和用戶(hù)顯式偏好數(shù)據(jù)的職位推薦方法(JME),并利用知識(shí)圖譜嵌人方法學(xué)習(xí)求職者和職位的潛在表示[25]。
2 模型介紹
2.1 問(wèn)題描述
假設(shè) U={u1,u2,…} 和 I={i1,i2,…} 分別代表求職者和職位的集合, Y={Y1,…,Yn,…,YN} 表示求職者與職位以不同行為類(lèi)型交互的矩陣列表,其中 ?Γ?Γ)Γ?Γ)Γ?Γ)Γ?Γ) 為目標(biāo)行為的交互矩陣。具體來(lái)說(shuō), yuin 代表求職者 u 和職位i 在第 n 種行為類(lèi)型下的交互邊,若求職者 u 和職位 i 發(fā)生過(guò)交互, yuin=1 ,否則 ynui=0 。除了交互數(shù)據(jù)外,由大量實(shí)體-關(guān)系-實(shí)體三元組 (h,r,t) 組成的知識(shí)圖譜 G 也是提供求職者偏好信息的重要來(lái)源。知識(shí)圖譜可以定義為 G={(h,r,t)|h,t∈ε,r∈R} ,其中 ε 為招聘平臺(tái)數(shù)據(jù)集中選出的部分與職位相關(guān)的實(shí)體集合,其中包括職位、學(xué)歷、薪資等實(shí)體, R 是通過(guò)招聘平臺(tái)數(shù)據(jù)集構(gòu)造的12種關(guān)系集合。對(duì)于每個(gè)三元組 (h,r,t),h∈s,t∈s 和 r∈R 分別表示頭實(shí)體、尾實(shí)體和這兩個(gè)實(shí)體之間的關(guān)系。進(jìn)一步定義相關(guān)概念如下。
定義1(相關(guān)實(shí)體)給定某一行為類(lèi)型下的交互矩陣 Yn 和知識(shí)圖譜 G ,定義求職者 u 的 k 跳相關(guān)實(shí)體集合為
式中: Eu0(n)=Yun={i∣yuin=1} 是求職者 u 在第 n 種行為類(lèi)型下的歷史交互職位集合,也就是求職者 u 在知識(shí)圖譜中的種子集; H 為最大跳數(shù)。
給定相關(guān)實(shí)體的定義,定義求職者 u 的 k 跳偏好集合如下。
定義2(偏好集合)求職者 u 的 k 跳偏好集合定義為從 εu(k-1)(n) 開(kāi)始的知識(shí)三元組的集合:
Suk(n)={(h,r,t)∣(h,r,t)∈G
h∈Eu(k-1)(n)},k=1,2,…,H°
給定多行為交互集合 Y 和知識(shí)圖譜 G ,本文旨在對(duì)求職者 u 在目標(biāo)行為下與職位 i 發(fā)生交互的可能性進(jìn)行預(yù)測(cè)。目標(biāo)是學(xué)習(xí)一個(gè)預(yù)測(cè)函數(shù) ,其中
表示求職者 u 在目標(biāo)行為下與職位i發(fā)生交互的可能性, Θ 表示函數(shù) F 的模型參數(shù)。
2.2 模型框架
模型結(jié)構(gòu)如圖1所示,MB-JRIKG采用了水波網(wǎng)絡(luò)的傳播理念,將求職者瀏覽過(guò)、投遞過(guò)、被認(rèn)可過(guò)的職位作為種子集,在知識(shí)圖譜中擴(kuò)展這些不同的行為偏好,以此增強(qiáng)求職者特征表示。隨后,將求職者的多行為表示向量和職位表示向量輸入預(yù)測(cè)函數(shù)中,計(jì)算用戶(hù)在每個(gè)行為類(lèi)型下的交互概率,并加權(quán)求和進(jìn)而預(yù)測(cè)求職者對(duì)候選職位的目標(biāo)行為交互概率。
2.3 知識(shí)圖譜構(gòu)建
知識(shí)圖譜是由實(shí)體和關(guān)系組成的知識(shí)語(yǔ)義庫(kù),通常是以(頭實(shí)體-關(guān)系-尾實(shí)體)的三元組形式存在。知識(shí)圖譜分為通用知識(shí)圖譜與領(lǐng)域知識(shí)圖譜,應(yīng)用于求職招聘領(lǐng)域時(shí)可稱(chēng)為職位知識(shí)圖譜。本文采用自頂向下的構(gòu)建方式構(gòu)建職位知識(shí)圖譜,具體的構(gòu)建流程如圖2所示。
首先,構(gòu)建職位知識(shí)圖譜的模式層,定義求職領(lǐng)域的本體;其次,抽取職位知識(shí),對(duì)于學(xué)歷要求、薪資這類(lèi)結(jié)構(gòu)化數(shù)據(jù),可設(shè)計(jì)對(duì)應(yīng)的映射模板和規(guī)則,將數(shù)據(jù)映射為已定義的知識(shí)圖譜模式中的實(shí)體、關(guān)系或者屬性。對(duì)于崗位描述這一非結(jié)構(gòu)化數(shù)據(jù),則需要使用命名實(shí)體識(shí)別模型 BERT-BiLSTM-CRF進(jìn)行知識(shí)抽取,進(jìn)而完成三元組的構(gòu)建。最后,利用實(shí)體鏈接技術(shù),將抽取出的知識(shí)組織成知識(shí)圖譜的三元組形式,并利用 Neo4j圖數(shù)據(jù)庫(kù)進(jìn)行存儲(chǔ)。
2.4基于RippleNet的多行為偏好傳播
圖3給出了RippleNet模型[18]的偏好傳播過(guò)程,本文在其基礎(chǔ)上進(jìn)行改進(jìn),將單一行為偏好傳播擴(kuò)展為多行為偏好傳播?;赗ippleNet的多行為偏好傳播過(guò)程如下。
Stepl首先獲取求職者 u 在行為類(lèi)型 n 下的歷史職位作為種子節(jié)點(diǎn)。Step2創(chuàng)建求職者在行為類(lèi)型 n 下的相關(guān)實(shí)體以及偏好集合。Step3給定職位 i 的嵌人表示和求職者 u 在行為類(lèi)型 n 下的1跳偏好集合 Su1(n) ,職位 i 分別與 Su1(n) (2中的頭實(shí)體 hi 和關(guān)系 Ri 計(jì)算來(lái)為每一個(gè)三元組 (hi,ri,ti) 分配一個(gè)關(guān)聯(lián)概率 ?pi ,如式(3)所示。
Seeds Hop1 Hop2 HopH Knowledge graph 。 O . ripple setS1 ripple set S2 ripple set SH useru histrrick propagation (h,r)→t propagation (h,r)→t (h,r)→t itemv KD item weighted embedding average predicted Rh softmax t probability user embedding
其中 和 Ri 分別表示職位和關(guān)系嵌人。關(guān)聯(lián)概率 ?Pi 可以表示為職位 i 和實(shí)體 hi 在關(guān)系空間 Ri 中的相似程度。因?yàn)椴煌年P(guān)系會(huì)得到不同的相似性,故這里計(jì)算也包括關(guān)系 Ri 。
Step4得到關(guān)聯(lián)概率后,將其與 Su1(n) 中對(duì)應(yīng)的尾實(shí)體 ti 相乘來(lái)得到求職者對(duì)歷史職位交互的第1次響應(yīng) ,如式(4)所示。
Step5將每次的響應(yīng)組合起來(lái)得到求職者 u 的嵌入表示,如式(5)所示。
Step6結(jié)合求職者和職位的嵌人表示來(lái)計(jì)算求職者在行為類(lèi)型 n 下對(duì)職位的交互概率,如式(6)所示。
其中:
Step7重復(fù)以上步驟,計(jì)算求職者在每個(gè)行為類(lèi)型下的交互概率,加權(quán)求和得到目標(biāo)行為的交互概率,如式(8)所示。
MB-RPNT方法的偽代碼見(jiàn)算法1。
算法1融合知識(shí)圖譜的多行為職位推薦算法
輸入:求職者-職位多行為交互矩陣 Y ,職位知識(shí)圖譜 G
輸出:預(yù)測(cè)函數(shù)
1.初始化所有參數(shù)
2.計(jì)算每個(gè)求職者在不同交互行為下的偏好集合
3.for模型迭代次數(shù)do
4. 從交互矩陣 YN 中抽取正負(fù)樣本
5. 根據(jù)樣本中每個(gè)求職者的偏好集合從中抽取三元組 (hi,ri,ti)
6. 訓(xùn)練知識(shí)圖譜 G 中三元組的正負(fù)樣本
7. 通過(guò)梯度下降法更新 I,E,{R}r∈R
8.end for
9.return F(u,i,θ)
3實(shí)驗(yàn)設(shè)計(jì)
3.1 數(shù)據(jù)集介紹
本文使用的數(shù)據(jù)來(lái)自天池競(jìng)賽平臺(tái)舉辦的\"大數(shù)據(jù)智能云上編程大賽-人崗智能招聘挑戰(zhàn)賽\"(https://tianchi.aliyun.com/dataset/44080),競(jìng)賽中使用的職位和簡(jiǎn)歷數(shù)據(jù)均來(lái)自于真實(shí)數(shù)據(jù)。數(shù)據(jù)集包括求職者數(shù)據(jù)、職位數(shù)據(jù)和求職者與職位間的行為數(shù)據(jù),數(shù)據(jù)集包含的特征如表1所示。
原始數(shù)據(jù)包含4500條求職者數(shù)據(jù),269534條職位數(shù)據(jù),700938條行為數(shù)據(jù)。對(duì)數(shù)據(jù)集進(jìn)行去重、缺失值填補(bǔ)和過(guò)濾等操作后,篩選出正負(fù)樣本數(shù)大于3的用戶(hù)數(shù)據(jù)集合,其中正樣本是指HR對(duì)求職者的崗位申請(qǐng)表示認(rèn)可,即行為交互表中的屬性satisfied =1 ,其余簡(jiǎn)歷崗位對(duì)作為負(fù)樣本。經(jīng)過(guò)篩選后的數(shù)據(jù)集信息如表2所示。
3.2 對(duì)比模型
為了驗(yàn)證本模型的有效性,本文選取以下模型與MB-JRIKG進(jìn)行比較。
1)MFMF方法的核心理念在于將協(xié)同過(guò)濾框架下的用戶(hù)-物品交互矩陣拆解為2個(gè)稠密矩陣——用戶(hù)的隱向量矩陣和物品的隱向量矩陣,通過(guò)這2個(gè)矩陣來(lái)學(xué)習(xí)用戶(hù)和物品的有效表示[26]。
2)XGBoost XGBoost是一種高效的梯度提升決策樹(shù)算法,是Boosting 算法的其中一種,其核心思想在于將多個(gè)弱分類(lèi)器整合,共同構(gòu)建一個(gè)強(qiáng)分類(lèi)器[27]。
3)KGCNKGCN是一種基于圖卷積神經(jīng)網(wǎng)絡(luò)的方法,它通過(guò)在知識(shí)圖譜上聚合鄰居節(jié)點(diǎn)的信息,來(lái)豐富每個(gè)節(jié)點(diǎn)的嵌入表示[28]。
4)RippleNet該模型將與用戶(hù)發(fā)生過(guò)交互的項(xiàng)目作為種子集,在知識(shí)圖譜上通過(guò)實(shí)體之間的關(guān)系傳播用戶(hù)的偏好并最終得到用戶(hù)的嵌入表示,最后計(jì)算用戶(hù)與項(xiàng)目的交互概率[18]。
3.3 評(píng)價(jià)指標(biāo)
本文模型進(jìn)行點(diǎn)擊率預(yù)測(cè)實(shí)驗(yàn)時(shí),使用預(yù)測(cè)準(zhǔn)確率(accuracy,ACC)和線(xiàn)下面積(area under the curve,AUC)作為實(shí)驗(yàn)的評(píng)價(jià)指標(biāo),用以衡量各個(gè)模型的性能,實(shí)現(xiàn)本文模型數(shù)值表征。ACC計(jì)算公式如式(9)所示。
式中:TP(true positive)表示樣本的真實(shí)類(lèi)別為正,最后預(yù)測(cè)結(jié)果也為正;FP(1 positive)表示樣本的真實(shí)類(lèi)別為負(fù),最后預(yù)測(cè)得到的結(jié)果卻為正;FN(1negative)表示樣本的真實(shí)類(lèi)別為正,最后預(yù)測(cè)得到的結(jié)果卻為負(fù);TN(truenegative)表示樣本的真實(shí)類(lèi)別為負(fù),最后預(yù)測(cè)得到的結(jié)果也為負(fù)。
AUC 是指接收者操作特征(receirer operating characteristic,ROC)曲線(xiàn)下的面積。AUC 數(shù)值為 0~1 數(shù)值越大,表明模型真實(shí)性、穩(wěn)健性越好。ROC 是將真正例率(true positive rate,TPR)繪制為假正例率(1 positiverate,F(xiàn)PR)在不同閾值設(shè)置下的變化曲線(xiàn),即以FPR 為橫軸,TPR 為縱軸的曲線(xiàn),其中 FPR和TPR公式如式(10)、(11)所示。
3.4實(shí)驗(yàn)設(shè)定與結(jié)果分析
本文模型基于TensorFlow框架實(shí)現(xiàn),底層開(kāi)發(fā)語(yǔ)言采用Python3.7.7,優(yōu)化模型采用Adam優(yōu)化器,參數(shù)初始化采用Xavier方法。訓(xùn)練使用的負(fù)樣本是從求職者在目標(biāo)行為下未交互的職位集合中隨機(jī)采樣得到的,所有模型均采用“招聘者是否認(rèn)可求職者”作為目標(biāo)行為。實(shí)驗(yàn)數(shù)據(jù)按照 6:2:2 的比例劃分為訓(xùn)練集、驗(yàn)證集和測(cè)試集。為了避免偶然誤差對(duì)實(shí)驗(yàn)結(jié)果的影響,本文所有實(shí)驗(yàn)均運(yùn)行5次,最終用平均值進(jìn)行量化。
3.4.1整體性能及分析
表3展示了本文模型在AUC和ACC上與對(duì)比模型的性能比較。通過(guò)分析實(shí)驗(yàn)數(shù)據(jù)可知,本文模型相比參照模型中最好的模型RippleNet在指標(biāo)AUC和ACC上分別提高了0.0145和0.0288。通過(guò)對(duì)比分析實(shí)驗(yàn)數(shù)據(jù)可知,3種基于知識(shí)圖譜的模型MB-JRIKG、KGCN和Ripple-Net在AUC和ACC指標(biāo)上均優(yōu)于MF和XG-Boost模型,這說(shuō)明在引入知識(shí)圖譜后,知識(shí)圖譜中的實(shí)體與關(guān)系信息有利于提升推薦性能。相對(duì)于MF模型,XGBoost模型在ACC和AUC指標(biāo)上分別提升了大約11個(gè)百分點(diǎn)和7個(gè)百分點(diǎn),這是因?yàn)閄GBoost模型相對(duì)于MF模型具有更強(qiáng)的擬合能力和泛化能力,能夠捕捉特征之間的復(fù)雜關(guān)系。相對(duì)于RippleNet模型,本模型在ACC 和AUC指標(biāo)上分別提升了大約1個(gè)百分點(diǎn)和2個(gè)百分點(diǎn),這表明本文模型能夠更充分地利用多行為交互數(shù)據(jù),有效提升推薦性能??傊?,相比于其他推薦模型,MB-JRIKG都取得了最好的性能。其原因在于MB-JRIKG 借助知識(shí)圖譜中實(shí)體間的鏈接路徑,將實(shí)體語(yǔ)義表征在圖中傳播,直接建模實(shí)體間的高階關(guān)系,從而更合理地挖掘了知識(shí)圖譜所包含的信息;除此之外,MB-JRIKG能夠有效提取多行為交互特征來(lái)優(yōu)化節(jié)點(diǎn)嵌人,從而更好地預(yù)測(cè)用戶(hù)偏好。
3.4.2參數(shù)實(shí)驗(yàn)分析
本文測(cè)試了實(shí)驗(yàn)參數(shù)偏好傳播層數(shù) Hop、維度 Dim 以及嵌人更新方法對(duì)本文模型的影響。不同 Hop取值對(duì)本文模型的影響如圖4所示。從圖中可以看出,Hop 取值過(guò)低、過(guò)高都會(huì)影響AUC——過(guò)高會(huì)引人噪音,過(guò)低則會(huì)減少算法內(nèi)所聚合的信息,從而影響算法性能。不同Dim下模型性能的變化如圖5所示。從圖中可以看出,提高維度可以有效地提升AUC,但維度過(guò)高會(huì)導(dǎo)致AUC下降,說(shuō)明合適的嵌入維度可以更加有效地編碼信息,其中該模型在Dim值取16的時(shí)候效果最好。
不同的嵌人更新方法的選擇對(duì) ACC 和AUC 的影響如表4所示,包括 replace、plus、replace_transform和plus_transform,每種方法的解釋如下。
1)replace方法:用新的嵌入向量完全替換原來(lái)的項(xiàng)目嵌入向量。2)plus方法:將新的嵌入向量與原項(xiàng)目嵌入向量相加。3)replace_transform方法:將新的嵌人向量與變換矩陣相乘,然后用結(jié)果替換原項(xiàng)目嵌入向量。4)plus_transform方法:將新的嵌入向量與原項(xiàng)目嵌人向量相加,然后與變換矩陣相乘。
實(shí)驗(yàn)結(jié)果表明,本文模型使用plus_transform方法表現(xiàn)最好,這種處理策略結(jié)合了加法操作和變換操作的優(yōu)勢(shì),能夠更好地捕捉項(xiàng)目嵌人的特征和關(guān)系,從而提高模型的表現(xiàn)。這也表明了不同的處理策略在嵌入更新過(guò)程中起著關(guān)鍵作用,選擇合適的更新方法可以提升模型的性能和效果。
4結(jié)語(yǔ)
本文提出了一種基于知識(shí)圖譜的多行為職位推薦模型(MB-JRIKG),通過(guò)引入知識(shí)圖譜豐富職位的背景信息,將實(shí)體語(yǔ)義表征在圖中傳播,直接建模實(shí)體間的高階關(guān)系,從而更合理地挖掘了知識(shí)圖譜所包含的信息。同時(shí),考慮了求職者和招聘者在“瀏覽崗位 $$ 投遞簡(jiǎn)歷 $$ 招聘者反饋\"等環(huán)節(jié)表現(xiàn)出的行為,通過(guò)提取多行為交互特征來(lái)優(yōu)化求職者表示,激發(fā)求職者的潛在興趣,進(jìn)而提高推薦性能。在真實(shí)數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明,MB-JRIKG在AUC和ACC評(píng)價(jià)指標(biāo)上均優(yōu)于基線(xiàn)模型,在提高推薦效果的同時(shí)較好地緩解了數(shù)據(jù)稀疏和數(shù)據(jù)利用率低的問(wèn)題。后續(xù)可以沿著時(shí)間線(xiàn)收集和利用求聘過(guò)程中的交互行為來(lái)捕獲用戶(hù)的動(dòng)態(tài)偏好,或者考慮更加細(xì)粒度的交互行為數(shù)據(jù),例如瀏覽時(shí)間、搜索關(guān)鍵詞、面試情況等。
參考文獻(xiàn)/References:
[1]CHENGYa,LUNa,LUingetalRecurrntowledgeaetionntworkforoieeommendationC/3rdInteaal Conference on Electron Device and Mechanical Engineering(ICEDME).Suzhou:[s.n.],2020:648-651.
[2]BERTRAM N,DUNKEL J,HERMOSO R.IamallEARS:Using opendata and knowledge graph embedings for music recommendations [J].Expert Systems with Applications,2023.DOI:10.1016/j.eswa.2023.120347.
[3]王子巖,司亮,劉濱,等.基于系統(tǒng)動(dòng)力學(xué)的資訊個(gè)性化推薦研究[J].科技大學(xué)學(xué)報(bào),2021,42(2):170-179. WANG Ziyan,SLiang,LUBnetal.StudyonformationpersoalizedrecommendatioasedonstemdamicsJ]JoualfHebei University of Science and Technology,2021,42(2):170-179.
[4]孫瑞雪,紀(jì)淑娟,梁永全.基于知識(shí)圖譜的用戶(hù)表征及在互補(bǔ)產(chǎn)品推薦中的應(yīng)用[J].計(jì)算機(jī)應(yīng)用研究,2023,40(12):3628-3635. SUNRuixue,JShujuanLIANGYongquan.Userrepresentationbasedonknowledgegraphanditsaplicationincomplementaryproduct recommendation[J].ApplicationResearch of Computers,2023,40(12):3628-3635.
[5]HEXiana,AOii,ZaangetaleuralobotiigC/roegsfte26thIeatialofceo WorldWideWeb.Perth:[s.n.],2017:173-182.
[6]ALMALISND,TSIHRINTZIS G A,KARAGIANNIS N.Acontent based approachforrecommending personnelforjobpostionsC/ The 5thInternational Conferenceon Information,Intelligence,SystemsandApplications.Chania:[s.n.],o14:45-49.
[7]KUMAR N,GUPTAM,SHARMA D,et al. Technical jobrecommendationsystemusing APIs and web crawling[J].Computational Intelligence and Neuroscience,2022.DOI:10.1155/2022/7797548.
[8]SHIMIZU R,MATSUTAN M,GOTO M.An explainable recommendationframework basedonanimproved knowledge graph atention network with massivevolumesofsideinformationJ].Knowledge-Based Systems,2022.DOI:10.1016/j.knosys.221.107970.
[9]SHOKRZADEH Z,F(xiàn)EIZI-DERAKHSHI M R,BALAFAR MA,etal. Knowledge graph-based recommendation system enhanced by neuralcollboratieingndodgegrabedingsEgieigal,O16ej6.
[10]ALSAIFSIHLEAKH,etalLeaigbsedmatcedrepresentatiotefobecommendaioJtes, 2022.DOI:10.3390/computers11110161.
[11]YIPengYANGCheng,Chen,etal.Ajobecommendationmethdotiiedbypositiondescritosandresumeiforatio/ 2016IEEEAdvanced InformationManagement,Communicates,ElectronicandAutomationControlConference(IMCEC).Xi'an:s.n.], 2016:761-764.
[12]ZHOUQingIAOFenglu,GELiangetal.PersoaledpreferenecollbativeilteringJoecommendatiforgaduates9 IEEESmart World,UbiquitousIntellgenceamp;.Computing,Advancedamp;.TrustedComputing,ScalableComputing amp;.Communications, Cloudamp;.Big Data Computing,Internetof People and Smart City Inovation(Smart World/SCALCOM/UIC/ATC/CBDCom/IOP/SCD). Leicester:[s.n.],2019:1055-1062.
[13]丁健龍.一種基于畫(huà)像關(guān)聯(lián)及本體相容匹配的就業(yè)推薦方法[J].浙江工業(yè)大學(xué)學(xué)報(bào),2022,50(3):270-275. DINGJianlong.AnemploymentrecommendatiomethodbasedonportraitassociationandntologycompatibilitymatchingJJoualof ZhejiangUniversity of Technology,2022,50(3):270-275.
[14]張婭,彭海英.基于混合深度神經(jīng)網(wǎng)絡(luò)的就業(yè)推薦方法[J].計(jì)算機(jī)工程與設(shè)計(jì),2022,43(4):995-1001. ZHANG Hua,PENG Haiying.Jobrecommendation methodbasedonhybriddepneuralnetworkJ].Computer Engineeringand Design, 2022,43(4):995-1001.
[15]JIGuoliang,HEuXUeng,etalKnowedggapmbedingviadamicmappingmatrixC]/roceedingsofthrdAal MeetingoftheAsociationforComputatioalLinguisticsandthe7thInternationalJointCoferenceonNaturalLanguageProsinBe jing:[s.n.],2015:687-696.
[16]HUBinbnun,ZHOWX,etalLeveragigmetaathasedotextfotoeommdationwithraatentioodel// Proceedingsof the24thACMSGKDDInternationalConferenceoKnowledgeDiscoveryamp;Data Mining.NewYork:s.n.]181531- 1540.
[17]WANG Xiang,HEXianganCAOYixin,etal.KGAT:KowledgegraphatentionetworkforecommendationC//Prodingfte 25th ACM SIGKDD International Conference on Knowledge Discovery amp;.Data Mining.Anchorage:[s.n.],2019:950-958.
[18]WANG Hongwei,ZHANGFuzheng,WANGJialin,etalRipleNet:Propagatinguserpreferencesontheknowledgegrahforoen dersystems[C]//Procedingsof the27thACM InternationalConferenceonInformationandKnowledge Management.NewYork: [s.n.],2018:417-426.
[19]徐孟奇,熊熙,李斌勇,等.基于知識(shí)圖譜的人崗?fù)扑]系統(tǒng)構(gòu)建[J].計(jì)算機(jī)應(yīng)用研究,2022,39(1):194-198. XU Mengqi,XIONG Xi,LI Binyong,et al.Constructionof person-post matching recommendedsystembased on knowledgegrap[J]. Application Research of Computers,2022,39(1):194-198.
[20]DINGJingtao,YUGuanghuiHEXiangnanetal.ImprovingimplicitrecommendersystemswithviewataC]/Proceedingsofteth International Joint Conference on Artificial Intelligence.[S.1.]:AAAI Press,2018;3343-3349.
[21]LONIB,PAGANOR,LARSONM,etalBayesianpersonalizedranking withmulti-channeluserfedbackC]/Procedingsoftheoth ACMConference onRecommender Systems.New York:[s.n.],2016:361-364.
[22]PENGXingchen,SUJing,Yingshi,etalAtentioguidedgaphconvolutioaletworkformulti-eaviorecommeatio]. Knowledge-Based Systems,2023.DOI:10.1016/j. knosys.2023.111040.
[23]XIALianghao,HUANGChao,XUYongetal.Knowledgeenhancedhierarchicalgraphtransformernetworkformulti-behaviorco mendation[C]//Proceedings of the AAAI Conference on Artificial Inteligence.[S.1.]:[s.n.],2O21:4486-4493.
[24]SAITOYSUGYAMAK.Multi-behaviorjobrecommendationwithdynamicavailablityC//ProedingsoftheAnualInteatioal ACMSIGIRConferenceonResearchandDevelopmentinInformationRetrievalintheAsiaPacificRegion.NewYorks.n.,6 271.
[25]SAITOY,SUGYAMAK.LeveragingmultiplebhaviorsandexplicitpreferencesforjobrecommendationJ].ExpertSystemswith Applications,2024.DOI:10.1016/j.eswa.2024.125149.
[26]KORENY,BELR,VOLINSKYC.Matrixfactorizationtechiques forrecommendersystems[J].Computer,20o9,4(8)0-37.
[27]CHENTianqi,GUESRINC.XGBoost:Ascalable treebostingsysteC]/Procedingsofthe22ndACMSGKDInternatioalConference on Knowledge Discovery and Data Mining.San Francisco:[s.n.],2o16:785-794.
[28]WANG Hongwei,ZHAO Miao,XIEXing,etal.Knowledge graphconvolutional networksforrecommendersystems[C]/The World Wide Web Conference.San Francisco:Association for Computing Machinery,2019:3307-3313.