高境辰,丁樂,王琦
(南京工程學院 計算機工程學院,江蘇 南京 211167)
當今社會經(jīng)濟發(fā)展迅速,就業(yè)難的情況已經(jīng)較為嚴重。一方面求職者不清楚自己的需求,盲目跟風進行求職,導致一些職位供不應求,但是有些職位又出現(xiàn)了人才短缺的情況;另外一方面是有些職位對求職者的水平要求較高,一部分求職者不能滿足職位的要求,浪費了寶貴的求職時間[1]。對于已經(jīng)就業(yè)的求職者,又表現(xiàn)出就業(yè)滿意度低等情況[2],這是崗位匹配度較低的表現(xiàn)。此種背景下,需要一個就業(yè)推薦系統(tǒng)來提高就業(yè)的成功率及滿意度。
在推薦系統(tǒng)領域,傳統(tǒng)的個性化推薦方案主要以協(xié)同過濾,基于內(nèi)容的推薦,混合型推薦為主,推薦系統(tǒng)主要從用戶的信息,推薦內(nèi)容的信息中提取有用的部分進行推薦。這些算法主要把推薦轉(zhuǎn)化成預測用戶評分的問題,對預測分數(shù)較高的內(nèi)容進行排序并進行推薦。傳統(tǒng)的推薦算法往往只考慮單方面的需求,導致評分預測較為主觀?;セ萃扑]算法同時考慮雙方偏好,對用戶的評分預測相比傳統(tǒng)的推薦算法較為客觀。本文主要對求職者和企業(yè)建立互惠推薦模型,把求職者對職位的滿意度分成主觀滿意度和客觀滿意度兩種,使用隨機森林模型進行回歸預測,在一定程度上提高了評分預測的精度。
隨機森林模型是由Breiman和Adele研究的一種集成學習的算法[3],隨機森林利用決策樹作為基礎的學習器,并在眾多決策樹的基礎上使用隨機的屬性選擇,通過多個決策樹進行投票的方式進行最后的決策。隨機森林每一次構(gòu)建樹的過程具有隨機性,所以各棵CART決策樹的結(jié)構(gòu)也是隨機的。隨機森林算法的概念較為簡單,在算法實現(xiàn)上比較容易,模型的泛化能力較強,對噪聲和異常數(shù)據(jù)的容忍度較強,回歸的精度較高,且支持增量學習,但是起始性能較差[4]。
互惠推薦算法是一種同時考慮用戶的偏好和物品偏好的一種推薦算法,互惠推薦依賴于雙邊興趣的表達,適用于推薦次數(shù)較少,并且推薦準確率較高的場景。
互惠推薦系統(tǒng)當且僅當推薦的雙方的滿意度都比較高時,系統(tǒng)認為推薦的雙方是匹配的。而傳統(tǒng)的推薦系統(tǒng)的滿意度僅取決于用戶的滿意度[5-6]。
表1 傳統(tǒng)推薦算法與互惠推薦算法的對比
在招聘領域中,傳統(tǒng)的推薦算法沒有綜合考慮求職者和職位之間的關系,在招聘領域,求職者對算法的使用次數(shù)少,如果僅考慮單方面因素進行推薦,容易導致能力較低的求職者匹配到要求較高的企業(yè),為了提高求職者投遞簡歷的成功率,同時減少求職者投遞簡歷失敗次數(shù),我們應該同時考慮求職者和企業(yè)雙方的意愿。對于求職者,求職者希望能夠找到待遇較好的公司,同時也受城市等地理位置因素影響,我們應該給求職者推薦符合其能力,也迎合求職者的自身意愿的職位。對于企業(yè),企業(yè)想招收的是有一定經(jīng)驗的,高學歷,高素質(zhì)的人才,我們應該推薦的求職者應該是符合企業(yè)的需求的,有價值的人才。
由于總滿意度受求職者和企業(yè)雙方的制約,同時考慮雙方的滿意度,定義求職者滿意度為S1,企業(yè)滿意度為S2,總滿意度為S。
定義總滿意度S,用戶滿意度模型的權(quán)重為w1,企業(yè)滿意度的權(quán)重為w2,S的表達式為:
根據(jù)熊凱[7],白爭輝[8]和涂曉明[9]對求職者滿意度影響因素的研究,我們可以將求職者自身的一些特征進行提取。我們將求職者的滿意度分為求職者的主觀滿意度和客觀滿意度。主觀滿意度和求職者自身的屬性相關,主要表現(xiàn)為求職者容易得到滿足,客觀滿意度和職位的屬性相關,影響求職者入職后的滿意度。
表2 求職者主觀滿意度變量的選取與說明
表3 求職者客觀滿意度變量的選取與說明
根據(jù)劉興林[10]的研究,企業(yè)的滿意度主要表現(xiàn)為以下幾個方面:薪資水平,單位類型,政治面貌,學歷。其中,企業(yè)發(fā)布崗位的薪資越高,企業(yè)對求職者能力的期望越高,對求職者滿意度的標準變高。一些特殊企業(yè),如政府機關,事業(yè)單位,對員工的政治面貌有一定的要求,期望求職者的政治面貌為黨員。企業(yè)會優(yōu)先錄取擁有較高學歷的求職者,學歷越高企業(yè)的滿意度越高。
表4 企業(yè)滿意度變量的選取與說明
評價一個推薦系統(tǒng)的好壞的方法可以使用預測準確度來衡量。
RMSE的定義為:
MAE的定義為:
本文使用通過問卷調(diào)查獲得的自定義數(shù)據(jù)集,本文算法的RMSE的比較如圖1所示,隨著用戶數(shù)量的增長,兩種模型的RMSE都在趨于下降,并在最后有穩(wěn)定的趨勢,互惠推薦算法的RMSE較低,相比傳統(tǒng)的基于內(nèi)容的算法有一定程度上的優(yōu)勢。本文互惠推薦算法的MAE的比較如圖2所示,MAE同樣有下降的趨勢,用戶數(shù)量的增加,數(shù)據(jù)稀疏的問題得到了解決,MAE趨于穩(wěn)定。綜合兩種評估方法,互惠推薦系統(tǒng)在測試數(shù)據(jù)集上的預測準確度相較普通的基于內(nèi)容的算法是較好的。
圖1 互惠推薦和基于內(nèi)容的推薦RMSE對比
圖2 互惠推薦和基于內(nèi)容的推薦MAE對比
本文實現(xiàn)了一種基于隨機森林模型的互惠就業(yè)推薦算法,通過將用戶和職位的信息進行建模,對求職者信息和招聘崗位信息分別選取特征,并對模型進行了訓練,實驗表明本文所述的模型在測試集上有比較好的表現(xiàn)。