劉興林 吳明芬 劉利偉
五邑大學(xué)計(jì)算機(jī)學(xué)院,廣東 江門(mén) 529020
當(dāng)前我國(guó)就業(yè)形勢(shì)越來(lái)越嚴(yán)峻,隨著我國(guó)諸多教育政策的不斷推出與執(zhí)行,社會(huì)的飛速發(fā)展這個(gè)大的背景下,高等教育的生源越來(lái)越廣泛,高等教育為了國(guó)家政策和社會(huì)的需要不斷地?cái)U(kuò)招[1],2013年新增就業(yè)大學(xué)生達(dá)699萬(wàn),這導(dǎo)致就業(yè)的力越來(lái)越大。盡管每年的畢業(yè)生在增多,但仍然存在一些企業(yè)出現(xiàn)招工難的問(wèn)題,這里主要的問(wèn)題是招聘不到合適的人才。據(jù)調(diào)查統(tǒng)計(jì),江門(mén)市勞動(dòng)力資源在數(shù)量上較為豐富,然而就業(yè)結(jié)構(gòu)不太合理,勞動(dòng)力文化素質(zhì)普遍偏低,高端技術(shù)型工種人才較短缺,“招工難”與“就業(yè)難”問(wèn)題并存[2]。
為解決就業(yè)存在的各種問(wèn)題,結(jié)合當(dāng)前江門(mén)市的就業(yè)形勢(shì),我們?cè)O(shè)計(jì)了基于向量相似度的招聘就業(yè)雙向推薦模型,為應(yīng)聘者和企事業(yè)招聘搭建了一個(gè)橋梁,找到各自合適的崗位和人才。該模型在投入應(yīng)用后,取得了較好的成效。
當(dāng)前就業(yè)推薦采用的方法主要有層次分析法[3,4],數(shù)據(jù)挖掘[5],聚類分析[6],隨機(jī)游走[7]等。
層次分析法由T. L. Saaty[8]首次,是定量和定性分析相結(jié)合的多目標(biāo)決策方法,它能夠有效地分析目標(biāo)準(zhǔn)則體系層次間的非序列關(guān)系,便于綜合測(cè)決策的判斷和比較,多用于社會(huì)、經(jīng)濟(jì)和管理等方面。陳玉峰等[3]根據(jù)農(nóng)民工的特征,采取不同的信息收集方式來(lái)采集農(nóng)民工基本信息特征及操作信息并利用ID3算法進(jìn)行了相關(guān)計(jì)算,在此基礎(chǔ)上,引入層次結(jié)構(gòu)模型設(shè)計(jì)方法,提出了更符合農(nóng)民工特征的用戶模型及其表示方法,能更有效地實(shí)現(xiàn)農(nóng)民工就業(yè)崗位的快速推薦。高曉霞等[4]利用層次分析法建立了高職學(xué)生就業(yè)推薦綜合測(cè)評(píng)模型,通過(guò)對(duì)定性因素加以量化并構(gòu)造判斷矩陣,進(jìn)行一致性檢驗(yàn),給出了一種公開(kāi)、公平的開(kāi)展高職學(xué)生就業(yè)推薦的方法。層次分析法的應(yīng)用較為廣泛[8-10],文獻(xiàn)[3]和文獻(xiàn)[4]將該方法應(yīng)用于就業(yè)推薦,對(duì)就業(yè)工作起到了較好的促進(jìn)作用,但層次分析法模型較為復(fù)雜,在構(gòu)造就業(yè)推薦模型時(shí)需要大量的權(quán)重設(shè)置和計(jì)算,因此在效率上有所限制。
陳玉峰等[5]前面的研究基礎(chǔ)上,深入分析數(shù)據(jù)挖掘理論與農(nóng)民工的主要特征要素,采用決策樹(shù)模型中的ID3算法,對(duì)樣本進(jìn)行整理、轉(zhuǎn)換以及分類,構(gòu)建了一個(gè)基于數(shù)據(jù)挖掘的農(nóng)民工就業(yè)推薦系統(tǒng),從海量的信息中發(fā)現(xiàn)規(guī)律和知識(shí),為企業(yè)單向推薦相關(guān)技術(shù)人才。
李晶等[6]將聚類分析應(yīng)用于就業(yè)推薦,將應(yīng)聘者和招聘企業(yè)數(shù)據(jù)通過(guò)相關(guān)度處理,使用改進(jìn)粒子群優(yōu)化的聚類分析算法,實(shí)現(xiàn)招聘企業(yè)與應(yīng)聘者的相互推薦.解決了推薦信息無(wú)用、雜亂等實(shí)際問(wèn)題。這種方法將招聘方和應(yīng)聘方同等處理,忽略了從雙方各自更關(guān)注的信息角度出發(fā)考慮問(wèn)題,比如對(duì)于應(yīng)聘者,在向其推薦企業(yè)時(shí),顯然在同等條件于待遇高的企業(yè)要優(yōu)先推薦,反過(guò)來(lái),對(duì)于招聘方而言,則希望將薪酬要求低的應(yīng)聘者優(yōu)先推薦。
吳迪等[7]設(shè)計(jì)并實(shí)現(xiàn)了一個(gè)基于隨機(jī)游走的就業(yè)推薦系統(tǒng),通過(guò)比較應(yīng)屆和往屆畢業(yè)生基本特征,并結(jié)合基于隨機(jī)游走模型的PageRank算法獲得的各個(gè)企業(yè)的“求職指數(shù)”,將招聘企業(yè)排序后推薦給每一名畢業(yè)生。經(jīng)實(shí)際數(shù)據(jù)測(cè)試,該系統(tǒng)能有針對(duì)性的為畢業(yè)生推薦相關(guān)企業(yè),有較好的效果。
在上述研究中,主要是單向的推薦,采用層次分析法在運(yùn)行效率上有所欠缺,為更高效的解決就業(yè)雙向推薦的問(wèn)題,我們提出了基于向量相似度的招聘就業(yè)雙向推薦模型,該模型將就業(yè)意向和招聘信息看成一條向量,抽取兩者共有的重要因素作為組成向量的分量,并對(duì)其進(jìn)行量化,通過(guò)計(jì)算它們之間的相似度來(lái)實(shí)現(xiàn)雙向推薦。
基于向量相似度的招聘就業(yè)雙向推薦模型分以下四個(gè)步驟進(jìn)行。
由于實(shí)際的招聘應(yīng)聘數(shù)據(jù)量達(dá)到50萬(wàn)以上,為了降低模型的計(jì)算量,提高運(yùn)算效率和準(zhǔn)確率,在進(jìn)行雙向推薦時(shí)對(duì)求職意向和招聘信息進(jìn)行了篩選,主要進(jìn)行以下篩選操作。
(1)空值篩選
考慮到某些信息填寫(xiě)不完夠整,系統(tǒng)會(huì)對(duì)大部分?jǐn)?shù)據(jù)根據(jù)求職者信息和企業(yè)登記信息進(jìn)行自動(dòng)填寫(xiě),但有些數(shù)據(jù)無(wú)法補(bǔ)充完整,模型在運(yùn)行時(shí)則將這部分空值數(shù)據(jù)過(guò)濾掉,以保證進(jìn)行模型數(shù)據(jù)的完整性。
(2)資格篩選
資格篩選主要考慮的是發(fā)布的求職意向和招聘信息是否過(guò)期,另外也要將已經(jīng)求職成功和招聘成功的記錄過(guò)濾掉。
(3)條件篩選
條件篩選是對(duì)所在的求職意向作招聘進(jìn)行篩選,若為求職者推薦崗位,則以求職者個(gè)人的信息為標(biāo)準(zhǔn),對(duì)招聘信息進(jìn)行篩選;若為企業(yè)推薦求職者,則以招聘企業(yè)的要求為標(biāo)準(zhǔn),對(duì)求職者進(jìn)行篩選。條件篩選的主要有以下幾個(gè)方面:對(duì)工種,按工種編碼先使用商用細(xì)類代碼進(jìn)行完全匹配篩選,若無(wú)數(shù)據(jù)再回退使用前4位進(jìn)行部分匹配篩選;對(duì)學(xué)歷進(jìn)行覆蓋篩選,對(duì)求職者而言,以求職者的學(xué)歷對(duì)招聘企業(yè)進(jìn)行篩選時(shí),篩選出學(xué)歷招聘要求等于或低于求職者學(xué)歷的招聘信息,反之則篩選出等于或高于企業(yè)學(xué)歷要求的求職者。
每條招聘信息或求職意向生成一個(gè)向量,該向量的各分量為招聘企業(yè)或求職者的各個(gè)條件,所有招聘信息或求職意向各自形成一個(gè)向量集。如,企業(yè)招聘信息向量:招聘(工種,學(xué)歷,職稱,年齡,性別,薪酬,住宿要求,工作地點(diǎn),…),個(gè)人求職信息向量:求職(工種,學(xué)歷,職稱,年齡,性別,薪酬,住宿要求,工作地點(diǎn),…),可以看到兩個(gè)向量的各個(gè)分量是一一對(duì)應(yīng)的。生成向量時(shí)考慮到企業(yè)和求職者的實(shí)際情況以及雙向所注重的因素,本模型向量只采用了工種,學(xué)歷,職稱,年齡,性別,薪酬,食宿要求和工作地點(diǎn)這8個(gè)分量。
為便于算法模型描述,將上述向量進(jìn)行形式化:
2.3.1 量化規(guī)則
為企業(yè)推薦求職者時(shí)以企業(yè)招聘信息向量為標(biāo)準(zhǔn)向量,其各個(gè)分量的值設(shè)為1,對(duì)于篩選出來(lái)的個(gè)人求職信息向量集,其每個(gè)向量的每個(gè)分量的取值范圍為[0,1],完全不匹配取值0,完全匹配或不限制取值為1。對(duì)個(gè)人求職而言,以個(gè)人求職信息向量為標(biāo)準(zhǔn)向量,其各個(gè)分量的值設(shè)為1,對(duì)于篩選出來(lái)的企業(yè)招聘信息向量集,其每個(gè)向量的每個(gè)分量的取值范圍為[0,1],完全不匹配取值0,完全匹配或不限制取值為1。
對(duì)向量各分量(建立映射表)逐一進(jìn)行量化,各分量量化值為預(yù)設(shè)值(可根據(jù)模型運(yùn)行情況調(diào)整),在充分的實(shí)驗(yàn)基礎(chǔ)之上,考慮按工種為各分量設(shè)定不同的量化值。各分量量化基本規(guī)則如下。
(1)工種
以工種編碼作為量化的基礎(chǔ),向企業(yè)推薦求職者和向求職者推薦崗位均采用以表1數(shù)據(jù)作為量化的依據(jù)。
表1 工種量化表
(2)學(xué)歷
在對(duì)學(xué)歷進(jìn)行量化時(shí),分兩種情況,一是向企業(yè)推薦求職者,二是為求職者推薦崗位。
向企業(yè)推薦求職者時(shí),采取以下原則:在其他條件相同的情況下,優(yōu)先向企業(yè)推薦高學(xué)歷的求職者。根據(jù)這個(gè)原則設(shè)定表2數(shù)據(jù)作為向企業(yè)推薦求職者時(shí)匹配向量的量化依據(jù)。
表2 推薦求職者學(xué)歷量化表
若向求職者推薦崗位,則在滿足招聘條件的前提下,優(yōu)先向求職者推薦最接近求職者學(xué)歷的企業(yè),比如,求職者的學(xué)歷為本科,則篩選出來(lái)的企業(yè)對(duì)學(xué)歷要求為本科及以下的所有招聘信息,在向求職者推薦時(shí)將學(xué)歷要求為本科的排在前,其他學(xué)歷依次往后排。
在量化時(shí),參照表2的匹配向量量化值,采用公式1對(duì)企業(yè)招聘信息學(xué)歷要求進(jìn)行量化。
其中,為求職者學(xué)歷按上表對(duì)應(yīng)的量化值, 為企業(yè)學(xué)歷要求按上表對(duì)應(yīng)的量化值。
(3)職稱/技術(shù)等級(jí)
對(duì)職稱和技術(shù)等級(jí)進(jìn)行量化時(shí),參照表3進(jìn)行。
表3 職稱/技術(shù)等級(jí)量化表
由于當(dāng)前系統(tǒng)中并沒(méi)有填寫(xiě)該字段信息,模型實(shí)際運(yùn)行時(shí)將該分量設(shè)為0,即不考慮該分量對(duì)推薦的影響。
(4)年齡
當(dāng)向企業(yè)推薦求職人員時(shí),考慮到在其他條件相同的前提下,企業(yè)更期望招聘年輕些的求職者,因此在量化時(shí)將更年輕的求職者量化為較高的值,年齡大的求職者量化較低的值,采用公式2對(duì)求職人員的年齡進(jìn)行量化。
式2表示,不大于25歲的人,對(duì)子集“年輕”的隸屬函數(shù)值是1,即一定屬于這一子集;而大于25歲的人,對(duì)子集“年輕”的隸屬函數(shù)值按來(lái)計(jì)算,例如對(duì)40歲的人,隸屬函數(shù)值
當(dāng)向求職者推薦招聘崗位時(shí),采用區(qū)間量化的方案進(jìn)行量化。設(shè)年齡的取值集合為U={50歲,45歲, 40歲 ,35歲,30歲, 25歲},模糊集“年青”可表示為:
A=0/50歲+0.1/45歲 + 0.3/40歲 + 0.5/35歲 + 0.9/30歲 +1/25歲,若年齡介于(50,45)之間,則量化為一個(gè)(0,0.1)間的一個(gè)值,其他以此類推。
(5)性別
對(duì)性別進(jìn)行量化時(shí),分別采用表4和表5量化值進(jìn)行量化。
表4 向企業(yè)推薦求職者性別量化表
表5 向求職者推薦崗位性別量化表
(6)薪酬
當(dāng)向企業(yè)推薦求職者時(shí),從企業(yè)招聘角度出發(fā)考慮,僅就薪酬這個(gè)因素而言,會(huì)優(yōu)先考慮對(duì)薪酬期望值更低的求職者,因此在向企業(yè)推薦求職者時(shí),將開(kāi)出薪酬更低的求職者排在前面,因此構(gòu)造以下量化規(guī)則。
設(shè)企業(yè)薪酬最低值為aavg,求職者薪酬要求最低值為:a1,a2,…,an,令M=max(a1,a2,…,an), m=min( a1,a2,…,an),則企業(yè)薪酬為標(biāo)準(zhǔn)向量,其值為1,求職者薪酬按公式3進(jìn)行量化。
若6e 為負(fù)數(shù),則令其為0。
當(dāng)向求職者推薦崗位時(shí),分析求職者對(duì)薪酬的心理期望,顯然會(huì)更優(yōu)先考慮開(kāi)出薪酬更高企業(yè),因此在向求職者推薦崗位時(shí),將開(kāi)出薪酬更高的企業(yè)排在前面,因此構(gòu)造以下量化規(guī)則。
11月26日,機(jī)電一體化專家博澤中國(guó)太倉(cāng)新生產(chǎn)基地舉行了開(kāi)業(yè)慶典儀式。博澤太倉(cāng)新工廠總建筑面積達(dá)7.3萬(wàn)?m2,總投資額達(dá)14億元人民幣。新工廠將生產(chǎn)近全系列博澤產(chǎn)品,包括車門(mén)系統(tǒng)、玻璃升降器、門(mén)鎖模塊、座椅系統(tǒng)、座椅導(dǎo)軌、座椅電動(dòng)機(jī)等。客戶涵蓋國(guó)內(nèi)外知名整車制造商,包括福特、吉利、捷豹路虎、大眾、沃爾沃等。此外,新工廠分為一期和二期,目前一期工廠已投入使用,二期工廠正在建設(shè)之中。未來(lái),二期工廠大部分是用于座椅的垂直生產(chǎn),包括沖壓、噴涂、激光焊接和整椅的組裝產(chǎn)線等。隨著二期的落成,至2024年工廠預(yù)計(jì)將擁有1?600多名員工,年?duì)I業(yè)額將突破58億元人民幣,規(guī)模列博澤亞洲第一。
設(shè)求職者薪酬要求的最低值為aavg,企業(yè)薪酬最低值為:a1,a2,…,an,令M=max(a1,a2,…,an), m=min( a1,a2,…,an),則求職者薪酬為標(biāo)準(zhǔn)向量,其值為1,企業(yè)薪酬按公式4進(jìn)行量化。
(7)食宿要求
當(dāng)向企業(yè)推薦求職者時(shí),從企業(yè)招聘角度出發(fā)考慮,僅就住宿要求這個(gè)因素而言,會(huì)優(yōu)先考慮對(duì)食宿要求越低的求職者,因此在向企業(yè)推薦求職者時(shí),將食宿要求越低的求職者排在前面,建立以下映射表(表6)進(jìn)行量化。
表6 向企業(yè)推薦求職者食宿要求量化表
當(dāng)向求職者推薦崗位時(shí),分析求職者對(duì)食宿要求的心理期望,顯然會(huì)更優(yōu)先考慮能夠解決住宿問(wèn)題的企業(yè),因此在向求職者推薦企業(yè)時(shí),將住宿條件更好的企業(yè)排在前面,建立以下映射表(表7)進(jìn)行量化。
表7 向求職者推薦崗位食宿條件量化表
(8)工作地點(diǎn)
當(dāng)前模型僅對(duì)江門(mén)地區(qū)的工作地點(diǎn)進(jìn)行量化,根據(jù)行政區(qū)域編碼的匹配度來(lái)進(jìn)行量化。行政區(qū)域編碼共10位,其中前6位編碼及表示的地區(qū)如下:440703(蓬江區(qū)),440704(江海區(qū)),440705(新會(huì)區(qū)),440781(臺(tái)山市),440783(開(kāi)平市),440784(鶴山市),440785(恩平市),編碼中第7-8位表示鎮(zhèn)及街道,第9-10位表示村。
建立表8對(duì)工作地點(diǎn)進(jìn)行量化(為企業(yè)推薦求職者和為求職者推薦崗位均按該表進(jìn)行量化)。
表8 工作地點(diǎn)量化表
2.3.2 量化實(shí)例
系統(tǒng)隨機(jī)生成20萬(wàn)條求職信息和10萬(wàn)條招聘信息,用于模型測(cè)試用。模型在量化時(shí),按推薦求職者和推薦崗位來(lái)采用相應(yīng)的量化規(guī)則進(jìn)行量化,下面給出一組量化實(shí)例。
(1)向企業(yè)推薦求職者
從數(shù)據(jù)庫(kù)中抽取招聘編號(hào)為“1”的招聘信息,如表9所示。
表9 編號(hào)為“1”的招聘信息
由于數(shù)據(jù)庫(kù)中存儲(chǔ)的各字段內(nèi)容為相應(yīng)的編碼,因此表9中給出也是相應(yīng)的編碼(以下同),代表不同的含義(性別列中值為3表示男女不限)。在為該招聘推薦求職者時(shí),該招聘記錄向量為標(biāo)準(zhǔn)向量,除“職稱/技術(shù)等級(jí)”分量外各分量均量化為1,即招聘向量1(工種,學(xué)歷,職稱,年齡,性別,薪酬,住宿要求,工作地點(diǎn))量化為E1(1,1,0,1,1,1,1,1)。
模型為該招聘信息篩選推薦出以下求職者,如表10所示,相應(yīng)的,各字段給出的也是編碼(以下同)。
表10 為“1”號(hào)招聘篩選推薦出的求職者信息
模型按2.3.1節(jié)的量化規(guī)則對(duì)求職者信息進(jìn)行量化,得到表11所示的量化結(jié)果。
表11 求職者信息量化結(jié)果
為盡可能區(qū)分各求職者與招聘要求之間的差距,表11中的量化結(jié)果按四舍五入的規(guī)則取四位小數(shù)。
(2)向求職者推薦崗位
從數(shù)據(jù)庫(kù)中抽取求職編號(hào)為“1”的求職者信息,如表12所示。
表12 求職編號(hào)為“1”的求職者信息
在為該求職者推薦崗位時(shí),該求職信息向量為標(biāo)準(zhǔn)向量,除“職稱/技術(shù)等級(jí)”分量外其余各分量均量化為1,即求職向量1(工種,學(xué)歷,職稱,年齡,性別,薪酬,住宿要求,工作地點(diǎn))量化為P1(1,1,0,1,1,1,1,1)。
模型為該求職者篩選推薦出以下崗位信息,如表13所示。
表13 為“1”號(hào)求職者篩選推薦出的崗位信息
模型按2.3.1節(jié)的量化規(guī)則對(duì)崗位信息進(jìn)行量化,得到表14所示的量化結(jié)果。
表14 崗位信息量化結(jié)果
為盡可能區(qū)分各崗位信息與求職者要求之間的差距,表11中的量化結(jié)果按四舍五入的規(guī)則取四位小數(shù)。
在為企業(yè)推薦求職者,或?yàn)榍舐氄咄扑]崗位時(shí),需要計(jì)算他們之間的匹配度,匹配度根據(jù)2.3節(jié)的量化結(jié)果進(jìn)行計(jì)算,即計(jì)算每條推薦向量與標(biāo)準(zhǔn)向量之間的相似度,然后按這個(gè)相似度從高到低排序,使得更符合的求職者或崗位能排在前面。
向量相似度的計(jì)算采用夾角余弦公式來(lái)計(jì)算,計(jì)算公式如式5所示。
其中分子和分母分別按公式6和公式7來(lái)計(jì)算。
就2.3.2節(jié)的例子(在本節(jié)已將相關(guān)的編碼轉(zhuǎn)換為對(duì)應(yīng)的含義,這樣便于分析比較匹配度結(jié)果),采用向量相似度計(jì)算公式來(lái)計(jì)算,向企業(yè)和求職者分別進(jìn)行推薦,進(jìn)行就業(yè)信息匹配,得到以下結(jié)果表15、表16、表17和表18所示結(jié)果。
表15 招聘編號(hào)為“1”招聘信息
表16 “1”號(hào)招聘的推薦結(jié)果
表17 “1”號(hào)求職者信息
表18 “1”號(hào)求職者的推薦結(jié)果
由于測(cè)試數(shù)據(jù)是隨機(jī)生成的,而算法在向企業(yè)推薦求職者時(shí),在其他條件相等的情況下優(yōu)先推薦推薦學(xué)歷更高的求職者,因此會(huì)出現(xiàn)表16中博士、碩士去應(yīng)聘電工這個(gè)工種的情況,實(shí)際情況不會(huì)出現(xiàn)這種現(xiàn)象。
從上述就業(yè)信息匹配實(shí)例來(lái)看,基于向量相似度的招聘就業(yè)雙向推薦模型能較好實(shí)現(xiàn)招聘與應(yīng)聘的對(duì)接,算法模型取得了較好的效果。
本節(jié)實(shí)驗(yàn)主要考察模型的運(yùn)行效率,模型的準(zhǔn)確性在第2節(jié)已得到了驗(yàn)證。
模型實(shí)驗(yàn)測(cè)試在隨機(jī)生成的20萬(wàn)條求職信息和10萬(wàn)條招聘信息數(shù)據(jù)集上進(jìn)行,模型運(yùn)行在以下配置的機(jī)器上:Windows7操作系統(tǒng),CPU為AMD雙核5000,2G內(nèi)存,500G硬盤(pán),從篩選、量化和相似度計(jì)算三個(gè)環(huán)節(jié)考察模型雙向推薦的運(yùn)行效率,共進(jìn)行了6組實(shí)驗(yàn),平均結(jié)果如表19所示。
表19 測(cè)試數(shù)據(jù)集模型運(yùn)行效率(單位:條/秒)
表19的結(jié)果顯示,該模型大部時(shí)間消耗在篩選階段,量化和相似度計(jì)算階段取得了較好的運(yùn)行效率。
模型投入實(shí)際運(yùn)行后,實(shí)際招聘應(yīng)聘的數(shù)據(jù)規(guī)模約50萬(wàn)條。從篩選、量化和相似度計(jì)算三個(gè)環(huán)節(jié)考察模型雙向推薦的運(yùn)行效率。實(shí)際系統(tǒng)配置了IBM System X3850系列服務(wù)器(2顆Xeon E7-4807 1.86GH,16GB內(nèi)存,4TB硬盤(pán)),硬件性能的提升也使模型的效率得到大幅度的提升。實(shí)際運(yùn)行結(jié)果如表20所示。
表20 實(shí)際數(shù)據(jù)集模型運(yùn)行效率(單位:條/秒)
表20的結(jié)果顯示,模型在實(shí)際數(shù)據(jù)集上亦能取得很好的運(yùn)行效率。同時(shí),從企業(yè)和求職者的反饋信息分析,模型能較好的實(shí)現(xiàn)招聘就業(yè)雙向推薦,能為雙向推薦最合適的崗位和人才,實(shí)現(xiàn)了雙贏。
本文實(shí)現(xiàn)了一個(gè)基于向量相似度的招聘就業(yè)雙向推薦模型,通過(guò)將招聘和求職信息轉(zhuǎn)化為向量,并按不同規(guī)則對(duì)不同分量進(jìn)行量化,采用夾角余弦公式計(jì)算向量間的相似度,并以此作為雙向推薦的標(biāo)準(zhǔn),模型在測(cè)試數(shù)據(jù)集和實(shí)驗(yàn)數(shù)據(jù)集上均取得了較好的效果。
進(jìn)一步的工作主要有:1)優(yōu)化各分量量化數(shù)值,目前模型采用的是經(jīng)驗(yàn)值,在模型穩(wěn)定運(yùn)行后,需要根據(jù)實(shí)驗(yàn)情況來(lái)調(diào)整量化值,使用模型更為合理;2)考慮到在招聘和應(yīng)聘的過(guò)程中,對(duì)各個(gè)分量有側(cè)重,當(dāng)前模型中各個(gè)分量的權(quán)重是一致,在后續(xù)的改進(jìn)中將對(duì)各分量進(jìn)行權(quán)重調(diào)整,以突出關(guān)鍵分量的重要性;3)優(yōu)化模型算法,提高運(yùn)行效率。實(shí)驗(yàn)結(jié)果和實(shí)際運(yùn)行情況表明,模型在篩選階段占用大量時(shí)間,直接影響了模型的效率,盡管由于機(jī)器性能的提升能提高效率,但仍需要不斷優(yōu)化模型,以適應(yīng)大數(shù)據(jù)集的需要。
[1]李英. 淺析當(dāng)今我國(guó)高校研究生就業(yè)現(xiàn)狀[J]. 神州, 2013, (3): 240.
[2]柳彥君. 江門(mén)市勞動(dòng)力資源與就業(yè)狀況研究[J]. 北方經(jīng)貿(mào), 2012, (10): 38-40.
[3]陳玉峰, 張紅燕, 敬松, 謝元瑰, 隆珂. 基于層次結(jié)構(gòu)的農(nóng)民工就業(yè)特征模型研究[J]. 中國(guó)農(nóng)學(xué)通報(bào), 2013, 29(11): 101-106.
[4]高曉霞. 層次分析法在高職學(xué)生就業(yè)推薦中的應(yīng)用[J]. 讀與閱雜志, 2010, 7(12): 46-47.
[5]陳玉峰, 張紅燕, 敬松, 謝元瑰. 基于數(shù)據(jù)挖掘的農(nóng)民工就業(yè)推薦系統(tǒng)構(gòu)建[J]. 安徽農(nóng)業(yè)科學(xué), 2011, 39(33): 20896-20898.
[6]李晶, 張磊. 聚類分析在就業(yè)推薦中的應(yīng)用[J]. 科技信息, 2010, (31): 149.
[7]吳迪, 周利娟, 林鴻飛. 基于隨機(jī)游走的就業(yè)推薦系統(tǒng)研究與實(shí)現(xiàn)[J]. 廣西師范大學(xué)學(xué)報(bào): 自然科學(xué)版, 2011, 29(1): 179-185.
[8]Saaty T. L.. Modelinugn structuredde cisiopnr oblems-ththee ory of analytical hierarchies[J]. MathemaCtiocsm apnudt ers in Simiounla, 1t978, 20(3): 147-158.
[9]郭金玉, 張忠彬, 孫慶云. 層次分析法的研究與應(yīng)用[J]. 中國(guó)安全科學(xué)學(xué)報(bào), 2008, 18(5): 148-153.
[10]蘭繼斌, 徐揚(yáng), 霍良安, 劉家忠. 模糊層次分析法權(quán)重研究[J]. 系統(tǒng)工程理論與實(shí)踐, 2006, (9): 107-112.