高發(fā)強(qiáng)
(江蘇科技大學(xué)數(shù)理學(xué)院,江蘇 鎮(zhèn)江 212003)
近年來,“大學(xué)生就業(yè)難”已經(jīng)成為一個(gè)熱門話題,大學(xué)生如何在就業(yè)形式嚴(yán)峻的情況下,高效找到工作越發(fā)困難。參加校園招聘是大學(xué)生簽訂工作的主要方式,如何從校園招聘的眾多學(xué)子中脫穎而出,是每個(gè)大學(xué)生面臨的難題。通過調(diào)查分析,文章用粗糙集理論和最小距離法相結(jié)合的方法,分析了校園招聘企業(yè)人才需求的影響因素,從而更加準(zhǔn)確的指出了不同性質(zhì)的企業(yè)在校園招聘中對(duì)畢業(yè)生的要求,對(duì)大學(xué)生如何準(zhǔn)備就業(yè)具有重要的指導(dǎo)意義。
波蘭數(shù)學(xué)家Z.Pawlak提出的粗糙集理論是一種處理不精確信息和含糊信息的新型數(shù)學(xué)方法,近年來成功應(yīng)用于醫(yī)療診斷、圖像處理、模式識(shí)別、知識(shí)獲取、數(shù)據(jù)挖掘和決策支持等領(lǐng)域。經(jīng)典粗糙集理論是通過論域U上的不可分辨二元關(guān)系(即等價(jià)關(guān)系)導(dǎo)出的等價(jià)類作為基本的知識(shí)顆粒,用一對(duì)上下近似集合來逼近數(shù)據(jù)庫種的不精確概念。粗糙集的核心思想是在保持分類能力不變的前提下,通過知識(shí)約簡(jiǎn),導(dǎo)出問題的決策或分類規(guī)則。
最小距離分類,是指求出未知類別向量到要識(shí)別各類別代表向量中心點(diǎn)的距離,將未知類別向量歸屬于距離最小一類的一種圖像分類方法。 本文將粗糙集理論和最小距離法用于校園招聘企業(yè)人才需求規(guī)則,高??山梃b此規(guī)則引導(dǎo)學(xué)生,避免大學(xué)生盲目擇業(yè);大學(xué)生也可參考此規(guī)則合理安排大學(xué)生活和做好就業(yè)準(zhǔn)備。
定義1 信息系統(tǒng)(Information System記為:IS)可定義為一個(gè)四元組:DIS=<U,AT,V,f>,其中U是一個(gè)非空有限對(duì)象的集合,又稱為論域:AT是非空有限屬性集合,?a∈AT,Va表示屬性a的值域;V表示全體屬性的值域集合, 即 V=VAT=Ua∈ATVa;f為信息函數(shù),Vx∈U,a∈AT,定義 f(x,a)表示 x 在屬性 a 上的取值,則有 f(x,a)∈Va。
如果AT=C U D,其中C是非空有限條件屬性集合,D是非空有限決策屬性集合,則<U,C∪D,V,f>又被稱為決策信息系統(tǒng)(DIS)。當(dāng)D={d}時(shí),稱<U,C∪pxtn3jf,V,f>為單決策信息系統(tǒng)。
定義2 設(shè)IS=<U,AT,V,f>,?A?AT,定義A上的不可分辨關(guān)系IND(A)={(x,y)∈U2|?a∈A,f(x,a)=f(y,a)}。 不可分辨關(guān)系滿足自反性、對(duì)稱性、和傳遞性,是U上的一個(gè)等價(jià)關(guān)系。由此等價(jià)關(guān)系可以導(dǎo)出U上的一個(gè)劃分,記為U/IND(A),Vx∈U,x的等價(jià)類記為[x]A,且[x]A={y∈U|(x,y)∈IND(A)}。
定義3 設(shè)IS=<U,AT,V,f>,?X?U,A?AT定義X關(guān)于屬性A的下、上近似分別記為:
定義 4 設(shè) DIS=<U,C∪bxplntx,V,f>,Vd={1,2,…i,…,r},A?C。 由決策屬性 d 導(dǎo)出的劃分 U/d={D1,D2,…,Dr},其中 Di={x∈U|f(x,d)=i}。 定義
(1)若LOW(A)=LOW(C),則稱A是C的一個(gè)下近似分布一致協(xié)調(diào)集;若A是C的一個(gè)下近 似分布一致協(xié)調(diào)集,且?B?A,B,都不是C的下近似分布一致協(xié)調(diào)集,則稱A是C的下近似分布約簡(jiǎn)。
(2)若UPP(A)=UPP(C),則稱A是C的一個(gè)上近似分布一致協(xié)調(diào)集;若A是C的一個(gè)下近似分布一致協(xié)調(diào)集,且?B?A,B,都不是C的上近似分布一致協(xié)調(diào)集,則稱A是C的上近似分布約簡(jiǎn)。
(3)若 LOW(A)=LOW(C),且 UPP(A)=UPP(C),則稱 A 是 C 的分布一致協(xié)調(diào)集;若A是C的分布一致協(xié)調(diào)集,且?B?A,B,都不是C的分布一致協(xié)調(diào)集,則稱A是C的分布約簡(jiǎn)。
定義5 設(shè)IS=<U,AT,V,f>是一個(gè)信息系統(tǒng),C∪5hdx5bf=AT,集合族{D1,D2,…,Dr}是由決策屬性 d 導(dǎo)出的劃分,則 C 對(duì){d}的近似分類質(zhì)量 γC(xd55xbv)記為:
γC(bx5pjlz)=|PosC(5bltdph)|/|U|
γC(rxnff55)表示在條件屬性集C下能夠確切劃入決策類U/d中的對(duì)象占論域?qū)ο罂倲?shù)的比率,表示了決策屬性對(duì)條件屬性的依賴程度:PosC(pxtbzdv)稱為{d}的相對(duì)于 C 的正域。
定義6 設(shè)IS=<U,AT,V,f>是一個(gè)信息系統(tǒng),C∪r5355j5=AT,條件屬性ci∈C(1,2,…,n),ci對(duì)于決策屬性的重要性程度為 Sig(ci,C,5jtzv55),其中Sig(ci,C,5dxhhv5)=γC(5nhhrrj)-γC-ci(r5xpjnp)。 PosC-ci(tv5r5n5)稱為{d}的相對(duì)于{C-ci}的正域,即U中所有根據(jù)屬性集{C-ci}劃分后,仍可準(zhǔn)確劃分到{d}的等價(jià)類中的對(duì)象集合。
在粗糙集用于決策規(guī)則獲取的理論中,隱藏在決策信息系統(tǒng)DIS=<U,C∪rn5xvxb,V,f>中的知識(shí)將以決策規(guī)則的形式被提取出來。設(shè)DIS=<U,AT,V,f>是一個(gè)決策表,AT=C∪5f5lfvj,C∩rtfl3tl=φ,其中 C 為條件屬性集,{d}為決策屬性,令Xi和Yj分別代表U/C與U/r5lltvl中的各個(gè)等價(jià)類,des(Xi)表示對(duì)等價(jià)類Xi的描述,即等價(jià)類Xi對(duì)于各條件屬性值的特定值;des(Yi)表示對(duì)等價(jià)類Yj的描述,即等價(jià)類Yj對(duì)于各決策屬性值的特定取值。
決策規(guī)則定義如下:
rij:des(Xi)→des(Yj),Yj∩Xi≠φ,
規(guī)則的確定性因子 μ(Xi,Yj)=|Yj∩Xi|/|Xi|,0<μ(Xi,Yj)≤1。
當(dāng) μ(Xi,Yj)=1 時(shí),rij是確定的;當(dāng) 0<μ(Xi,Yj)<1 時(shí),rij是不確定的。
注:在產(chǎn)生決策規(guī)則之前,可首先對(duì)決策表中的屬性進(jìn)行約簡(jiǎn)。
設(shè) Gi,Gj是兩個(gè)類:任意?Xi∈Gi,Xj∈Gj,則定義:
其中dij是Xi,Xj之間的距離,為兩個(gè)類Gi,Gj之間的距離,它是Gi,Gj之間的最短距離。 用此方法,設(shè) Gp,Gq合并為一個(gè)新類 Gr,則對(duì)于任意一個(gè)類Gk,有
經(jīng)過專家打分本文選出13個(gè)影響因素,做了100份問卷調(diào)查,構(gòu)建決策信息表如表1所示:
表1 調(diào)查問卷設(shè)計(jì)
表中用“0、1、2、3、4”來表示不同的取值。 U={u1,u2,…,u100}表示100分問卷的集合,A={C1,C2,…,C12,d1}表示屬性集。經(jīng)過上述處理后可得到如下的決策信息表:
表2 決策信息表
已知 DIS=<U,C∪tnz5xn3,V,f>,屬性集 C={c1,c2,…,ci},U/d={D1,D2,…,Dr}是由決策屬性d導(dǎo)出的覆蓋,則條件屬性集C的下近似分布約簡(jiǎn)的步驟如下:
步驟1:令C的下近似分布約簡(jiǎn)R=φ。
步驟2:判斷LOW(R)=LOW(C)是否成立,若成立則轉(zhuǎn)步驟4,否則轉(zhuǎn)步驟3;
步驟 3:對(duì)任意 ai∈(C-R),取 Sig(ai,C,nfnvtjx)獲得最小值時(shí)的 ai,更新 R,使 R=R∪{ai}, 轉(zhuǎn)步驟 2;
步驟4:輸出R,R即為C的下近似分布約簡(jiǎn)。
算法的時(shí)間復(fù)雜度分析:步驟2中計(jì)算LOW(R)與LOW(C)是否相等的時(shí)間復(fù)雜度是 O(|C|U|2)步驟 3 的時(shí)間復(fù)雜度是因此該算法的時(shí)間復(fù)雜度是 O(|C|U|2)。 將步驟 2中的判斷條件改為 UPP(R)=UPP(C),步驟 3 的啟發(fā)信息改為 Sig(Ci,C,55fbjbv),即可求得 C 的上近似分布約簡(jiǎn)。
通過計(jì)算約簡(jiǎn)掉的冗余數(shù)據(jù)為 {c5,c11,c12,c13},最終得到C對(duì){d}的相對(duì)約簡(jiǎn)為{c1,c2,c3,c4,c6,c7,c8,c9,c10}。因此獲得的確定性規(guī)則如下:
r1:(c1=3)^(c2=3)^(c3=1)^(c4=1)^(c6=0)^(c7=1)^(c8=0)^(c9=1)^(c10=1)→(d=0),可信度為1
r2:(c1=3)^(c2=3)^(c3=0)^(c4=1)^(c6=1)^(c7=1)^(c8=1)^(c9=1)^(c10=1)→(d=2),可信度為1
r3:(c1=3)^(c2=3)^(c3=1)^(c4=1)^(c6=0)^(c7=1)^(c8=1)^(c9=1)^(c10=0)→(d=1),可信度為1
r4:(c1=3)^(c2=3)^(c3=0)^(c4=1)^(c6=0)^(c7=1)^(c8=1)^(c9=1)^(c10=1)→(d=3),可信度為1
上述確定性規(guī)則用通俗語言解釋如下:
1)有相關(guān)證書,成績(jī)較好,學(xué)生黨員,學(xué)生干部,不是自主創(chuàng)業(yè)嘗試者,有獨(dú)立工作能力,缺乏綜合分析能力,有口頭表達(dá)能力,有創(chuàng)新能力;該類畢業(yè)生適合國企,可信度為1。
2)有相關(guān)證書,成績(jī)較好,不是學(xué)生黨員,學(xué)生干部,自主創(chuàng)業(yè)嘗試者,有獨(dú)立工作能力,一定綜合分析能力,有口頭表達(dá)能力,有創(chuàng)新能力;該類畢業(yè)生適合外企,可信度為1。
3)有相關(guān)證書,成績(jī)較好,學(xué)生黨員,學(xué)生干部,不是自主創(chuàng)業(yè)嘗試者,有獨(dú)立工作能力,一定綜合分析能力,有口頭表達(dá)能力,創(chuàng)新能力弱;該類畢業(yè)生適合民企,可信度為1。
4)有相關(guān)證書,成績(jī)較好,不是學(xué)生黨員,學(xué)生干部,不是自主創(chuàng)業(yè)嘗試者,有獨(dú)立工作能力,一定綜合分析能力,有口頭表達(dá)能力,有創(chuàng)新能力;該類畢業(yè)生適合其他類型企業(yè),可信度為1。
不足之處:通過知識(shí)約簡(jiǎn)獲得的確定性規(guī)則,雖然每個(gè)屬性都是必要的,但表示的確定性規(guī)則顯得繁雜,尤其用通俗語言解釋時(shí)。如果當(dāng)?shù)玫酱_定性規(guī)則存在幾十個(gè)屬性并很多屬性必要且相同時(shí),不管用通俗語言解釋還是用符號(hào)表示,就會(huì)更加繁雜,難以簡(jiǎn)單的找到區(qū)分點(diǎn)。因此解決這個(gè)不足之處是必須的。
改進(jìn)方法:最小距離法和粗糙集相結(jié)合。
最小距離法步驟如下:
第二步:找出D(0)的非對(duì)角線上的最小元素,假設(shè)為Dpq,將Gp,Gq合成一個(gè)新類Gr。
第三步:求出 n-1 個(gè)新類的距離矩陣 D(1)=(Dij),其中:Dir=Dri=min{Dip,Diq}。
第四步:重復(fù)第二、三兩個(gè)步驟,直至將樣品合并為所需的類。
通過最小距離法,將屬性c1和c2分為一類,記為C1,即顯性具體能力;屬性c7和c9分為一類,記為C2,即基本能力。則改進(jìn)后的確定性規(guī)則如下:q
r1:(C1=3)^(c3=1)^(c4=1)^(c6=0)^(C2=1)^(c8=0)^(c10=1)→(d=0),可信度為1
r2:(C1=3)^(c3=0)^(c4=1)^(c6=1)^(C2=1)^(c8=1)^(c10=1)→(d=2),可信度為1
r3:(C1=3)^(c3=1)^(c4=1)^(c6=0)^(C2=1)^(c8=1)^(c10=0)→(d=1),可信度為1
r4:(C1=3)^(c3=0)^(c4=1)^(c6=0)^(C2=1)^(c8=1)^(c10=1)→(d=3),可信度為1
上述確定性規(guī)則用通俗語言解釋如下:
1)有顯性具體能力,學(xué)生黨員,學(xué)生干部,不是自主創(chuàng)業(yè)嘗試者,有基本能力,缺乏綜合分析能力,有創(chuàng)新能力;該類畢業(yè)生適合國企,可信度為1。
2)有顯性具體能力,不是學(xué)生黨員,學(xué)生干部,自主創(chuàng)業(yè)嘗試者,有基本能力,一定綜合分析能力,有創(chuàng)新能力;該類畢業(yè)生適合外企,可信度為1。
3)有顯性具體能力,學(xué)生黨員,學(xué)生干部,不是自主創(chuàng)業(yè)嘗試者,有基本能力,一定綜合分析能力,創(chuàng)新能力弱;該類畢業(yè)生適合民企,可信度為1。
4)有顯性具體能力,不是學(xué)生黨員,學(xué)生干部,不是自主創(chuàng)業(yè)嘗試者,有基本能力,一定綜合分析能力,有創(chuàng)新能力;該類畢業(yè)生適合其他類型企業(yè),可信度為1。
本文利用最小距離法和粗糙集的知識(shí)對(duì)企業(yè)人才需求狀況的數(shù)據(jù)處理,通過上述可以看出,不同的企業(yè)對(duì)畢業(yè)生有不同的要求,但其中有些是共同因素,如:證書,成績(jī)的重要性,學(xué)生干部,獨(dú)立工作能力等。因此,學(xué)校針對(duì)性地采取有效措施,正確引導(dǎo)大學(xué)生合理安排大學(xué)生活,應(yīng)屆畢業(yè)生可根據(jù)自身的情況找到適合的類型企業(yè)或根據(jù)企業(yè)的類型來準(zhǔn)備簡(jiǎn)歷和其他相關(guān)性的事情,這對(duì)應(yīng)屆畢業(yè)生在校園招聘中有一定的參考價(jià)值。
[1]張文修,吳偉志,梁吉業(yè),李德玉.粗糙集理論與方法[J].北京:科學(xué)出版社,2001.
[2]Pawlak Z.Rough sets[J].International Joumal of Computer and information Sciences,1982,11(5):341-356.
[3]徐維艷,魏敏,張明.基于相似關(guān)系粗糙集中的否定規(guī)則及約簡(jiǎn)[J].微電子學(xué)與計(jì)算機(jī),2012.
[4]賀瑩,嚴(yán)春芳.關(guān)于提高校園招聘有效性的思考[M].上海:中國電子科技集團(tuán)公司第二十三研究所,2014.
[5]徐映梅.市場(chǎng)分析方法[M].北京:中國財(cái)經(jīng)經(jīng)濟(jì)出版社,2006.