云南中醫(yī)藥大學(xué)信息學(xué)院 董如福
云南師范大學(xué)教育學(xué)部 云南中醫(yī)藥大學(xué)信息學(xué)院 楊福華
云南中醫(yī)藥大學(xué)信息學(xué)院 劉紅杏
高校畢業(yè)生就業(yè)工作事關(guān)社會(huì)和諧穩(wěn)定,面對(duì)面對(duì)網(wǎng)絡(luò)平臺(tái)上海量的就職信息,學(xué)生如何找到適合自己的崗位,企業(yè)如何讓自己的招聘信息脫穎而出是較為困難的問(wèn)題,就業(yè)市場(chǎng)供需矛盾仍然突出。通過(guò)構(gòu)建基于用戶畫(huà)像的精準(zhǔn)就業(yè)模型,繪制畢業(yè)生用戶畫(huà)像,為畢業(yè)生精準(zhǔn)推送與自身相符的崗位,實(shí)現(xiàn)“人職匹配”,真正實(shí)現(xiàn)畢業(yè)生就業(yè)精化、高質(zhì)量就業(yè)。
2021年,根據(jù)教育部發(fā)布的數(shù)據(jù)顯示,我國(guó)大學(xué)畢業(yè)生數(shù)將達(dá)到909萬(wàn)人,再創(chuàng)歷史新高,就業(yè)形勢(shì)復(fù)雜嚴(yán)峻。為了緩解這種壓力,國(guó)家行政部門(mén)發(fā)布了《國(guó)務(wù)院關(guān)于進(jìn)一步做好新形勢(shì)下就業(yè)創(chuàng)業(yè)工作的意見(jiàn)》、《教育部辦公廳關(guān)于開(kāi)展全國(guó)普通高校畢業(yè)生精準(zhǔn)就業(yè)服務(wù)工作的通知》等文件,要求各地各高校要充分利用短信、APP、微信等渠道,建立精準(zhǔn)就業(yè)服務(wù)平臺(tái)。根據(jù)畢業(yè)生不同階段需求和求職意愿,精準(zhǔn)推送相應(yīng)的就業(yè)政策、崗位信息、指導(dǎo)服務(wù),實(shí)現(xiàn)就業(yè)服務(wù)個(gè)性化、差異化。其次,網(wǎng)絡(luò)技術(shù)的高速發(fā)展也為就業(yè)服務(wù)的精準(zhǔn)化提供了技術(shù)保障,畢業(yè)生在在校期間產(chǎn)生了海量的數(shù)據(jù),包括基礎(chǔ)數(shù)據(jù):畢業(yè)生成績(jī)數(shù)據(jù)、畢業(yè)生基本信息數(shù)據(jù)等、學(xué)校管理數(shù)據(jù)等。通過(guò)對(duì)這些數(shù)據(jù)進(jìn)行分析、挖掘,構(gòu)建畢業(yè)生用戶畫(huà)像。為畢業(yè)生精準(zhǔn)推送與自身相符的崗位,實(shí)現(xiàn)“人職匹配”,為畢業(yè)生提供精準(zhǔn)化就業(yè)服務(wù)。
用戶畫(huà)像是由交互設(shè)計(jì)之父Alan Cooper提出,是指用戶信息的標(biāo)簽化,是建立在一系列數(shù)據(jù)之上的目標(biāo)用戶模型。用戶畫(huà)像根據(jù)用戶的社會(huì)屬性、生活習(xí)慣和消費(fèi)行為等信息,抽取處一個(gè)或一類(lèi)用戶的標(biāo)簽,對(duì)用戶信息進(jìn)行結(jié)構(gòu)化處理。通過(guò)對(duì)用戶信息的分析和挖掘,實(shí)現(xiàn)對(duì)用戶群體特征的準(zhǔn)確描述,從而能精準(zhǔn)預(yù)測(cè)用戶的實(shí)際需求。
用戶畫(huà)像在電子商務(wù)、圖書(shū)情報(bào)、社交媒體和醫(yī)療健康等領(lǐng)域都有廣泛的應(yīng)用。用戶畫(huà)像通過(guò)定性和定量的方法,對(duì)用戶的各個(gè)屬性進(jìn)行分析、概括,全面精確的獲取用戶的需求,為用戶提供個(gè)性化、精準(zhǔn)的服務(wù)或商品打下基礎(chǔ)。
目前,將用戶畫(huà)像運(yùn)用于就業(yè)推薦方面取得了豐碩的成果。劉艷提出通過(guò)利用大數(shù)據(jù)能夠有效促進(jìn)校園管理和建設(shè)的開(kāi)展,能夠?qū)π@就業(yè)情況進(jìn)行用戶畫(huà)像建設(shè)。張東迅通過(guò)構(gòu)建雇主畫(huà)像的總體框架,進(jìn)行了雇主畫(huà)像維度和標(biāo)簽體系的設(shè)計(jì),并探索且提出了雇主畫(huà)像的構(gòu)建方法和流程。通過(guò)已有研究發(fā)現(xiàn),目前基于用戶畫(huà)像的就業(yè)推薦研究還不夠深入,對(duì)畢業(yè)生就業(yè)情況的用戶畫(huà)像建設(shè)僅停留在實(shí)踐探索層面,研究還不夠深入。其次,我國(guó)大學(xué)生就業(yè)質(zhì)量偏低的情況還沒(méi)有改變,具體體現(xiàn)在就業(yè)穩(wěn)定性低,崗位匹配度低,就業(yè)期望與崗位實(shí)際差距大。構(gòu)建基本的信息化管理平臺(tái),建立用戶畫(huà)像,通過(guò)有效地抓取和合理地利用畢業(yè)生、高校的數(shù)據(jù),并對(duì)其進(jìn)行數(shù)據(jù)分析和挖掘,來(lái)提高高校就業(yè)服務(wù)質(zhì)量和精準(zhǔn)就業(yè)服務(wù)的水平具有重要的意義。
數(shù)據(jù)的采集是建立用戶畫(huà)像的基礎(chǔ),T.Laouge、J.LARDY和N.B.ABDALLAH認(rèn)為用戶畫(huà)像中的用戶特征信息主要包含兩個(gè)方面:一是穩(wěn)定因素,如用戶的人口統(tǒng)計(jì)學(xué)數(shù)據(jù);二是可變因素。另外,代懋等指出大學(xué)生就業(yè)匹配主要受供給、需求和中介因素的影響。其中,供給因素主要考察大學(xué)生人口統(tǒng)計(jì)特征和在校實(shí)踐等對(duì)職位匹配的影響,包括性別、受教育程度、戶籍、專業(yè)類(lèi)別、學(xué)習(xí)成績(jī)、在校是否擔(dān)任學(xué)生干部、參加社會(huì)實(shí)踐的情況。其中,需求、中介因素以及供給因素中的受教育程度、專業(yè)類(lèi)別對(duì)于同一個(gè)學(xué)校的畢業(yè)生而言是不變因素,在此就不再討論。按照用戶畫(huà)像中用戶特征信息,認(rèn)為畢業(yè)生的用戶畫(huà)像的穩(wěn)定因素主要是指畢業(yè)生人口統(tǒng)計(jì)學(xué)數(shù)據(jù),包括性別、生源地、學(xué)習(xí)成績(jī)、是否擔(dān)任學(xué)生干部、參加實(shí)習(xí)情況等。此類(lèi)信息數(shù)據(jù)主要是通過(guò)采集學(xué)校的相關(guān)應(yīng)用系統(tǒng)產(chǎn)生。而可變因素包括畢業(yè)生在校期間借閱圖書(shū)的情況、使用學(xué)校就業(yè)信息系統(tǒng)產(chǎn)生的數(shù)據(jù)信息等,則從圖書(shū)管理系統(tǒng)和學(xué)校就業(yè)信息系統(tǒng)獲取。經(jīng)過(guò)采集和篩選以后,共得到了150名醫(yī)學(xué)信息學(xué)畢業(yè)生的信息,共計(jì)8000條數(shù)據(jù)。采集的數(shù)據(jù)維度如表1所示。
表1 采集的數(shù)據(jù)維度
本次研究的數(shù)據(jù)主要來(lái)源于某中醫(yī)藥大學(xué)醫(yī)學(xué)信息工程專業(yè)的歷屆畢業(yè)生,通過(guò)對(duì)采集到的數(shù)據(jù),進(jìn)行有效組織存儲(chǔ),整合成數(shù)據(jù)集。Guimaraes TP將用戶畫(huà)像的數(shù)據(jù)來(lái)源總結(jié)為用戶的基本素養(yǎng)、學(xué)歷層次、社會(huì)關(guān)系、工作狀態(tài)、位置情況、時(shí)間信息等。按照云南中醫(yī)藥大學(xué)醫(yī)學(xué)信息工程人才培養(yǎng)方案,該專業(yè)的畢業(yè)生就業(yè)方向主要分為電子信息類(lèi)、網(wǎng)絡(luò)技術(shù)類(lèi)、軟件設(shè)計(jì)開(kāi)發(fā)類(lèi)、醫(yī)學(xué)信息系統(tǒng)分析和設(shè)計(jì)類(lèi)。所以,本文就以此為依據(jù)對(duì)畢業(yè)生進(jìn)行分類(lèi),將用戶畫(huà)像數(shù)據(jù)進(jìn)行聚類(lèi)、分析。
(1)基本信息
基本信息維度主要是對(duì)畢業(yè)生的畫(huà)像進(jìn)行基本繪制,主要包含性別和生源地兩個(gè)信息。由于基本信息不同,對(duì)應(yīng)的就業(yè)需求也不同。在進(jìn)行畢業(yè)生用戶畫(huà)像標(biāo)簽構(gòu)建過(guò)程中,要對(duì)用戶基本信息數(shù)據(jù)作標(biāo)簽化處理,為每個(gè)用戶賦予不同形式與內(nèi)容的標(biāo)簽。
(2)就業(yè)能力
就業(yè)能力維度作為畢業(yè)生就業(yè)畫(huà)像的核心內(nèi)容,主要包括主要課程的成績(jī)、實(shí)習(xí)單位、實(shí)習(xí)時(shí)間和實(shí)習(xí)成績(jī)。云南中醫(yī)藥大學(xué)醫(yī)學(xué)信息工程專業(yè)畢業(yè)生就業(yè)方向和對(duì)應(yīng)課程設(shè)置如表2所示。
表2 云南中醫(yī)藥大學(xué)醫(yī)學(xué)信息工程專業(yè)畢業(yè)生就業(yè)方向和對(duì)應(yīng)課程設(shè)置
通過(guò)教務(wù)管理系統(tǒng)獲取學(xué)生的專業(yè)課成績(jī),并以此為依據(jù),對(duì)學(xué)生的成績(jī)進(jìn)行預(yù)處理,利用數(shù)據(jù)挖掘的相關(guān)方法,對(duì)畢業(yè)生相關(guān)數(shù)據(jù)進(jìn)行分析。
(3)就業(yè)傾向
就業(yè)傾向維度主要是作為畢業(yè)生生畫(huà)像的輔助內(nèi)容,主要包含了生源地、喜好、發(fā)展前景等。比如通過(guò)生源地可以給畢業(yè)生推薦生源地所在就業(yè)單位;通過(guò)專業(yè)相關(guān)、個(gè)人喜好、發(fā)展前景等屬性內(nèi)容推薦高度匹配就業(yè)崗位。
數(shù)據(jù)預(yù)處理是將數(shù)據(jù)進(jìn)行清洗、集成、標(biāo)準(zhǔn)化和轉(zhuǎn)換,并直接用于數(shù)據(jù)分析、建立模型的技術(shù)實(shí)現(xiàn)過(guò)程。根據(jù)采集到的數(shù)據(jù),將各個(gè)字段進(jìn)行量化,得到的數(shù)據(jù)特征如表3所示。
表3 根據(jù)采集數(shù)據(jù)各個(gè)字段量化的數(shù)據(jù)特征
通過(guò)數(shù)據(jù)分析過(guò)程,梳理得出單個(gè)學(xué)生的特征標(biāo)簽,實(shí)現(xiàn)個(gè)體的用戶畫(huà)像的構(gòu)建:
XX,男,云南XX人,電子信息類(lèi)成績(jī)較好,在XX公司實(shí)習(xí)從事軟件開(kāi)發(fā)工作,實(shí)習(xí)成績(jī)較好,喜歡借閱關(guān)于軟件開(kāi)發(fā)類(lèi)的書(shū)籍。
XXX,女,山東XX人,網(wǎng)絡(luò)信息系統(tǒng)和設(shè)計(jì)類(lèi)課程成績(jī)較好,在醫(yī)院信息科實(shí)習(xí),實(shí)習(xí)成績(jī)較好,喜歡借閱UI設(shè)計(jì)的書(shū)籍。
XXX,男,云南XX,網(wǎng)絡(luò)技術(shù)類(lèi)課程成績(jī)較好,在某網(wǎng)絡(luò)集成代理商實(shí)習(xí),實(shí)習(xí)成績(jī)較好,無(wú)書(shū)籍借閱情況。
本文采用k-means算法進(jìn)行聚類(lèi),通過(guò)Elbow Method方法得出當(dāng)k=4時(shí),聚類(lèi)效果最佳。由此可得到4類(lèi)畢業(yè)生類(lèi)別:畢業(yè)生群體1為就業(yè)能力強(qiáng),目標(biāo)明確。該類(lèi)學(xué)生在平時(shí)成績(jī)好,通過(guò)就業(yè)興趣維度發(fā)現(xiàn)其有明確的就業(yè)方向;畢業(yè)生群體2為就業(yè)能力弱,目標(biāo)明確。該類(lèi)學(xué)生在平時(shí)成績(jī)一般,但有明確的就業(yè)方向;畢業(yè)生群體3為就業(yè)能力強(qiáng),但無(wú)明確的就業(yè)方向;畢業(yè)生群體4為就業(yè)能力弱,無(wú)明確的就業(yè)方向。
根據(jù)畢業(yè)生用戶畫(huà)像進(jìn)行崗位匹配,本文采用貝葉斯算法對(duì)某中醫(yī)藥院校醫(yī)學(xué)專業(yè)畢業(yè)生的就業(yè)方向進(jìn)行預(yù)測(cè),為畢業(yè)生實(shí)現(xiàn)更加充分、更高質(zhì)量的精準(zhǔn)就業(yè)提供強(qiáng)有力保障。貝葉斯定理是一種把類(lèi)的先驗(yàn)知識(shí)和從數(shù)據(jù)中收集新證據(jù)相結(jié)合的統(tǒng)計(jì)原理。
貝葉斯定理的作用是在已知P(A|B)的情況下求得P(B|A)。其中,P(A|B)表示事件B已經(jīng)發(fā)生的前提下事件A發(fā)生的概率,P(A)和P(B)為無(wú)條件概率。精準(zhǔn)就業(yè)推薦算法如下:
算法輸入:已知2018屆至2020屆某中醫(yī)藥大學(xué)醫(yī)學(xué)信息學(xué)專業(yè)畢業(yè)生的畫(huà)像信息和就業(yè)方向。
算法輸出:確定2021屆某中醫(yī)藥大學(xué)醫(yī)學(xué)信息學(xué)專業(yè)畢業(yè)生就業(yè)方向,作為就業(yè)推薦方向。
(1)將畢業(yè)生的各項(xiàng)屬性進(jìn)行預(yù)處理。例如,將課程成績(jī)?yōu)?0分以上賦值為3,課程成績(jī)70-79賦值為2,課程成績(jī)60-69賦值為1,60分以下賦值為0;
(2)設(shè)畢業(yè)生用戶畫(huà)像集合為S={a1,a2,a3…am},a1-am表示用戶畫(huà)像的特征屬性,即為表中的各屬性值;
(3)設(shè)醫(yī)學(xué)信息工程專業(yè)的就業(yè)方向?yàn)榧螩={y1,y2,y3…yn};
(4)計(jì)算P(y1|S),P(y2|S),P(y3|S)…P(yn|S):1)將2018屆至2020屆某中醫(yī)藥大學(xué)醫(yī)學(xué)信息學(xué)專業(yè)畢業(yè)生作為訓(xùn)練樣本集;2)得到各就業(yè)方向下畢業(yè)生用戶畫(huà)像特征屬性的條件概率;3)若各個(gè)特征屬性是條件獨(dú)立的,則根據(jù)貝葉斯定理有如下推導(dǎo)。因?yàn)榉帜笇?duì)于所有的就業(yè)方向?yàn)槌A?,因此取得分子的最大值即可?/p>
(5)取得為最大值,則C。
基于用戶畫(huà)像的就業(yè)服務(wù)平臺(tái)主要包括以下幾個(gè)模塊,如圖1所示。
圖1 用戶畫(huà)像的就業(yè)服務(wù)平臺(tái)架構(gòu)
從基本信息、就業(yè)能力、就業(yè)傾向等維度對(duì)畢業(yè)生的數(shù)據(jù)進(jìn)行采集和分析,平臺(tái)收集的信息主要來(lái)源于平臺(tái)注冊(cè)獲取相關(guān)信息、全國(guó)就業(yè)信息網(wǎng)和高校應(yīng)用系統(tǒng)相關(guān)信息,通過(guò)開(kāi)發(fā)的就業(yè)服務(wù)平臺(tái)中的模塊實(shí)現(xiàn)對(duì)相關(guān)信息進(jìn)行采集。之后對(duì)就業(yè)信息進(jìn)行清洗和格式整理,并存儲(chǔ)在對(duì)應(yīng)的數(shù)據(jù)庫(kù)中。
利用已建立的就業(yè)服務(wù)信息系統(tǒng),利用獲取到的數(shù)據(jù)組成的多源數(shù)據(jù),進(jìn)行有效量化,整合成數(shù)據(jù)集,然后進(jìn)行深度分析,構(gòu)建畢業(yè)生用戶畫(huà)像,為畢業(yè)生提供精準(zhǔn)化就業(yè)服務(wù)。
基于用戶特征,對(duì)需要推薦的畢業(yè)生和已有的畢業(yè)生用戶畫(huà)像庫(kù)進(jìn)行相似度匹配,為畢業(yè)生精準(zhǔn)推送相關(guān)崗位,實(shí)現(xiàn)“人職匹配”。
畢業(yè)生可以對(duì)推薦結(jié)果進(jìn)行反饋。通過(guò)就業(yè)服務(wù)系統(tǒng)實(shí)現(xiàn)對(duì)畢業(yè)生就業(yè)滿意度、就業(yè)推薦匹配度等多方面的就業(yè)質(zhì)量綜合情況進(jìn)行收集,根據(jù)職業(yè)的需求與發(fā)展需要,得出相應(yīng)的結(jié)果。并以此為依據(jù)對(duì)用戶畫(huà)像進(jìn)行更新,為高校的人才培養(yǎng)、就業(yè)服務(wù)等提供改革依據(jù)。
利用大數(shù)據(jù)技術(shù),構(gòu)建基本的信息化管理平臺(tái),建立用戶畫(huà)像,通過(guò)有效地抓取和合理地利用畢業(yè)生、高校的數(shù)據(jù),并對(duì)其進(jìn)行數(shù)據(jù)分析和挖掘來(lái)提高高校就業(yè)服務(wù)的效率和精準(zhǔn)就業(yè)服務(wù)的水平具有重要的意義。對(duì)畢業(yè)生用戶就業(yè)用戶畫(huà)像進(jìn)行研究是實(shí)現(xiàn)精準(zhǔn)化就業(yè)的重要途徑之一,可以更好地促進(jìn)實(shí)現(xiàn)高等教育培養(yǎng)高素質(zhì)人才的最終目的,減少教育資源浪費(fèi),為國(guó)家發(fā)展提供更專業(yè)的各方面人才,對(duì)學(xué)校而言可以對(duì)實(shí)現(xiàn)對(duì)人才培養(yǎng)方案的不斷優(yōu)化,對(duì)于大學(xué)生個(gè)人而言也更能更好地促進(jìn)自我價(jià)值的最終實(shí)現(xiàn)。