劉 欣,岳曉磊,靖 超,王亞林
(河北北方學(xué)院附屬第一醫(yī)院,河北張家口 075000)
隨著人工智能技術(shù)的發(fā)展,醫(yī)院的智能化進(jìn)程也在快速推進(jìn),這體現(xiàn)在管理智能化及醫(yī)療設(shè)備自動(dòng)化兩方面。作為管理智能化的重要組成部分,人力資源智能化管理被越來(lái)越多的醫(yī)療機(jī)構(gòu)所重視。人力資源合理化管理對(duì)醫(yī)院高效培養(yǎng)醫(yī)療領(lǐng)域人才、完善醫(yī)院管理模式和提高醫(yī)院整體資源利用率均有極大的幫助,在有效加強(qiáng)醫(yī)院整體性的同時(shí)也可以更優(yōu)的發(fā)揮醫(yī)院經(jīng)濟(jì)價(jià)值與社會(huì)價(jià)值。因此,對(duì)醫(yī)院進(jìn)行高效率、智能化的人力資源管理尤為重要[1-2]。
然而智能化時(shí)代的顯著特征即是數(shù)據(jù)的爆炸式增長(zhǎng),由此帶來(lái)的是傳統(tǒng)人力資源管理方式已無(wú)法滿足海量的數(shù)據(jù)處理需求。簡(jiǎn)單的人力資源管理系統(tǒng)也無(wú)法對(duì)醫(yī)院的人力數(shù)據(jù)做出準(zhǔn)確的分析與調(diào)配,同時(shí)也浪費(fèi)了醫(yī)院各類信息系統(tǒng)收集的大量數(shù)據(jù)。這不僅流失了醫(yī)院的信息化資源,也拖累了醫(yī)院的智能信息化進(jìn)程。因此,有必要將先進(jìn)的人工智能算法應(yīng)用于醫(yī)院人力資源配置系統(tǒng),可以大幅提高醫(yī)院人力資源數(shù)據(jù)的處理能力。
從根本而言,對(duì)數(shù)據(jù)的處理即是數(shù)據(jù)挖掘。數(shù)據(jù)挖掘指的是使用軟件系統(tǒng)對(duì)數(shù)據(jù)包含的有用信息進(jìn)行合理提取,傳統(tǒng)數(shù)據(jù)挖掘方法大多是使用統(tǒng)計(jì)學(xué)的方法。統(tǒng)計(jì)學(xué)方法在數(shù)據(jù)內(nèi)容較少的情況下可以使用,但若有海量數(shù)據(jù),統(tǒng)計(jì)學(xué)方法則較為無(wú)法適應(yīng)需求。機(jī)器學(xué)習(xí)是目前使用廣泛的數(shù)據(jù)挖掘方法,其可以對(duì)海量數(shù)據(jù)進(jìn)行訓(xùn)練,并提取數(shù)據(jù)隱藏的特征。然后不斷地學(xué)習(xí)這些特征,可以準(zhǔn)確地進(jìn)行數(shù)據(jù)信息提取。文中使用了機(jī)器學(xué)習(xí)的方法對(duì)人力資源數(shù)據(jù)進(jìn)行處理,進(jìn)而提高人力資源數(shù)據(jù)處理能力[3-5]。
根據(jù)傳統(tǒng)人力資源配置理論,規(guī)劃人力資源主要是對(duì)單位的人事結(jié)構(gòu)進(jìn)行分析,并詳細(xì)梳理崗位需求與人員能力之間的關(guān)聯(lián)性。人員能力包括多種要素,對(duì)這些要素進(jìn)行加權(quán)求和,判斷人員的素質(zhì)得分[6-8]。
傳統(tǒng)的人力資源評(píng)分過(guò)程,如圖1 所示。
圖1 人力資源評(píng)分流程
首先,對(duì)接收到的數(shù)據(jù)進(jìn)行分組分析,數(shù)據(jù)分組包括人員評(píng)價(jià)矩陣和人員能力矩陣這兩組。其中最常用的是建立職工能力評(píng)價(jià)矩陣,該矩陣可能考慮到多方面的因素,如自我評(píng)價(jià)、上下級(jí)評(píng)價(jià)、患者評(píng)價(jià)等。人員能力矩陣包括員工績(jī)效、出勤率、職稱等信息。在得到人員評(píng)價(jià)矩陣值與人員能力矩陣值后,可以得到關(guān)鍵指標(biāo)人崗匹配度,如式(1)所示:
其中,n1~n4為對(duì)應(yīng)評(píng)價(jià)參數(shù)。
設(shè)另一變量為Xij,有:
因此,可以由人崗匹配度模型對(duì)人員進(jìn)行優(yōu)化,如下式所示:
上述算法簡(jiǎn)單、有效,可以對(duì)人力資源進(jìn)行較好的配置,但這僅適用于人力數(shù)據(jù)較少的情況下。隨著醫(yī)院體制的增加,人力數(shù)據(jù)也在增多,問(wèn)題也變得復(fù)雜化。這種方法計(jì)算效率低,不能較好地對(duì)數(shù)據(jù)進(jìn)行挖掘,無(wú)法對(duì)人力資源進(jìn)行有效的管理。
從上文可知,人力資源調(diào)度模型本質(zhì)是對(duì)人力資源數(shù)據(jù)進(jìn)行分析,計(jì)算人崗匹配度。然后根據(jù)人崗匹配度分?jǐn)?shù)進(jìn)行人員的調(diào)度,這在本質(zhì)上可以抽象成為推薦模型。推薦模型在眾多領(lǐng)域內(nèi)均有分析和驗(yàn)證,目前主流的推薦模型使用循環(huán)神經(jīng)網(wǎng)絡(luò)作為數(shù)據(jù)處理模塊。
循環(huán)神經(jīng)網(wǎng)絡(luò)最主要的特征是使用循環(huán)卷積進(jìn)行數(shù)據(jù)訓(xùn)練運(yùn)算[9-10]。循環(huán)卷積網(wǎng)絡(luò)模型可以看作一種層次化的數(shù)據(jù)模型,卷積網(wǎng)絡(luò)的輸入為原始的人力資源數(shù)據(jù)。經(jīng)過(guò)循環(huán)卷積運(yùn)算、池化、激活函數(shù)等過(guò)程,將數(shù)據(jù)之間的抽象特征提取出來(lái),其過(guò)程表達(dá)式如下:
其中,xL為L(zhǎng)層的數(shù)據(jù)輸入,ω為L(zhǎng)層的參數(shù)權(quán)重值,z為模型選擇的損失函數(shù),y為模型的標(biāo)定值,函數(shù)f為模型的最終計(jì)算參數(shù)。
文中將基礎(chǔ)神經(jīng)網(wǎng)絡(luò)進(jìn)行改進(jìn),使用混合循環(huán)神經(jīng)網(wǎng)絡(luò)模型,并利用全局模型和局部模型相結(jié)合的方式,將模型層次化運(yùn)算后的數(shù)據(jù)特征作為網(wǎng)絡(luò)輸出,進(jìn)而實(shí)現(xiàn)數(shù)據(jù)的處理。然后使用層次化的模型結(jié)構(gòu)進(jìn)行網(wǎng)絡(luò)搭建,進(jìn)而實(shí)現(xiàn)人崗匹配推薦[11-13]?;旌涎h(huán)網(wǎng)絡(luò)模型,如圖2 所示。
圖2 混合循環(huán)網(wǎng)絡(luò)模型
在模型搭建過(guò)程中,文中選取交叉熵作為判斷損失函數(shù)。該損失函數(shù)可以對(duì)數(shù)據(jù)實(shí)際值和數(shù)據(jù)期望值進(jìn)行比較,進(jìn)而確定數(shù)據(jù)的接近程度,損失函數(shù)如下:
同時(shí),在訓(xùn)練時(shí)使用梯度優(yōu)化算法對(duì)參數(shù)進(jìn)行優(yōu)化。這樣參數(shù)傳遞可以盡量準(zhǔn)確,模型參數(shù)的具體更新過(guò)程為:
1)對(duì)神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)率、迭代次數(shù)進(jìn)行更新,如下式所示:
其中,β1、β2為循環(huán)神經(jīng)網(wǎng)絡(luò)的超參數(shù),gt為模型的計(jì)算梯度,t為模型的迭代次數(shù)。
2)對(duì)一階估計(jì)值和二階估計(jì)值進(jìn)行優(yōu)化定向,有:
3)由上文得到的結(jié)果對(duì)模型的參數(shù)進(jìn)行更新:
文中1.2 節(jié)提到,使用的總體算法即為人崗匹配推薦算法。推薦算法的流程設(shè)計(jì)也要針對(duì)不同的應(yīng)用場(chǎng)景和數(shù)據(jù)特征。當(dāng)前使用的人力資源領(lǐng)域的算法通常均是統(tǒng)計(jì)算法,未考慮到數(shù)據(jù)隱藏的特征,僅依靠簡(jiǎn)單的打分和專家評(píng)判機(jī)制,這容易導(dǎo)致信息匱乏問(wèn)題的出現(xiàn)。
文中將循環(huán)卷積神經(jīng)網(wǎng)絡(luò)和傳統(tǒng)人力資源配置算法相結(jié)合,設(shè)計(jì)了適用于人力資源領(lǐng)域的人崗匹配推薦算法。該算法不但改善了傳統(tǒng)算法數(shù)據(jù)訓(xùn)練質(zhì)量較低的問(wèn)題,而且通過(guò)采用循環(huán)神經(jīng)網(wǎng)絡(luò)有效提高了數(shù)據(jù)計(jì)算效率。算法的核心思想是:首先對(duì)數(shù)據(jù)中的原始特征進(jìn)行提取,原始特征和傳統(tǒng)人力資源所需特征一致,包括人員評(píng)價(jià)矩陣和人員能力矩陣。數(shù)據(jù)提取進(jìn)入編碼器進(jìn)行編碼,然后將編碼特征作為數(shù)據(jù)輸入項(xiàng)輸入到循環(huán)神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)輸入層。使用循環(huán)卷積層對(duì)數(shù)據(jù)進(jìn)行處理,進(jìn)而得到人崗匹配結(jié)果,算法流程如圖3 所示。
圖3 算法流程
首先,進(jìn)行數(shù)據(jù)采集,其使用分布流式采集方法對(duì)數(shù)據(jù)進(jìn)行選擇,分組為人員評(píng)價(jià)矩陣和人員能力矩陣。然后將數(shù)據(jù)抽象化,對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,使用編碼器對(duì)數(shù)據(jù)進(jìn)行編碼且保存到數(shù)據(jù)倉(cāng)庫(kù);使用提升特征算法對(duì)數(shù)據(jù)特征進(jìn)一步加強(qiáng)后,輸入至循環(huán)卷積網(wǎng)絡(luò)。最終輸出人崗匹配分?jǐn)?shù),人力資源推薦過(guò)程完成。
算法流程中的步驟說(shuō)明如下:
1)數(shù)據(jù)采集。使用分布流式的數(shù)據(jù)采集方法,由于不同醫(yī)院人力數(shù)據(jù)不同,格式也存在差異。因此必須對(duì)人力數(shù)據(jù)進(jìn)行統(tǒng)一格式處理,處理方式包括數(shù)據(jù)舍棄、轉(zhuǎn)換等操作。
2)對(duì)原始的數(shù)據(jù)進(jìn)行預(yù)處理。對(duì)數(shù)據(jù)進(jìn)行分組,從而對(duì)人力資源模型特征進(jìn)行更加全面的了解。同時(shí)將數(shù)據(jù)保存至數(shù)據(jù)倉(cāng)庫(kù)中,這樣可以對(duì)后續(xù)的數(shù)據(jù)模型訓(xùn)練進(jìn)行支撐。
3)進(jìn)行特征增強(qiáng)。從數(shù)據(jù)倉(cāng)庫(kù)中獲取數(shù)據(jù),并對(duì)數(shù)據(jù)分組結(jié)果進(jìn)行學(xué)習(xí)。將融合后的數(shù)據(jù)結(jié)果作為神經(jīng)網(wǎng)絡(luò)數(shù)據(jù)輸入,進(jìn)行網(wǎng)絡(luò)訓(xùn)練。
4)推薦結(jié)果輸出。將人崗匹配度結(jié)果進(jìn)行排序,然后參考分?jǐn)?shù)進(jìn)行合理的崗位分配。
對(duì)算法進(jìn)行評(píng)價(jià),一般通過(guò)一定數(shù)量的指標(biāo)進(jìn)行,文中的人力資源推薦算法評(píng)價(jià)指標(biāo)采用準(zhǔn)確度評(píng)價(jià)指標(biāo)[14-16]。
在評(píng)價(jià)體系中,準(zhǔn)確率和召回率越高,代表算法越優(yōu)。但在一些場(chǎng)景下,準(zhǔn)確率和召回率可能是矛盾的,所以為了綜合這兩個(gè)指標(biāo),文中使用F1 值進(jìn)行綜合,公式為:
文中數(shù)據(jù)對(duì)醫(yī)院人力資源數(shù)據(jù)進(jìn)行分類整理,數(shù)據(jù)包含人員自身信息、人員評(píng)價(jià)矩陣值及人員能力矩陣值3 種。該次數(shù)據(jù)共采集到醫(yī)院職工4 560名,醫(yī)院崗位1 233 個(gè),樣本數(shù)量為134 540 個(gè)。該次實(shí)驗(yàn)的環(huán)境,如表1 所示。
表1 實(shí)驗(yàn)設(shè)置環(huán)境說(shuō)明
文中將樣本分為訓(xùn)練樣本集和測(cè)試樣本集。神經(jīng)網(wǎng)絡(luò)測(cè)試過(guò)程偽代碼如下:
輸入:特征D。
輸出:混合循環(huán)神經(jīng)模型。
1)初始化超參數(shù),參數(shù)包括迭代次數(shù)t,學(xué)習(xí)率L,循環(huán)神經(jīng)網(wǎng)絡(luò)的超參數(shù)β1、β2,模型的計(jì)算梯度gt;
2)i從1 到t循環(huán);
3)j從1 到t循環(huán);
4)計(jì)算各個(gè)通道的特征值,代入函數(shù)f;
5)若j=t,則終止循環(huán),執(zhí)行步驟6);若j<t,則返回步驟3);
6)提取卷積特征,得到F;
7)將F值和局部模型特征值結(jié)合,得到概率值;
8)得到當(dāng)前的人崗匹配值;
9)排序,輸出最終結(jié)果;
10)若i<t,則返回步驟2),循環(huán)執(zhí)行i過(guò)程;
11)若i=t,結(jié)束。
然后對(duì)文中算法的可行性進(jìn)行對(duì)比實(shí)驗(yàn),使用文中算法、卷積神經(jīng)網(wǎng)絡(luò)算法、傳統(tǒng)統(tǒng)計(jì)學(xué)方法進(jìn)行模型訓(xùn)練以及實(shí)驗(yàn)分析,分析評(píng)價(jià)指標(biāo)為準(zhǔn)確率、召回率和F1 值。實(shí)驗(yàn)結(jié)果如表2 所示。
表2 對(duì)比實(shí)驗(yàn)結(jié)果
由表2 可以看出,文中算法的F1 值和其他兩項(xiàng)算法相比均有明顯提升,傳統(tǒng)統(tǒng)計(jì)學(xué)方法效果最差。在數(shù)據(jù)量較多的情況下F1 值為0.678,普通卷積神經(jīng)網(wǎng)絡(luò)算法F1 值有所提升,為0.766;文中算法表現(xiàn)最優(yōu),F(xiàn)1 值為0.823。這說(shuō)明直接使用循環(huán)卷積網(wǎng)絡(luò)并不能真正提升數(shù)據(jù)的訓(xùn)練特征,而文中使用全局網(wǎng)絡(luò)加局部網(wǎng)絡(luò)的方法,可以有效提升數(shù)據(jù)的隱層特征,進(jìn)而提升數(shù)據(jù)的訓(xùn)練質(zhì)量,提高算法的匹配度和推薦精度。
人力資源調(diào)度模型本質(zhì)是對(duì)人力資源數(shù)據(jù)進(jìn)行分析,計(jì)算人崗匹配度。然后根據(jù)人崗匹配度分?jǐn)?shù)進(jìn)行人員的調(diào)度,這在本質(zhì)上可以抽象成為推薦模型。文中對(duì)基礎(chǔ)神經(jīng)網(wǎng)絡(luò)進(jìn)行改進(jìn),使用混合循環(huán)神經(jīng)網(wǎng)絡(luò)模型、全局模型和局部模型相結(jié)合的方式,將模型層次化運(yùn)算后的數(shù)據(jù)特征作為網(wǎng)絡(luò)輸出,進(jìn)而實(shí)現(xiàn)數(shù)據(jù)的處理。通過(guò)采用層次化的模型結(jié)構(gòu)進(jìn)行網(wǎng)絡(luò)搭建,最終實(shí)現(xiàn)高精確度的人崗匹配與推薦。