亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于Stacking 集成學習的員工離職預(yù)測方法

        2021-06-24 11:22:46李佳浩褚治廣
        關(guān)鍵詞:流失率分類器準確率

        李佳浩,李 昕,褚治廣

        (遼寧工業(yè)大學 計算中心,遼寧 錦州 121001)

        如今大公司的人員流失越來越嚴重,尤其是一些專業(yè)的員工。但是,擁有不同追求的員工往往不滿于現(xiàn)狀,抑或是因為種種的原因,缺乏與企業(yè)的溝通交流,一時選擇離職來解決問題[1]。員工的離職不僅會給公司帶來收益降低,而且會給企業(yè)發(fā)展帶來很多危害,比如商業(yè)機密的泄露,一些重要客戶的丟失,在市場中失去了企業(yè)競爭力。因此一種能夠提前洞悉員工離職想法的系統(tǒng)非常必要,通過IBM 公司提供的相關(guān)數(shù)據(jù),對其進行大數(shù)據(jù)分析[2]。通過對數(shù)據(jù)進行數(shù)據(jù)清洗等預(yù)處理,數(shù)據(jù)可視化分析,本實驗用了一種基于 Stacking 集成算法Adaboost 和隨機森林算法一起構(gòu)建的一種LRA 員工離職傾向模型。學習數(shù)據(jù)中蘊含的規(guī)律,對員工離職因素數(shù)據(jù)集進行分析。最后對可能影響員工離職的重要因素進行分析,從而減少員工想要離職的想法,減少企業(yè)的不必要的經(jīng)濟損失、讓企業(yè)領(lǐng)導(dǎo)者做出正確的決定,來減少想要離職的員工人數(shù)[3]。

        1 算法介紹

        1.1 Adaboost 算法

        Adaboost 是Boosting算法中最具有代表性的一種算法之一。算法過程如下:

        假設(shè)訓練集

        M為樣本的個數(shù),(其中,i=1,2,...,M)。

        帶有權(quán)值分布的Dm訓練數(shù)據(jù)集,在第m次運算后得到的基本分類器其中,m代表次數(shù))。

        計算Gm(x)的分類誤差:

        計算Gm(x)的系數(shù):

        更新訓練集的權(quán)限分布:

        其中,i=1,2,...,M,Zm是規(guī)范化因子,

        其目的是得到最終分類器,

        線性組合f(x)實現(xiàn)M個基學習器的加權(quán)表決,αm表示基本分類器Gm(x)的重要程度[4]。

        1.2 隨機森林算法

        設(shè)樣本有M個特征,隨機森林隨機抽取了K個 bootstrap 數(shù)據(jù)集,對應(yīng)有K個 OOB 數(shù)據(jù)集,特征重要性排序的步驟如下:

        (1)初始化k=1;

        (2)使用第k個 bootstrap 數(shù)據(jù)集,訓練決策樹TK,計算第k個 OOB 數(shù)據(jù)集的分類準確率L_K^OOB;

        (3)對OOB 數(shù)據(jù)集中的特征Xi,i=1,2,3...M施加擾動,重新計算準確率L_(K,I)^OOB;

        (4)對于k=2,3,...K重復(fù)步驟(2)(3);

        (5)計算特征重要性;

        (6)對PI 降序排列,得到特征重要性排序,排名靠越前重要性越高[5]。

        根據(jù)分類器特性及總特征個數(shù)設(shè)定特征數(shù)目上限,依據(jù)特征重要性排序,使用序列前向選擇法,每次無放回地選取排序最前的特征加入特征子集,計算子集分類準確率,直到達到特征數(shù)目上限,最后選出分類效果好且特征數(shù)目少的最優(yōu)特征集[6]。

        2 數(shù)據(jù)分析

        對一些重要的變量進行快速可視化及探索性分析,特別是與基礎(chǔ)信息、收入、晉升、快樂的程度、家庭幸福、工作的熱愛度。對數(shù)據(jù)集的特征屬性進行匯總,將變量屬性人為分為以下幾類:

        (1)基礎(chǔ)屬性:Age(年齡)、Gender(性別)、Education(學歷)、EducationField(學歷專業(yè))、MaritalStatus(婚姻情況);

        (2)年齡與工作時間掛鉤:Age(年齡)、NumCampaniesWorked(任職企業(yè)數(shù)量)、YearsAtCompany(在目前公司工作年數(shù))、TotalWorkingYears(總工齡);

        (3)工作部門等:Department(部門)Jobrole(職位)JobLevel(職位等級);

        (4)探索收入、投入等:OverTime(是否加班)、HourlyRate(時息)、DailyRate(日息)、MonthlyRate(月息)、MonthlyIncome(月收入)、JobInvolvement(工作投入);

        (5)員工對環(huán)境等滿意度:EnviromentSatisfa ction(環(huán)境滿意度)、JobSatisfaction(工作滿意度)、RelationshipSatisfaction(關(guān)系滿意度);

        (6)員工所受福利等:PerformanceRating(績效評估)、StockOptionLevel(員工優(yōu)先認股權(quán))、PercentSalaryHike(工資漲薪百分比)、TrainingTimesLastYear(上一年培訓次數(shù))、YearsSinceLastPromotion(距離上次升職時長);

        (7)工作和生活平衡相關(guān):OverTime(是否加班)、Balance(工作與生活平衡情況)、DistanceFromHome(離家距離)、BussinessTravel(商務(wù)出差頻率)。

        員工對環(huán)境等滿意度的分析,如圖1 所示。

        圖1 員工職業(yè)關(guān)系環(huán)境滿意度對離職影響圖

        從圖中可看出:滿意度的觀察結(jié)果來說比較直接,3 個滿意度變量都顯示了低滿意度是離開的原因。

        員工所受福利數(shù)據(jù)探索性分析,如圖2 所示為員工績效分布圖。

        功績越低或越高 越有可能離職。員工績效對于員工的離職有著很大的影響,如圖2、圖3 所示。

        圖2 員工績效分布圖

        圖3 員工績效分布圖

        工作和生活平衡相關(guān)數(shù)據(jù)探索性分析,如圖4所示。

        由圖3 可知,沒有員工優(yōu)先認股權(quán)的員工流失率較高;上一年沒有參與培訓的員工流失率高,但相對其他有參與培訓的員工的并不算特別高。從加薪、培訓、和升職的角度看,好像并沒有很強的關(guān)系說明能夠影響員工的流失,也許正是因為這些手段在員工看到是理所當然的,應(yīng)有的福利回報,或許有可能給得越多員工可能還是認為不夠,適得其反。反觀員工優(yōu)先認股權(quán)對于員工來源是有效的手段,有認股權(quán)的員工相對來說較穩(wěn)定,因為那是未來觸手可及的利益,有利益的捆綁,重點在于捆綁。

        由圖4 可知,經(jīng)常加班的員工相對于不加班的員工流失率非常高;認為工作與生活平衡水平為1的員工流失率較高;頻繁出差的員工流失率較高;距離家較遠的員工流失率較高[7]。加班是最為影響生活質(zhì)量的因素,其結(jié)果也是最明顯,在加班與不加班的員工中,流失率的差異非常大;工作與生活較不平衡的員工流失率也會高一點;出差比較頻繁的員工也容易流失,上班距離較遠的員工也容易流失,總體而言,工作與生活的平衡這一類因素對員工流失的影響較為嚴重[8]。

        圖4 工作和生活平衡與員工離職關(guān)系圖

        由此方法可以刪選得到DistanceFromHome(離家距離)、Age(年齡)等20 個特征屬性。

        3 結(jié)果分析

        通過得到的實驗結(jié)果報告數(shù)據(jù)顯示,Adaboost 和隨機森林模型準確率比Stacking 算法構(gòu)建的 LRA 模型所得到的預(yù)測結(jié)果準確率要低很多,從得到的實驗結(jié)果上直觀的證明了采用Stacking 算法構(gòu)建的 LRA 模型可行性[9]。相對于決策樹,隨機森林,Adaboost 這3 個單獨模型,LRA 的準確率,查準率,查全率和F1度量都效果優(yōu)秀。各模型標準值如表1 所示。

        表1 各模型的指標值

        從查全率來看:決策數(shù)模型最低,為 20.43%;LRA 模型最高為54.38%,Adaboost 第二為46.53%,隨機森林為22.36%,LRA 模型、Adaboost、隨機森林的查全率均高于決策樹模型[7]。從查準率來看:決策數(shù)模型最低為 19.10%;LRA 模型最高為55.67%,Adaboost 其次為46.59%,隨機森林為43.67%,LRA 模型、Adaboost、隨機森林的查準率均高于決策樹模型。因此LRA 模型的穩(wěn)健性更好,所以可以使用LRA 模型進行員工離職預(yù)測[10]。對離職有影響的因素為:薪資高低,福利待遇,假期長短,工作時間長短,加班時間等[11]。員工想要離職的想法和這些因素息息相關(guān)。因此企業(yè)管理者可以從這幾個主要方面入手,根據(jù)員工需求來解決問題,更好地滿足員工的條件。

        (1) 減少員工加班時間,多給員工減壓。

        (2) 適當時間找員工談話,滿足員工的一些需求。

        (3) 適當提高待遇,給予員工股份,來獎勵員工。

        (4) 平衡工作和家庭生活的關(guān)系,讓員工沒有后顧之憂。

        (5) 完善一些制度,提升員工對企業(yè)的歸屬感,降低員工離職的傾向。

        4 結(jié)論與展望

        本文主要研究數(shù)據(jù)挖掘中的分類算法在員工離職預(yù)測中的應(yīng)用,通過對初始數(shù)據(jù)集進行去重、刪除冗余屬性、連續(xù)屬性離散化等數(shù)據(jù)預(yù)處理來精簡優(yōu)化數(shù)據(jù),提高模型構(gòu)建效率。之后通過有放回抽樣的方式處理非均衡數(shù)據(jù)集,重構(gòu)數(shù)據(jù)集獲得均衡數(shù)據(jù)集用以模型的訓練。本文從實際場景數(shù)據(jù)出發(fā),對數(shù)據(jù)進行預(yù)處理。為核心算法提供干凈、更具針對性、符合算法模型要求的數(shù)據(jù)集,把一些和數(shù)據(jù)分析無關(guān)的屬性特征刪除,去除冗余和不完整數(shù)據(jù)為數(shù)據(jù)挖掘提供更好的,更符合需求的高質(zhì)量數(shù)據(jù)。數(shù)據(jù)進行探索性分析。對一些重要的變量進行快速可視化及探索性分析,特別是與基礎(chǔ)信息、收入、晉升、滿意度、績效和工作與生活平衡等相關(guān)的變量。對數(shù)據(jù)集的特征屬性利用R 語言進行匯總構(gòu)圖。做數(shù)據(jù)可視化處理。選用分類算法進行預(yù)測,選擇其中常用的決策樹作為基分類器模型,以隨機森林、Adaboost 作為初級分類器,Logistic 作為次級分類器,折交叉驗證構(gòu)建模型并構(gòu)建的LRA員工離職預(yù)測模型,達到預(yù)測員工離職的目的。這對公司人力資源分配具有意義,員工離職預(yù)測結(jié)果可以作為公司人力資源對員工離職判斷的輔助手段,有利于公司做出正確的決策[9]。

        猜你喜歡
        流失率分類器準確率
        乳腺超聲檢查診斷乳腺腫瘤的特異度及準確率分析
        健康之家(2021年19期)2021-05-23 11:17:39
        不同序列磁共振成像診斷脊柱損傷的臨床準確率比較探討
        2015—2017 年寧夏各天氣預(yù)報參考產(chǎn)品質(zhì)量檢驗分析
        生鮮豬肉肌細胞內(nèi)外間隙和水分狀態(tài)與持水性的關(guān)系
        食品科學(2020年21期)2020-11-27 10:45:56
        高速公路車牌識別標識站準確率驗證法
        BP-GA光照分類器在車道線識別中的應(yīng)用
        電子測試(2018年1期)2018-04-18 11:52:35
        壽險公司個人代理人流失的對策研究
        商情(2017年10期)2017-04-30 11:07:24
        美國OTT服務(wù)用戶流失率達19%
        綜藝報(2017年4期)2017-03-29 09:45:38
        加權(quán)空-譜與最近鄰分類器相結(jié)合的高光譜圖像分類
        結(jié)合模糊(C+P)均值聚類和SP-V-支持向量機的TSK分類器
        一本一道久久a久久精品综合蜜桃 成年女人18毛片毛片免费 | 精品国产91久久久久久久a| 我也色自拍俺也色自拍| 手机看片久久第一人妻| 在线观看精品视频网站| 亚洲国产av无码精品无广告| 欧美精品v国产精品v日韩精品| 欧美激情区| 午夜精品一区二区久久做老熟女| 国产亚洲av成人噜噜噜他| 久久777国产线看观看精品| 亚洲国产精品ⅴa在线观看| 女性女同性aⅴ免费观女性恋| 97福利视频| 国产视频免费一区二区| 亚洲国产精品成人久久久| 无码中文亚洲av影音先锋| 婷婷五月综合缴情在线视频| 国内精品久久久久国产盗摄 | 粉嫩少妇内射浓精videos| 无码一区二区丝袜| av有码在线一区二区三区| www国产亚洲精品久久麻豆| a级毛片内射免费视频| 欧美综合图区亚洲综合图区| 今井夏帆在线中文字幕| 极品尤物精品在线观看| 亚洲成av人片在线观看麦芽| 成人性生交大片免费看r| av无码特黄一级| 国产精品亚洲精品专区| 人人人妻人人人妻人人人| 日本阿v网站在线观看中文 | 亚洲爆乳少妇无码激情| 午夜在线观看有码无码| 国产精品国产自产拍高清| 日韩放荡少妇无码视频| 4444亚洲人成无码网在线观看| 亚洲日韩AV无码美腿丝袜| 国产精品白浆一区二区免费看| 亚洲三区在线观看内射后入|