辛志杰
技術(shù)應(yīng)用
基于模糊聚類的企業(yè)人力資源信息自動整合系統(tǒng)
辛志杰
(楊凌示范區(qū)人才交流服務(wù)中心,陜西 楊凌 712100)
人力資源信息管理是優(yōu)化企業(yè)人力資源配置的基礎(chǔ)。針對傳統(tǒng)人力資源信息整合系統(tǒng)主要利用固定流程對數(shù)據(jù)進(jìn)行統(tǒng)一配置處理,忽略了人力資源信息中無明顯分類界限的特點(diǎn),導(dǎo)致系統(tǒng)輸出存在大量冗余,整合效果較差的問題,設(shè)計(jì)基于模糊聚類的企業(yè)人力資源信息自動整合系統(tǒng)。利用Struts框架搭設(shè)三層系統(tǒng)結(jié)構(gòu),分析信息數(shù)據(jù)來源和對應(yīng)實(shí)體關(guān)系,建立系統(tǒng)數(shù)據(jù)庫;引入信息熵提取人力資源信息結(jié)構(gòu),并使用模糊聚類算法聚類信息,實(shí)現(xiàn)人力資源信息整合。本文系統(tǒng)與基于用戶畫像和基于知識元的整合系統(tǒng)進(jìn)行對比,其信息冗余比、整合差異比均最低,信息整合效果好、效率高。
模糊聚類;企業(yè)人力資源;信息整合;Struts框架;信息熵
人力資源管理是企業(yè)經(jīng)營的重要工作組成。企業(yè)經(jīng)營規(guī)模擴(kuò)大、業(yè)務(wù)量增加,均提升了人力資源管理工作的難度。在企業(yè)信息化建設(shè)背景下,日常經(jīng)營管理也逐漸轉(zhuǎn)為信息化[1]。信息資源整合能夠提升管理工作效率,對企業(yè)經(jīng)營管理的重組與優(yōu)化配置十分重要。信息資源整合的相關(guān)研究成果較多,適用場景存在差異。文獻(xiàn)[2]針對政務(wù)信息橫向整合度低,缺乏個性管理功能的問題,利用用戶畫像技術(shù),通過分析大數(shù)據(jù),搭建信息整合模型。文獻(xiàn)[3]利用知識元相關(guān)理論,設(shè)計(jì)在模型-視圖-控制器(model view controller, MVC)軟件架構(gòu)模式下的信息整合系統(tǒng),提升數(shù)據(jù)利用與存儲效率。文獻(xiàn)[4]提出的整合系統(tǒng)利用信息檢索和整合模塊,減少數(shù)據(jù)整合丟失量,優(yōu)化系統(tǒng)性能。
人力資源信息整合系統(tǒng)將企業(yè)人力資源管理過程中產(chǎn)生的信息數(shù)據(jù)進(jìn)行組織配置,拓寬人力資源信息的應(yīng)用范圍,最大化利用人力資源,增強(qiáng)人力資源管理能力。整合人力資源信息時,由于資源信息數(shù)據(jù)與實(shí)體之間沒有明顯區(qū)分界限或?qū)傩?,?dǎo)致傳統(tǒng)的整合方法無法解決資源信息中的不確定性,造成資源整合結(jié)果出現(xiàn)大量冗余。模糊聚類算法對數(shù)據(jù)的歸屬度劃分不明確,無需預(yù)先設(shè)定清晰的分類標(biāo)準(zhǔn),實(shí)際分類應(yīng)用效果更佳。為此,本文設(shè)計(jì)基于模糊聚類的企業(yè)人力資源信息自動整合系統(tǒng),滿足人力資源管理工作基礎(chǔ)需求的同時,進(jìn)一步提高人力資源的使用與效率。
基于模糊聚類的企業(yè)人力資源信息自動整合系統(tǒng)主要由顯示層、業(yè)務(wù)邏輯層、數(shù)據(jù)層組成,系統(tǒng)框架如圖1所示。
圖1 基于模糊聚類的企業(yè)人力資源信息自動整合系統(tǒng)框架
顯示層主要用于人機(jī)交互。用戶通過系統(tǒng)終端頁面的HTML顯示按鍵,操作系統(tǒng)并獲取響應(yīng)。
業(yè)務(wù)邏輯層是系統(tǒng)的核心,主要響應(yīng)用戶請求、采集、整合人力資源信息數(shù)據(jù)、返回指令請求等操作。
數(shù)據(jù)層對整合的人力資源信息數(shù)據(jù)進(jìn)行分類存儲、調(diào)用處理。當(dāng)業(yè)務(wù)邏輯層發(fā)出數(shù)據(jù)查詢請求時,數(shù)據(jù)層調(diào)用數(shù)據(jù)庫的數(shù)據(jù)返回給業(yè)務(wù)邏輯層。
系統(tǒng)采用Struts框架搭設(shè),通過企業(yè)內(nèi)網(wǎng)將人力資源管理部門的業(yè)務(wù)終端接入系統(tǒng);通過網(wǎng)絡(luò)路由、防火墻將外部人力資源管理終端或子公司終端接入系統(tǒng)[5]。在B/S架構(gòu)下,系統(tǒng)采用HTTP協(xié)議通信,每次通信都需對數(shù)據(jù)請求接收形式進(jìn)行封裝、驗(yàn)證,判斷請求是否異常。
控制器接收資源信息管理終端的業(yè)務(wù)請求后,發(fā)送給下一個系統(tǒng)組件;經(jīng)系統(tǒng)組件的映射、配置與請求對應(yīng)的動作接口和路徑,執(zhí)行業(yè)務(wù)處理邏輯操作。
為方便調(diào)用數(shù)據(jù)庫內(nèi)整合的人力資源信息,本文在傳統(tǒng)人力資源信息整合系統(tǒng)硬件的基礎(chǔ)上,利用MySQL對數(shù)據(jù)庫進(jìn)行優(yōu)化設(shè)計(jì)。數(shù)據(jù)庫中的數(shù)據(jù)以文本、表格、圖片等文件形式存儲。
系統(tǒng)的數(shù)據(jù)庫可分為主題、業(yè)務(wù)、基礎(chǔ)3個子數(shù)據(jù)庫。其中,主題數(shù)據(jù)庫主要存儲人力資源管理的不同操作信息,包括人力資源數(shù)據(jù)修改、企業(yè)內(nèi)部人力調(diào)動關(guān)系管理等;業(yè)務(wù)數(shù)據(jù)庫主要存儲人力資源管理的相關(guān)數(shù)據(jù),包括各部門的人力信息、部門人力關(guān)系、人員和業(yè)務(wù)對應(yīng)信息等;基礎(chǔ)數(shù)據(jù)庫存儲企業(yè)內(nèi)部人力資源情況的基本數(shù)據(jù),主要包括考勤信息、在崗信息、每日工時等。主題數(shù)據(jù)庫中操作實(shí)體與業(yè)務(wù)數(shù)據(jù)是一對多關(guān)系;業(yè)務(wù)數(shù)據(jù)庫中業(yè)務(wù)部門與人力數(shù)據(jù)之間為一對多關(guān)系;人力資源信息數(shù)據(jù)與員工基礎(chǔ)信息之間存在關(guān)聯(lián)關(guān)系。
根據(jù)數(shù)據(jù)庫中存儲數(shù)據(jù)的實(shí)體關(guān)系,以星型關(guān)系模型為架構(gòu),利用MySQL 2014設(shè)計(jì)系統(tǒng)數(shù)據(jù)庫。企業(yè)人力資源信息中主要涉及的實(shí)體包括員工、部門、在崗情況、對應(yīng)業(yè)務(wù)等。根據(jù)實(shí)體與信息數(shù)據(jù)屬性之間的關(guān)系,建立如表1所示的數(shù)據(jù)庫表。
用戶登錄系統(tǒng),通過顯示層交互按鍵發(fā)出信息調(diào)用請求后,數(shù)據(jù)庫GetUserInfo類查找調(diào)用指令對應(yīng)的數(shù)據(jù)表;將數(shù)據(jù)表中的數(shù)據(jù)按照調(diào)用指令,抽取對應(yīng)的數(shù)據(jù)類信息數(shù)據(jù);數(shù)據(jù)經(jīng)過GetUserInfo類的模板文件渲染轉(zhuǎn)換為對應(yīng)顯示層的顯示形式,響應(yīng)用戶請求。
表1 系統(tǒng)數(shù)據(jù)庫表(僅部分)
用戶對整合的人力資源信息數(shù)據(jù)進(jìn)行更新、刪除等處理時,通過交互按鍵發(fā)出數(shù)據(jù)修改指令;數(shù)據(jù)修改指令通過ModifyUserInfo 類轉(zhuǎn)換為數(shù)據(jù)修改操作,并將數(shù)據(jù)修改結(jié)果返回給用戶;修改結(jié)果在顯示層顯示,經(jīng)用戶確認(rèn)后,由數(shù)據(jù)庫存儲。
原始的人力資源信息經(jīng)清洗、轉(zhuǎn)換處理后生成無噪聲數(shù)據(jù)。采用模糊聚類算法對人力資源信息進(jìn)行整合,可減少對先驗(yàn)知識的依賴,提高信息整合效率。首先,讀取待處理的原始人力資源信息,根據(jù)數(shù)據(jù)庫的數(shù)據(jù)表設(shè)置種子節(jié)點(diǎn);然后,以種子節(jié)點(diǎn)為參照,分割信息數(shù)據(jù)集;接著,信息數(shù)據(jù)集中的數(shù)字型數(shù)據(jù)若存在少量缺失,采用計(jì)算均值填補(bǔ),若存在大量缺失,采用缺失值所處位置的中位數(shù)填補(bǔ);最后,計(jì)算同類型信息之間的相似度。
式中:
式中:
利用公式(2)生成待處理的人力資源信息的一階關(guān)系無向圖。對不存在相同數(shù)據(jù)點(diǎn)的聚類簇,利用公式(3)計(jì)算二階相似度。
式中:
由公式(4)得到的二階相關(guān)性,建立人力資源信息結(jié)構(gòu)矩陣:
式中:
提取人力資源信息結(jié)構(gòu)后,利用模糊C均值(fuzzy C-means, FCM)聚類算法聚類人力資源信息,得到整合結(jié)果。
利用FCM聚類算法分類人力資源信息時,以拉格朗日乘子對公式(6)求極值,得到單次聚類時的信息隸屬度和單個聚類簇中心。選擇新的聚類中心,重復(fù)對公式(6)的極值求解過程,直至無新的聚類中心產(chǎn)生,停止模糊聚類過程。最終輸出的模糊聚類結(jié)果,即為企業(yè)人力資源信息整合的最終結(jié)果。
采用JAVA語言實(shí)現(xiàn)系統(tǒng)功能,即完成系統(tǒng)設(shè)計(jì)。
為驗(yàn)證系統(tǒng)性能,對系統(tǒng)的信息整合性能進(jìn)行測試。測試環(huán)境:客戶端配置,4.9 GHz i7-12700 CPU,64 GB高頻內(nèi)存,1 TB高速固態(tài)內(nèi)存Windows 10操作系統(tǒng);系統(tǒng)服務(wù)器配置,Intel Xeon 3.5 GHz四核CPU,可擴(kuò)展內(nèi)存128 GB,數(shù)據(jù)庫為MySQL 2014。
系統(tǒng)性能測試主要以整合后人力資源信息的冗余比和信息整合差異比為指標(biāo)進(jìn)行驗(yàn)證。
整合后人力資源信息的冗余比為
式中:
信息整合差異比為
式中:
由基于模糊聚類的系統(tǒng)(本文系統(tǒng))、基于用戶畫像的系統(tǒng)(系統(tǒng)1)、基于知識元的系統(tǒng)(系統(tǒng)2)分別對測試集信息進(jìn)行整合,整合后的信息冗余比如圖2所示。
圖2 3個系統(tǒng)整合后的信息冗余比
由圖2可以看出,基于模糊聚類的系統(tǒng)信息冗余比遠(yuǎn)低于另外2個系統(tǒng),且冗余量不完全隨測試數(shù)據(jù)量增加而增加,說明系統(tǒng)整合后不具價值的重復(fù)信息大量減少,提升了后續(xù)的信息利用效率,節(jié)省存儲空間。
在相同時間內(nèi),實(shí)際信息整合量與預(yù)期整合量的差異比如圖3所示。
圖3 實(shí)際信息整合量與預(yù)期整合量的差異比
由圖3可知:基于模糊聚類的系統(tǒng)整合差異比低于另外2個系統(tǒng),表明基于模糊聚類的系統(tǒng)整合信息量與預(yù)期更接近。從數(shù)值上看,基于模糊聚類的系統(tǒng)整合差異比小于0.23%,低于基于用戶畫像的系統(tǒng)最小差異比0.28%、基于知識元的系統(tǒng)最小差異比0.35%;同時,在相同時間內(nèi),基于模糊聚類的系統(tǒng)整合信息的速度明顯高于另外2個系統(tǒng)。綜上所述,本文設(shè)計(jì)的基于模糊聚類的企業(yè)人力資源信息自動整合系統(tǒng)信息整合效果好、效率高。
為進(jìn)一步驗(yàn)證系統(tǒng)的實(shí)用性,以信息整合時長為指標(biāo),采用基于模糊聚類的系統(tǒng)(本文系統(tǒng))、基于用戶畫像系統(tǒng)(系統(tǒng)1)與基于知識元的系統(tǒng)(系統(tǒng)2)分別進(jìn)行測試,測試結(jié)果如表2所示。
由表2可知,基于模糊聚類系統(tǒng)的信息整合時長最長為1.40 min,基于用戶畫像系統(tǒng)的信息整合時長最長為3.99 min,基于知識元系統(tǒng)的信息整合時長最長為5.12 min。由此可見,基于模糊聚類系統(tǒng)的信息整合時長明顯低于基于用戶畫像系統(tǒng)和基于知識元系統(tǒng)?;谀:垲惖南到y(tǒng)使用模糊聚類算法聚類信息,解決了資源整合結(jié)果的大量冗余現(xiàn)象,提升系統(tǒng)的信息整合效率。
表2 3個系統(tǒng)信息整合時長對比表
為實(shí)現(xiàn)人力資源信息有效利用,本文設(shè)計(jì)基于模糊聚類的企業(yè)人力資源信息自動整合系統(tǒng)。該系統(tǒng)利用模糊聚類算法,對不同特征的人力資源信息進(jìn)行聚類,實(shí)現(xiàn)人力資源信息有組織地聚合處理,提升信息的利用價值。
[1] 方錦文,許潼歆,何晉樂.高校信息整合平臺前端設(shè)計(jì)與實(shí)現(xiàn)[J].信息與電腦(理論版),2022,34(8):111-113.
[2] 蔡盈芳,李子林,虞香群.基于企業(yè)用戶畫像的政務(wù)檔案信息整合利用模型設(shè)計(jì)[J].檔案學(xué)研究,2021(2):125-131.
[3] 沙敏,劉廣琦.MVC模式下電子檔案信息自動整合系統(tǒng)設(shè)計(jì)[J].現(xiàn)代電子技術(shù),2020,43(22):90-93.
[4] 梁琴琴,何東林,王振飛,等.三維數(shù)字化礦山地質(zhì)信息整合系統(tǒng)設(shè)計(jì)及應(yīng)用[J].中國金屬通報(bào),2021(1):237-238.
[5] 梁凌,鄧趙紅,王士同.兼顧顯隱信息與特征加權(quán)的多視角模糊聚類[J].計(jì)算機(jī)科學(xué)與探索,2021,15(6):1092-1102.
[6] 毛俊華.基于模糊聚類的智慧醫(yī)院多源異構(gòu)數(shù)據(jù)整合系統(tǒng)[J].電子設(shè)計(jì)工程,2022,30(7):120-124.
Enterprise Human Resource Information Automatic Integration System Based on Fuzzy Clustering
XIN Zhijie
(Yangling Demonstration Zone Talent Exchange Service Center, Yangling 712100, China)
Human resource information management is the basis for optimizing the allocation of human resources in enterprises. In view of the fact that traditional human resource information integration systems mainly use fixed processes to uniformly configure and process data, ignoring the characteristics of no obvious classification boundaries in human resource information, which leads to a lot of redundancy in system output and poor integration effect, an enterprise human resource information automatic integration system based on fuzzy clustering is designed. Use Struts framework to set up a three-tier system structure, analyze the source of information and data and the corresponding entity relationship, and establish the system database; Information entropy is introduced to extract the information structure of human resources, and fuzzy clustering algorithm is used to cluster information to achieve the integration of human resources information. Compared with the integration system based on user portrait and knowledge element, the system in this paper has the lowest integration difference ratio and information redundancy ratio, with good information integration effect and high efficiency.
fuzzy clustering; enterprise human resources; information automatic integration; Struts framework; information entropy
TP311
A
1674-2605(2022)05-0007-05
10.3969/j.issn.1674-2605.2022.05.007
辛志杰.基于模糊聚類的企業(yè)人力資源信息自動整合系統(tǒng)[J].自動化與信息工程,2022,43(5):35-39.
XIN Zhijie. Enterprise Human Resource Information Automatic Integration System Based on Fuzzy Clustering[J]. Automation & Information Engineering, 2022,43(5):35-39.
辛志杰,男,1983年生,本科,副高級工程師,主要研究方向:信息管理與信息系統(tǒng)。E-mail: 17192984112@163.com