喬桂玲
(黑河市黑寶山礦業(yè)有限責(zé)任公司,黑龍江 黑河 161449)
在當(dāng)今社會,人是最為關(guān)鍵的要素,此時人力資源相關(guān)的管控活動就成為了單位發(fā)展中要面對的一項非常關(guān)鍵的要素。單位開展該項管控活動的意義是結(jié)合單位戰(zhàn)略意識的規(guī)定,分析將來或許會出現(xiàn)的問題對單位的該項管控工作產(chǎn)生的作用,設(shè)置單位人力資源發(fā)展思想以及活動意義,獲取對單位成長有益的工作者,而且設(shè)置氛圍,以此來確保工作者能夠真正的參加到工作之中,切實(shí)的體現(xiàn)其能力。為了積極的應(yīng)對管控活動中面對的不利現(xiàn)象,需要通過數(shù)據(jù)挖掘工藝對相關(guān)的信息開展全方位的探索,分析其中有意義的內(nèi)容,進(jìn)而為形成人力資源的綜合方案等提供必要的參考信息。而且能夠幫助更好的進(jìn)行員工聘用以及培訓(xùn)等活動,所以,研發(fā)一項以數(shù)據(jù)倉庫信息為前提的統(tǒng)計信息體系,對于當(dāng)前的單位來講意義非常關(guān)鍵。
數(shù)據(jù)倉庫是一種從數(shù)據(jù)庫技術(shù)發(fā)展而來但又不同于數(shù)據(jù)庫的數(shù)據(jù)組織和存儲技術(shù),其主要的面對主題。而且是綜合化的,會隨著時間而改變的,非易失性的數(shù)據(jù)集合,它用于支持管理層的決策過程。不論是它的形成亦或是運(yùn)行均是以主題為中心來開展的,其中的信息并非是信息單純的聚集到一起,它是對于多種信息匯集,挑選然后全面分析而獲取的內(nèi)容的綜合。其中存儲的信息關(guān)鍵是用來查找等的目的的。由于數(shù)據(jù)倉庫以統(tǒng)計分析技術(shù)作為分析數(shù)據(jù)和提取信息的有效方法,該項技術(shù)的關(guān)鍵前提及時統(tǒng)計學(xué)內(nèi)容,所以數(shù)據(jù)倉庫術(shù)、以及基于數(shù)據(jù)倉庫的OLAP和數(shù)據(jù)挖掘形成了新型的統(tǒng)計信息系統(tǒng)框架。
它是一項融合多種學(xué)科知識的體系,比如數(shù)據(jù)庫技術(shù)、人工智能、機(jī)器學(xué)習(xí)、統(tǒng)計學(xué)、面向?qū)ο蠓椒ā⑿畔z索、高性能計算等學(xué)科。它是通過從很多層次的,有雜音的以及不明確的等特征的具體應(yīng)用信息里得到的,分析其中隱藏的,之前并不了解的,有著實(shí)際意義的信息的一個具體的步驟。提取的知識表示為概念、規(guī)則、規(guī)律、模式等形式?,F(xiàn)在常用的挖掘措施有如下的一些,統(tǒng)計分析方法、神經(jīng)網(wǎng)絡(luò)、機(jī)器學(xué)習(xí)、遺傳算法、模糊集法、近似推理等。它的成立并不是必須要以數(shù)據(jù)倉庫為基礎(chǔ)的,但基于數(shù)據(jù)倉庫的數(shù)據(jù)挖掘能簡化數(shù)據(jù)挖掘過程的某些步驟,提升信息挖掘的功效特征,而且可以更加合理的符合當(dāng)前的戰(zhàn)略決定的規(guī)定。
該項體系分為兩個要素,分別是統(tǒng)計管理和數(shù)據(jù)挖掘,依據(jù)數(shù)據(jù)流圖和處理過程,統(tǒng)計管理包括了8個功能模塊,分別是人力資總體規(guī)劃、人員聘用計劃生成、人員使用計劃生成、培養(yǎng)和選拔計劃生成、薪資計劃生成、勞動關(guān)系計劃生成、綜合查詢、報告生成,數(shù)據(jù)挖掘包括了3個功能模塊,分別是數(shù)據(jù)倉庫維護(hù)、SQL挖掘、自編算法挖掘。
(1)認(rèn)真結(jié)合軟件項目規(guī)定的研發(fā)以及制作等等的步驟,合理的利用有利的要素,研究出適合當(dāng)前的管控體系的信息內(nèi)容。(2)集成性與開放性并重。不僅要確保體系之中的所有的要素有效的聯(lián)系,同時還要確保對外界公開。(3)合理的分析可視化內(nèi)容,為使用者帶來一種非常合理高效的應(yīng)用體系。(4)使用當(dāng)今的軟件項目的措施,站在體系的多個層次中分析其穩(wěn)定性。
(1)基礎(chǔ)類報告:按年、季度、月等生成員工工資報告、員工考勤報告、員工基本情況匯總報告、人員使用計劃、薪資計劃、人員聘用計劃報告等。(2)統(tǒng)計分析類報告:人員及工資的成本分析及統(tǒng)計報告、人員流失分析報告、人員缺口分析報告、人員需求預(yù)測報告、人員供給預(yù)測報告等。
(1)離散化:它是為合乎使用的規(guī)定,使用少量的離散信息來代替連續(xù)的信息,也就是說把連續(xù)的內(nèi)容分成單獨(dú)的部分,所有的部分中的信息使用一個數(shù)來替換。(1)唯一性:即編碼應(yīng)該明確其有單獨(dú)的指代要素。(3)結(jié)構(gòu)化:結(jié)合編碼的客體特征,設(shè)置有著特殊性質(zhì)的編碼體系,以此來綜合化的體現(xiàn)其特征,便于它的的運(yùn)行。
(1)定義數(shù)據(jù)倉庫的體系結(jié)構(gòu)。數(shù)據(jù)倉庫體系架構(gòu)可以分為五個層次:數(shù)據(jù)建模層、數(shù)據(jù)獲取層、數(shù)據(jù)存儲層、數(shù)據(jù)訪問層、數(shù)據(jù)與元數(shù)據(jù)管理層。通過分析上面講道的體系構(gòu)造,可以通過數(shù)據(jù)倉庫內(nèi)容,設(shè)置適宜單位活動的智能化的應(yīng)對措施,現(xiàn)提出集線器結(jié)構(gòu)和集中式結(jié)構(gòu)兩種數(shù)據(jù)倉庫的體系結(jié)構(gòu)供企業(yè)統(tǒng)計信息系統(tǒng)選擇并創(chuàng)建。(2)進(jìn)行數(shù)據(jù)倉庫容量的規(guī)劃,定義物理的數(shù)據(jù)倉庫結(jié)構(gòu),明確信息的放置以及查詢的措施等,并選擇存儲服務(wù)器、數(shù)據(jù)庫、OLAP服務(wù)器以及其它工具。(3)定義新的數(shù)據(jù)模型,設(shè)計數(shù)據(jù)倉庫的模式和視圖。因?yàn)樗P(guān)注的是信息的查詢,所以信息是結(jié)合決策探索的主要內(nèi)容來設(shè)置的,所有的要素都對應(yīng)著單獨(dú)的分析內(nèi)容。數(shù)據(jù)的邏輯模型是多維數(shù)據(jù)模型,能夠運(yùn)用多種存儲模式來體現(xiàn),此時可通過多維分析措施,以多層次化來對信息開展全方位的探索。常見的數(shù)據(jù)模型有:星形模型、雪花模型、星座模型、雪瀑模型等。(4)數(shù)據(jù)倉庫的中間件設(shè)計。這些要素可以把倉庫中的所有的內(nèi)容有效地聯(lián)系成為一個整體。數(shù)據(jù)倉庫的中間件包括:數(shù)據(jù)抽取、轉(zhuǎn)換、復(fù)制的拷貝中間件;數(shù)據(jù)庫訪問的網(wǎng)關(guān)中間件;對數(shù)據(jù)倉庫進(jìn)行監(jiān)控的中間件。(5)對于初始信息的審定以及分析。因?yàn)樾畔⑹莵碜杂诙鄠€機(jī)構(gòu)的的數(shù)據(jù)庫中的,所有的數(shù)據(jù)都是有其對應(yīng)的使用方向的,所以,很多信息在進(jìn)入庫之前的時候,必須認(rèn)真地處理。為實(shí)現(xiàn)異構(gòu)數(shù)據(jù)庫的數(shù)據(jù)集成,必須首先通過數(shù)據(jù)的抽取和轉(zhuǎn)換工具將位于不同操作系統(tǒng)平臺、不同數(shù)據(jù)組織形式的數(shù)據(jù)按照一定的數(shù)據(jù)模型集成到數(shù)據(jù)挖掘庫中,其目的就是保證數(shù)據(jù)倉庫中數(shù)據(jù)的一致性。
和SAS等體系有很大的差距,這個體系不論是在功效的設(shè)計層次,亦或是其他的一些方面都更加的繁瑣,應(yīng)該融合實(shí)際的業(yè)務(wù)內(nèi)容來進(jìn)行全方位的設(shè)計活動,確保其能夠非常的合理,而且便于使用者認(rèn)可。而統(tǒng)計類數(shù)據(jù)挖掘方法應(yīng)用的過程中較多地依賴于用戶解決問題的能力,一般無法自動的分析涵蓋在信息之后的內(nèi)容。我們都知道,統(tǒng)計學(xué)是非常的綜合的。它和希望分析模型的使用者間有著很大的間隙,所以,要結(jié)合領(lǐng)域的具體特征,研究適合的模型內(nèi)容。
[1]杜棟.現(xiàn)代統(tǒng)計信息系統(tǒng)理論與實(shí)踐[M].北京:清華大學(xué)出版社,2004.
[2]陳京民,等.數(shù)據(jù)倉庫與數(shù)據(jù)挖掘技術(shù)[M].北京:電子工業(yè)出版社,2002.