黃麗
數(shù)據(jù)挖掘是數(shù)據(jù)庫技術(shù)開發(fā)的成果,在當(dāng)前越來越多領(lǐng)域中獲得了普遍應(yīng)用,最主要的優(yōu)勢(shì)便是數(shù)據(jù)的價(jià)值分析,運(yùn)用數(shù)據(jù)挖掘工具來深度挖掘信息資源的利用價(jià)值。對(duì)于社會(huì)保險(xiǎn)決策分析來說,數(shù)據(jù)挖掘技術(shù)應(yīng)用方面的研究仍然不夠全面,在各種專著中大多僅涉及社會(huì)保障部或勞動(dòng)部等。以社會(huì)保險(xiǎn)決策分析的現(xiàn)狀來看,很多信息數(shù)據(jù)存在著浪費(fèi)的現(xiàn)象,數(shù)據(jù)挖掘技術(shù)的合理運(yùn)用則可以幫助工作人員在海量數(shù)據(jù)中挖掘潛在的價(jià)值和規(guī)律,通過多種數(shù)據(jù)挖掘方法來實(shí)現(xiàn)數(shù)據(jù)資源的深度利用,為社會(huì)保險(xiǎn)決策分析提供可靠的依據(jù)。本文主要圍繞社會(huì)保險(xiǎn)決策分析展開論述,探討了數(shù)據(jù)挖掘技術(shù)的應(yīng)用對(duì)策。
近年來互聯(lián)網(wǎng)技術(shù)的快速發(fā)展使得計(jì)算機(jī)網(wǎng)絡(luò)的功能性也越來越多元化,各地“金保工程”水保險(xiǎn)管理信息系統(tǒng)為人們辦理有關(guān)的養(yǎng)老保險(xiǎn)繳費(fèi)和變更等業(yè)務(wù),利用計(jì)算機(jī)系統(tǒng)將養(yǎng)老、醫(yī)療、生育等社會(huì)保障信息傳輸?shù)绞〖?jí)集中式核心數(shù)據(jù)庫。但怎樣才能在社會(huì)保險(xiǎn)的多個(gè)險(xiǎn)種參保人員數(shù)據(jù)中分析出問題數(shù)據(jù),為社會(huì)保險(xiǎn)基金監(jiān)管工作提供參考則成了當(dāng)下需要重點(diǎn)探討和解決的問題,以往的信息數(shù)據(jù)管理模式隨著當(dāng)前社會(huì)保障信息數(shù)量的快速累積也顯得力不從心,效率難以達(dá)到現(xiàn)實(shí)要求。對(duì)此數(shù)據(jù)挖掘技術(shù)的應(yīng)用使得這一現(xiàn)狀有了新的突破,為社會(huì)保險(xiǎn)基金監(jiān)管中的決策分析工作帶來了更加充足且真實(shí)的數(shù)據(jù)支持。
人工智能技術(shù)和數(shù)據(jù)庫技術(shù)是近幾年的熱門研究領(lǐng)域,而數(shù)據(jù)挖掘技術(shù)則是這兩項(xiàng)技術(shù)下的產(chǎn)物,也屬于計(jì)算機(jī)科學(xué)技術(shù),計(jì)算機(jī)技術(shù)的快速發(fā)展以及普及對(duì)數(shù)據(jù)挖掘技術(shù)的產(chǎn)生和推廣來說具有先決性作用。數(shù)據(jù)挖掘是在大量數(shù)據(jù)之中提取信息價(jià)值的技術(shù)手段,利用靈活的數(shù)據(jù)挖掘和分析算法,在目標(biāo)數(shù)據(jù)中建立模型,以人工智能技術(shù)作為支持,但僅借用人工智能中較為成熟的算法和技術(shù)手段,例如決策樹和人工神經(jīng)網(wǎng)絡(luò)等,問題的復(fù)雜度和難度相較于人工智能來說耕地。數(shù)據(jù)挖掘技術(shù)的應(yīng)用方法也不止一種,應(yīng)用較為廣泛的有序列模式分析、關(guān)聯(lián)分析、分類分析等,具體原理介紹如下:1.關(guān)聯(lián)分析。管理分析主要通過關(guān)聯(lián)規(guī)則來實(shí)現(xiàn)數(shù)據(jù)的挖掘,關(guān)聯(lián)規(guī)則指的是事物間存在的規(guī)律知識(shí)模式,關(guān)聯(lián)分析主旨在于進(jìn)一步找出數(shù)據(jù)之間潛在的關(guān)系和規(guī)律。2.序列模式分析。序列模式分析和關(guān)聯(lián)分析的原理并沒有太大差異,結(jié)合數(shù)據(jù)存在的關(guān)聯(lián)性和時(shí)間性特征,為了解序列模式,需要了解事件發(fā)生與否,并且找出事件的產(chǎn)生時(shí)間,主旨仍然是找出數(shù)據(jù)間潛在的關(guān)系和規(guī)律,但相比之下序列模式分析更加關(guān)注數(shù)據(jù)與數(shù)據(jù)之間是否存在因果關(guān)系。3.分類分析。分類分析指的是分類示例數(shù)據(jù)庫中的數(shù)據(jù),針對(duì)不同的數(shù)據(jù)進(jìn)行描述,建立對(duì)應(yīng)的分析模型或挖掘分類的規(guī)律,將數(shù)據(jù)集中的數(shù)據(jù)映射于某一既定的類中,輸入集是一組記錄集合與多個(gè)標(biāo)記。4.聚類分析。聚類分析和分類分析具有很大差異,輸入集通常為一組沒有標(biāo)定的記錄,這一期間輸入的記錄并沒有任飛處理,分析的主旨則是結(jié)合已知的規(guī)律進(jìn)行記錄集合的劃分,讓不同的組具有更大的區(qū)別,而組內(nèi)的區(qū)別則盡量降低。
結(jié)合數(shù)據(jù)挖掘技術(shù)的基本特征,數(shù)據(jù)挖掘技術(shù)在社會(huì)保險(xiǎn)決策分析中的應(yīng)用能夠在社保對(duì)象分析、社保基金管理、社保決策管理等方面發(fā)揮良好的作用效果,而數(shù)據(jù)挖掘技術(shù)的應(yīng)用方式主要有以下幾點(diǎn):
通過聚類分析法分析參保群體類別
目前,數(shù)據(jù)處理技術(shù)的不斷進(jìn)步,功能性和便利性都有了進(jìn)一步增強(qiáng),成了社會(huì)保險(xiǎn)基金管理工作的開展工具之一,這也代表社會(huì)保險(xiǎn)機(jī)構(gòu)可以運(yùn)用數(shù)據(jù)處理和挖掘等方式來深入了解參保人群,根據(jù)參保人群的基本特征和需求進(jìn)行準(zhǔn)確了解,提高服務(wù)水平,也讓社會(huì)保險(xiǎn)決策更加契合更多參保人群。
分析參保人群基本背景
對(duì)于社會(huì)保險(xiǎn)決策分析工作來說,掌握參保人群的背景資料能夠幫助工作人員分析參保對(duì)象,進(jìn)一步完善或調(diào)整社會(huì)保障策略。而數(shù)據(jù)挖掘技術(shù)最主要的優(yōu)勢(shì)便是在海量數(shù)據(jù)信息中找到對(duì)社會(huì)保險(xiǎn)決策分析有用的信息數(shù)據(jù),在提高信息處理效率的同時(shí)也為社會(huì)保險(xiǎn)決策分析帶來了更加可靠的支持。
分析參保人員信用
分析參保人員的信用信息有助于針對(duì)參保人群根據(jù)信用情況進(jìn)行等級(jí)劃分,對(duì)于社會(huì)保險(xiǎn)機(jī)構(gòu)的決策分析以及管理工作來說具有重大意義,針對(duì)不同信用等級(jí)的參保人員選擇不同的監(jiān)督管理方式。數(shù)據(jù)挖掘技術(shù)能夠在歷史信息中分析參保人員的信用記錄,從而準(zhǔn)確劃分信用等級(jí)。
數(shù)據(jù)資源的挖掘與共享
數(shù)據(jù)挖掘技術(shù)的應(yīng)用對(duì)于數(shù)據(jù)收集工作具有更加嚴(yán)格的工作要求,這對(duì)于社會(huì)保險(xiǎn)數(shù)據(jù)的收集及整合工作來說也帶來了一定壓力,為進(jìn)一步提高社會(huì)保險(xiǎn)機(jī)構(gòu)的服務(wù)水平,實(shí)現(xiàn)精準(zhǔn)化服務(wù),便需要將數(shù)據(jù)庫平臺(tái)資源一同整合,實(shí)現(xiàn)資源利用率的最大化,更有利于數(shù)據(jù)的快速分析和共享,節(jié)約成本投入的同時(shí)也改善數(shù)據(jù)資源的利用率。
某省金保工程社會(huì)保險(xiǎn)管理信息系統(tǒng)于1996年建立并發(fā)展,互聯(lián)網(wǎng)技術(shù)的應(yīng)用使得本地域訪問社會(huì)保險(xiǎn)信息數(shù)據(jù)能夠被域網(wǎng)中所有的勞動(dòng)保障機(jī)構(gòu)訪問和管控。該系統(tǒng)屬于信息資源系統(tǒng),最主要的特征便是開發(fā)了公共空間,能夠讓工作人員進(jìn)行收據(jù)信息的讀取。同時(shí)也是一種獨(dú)特的管理模式,不同的社會(huì)保險(xiǎn)服務(wù)站用戶能夠利用核心數(shù)據(jù)平臺(tái)的網(wǎng)絡(luò)快速為參保人處理保險(xiǎn)業(yè)務(wù),工作效率與質(zhì)量都有了明顯提高。
明確問題類型
在遭遇具體的應(yīng)用問題時(shí),需要找到問題的類型,之后按照不同類型問題選擇對(duì)應(yīng)的處理方法。如在進(jìn)行參保目標(biāo)的信用分析過程中,便需要針對(duì)參保目標(biāo)信用分析問題進(jìn)行分類,若這一問題不能通過數(shù)據(jù)挖掘工具直接解決,則需要選擇其他更適合的辦法來執(zhí)行。
選擇數(shù)據(jù)挖掘技術(shù)
在了解問題所屬的類型之后,便可以根據(jù)問題的具體類型選擇合理的數(shù)據(jù)挖掘技術(shù)。還是以參保目標(biāo)信用分析問題為例,在找到任務(wù)主要分形后可以選擇幾種技術(shù)手段來解決,如人工神經(jīng)網(wǎng)絡(luò)和遺傳算法技術(shù)等。在完成問題分類和技術(shù)選擇后,還可以根據(jù)不同類的信用等級(jí)以及問題預(yù)測(cè)來選擇數(shù)據(jù)挖掘技術(shù)與對(duì)應(yīng)的工具,預(yù)測(cè)未來可能會(huì)對(duì)性能及可靠性帶來影響的因素,確保技術(shù)和工具選擇的有效性。