摘要:近些年來,我國(guó)綜合國(guó)力發(fā)展迅速,在全球經(jīng)濟(jì)發(fā)展中發(fā)揮著重要的作用,這得益于我國(guó)政府的宏觀調(diào)控以及各大企業(yè)的積極響應(yīng)。其中,企業(yè)信用評(píng)估工作是保障我國(guó)經(jīng)濟(jì)發(fā)展的一個(gè)重要因素,有助于切實(shí)提高我國(guó)經(jīng)濟(jì)發(fā)展的速率。但是在開展數(shù)據(jù)采集工作的時(shí)候,由于有關(guān)企業(yè)信息的隱私保護(hù)工作不到位,導(dǎo)致企業(yè)內(nèi)部信息的泄露,進(jìn)而對(duì)企業(yè)的實(shí)際發(fā)展產(chǎn)生一定的影響。所以,需要通過技術(shù)拓展,利用分布式隱私保護(hù)數(shù)據(jù)挖掘結(jié)構(gòu)開展相應(yīng)的信用評(píng)估工作,從而確保企業(yè)在接受信用評(píng)估的過程中信息不會(huì)泄露。本文主要介紹數(shù)據(jù)挖掘工作的主要內(nèi)容,以及分布式隱私保護(hù)架構(gòu)的原理和具體實(shí)施的流程。
關(guān)鍵詞:企業(yè)信用評(píng)估;分布式隱私保護(hù);數(shù)據(jù)挖掘
引言:
資源信息共享是推動(dòng)我國(guó)有效發(fā)展的主要因素之一。在我國(guó)主要的幾個(gè)經(jīng)濟(jì)大省中,政府主管財(cái)務(wù)的部門,以及相應(yīng)的職能部門和企業(yè)存儲(chǔ)了大量的數(shù)據(jù)資源,但是各個(gè)部門之間卻并沒有很好的利用相應(yīng)的信息資源,從而無法從其中提取出有助于推動(dòng)整個(gè)城市發(fā)展的信息和知識(shí)。所以,為了滿足城市發(fā)展的需求,數(shù)據(jù)挖掘應(yīng)運(yùn)而生。通過對(duì)大量的經(jīng)濟(jì)數(shù)據(jù)進(jìn)行系統(tǒng)的分析工作,發(fā)掘出其中潛在的、有用的信息,最終可以為企業(yè)制定發(fā)展戰(zhàn)略的時(shí)候提供強(qiáng)有力的數(shù)據(jù)支持。在實(shí)際開展數(shù)據(jù)挖掘工作的時(shí)候,要注重對(duì)各個(gè)部門信息隱私的保護(hù),進(jìn)而打消其顧慮,使其愿意和其他部門進(jìn)行資源共享。
一、重要性淺析
對(duì)數(shù)據(jù)挖掘進(jìn)行隱私保護(hù)可以切實(shí)提高整個(gè)數(shù)據(jù)挖掘工作的效率以及數(shù)據(jù)挖掘工作的普及范圍,對(duì)企業(yè)而言,隱私保護(hù)數(shù)據(jù)挖掘可以將企業(yè)內(nèi)部所有部門有價(jià)值的數(shù)據(jù)信息進(jìn)行整合,從而為企業(yè)制定發(fā)展方案提供理論依據(jù)。對(duì)我國(guó)整體經(jīng)濟(jì)發(fā)展而言,可以有效的推動(dòng)國(guó)家經(jīng)濟(jì)的發(fā)展。在全球化大背景下,只有做好相應(yīng)的隱私保護(hù)數(shù)據(jù)挖掘才能順應(yīng)時(shí)代的發(fā)展。
二、隱私保護(hù)數(shù)據(jù)挖掘簡(jiǎn)介
(一)主要內(nèi)容簡(jiǎn)介
目前大多數(shù)企業(yè)內(nèi)部部門之間以及企業(yè)和企業(yè)之間不愿意將自己獨(dú)有的數(shù)據(jù)分享出來,主要的原因還是出于對(duì)自身隱私的保護(hù),尤其是對(duì)于一些帶有敏感信息的部門而言,一旦相應(yīng)的敏感信息泄露,就會(huì)對(duì)整個(gè)企業(yè)的發(fā)展造成極大的影響。而數(shù)據(jù)挖掘?qū)ν苿?dòng)企業(yè)發(fā)展以及金融詐騙分析,乃至我國(guó)經(jīng)濟(jì)發(fā)展具有十分重要的戰(zhàn)略意義,所以,要通過大力開發(fā)隱私保護(hù)體系,進(jìn)而調(diào)動(dòng)企業(yè)內(nèi)部數(shù)據(jù)共享的積極性。隱私保護(hù)數(shù)據(jù)挖掘主要是通過對(duì)知識(shí)庫中的所有數(shù)據(jù)進(jìn)行加密,或者通過算法將相應(yīng)的數(shù)據(jù)進(jìn)行轉(zhuǎn)化,實(shí)現(xiàn)對(duì)用戶信息的保護(hù)功能。通過使用隱私保護(hù)數(shù)據(jù)挖掘,可以在進(jìn)行數(shù)據(jù)挖掘的同時(shí)保障每位用戶信息的安全,確保敏感信息不會(huì)泄露。
(二)衡量隱私保護(hù)質(zhì)量的主要指標(biāo)
1.安全性
安全性是衡量隱私保護(hù)數(shù)據(jù)挖掘構(gòu)架的重要指標(biāo)之一。只有確保每位用戶的數(shù)據(jù)信息不會(huì)在挖掘期間泄露出去,才能促使用戶愿意將數(shù)據(jù)共享出來。安全性是開展數(shù)據(jù)挖掘工作的前提,如果無法保障用戶的隱私,則后續(xù)的工作是沒有任何意義的。
2.準(zhǔn)確性
前文提到過,數(shù)據(jù)挖掘只有在一定基數(shù)數(shù)據(jù)基礎(chǔ)上進(jìn)行才有意義,但是數(shù)據(jù)的基數(shù)越大,挖掘工作的難度也就越大。而且在整個(gè)數(shù)據(jù)群中,大部分的數(shù)據(jù)是沒有任何意義的。所以,在注重隱私保護(hù)數(shù)據(jù)挖掘安全性的同時(shí),還要從隱私保護(hù)數(shù)據(jù)挖掘架構(gòu)的準(zhǔn)確性考慮,要對(duì)構(gòu)架進(jìn)行優(yōu)化,從而提高所挖掘出來的數(shù)據(jù)的價(jià)值。
3.效率
效率是衡量隱私保護(hù)數(shù)據(jù)挖掘的指標(biāo)之一,主要通過優(yōu)化算法以及硬件設(shè)施提高整個(gè)數(shù)據(jù)挖掘構(gòu)架的效率。在實(shí)際開展隱私保護(hù)數(shù)據(jù)挖掘工作的過程中,對(duì)數(shù)據(jù)的計(jì)算、篩選,對(duì)有用數(shù)據(jù)的提取,以及對(duì)所有數(shù)據(jù)的加密,都需要花費(fèi)大量的時(shí)間進(jìn)行。但是金融市場(chǎng)瞬息萬變,效率較低的隱私保護(hù)數(shù)據(jù)挖掘構(gòu)架顯然無法滿足現(xiàn)實(shí)需求,所以就要通過優(yōu)化構(gòu)架提高整個(gè)挖掘工作的效率。
三、Agrent淺析
Agent技術(shù)是搭建數(shù)據(jù)挖掘構(gòu)架使用的技術(shù)手段之一。在實(shí)際應(yīng)用的過程中,首先Agent技術(shù)沒有中心控制,所有子網(wǎng)絡(luò)的數(shù)據(jù)都會(huì)直接上傳到知識(shí)庫中,從而有效的提高了整個(gè)數(shù)據(jù)挖掘工作的效率;其次,基于Agent技術(shù)搭建的系統(tǒng)具有動(dòng)態(tài)性的特點(diǎn),在數(shù)據(jù)挖掘工作開展的過程中可以根據(jù)企業(yè)的需求,通過技術(shù)手段對(duì)整個(gè)架構(gòu)做出相應(yīng)的調(diào)整;最后,基于Agent技術(shù)的隱私保護(hù)數(shù)據(jù)挖掘架構(gòu)實(shí)現(xiàn)透明化的特定。除此以外,Agent技術(shù)采取的是局部通信的方式進(jìn)行數(shù)據(jù)挖掘,這一通信模式進(jìn)一步提高了企業(yè)內(nèi)部各個(gè)用戶隱私的安全系數(shù)。如圖1 所示,即為基于Agent技術(shù)的模型圖:
四、實(shí)施方案
分布式架構(gòu)主要利用了安全多方計(jì)算技術(shù),該技術(shù)主要將局域網(wǎng)劃分成多個(gè)子網(wǎng)絡(luò),各個(gè)子網(wǎng)絡(luò)之間的信息不會(huì)傳遞,每位用戶都有一個(gè)獨(dú)立的子網(wǎng)絡(luò)用于上傳數(shù)據(jù),每位用戶將數(shù)據(jù)上傳完畢后,相應(yīng)的數(shù)據(jù)信息會(huì)直接上傳到局域網(wǎng)中,其他用戶無法訪問或者下載,也就保障了每位用戶的隱私安全。但是隨著計(jì)算基數(shù)的發(fā)展,安全多方技術(shù)的缺點(diǎn)也逐漸暴露了出來。由于只有在所有用戶將數(shù)據(jù)信息上傳完畢后,分布式構(gòu)架才能進(jìn)行數(shù)據(jù)挖掘,整個(gè)計(jì)算的流程過于復(fù)雜,導(dǎo)致整個(gè)數(shù)據(jù)挖掘工作的效率較低,所以,通過對(duì)安全多方技術(shù)的改造升級(jí)研發(fā)出了效率更高的挖掘算法,該組件可以有效的提高數(shù)據(jù)挖掘工作的隱私保護(hù)效果,以及整個(gè)數(shù)據(jù)挖掘工作的效率。而且整個(gè)組件較為靈活,可以根據(jù)企業(yè)的實(shí)際情況制定出具有一定針對(duì)性的企業(yè)信用評(píng)估模型。
如下圖所示,即為隱私保護(hù)數(shù)據(jù)挖掘架構(gòu)的模型和實(shí)際實(shí)施流程。
1.基于Agent技術(shù),構(gòu)建數(shù)據(jù)挖掘架構(gòu),該架構(gòu)可以滿足企業(yè)信用評(píng)估工作開展的時(shí)候?qū)Ψ植际綌?shù)據(jù)處理的需求。在搭建架構(gòu)的時(shí)候,要注意對(duì)企業(yè)進(jìn)行系統(tǒng)、深入的分析工作,對(duì)原有的架構(gòu)進(jìn)行一定的調(diào)整,使整個(gè)架構(gòu)更具有針對(duì)性。
2.基于安全多方計(jì)算技術(shù)以及數(shù)字信息安全防護(hù)技術(shù),設(shè)計(jì)出能夠切實(shí)保障企業(yè)內(nèi)部各個(gè)部門信息的安全。在此基礎(chǔ)上,將企業(yè)內(nèi)部所有用戶的信息匯總,并上傳到知識(shí)庫中。
3.根據(jù)“問題定義”和“數(shù)據(jù)收集”,并咨詢有關(guān)專家的意見建立一個(gè)模型庫,將知識(shí)庫中的信息按照模型庫的格式進(jìn)行挖掘整理,對(duì)于沒有價(jià)值的信息則自動(dòng)進(jìn)行加密處理。
4.在挖掘數(shù)據(jù)后,知識(shí)庫將挖掘完成的信息上傳到信用評(píng)估系統(tǒng)中,由系統(tǒng)對(duì)相應(yīng)的數(shù)據(jù)信息進(jìn)行分析,最終生成相應(yīng)的信用評(píng)估結(jié)果。
參考文獻(xiàn)
[1]王金龍. 面向企業(yè)信用評(píng)估的分布式隱私保護(hù)數(shù)據(jù)挖掘[J]. journal6,2006,44(35):243-245.
[2]蔣云良,徐從富,王金龍,et al. 基于分布式隱私保護(hù)數(shù)據(jù)挖掘的企業(yè)信用評(píng)估方法:.
[3]葛新景,朱建明. 基于博弈論的隱私保護(hù)分布式數(shù)據(jù)挖掘[J]. 計(jì)算機(jī)科學(xué),2011,38(11):161-166.
[4]劉英超. 面向分布式的數(shù)據(jù)挖掘隱私保護(hù)方法研究[D]. 哈爾濱工程大學(xué).
作者簡(jiǎn)介:徐志高,1959年8月,男,漢,碩士,首冠信用評(píng)估有限公司全國(guó)市場(chǎng)開發(fā)與管理總監(jiān),中國(guó)國(guó)際經(jīng)濟(jì)合作學(xué)會(huì)商務(wù)誠(chéng)信工作委員會(huì)副秘書長(zhǎng),高級(jí)信用管理師,高級(jí)信用評(píng)估師,電氣工程師,英國(guó)商報(bào)FT中文網(wǎng)特邀嘉賓,IBM年度嘉賓;國(guó)際人力資本網(wǎng)發(fā)言嘉賓、ISO9001認(rèn)證復(fù)檢專家、信用行業(yè)管理帶頭人、國(guó)家級(jí)雜志發(fā)表過多篇論文、中國(guó)LED工程聯(lián)盟專家組成員、北大EMBA同學(xué)會(huì)“一帶一路”信用課程應(yīng)邀講師、商場(chǎng)銷售管理銷售技巧全程講師;集建筑、工業(yè)、商業(yè)、教育、商貿(mào)于一身的綜合型高級(jí)管理人才。
(作者單位:首冠信用評(píng)估有限公司)