吳 浩,李廷鵑,李玉健,向夢蕓,龐雅琪
(1.青海省科技發(fā)展服務(wù)中心,青海西寧 810000;2.青海省科學(xué)技術(shù)信息研究所有限公司,青海西寧 810000)
數(shù)據(jù)挖掘思想對于數(shù)據(jù)類型的要求并不十分嚴(yán)格,可用于挖掘處理的數(shù)據(jù)參量既可以是結(jié)構(gòu)化狀態(tài)參量,也可以是半結(jié)構(gòu)化狀態(tài)參量,甚至一些形態(tài)特殊的異構(gòu)型參量也可以被作為挖掘指令的處理對象。在既定數(shù)據(jù)庫存儲環(huán)境中,數(shù)據(jù)挖掘方法既可以總結(jié)出信息參量的數(shù)學(xué)歸納規(guī)律,也能夠?qū)⒅髯兞恐笜?biāo)與因變量指標(biāo)的數(shù)學(xué)關(guān)系對調(diào),從而使得數(shù)據(jù)庫主機(jī)能夠?qū)鬏斝畔⒘客瓿蓽?zhǔn)確記錄[1-2]。與其他類型的搜索算法相比,數(shù)據(jù)挖掘方法對于信息參量的包容性更強(qiáng),既不需要準(zhǔn)確掌握待處理數(shù)據(jù)來源,也不限制信息參量的實時傳輸速率。
數(shù)據(jù)庫信息查詢機(jī)制是指網(wǎng)絡(luò)主機(jī)在數(shù)據(jù)庫環(huán)境中,按照向量分布形式,提取數(shù)據(jù)信息文件的執(zhí)行算法,能夠?qū)⒁汛鎯?shù)據(jù)的參量全部篩選出來,并可以借助傳輸通路,將這些數(shù)據(jù)文本反饋回核心網(wǎng)絡(luò)主機(jī)[3]。隨著待處理數(shù)據(jù)信息參量的不斷累積,數(shù)據(jù)庫信息查詢機(jī)制會出現(xiàn)明顯的缺失狀態(tài),極易使網(wǎng)絡(luò)主機(jī)無法對數(shù)據(jù)信息參量的訪問連接行為做出有效控制。
傳統(tǒng)RBAC 訪問控制系統(tǒng)以B/S 架構(gòu)為基礎(chǔ),能夠聯(lián)合云計算主機(jī)與TLoa 設(shè)備對已存儲信息查詢,并可以將完成檢測的指令文件存儲于數(shù)據(jù)庫主機(jī)之中[4]。然而,此類型應(yīng)用系統(tǒng)并不能提升數(shù)據(jù)庫信息查詢機(jī)制的完整度水平,不利于有效控制數(shù)據(jù)信息參量的訪問連接行為。為解決上述問題,設(shè)計基于數(shù)據(jù)挖掘的數(shù)據(jù)庫信息查詢訪問控制系統(tǒng)。
在數(shù)據(jù)庫信息查詢訪問控制系統(tǒng)中,CloudFile User 控制主機(jī)負(fù)責(zé)與TCP 端口、UDP 端口進(jìn)行對接,可以在建立數(shù)據(jù)庫訪問機(jī)制的同時,協(xié)調(diào)數(shù)據(jù)信息參量的實時存儲行為,并可將所生成執(zhí)行指令借助網(wǎng)絡(luò)通信模塊,傳輸至下級硬件應(yīng)用設(shè)備之中[5-6]。對于CloudFileUser 控制主機(jī)而言,TCP 端口與UDP 端口是兩個完全獨(dú)立的連接結(jié)構(gòu),前者負(fù)責(zé)處理已存儲的數(shù)據(jù)信息參量,后者負(fù)責(zé)記錄與查詢機(jī)制相關(guān)的執(zhí)行指令,但在訪問連接行為非可逆的情況下,兩者之間會建立虛擬數(shù)據(jù)反饋關(guān)系。完整的CloudFileUser 控制主機(jī)連接形式如圖1 所示。
圖1 CloudFileUser控制主機(jī)連接結(jié)構(gòu)
為避免數(shù)據(jù)庫主機(jī)對待查詢信息參量的實時存儲能力受到影響,訪問連接指令的傳輸方向只能由TCP 端口與UDP 端口指向下級客戶端平臺。
Server 查詢模塊作為CloudFileUser 控制主機(jī)的下級負(fù)載結(jié)構(gòu),能夠借助連接管腳深入數(shù)據(jù)庫主機(jī)內(nèi)部,并可以對其中存儲的信息參量實現(xiàn)分類提取。在數(shù)據(jù)挖掘算法的作用下,由Server 查詢模塊提取的信息參量可被系統(tǒng)主機(jī)直接調(diào)取,完成調(diào)取指令后的數(shù)據(jù)信息可以暫時存儲于數(shù)據(jù)處理模塊中,以便控制設(shè)備可將其直接用于完善系統(tǒng)主機(jī)所遵循的查詢機(jī)制[7-8]。Server 查詢模塊的設(shè)計主要針對String、Array、List等多個端口節(jié)點(diǎn)。
表1 Server查詢模塊設(shè)置標(biāo)準(zhǔn)
在數(shù)據(jù)庫信息查詢訪問控制系統(tǒng)中,Server 查詢模塊的連接位置存在于CloudFileUser 控制主機(jī)與數(shù)據(jù)處理模塊之間。
數(shù)據(jù)處理模塊由處理終端、控制主機(jī)兩部分組成。完整的數(shù)據(jù)處理模塊連接結(jié)構(gòu)如圖2 所示。
圖2 數(shù)據(jù)處理模塊的結(jié)構(gòu)示意圖
其中,數(shù)據(jù)處理終端以CSP 服務(wù)器作為核心應(yīng)用結(jié)構(gòu),可以準(zhǔn)確地提取數(shù)據(jù)庫信息參量,并可以在數(shù)據(jù)庫主機(jī)元件的作用下,規(guī)范查詢機(jī)制的作用形式[9-10]。為增強(qiáng)數(shù)據(jù)庫信息查詢機(jī)制的完整性,在建立數(shù)據(jù)處理模塊時,要求信息參量不具有雙向傳輸?shù)膱?zhí)行能力。
數(shù)據(jù)簇中心是指數(shù)據(jù)庫信息參量的核心存儲位置。在數(shù)據(jù)挖掘算法中,系統(tǒng)主機(jī)只有準(zhǔn)確掌握數(shù)據(jù)簇中心的定義表達(dá)式,才能夠最大化提升查詢機(jī)制的完整性水平[11-12]。定義數(shù)據(jù)簇中心表達(dá)式需要確認(rèn)訪問行為系數(shù)、連接行為系數(shù)的實際取值。設(shè)e表示訪問行為系數(shù)取值,w表示連接行為系數(shù)取值,在數(shù)據(jù)挖掘算法的影響下,e指標(biāo)、w指標(biāo)的最小取值結(jié)果都等于物理自然數(shù)1。設(shè)re表示基于系數(shù)e的參量查詢特征,rw表示基于系數(shù)w的參量查詢特征。聯(lián)立上述物理量,可將基于數(shù)據(jù)挖掘的數(shù)據(jù)簇中心提取表達(dá)式定義為:
式中,β表示查詢參量的提取系數(shù),ΔP表示數(shù)據(jù)庫信息的單位提取量。為使數(shù)據(jù)簇中心提取表達(dá)式的求解結(jié)果更符合實際應(yīng)用需求,系數(shù)re與系數(shù)rw的賦值不能同時等于極大值或極小值。
數(shù)據(jù)集轉(zhuǎn)換是執(zhí)行數(shù)據(jù)挖掘算法的必要處理環(huán)節(jié),可以將待檢測數(shù)據(jù)庫信息參量與查詢機(jī)制對應(yīng)起來,從而使得控制主機(jī)能夠?qū)π畔⒃L問行為進(jìn)行按需調(diào)節(jié)[13-14]。設(shè)Z表示一個標(biāo)準(zhǔn)的數(shù)據(jù)庫信息參量集合空間,其定義式如下:
其中,i1,i2,…,in表示n個不同的信息參量定義系數(shù)。設(shè)d1,d2,…,dn表示與信息參量定義系數(shù)相關(guān)的數(shù)據(jù)轉(zhuǎn)換度量值,φ表示信息參量調(diào)節(jié)系數(shù),γ表示數(shù)據(jù)庫信息參量的查詢向量。在上述物理量的支持下,聯(lián)立式(1)、式(2),可將數(shù)據(jù)集轉(zhuǎn)換條件定義為:
挖掘深度對系統(tǒng)主機(jī)數(shù)據(jù)庫信息參量的處理能力具有關(guān)鍵性影響[15-16]。由于數(shù)據(jù)挖掘算法的執(zhí)行不具備逆運(yùn)算的能力,所以在計算挖掘深度指標(biāo)時,要求數(shù)據(jù)庫信息參量的傳輸必須滿足一致性原則。設(shè)λmax表示數(shù)據(jù)庫信息參量挖掘特征的最大取值結(jié)果,v1、v2表示兩個隨機(jī)選取的信息參量挖掘定義項系數(shù)。數(shù)據(jù)庫信息在查詢訪問控制系統(tǒng)中的挖掘深度計算式為:
當(dāng)挖掘深度指標(biāo)符合既定實值標(biāo)準(zhǔn)時,增大λmax系數(shù)取值可以充分激發(fā)查詢訪問控制系統(tǒng)對于數(shù)據(jù)庫信息參量的處理能力[17-19]。
數(shù)據(jù)庫信息查詢機(jī)制的完整性(η)可以描述網(wǎng)絡(luò)主機(jī)對于數(shù)據(jù)信息參量訪問連接行為的控制有效性,且完整度水平越高,網(wǎng)絡(luò)主機(jī)對于數(shù)據(jù)信息參量訪問連接行為的控制也就越有效。
數(shù)據(jù)庫信息查詢機(jī)制的完整性(η) 的計算式如下:
式中,M表示數(shù)據(jù)庫信息檢測總量,B表示趨向性訪問行為系數(shù)。
以基于數(shù)據(jù)挖掘的數(shù)據(jù)庫信息查詢訪問控制系統(tǒng)作為實驗組應(yīng)用方法,以傳統(tǒng)RBAC 訪問控制系統(tǒng)作為對照組應(yīng)用方法,分別將兩類應(yīng)用系統(tǒng)的執(zhí)行程序輸入所選定的實驗主機(jī),記錄在相同實驗時間內(nèi),實驗組、對照組變量指標(biāo)的數(shù)值變化情況。具體實驗流程如圖3 所示。
圖3 實驗流程圖
以60 min 作為實驗時長,分別記錄該段實驗時間內(nèi),實驗組、對照組數(shù)據(jù)庫信息檢測總量(M) 與趨向性訪問行為系數(shù)(B)的數(shù)值變化情況,詳情如表2、表3 所示。
表2 數(shù)據(jù)庫信息檢測總量
表3 趨向性訪問行為系數(shù)
分析表2 可知,實驗過程中,實驗組、對照組數(shù)據(jù)庫信息檢測總量均呈現(xiàn)出不斷增大的數(shù)值變化狀態(tài),二者上升幅度相差不大,但實驗組數(shù)據(jù)庫信息檢測總量均值高于對照組。
分析表3 可知,實驗組趨向性訪問行為系數(shù)呈現(xiàn)出先增大后穩(wěn)定的變化狀態(tài),但其整體均值水平相對較低。對照組趨向性訪問行為系數(shù)在整個實驗過程中始終保持不斷增大的數(shù)值變化狀態(tài),且其均值水平明顯高于實驗組。
根據(jù)表2、表3 中的數(shù)據(jù)可計算數(shù)據(jù)庫信息查詢機(jī)制的完整性(η),計算結(jié)果如圖4 所示。
圖4 數(shù)據(jù)庫信息查詢機(jī)制的完整性測試
分析圖4 可知,在整個實驗過程中,實驗組η指標(biāo)的均值水平更高,其最大值達(dá)到了71.6%;對照組η指標(biāo)的均值水平則相對較低,其最大值只能達(dá)到43.3%,與實驗組最大值相比,下降了28.3%。
綜上可知,在數(shù)據(jù)挖掘算法的應(yīng)用下,數(shù)據(jù)庫信息查詢機(jī)制的完整性提升了近30%,與傳統(tǒng)RBAC訪問控制系統(tǒng)相比,新型應(yīng)用系統(tǒng)更能確保網(wǎng)絡(luò)主機(jī)對于數(shù)據(jù)信息參量訪問連接行為的控制有效性。
應(yīng)用數(shù)據(jù)挖掘算法,設(shè)計新型數(shù)據(jù)庫信息查詢訪問控制系統(tǒng),重新規(guī)劃了CloudFileUser 控制主機(jī)與Server 查詢模塊之間的實時連接關(guān)系,又借助數(shù)據(jù)處理模塊,對數(shù)據(jù)簇中心進(jìn)行按需提取。在實用性方面,新型控制系統(tǒng)增強(qiáng)了數(shù)據(jù)庫信息查詢機(jī)制的完整性,使得網(wǎng)絡(luò)主機(jī)可以有效控制數(shù)據(jù)信息參量的訪問連接行為,符合實際應(yīng)用需求。