李春生,李少龍,邸京華,張可佳
(東北石油大學(xué) 計(jì)算機(jī)與信息技術(shù)學(xué)院,黑龍江 大慶 163318)
基于輻射關(guān)系的數(shù)據(jù)行為響應(yīng)機(jī)制研究
李春生,李少龍,邸京華,張可佳
(東北石油大學(xué) 計(jì)算機(jī)與信息技術(shù)學(xué)院,黑龍江 大慶 163318)
在數(shù)據(jù)集成應(yīng)用于構(gòu)建智能化平臺過程中,隨著規(guī)模的不斷擴(kuò)大,大量數(shù)據(jù)的高頻變更行為帶來的聯(lián)動影響導(dǎo)致平臺工作穩(wěn)定性及效率出現(xiàn)瓶頸。為了提高平臺處理數(shù)據(jù)聯(lián)動變更業(yè)務(wù)的準(zhǔn)確性和高效性,文中提出數(shù)據(jù)輻射模型概念,借鑒分類分析方法描述輻射行為,針對其復(fù)雜程度與輻射范圍制定出完整的行為響應(yīng)規(guī)則。同時為進(jìn)一步優(yōu)化行為反饋效率,縮短處理時間,設(shè)計(jì)出基于時間代價優(yōu)化的RD-TCO模型用于處理數(shù)據(jù)輻射行為,并完成基于輻射關(guān)系的數(shù)據(jù)行為響應(yīng)機(jī)制(RDBR),以達(dá)到增加數(shù)據(jù)處理準(zhǔn)確度、提高數(shù)據(jù)集成平臺工作效率的目的。最后結(jié)合大慶油田某采油廠三次采油跟蹤運(yùn)行數(shù)據(jù)管理平臺的實(shí)際使用情況,利用RDBR機(jī)制實(shí)現(xiàn)對平臺中數(shù)據(jù)集成系統(tǒng)的設(shè)計(jì)與改進(jìn)。
數(shù)據(jù)輻射;行為響應(yīng);時間代價優(yōu)化;RD-TCO模型
數(shù)據(jù)集成技術(shù)經(jīng)過數(shù)十年的發(fā)展,已經(jīng)廣泛應(yīng)用于工業(yè)生產(chǎn)及工程施工各領(lǐng)域中,并發(fā)揮著舉足輕重的作用[1]。由于數(shù)據(jù)規(guī)模的擴(kuò)大和開發(fā)時效性的增強(qiáng),對相關(guān)生產(chǎn)數(shù)據(jù)準(zhǔn)確性與高效性的需求與日俱增,于是探究數(shù)據(jù)內(nèi)部聯(lián)動關(guān)系,制定迅捷有效的數(shù)據(jù)行為響應(yīng)機(jī)制成為提高集成平臺工作效率的關(guān)鍵[2-4]。輻射關(guān)系的提出將數(shù)據(jù)聯(lián)動影響規(guī)則化,降低了大量數(shù)據(jù)行為變化過程中來源缺失、關(guān)系變更等現(xiàn)象帶來的負(fù)面影響,解決了數(shù)據(jù)集成平臺工作過程中由于數(shù)據(jù)聯(lián)動關(guān)系帶來的冗余與模糊[5]。
集成平臺對數(shù)據(jù)動態(tài)的分析與管理為企業(yè)提供了實(shí)時的數(shù)據(jù)視圖與靈活的查詢服務(wù)[6]。雖然通過制定基于標(biāo)準(zhǔn)的元數(shù)據(jù)模型實(shí)現(xiàn)了數(shù)據(jù)變更的協(xié)同性,但由于集成數(shù)據(jù)頻繁的行為變更與復(fù)雜的關(guān)系網(wǎng)絡(luò)而依舊存在以下不足:
(1)由于工程需求的多變性,導(dǎo)致部分?jǐn)?shù)據(jù)缺失狀況嚴(yán)重或使用價值較小,造成數(shù)據(jù)來源定義模糊,數(shù)據(jù)獲取方式混亂[2,7]。
(2)部分有動態(tài)化需求的數(shù)據(jù)由于關(guān)聯(lián)數(shù)據(jù)從屬關(guān)系的變更,計(jì)量單位、語義屬性、計(jì)算方式等因素的改變,極大程度地降低了數(shù)據(jù)的準(zhǔn)確度。
(3)當(dāng)多個數(shù)據(jù)變更行為發(fā)生時,彼此之間涉及的數(shù)據(jù)模型可能存在錯綜復(fù)雜的獲取順序問題,導(dǎo)致集成平臺工作效率的低下[8]。
針對上述問題,設(shè)計(jì)基于輻射關(guān)系的數(shù)據(jù)行為響應(yīng)機(jī)制,提出數(shù)據(jù)輻射模型表示發(fā)生行為變化數(shù)據(jù)的關(guān)系屬性及邏輯結(jié)構(gòu)。通過分類分析的方法構(gòu)建數(shù)據(jù)行為響應(yīng)規(guī)則,設(shè)計(jì)RD-TCO模型,實(shí)現(xiàn)對多行為并發(fā)響應(yīng)順序的優(yōu)化,達(dá)到提高數(shù)據(jù)聯(lián)動變更準(zhǔn)確率與多變更行為處理效率的目的。
數(shù)據(jù)輻射概念源于數(shù)據(jù)集成平臺工作中頻發(fā)的數(shù)據(jù)變更過程所產(chǎn)生的聯(lián)動影響,現(xiàn)將其定義為由于部分?jǐn)?shù)據(jù)模型發(fā)生邏輯屬性、計(jì)算方式、數(shù)值內(nèi)容等數(shù)據(jù)行為變化造成關(guān)聯(lián)數(shù)據(jù)模型屬性與功能的變更[9-10]。
在數(shù)據(jù)集成平臺中,當(dāng)部分?jǐn)?shù)據(jù)發(fā)生行為變化時,稱該數(shù)據(jù)為輻射源數(shù)據(jù)Ds。Ds是造成數(shù)據(jù)輻射的主要原因。將受Ds影響發(fā)生改變的數(shù)據(jù)集合稱為輻射域β,β內(nèi)具體受影響的數(shù)據(jù)元素稱為輻射域影響因子φ。
數(shù)據(jù)輻射模型可描述為一個五元組[11](觸發(fā)標(biāo)識γ,輻射元素Rdf,業(yè)務(wù)屬性Buf,輻射域β,輻射關(guān)系α)。
觸發(fā)標(biāo)識γ作為檢測數(shù)據(jù)是否發(fā)生變更行為的觸發(fā)器,默認(rèn)未發(fā)生變更時狀態(tài)為0,發(fā)生變更時置為1。輻射元素Rdf是模型中發(fā)生變化的數(shù)據(jù)元素集合,具體表示形式為:
業(yè)務(wù)屬性Buf用以描述Rdf中數(shù)據(jù)元素在實(shí)際項(xiàng)目中代表的含義以及計(jì)量單位等具體功能。輻射域β表示受Rdf輻射的數(shù)據(jù)模型的集合矩陣,具體表示形式如下:
輻射關(guān)系α包含了輻射數(shù)據(jù)Rdf與輻射域β中對應(yīng)數(shù)據(jù)元素的獲取方式。因此一個基于輻射關(guān)系的源數(shù)據(jù)模型可直接表示為:
輻射關(guān)系分為數(shù)值行為輻射與關(guān)系行為輻射[12]。其中數(shù)值行為輻射較為簡單,只需考慮數(shù)值變化時對輻射數(shù)據(jù)的影響,具體包括:
數(shù)值變更。源數(shù)據(jù)模型中只有數(shù)據(jù)元素的數(shù)值發(fā)生變化,其一般表述形式為:
業(yè)務(wù)屬性變更。在項(xiàng)目中表達(dá)的含義發(fā)生變化,如月度數(shù)據(jù)更改為旬度數(shù)據(jù)、計(jì)量單位的變化等,可能會造成數(shù)值的連帶變更,其一般表述形式為:
關(guān)系行為輻射因源數(shù)據(jù)與輻射數(shù)據(jù)對應(yīng)關(guān)系發(fā)生變化需要考慮因素眾多,較為復(fù)雜,具體包括如下兩種情況。
(1)輻射關(guān)系變更。源數(shù)據(jù)模型獲得輻射數(shù)據(jù)時對應(yīng)的計(jì)算方式發(fā)生變化,其一般表述形式為:
(2)輻射源變更。輻射源的變更分為新增、刪除與替換每項(xiàng)變更在發(fā)生時都有可能造成對應(yīng)關(guān)系的變化,其一般表述形式為:
在分析輻射源變更情況時,首先對源數(shù)據(jù)與輻射數(shù)據(jù)的對應(yīng)關(guān)系進(jìn)行分類。
當(dāng)且僅當(dāng)e→en時總有:
則認(rèn)為M1和M2存在SCI型關(guān)系。
當(dāng)e→en時總有:
則認(rèn)為M1和M2,M3,…,Mk存在SCS型關(guān)系。
rv=linkp(e1,e2,…,et);{e1∈Rd1∈M1,e2∈Rd2∈M2,…,et∈Rdt∈Mt}
當(dāng)e1→en1,e2→en2,…,et→ent時總有:
rvn=linkp(en1,en2,…,ent)
則認(rèn)為M1,M2,…,Mt和Mv存在MCN型關(guān)系。由于輻射數(shù)據(jù)模型中不同數(shù)據(jù)元素可以受多個輻射源影響,所以輻射源與輻射數(shù)據(jù)的對應(yīng)關(guān)系可以是三種關(guān)系的交集。
行為響應(yīng)規(guī)則的制定如下所述:
針對數(shù)值行為和關(guān)系行為具體分類情況,研究輻射數(shù)據(jù)在受到數(shù)據(jù)行為影響后的變化規(guī)律,提出如下響應(yīng)規(guī)則:
Rule1:當(dāng)發(fā)生輻射行為時,將觸發(fā)標(biāo)識γ置為1,并判斷輻射行為如果是數(shù)值行為則進(jìn)行Rule2,否則進(jìn)行Rule3。
Rule2:當(dāng)發(fā)生數(shù)值變更行為時,依據(jù)原有輻射關(guān)系搜索輻射域影響數(shù)據(jù)元素和業(yè)務(wù)屬性進(jìn)行修改。
Rule3:判斷關(guān)系變更行為類型,如果是輻射關(guān)系的變更則進(jìn)行Rule4,否則進(jìn)行Rule5。
Rule4:當(dāng)發(fā)生輻射關(guān)系變更時,修改輻射關(guān)系,將新的輻射關(guān)系αn賦予源數(shù)據(jù)模型。
Rule5:當(dāng)變更行為是輻射源的增加時,建立新的輻射關(guān)系。如果變更行為是輻射源的刪除且關(guān)系不為MCN型,則將輻射域β內(nèi)所有輻射數(shù)據(jù)元素Rdf刪除,否則判斷其他n-1個輻射源是否發(fā)生輻射關(guān)系之內(nèi)的替換行為,發(fā)生則對源數(shù)據(jù)模型的輻射域和輻射關(guān)系進(jìn)行修改,不發(fā)生則直接進(jìn)行刪除。
當(dāng)變更行為是輻射源的替換時,將原有輻射關(guān)系α從舊輻射源中剔除,如果是SCI型、SCS型,則關(guān)系α賦予新輻射源,否則建立新輻射關(guān)系。
Rule6:在Rule2、Rule4、Rule5完成之后將輻射數(shù)據(jù)模型標(biāo)記為新的輻射源模型,重新進(jìn)行Rule1直至觸發(fā)標(biāo)識為0。
通過對輻射關(guān)系的分類以及針對性的行為響應(yīng)規(guī)則設(shè)計(jì),對數(shù)據(jù)輻射行為有了基本的處理方法。但當(dāng)多個輻射行為發(fā)生時,數(shù)據(jù)模型通常會處于一個較為復(fù)雜的關(guān)系網(wǎng)之中,因此設(shè)計(jì)一套高效有序的響應(yīng)執(zhí)行模型變得至關(guān)重要[13]。將輻射關(guān)系簡化為一個執(zhí)行順序有向圖G,D表示輻射關(guān)系中所有涉及的數(shù)據(jù)模型集合,F(xiàn)表示執(zhí)行輻射響應(yīng)所需時間代價的集合,因此行為響應(yīng)模型的實(shí)際功能轉(zhuǎn)化為圖的路徑搜索優(yōu)化問題。涉及路徑問題常使用的幾種算法其時間代價相對固定,且不能直觀地反映各頂點(diǎn)之間路徑序列的先后關(guān)系[14]。所以,為了提高效率,減少無謂的重復(fù)比較計(jì)算,文中提出了基于數(shù)據(jù)行為響應(yīng)順序的時間代價優(yōu)化算法。
第三步,若T(k+1)=T(k),得到最優(yōu)執(zhí)行順序,算法終止,否則返回第二步。
RD-TCO模型的引入如下所示。
應(yīng)用時間代價優(yōu)化算法進(jìn)行RD-TCO模型的構(gòu)建。對圖1所示的執(zhí)行順序有向圖G1進(jìn)行執(zhí)行順序求解。
圖1 執(zhí)行順序有向圖G1
針對數(shù)值行為和關(guān)系行為具體分類情況,構(gòu)建初始狀態(tài)矩陣T(0)和關(guān)系矩陣R(0):
對關(guān)系矩陣R(0):
此時將節(jié)點(diǎn)V2加入路徑,即V1到V3的路徑需經(jīng)過V2。
插入節(jié)點(diǎn)V2加入路徑:
將方法推廣至T(1)和R(1)中所有元素,得到時間代價矩陣T(1)和關(guān)系矩陣R(1):
顯然有T(1)≠T(0),需要繼續(xù)執(zhí)行順序優(yōu)化,利用上述方法得到時間代價矩陣T(2)和關(guān)系矩陣R(2):
其中,p表示圖的稀疏程度。
時間T可以表示為:
表1 RD-TCO模型與一般傳統(tǒng)方法性能比較表
由此可見,基于時間代價優(yōu)化的RD-TCO模型在復(fù)雜行為關(guān)系執(zhí)行順序的問題上具有高效緊湊的優(yōu)勢[15]。
以RD-TCO模型為基礎(chǔ),設(shè)計(jì)數(shù)據(jù)輻射行為響應(yīng)機(jī)制,對油田施工中的生產(chǎn)數(shù)據(jù)及相關(guān)作業(yè)歷史數(shù)據(jù)的聯(lián)動變更進(jìn)行更新與修改,應(yīng)用在大慶油田某采油廠地質(zhì)大隊(duì)、作業(yè)大隊(duì)等相關(guān)單位。選擇較為有代表性的采油區(qū)塊月度注入數(shù)據(jù)進(jìn)行說明,如表2所示。
表2 采油區(qū)塊月度注入動態(tài)數(shù)據(jù)表
表2選取了區(qū)塊月度注入動態(tài)數(shù)據(jù)模型中若干數(shù)據(jù)元素,既包括受多個輻射源影響的視吸水指數(shù)、注采比,還有模型內(nèi)部輻射的開井率等,因此極具代表性。為了提高效果的直觀性,選取6個變更樣本,如表3所示。
根據(jù)輻射類型將樣本進(jìn)行分類,可知1、2號樣本屬于數(shù)值變更,5號屬于業(yè)務(wù)屬性變更,3號屬于輻射關(guān)系變更。4、5號分別屬于MCN型、SCI型輻射源變更。
分析6個樣本的輻射關(guān)系和涉及數(shù)據(jù)元素估算具體行為執(zhí)行時間代價,根據(jù)RD-TCO模型計(jì)算出最優(yōu)化執(zhí)行順序?yàn)椋?/p>
V1→V2
V1→V4→V3
V1→V4
V1→V4→V3→V5
經(jīng)過上述分析計(jì)算可知,當(dāng)輻射行為的并行發(fā)生量增至1 000條時,傳統(tǒng)方法較基于輻射關(guān)系的行為響應(yīng)機(jī)制語句執(zhí)行頻度高出約56%,所以該機(jī)制對于數(shù)據(jù)執(zhí)行效率具有較為明顯的提升。
表3 數(shù)據(jù)行為變更樣本表
將上述樣本實(shí)驗(yàn)應(yīng)用于另外20余個輻射關(guān)系模型,其中17個模型在實(shí)際運(yùn)行過程中未出現(xiàn)系統(tǒng)崩潰和數(shù)據(jù)錯誤問題,2個模型運(yùn)行過程中出現(xiàn)系統(tǒng)崩潰,經(jīng)工作人員排查,系計(jì)算機(jī)硬件問題,1個模型發(fā)生數(shù)據(jù)錯誤問題,屬于人工錄入錯誤。由此可見基于輻射關(guān)系的行為響應(yīng)機(jī)制可以應(yīng)用于數(shù)據(jù)集成平臺等領(lǐng)域。
根據(jù)基于輻射關(guān)系的行為響應(yīng)機(jī)制開發(fā)的數(shù)據(jù)管理平臺已經(jīng)正常工作,憑借對聯(lián)動數(shù)據(jù)變更高效而準(zhǔn)確的處理受到了應(yīng)用單位的較好評價。
文中提出了基于輻射關(guān)系的數(shù)據(jù)行為響應(yīng)機(jī)制,定義了數(shù)據(jù)輻射基本概念,對輻射關(guān)系中數(shù)據(jù)元素進(jìn)行結(jié)構(gòu)化的描述,采用分類分析的方法對數(shù)據(jù)行為進(jìn)行了分類并設(shè)計(jì)了針對分類情況的響應(yīng)規(guī)則,同時根據(jù)多輻射關(guān)系特征引入基于時間代價優(yōu)化算法的RD-TCO模型完成了行為響應(yīng)機(jī)制并節(jié)約了響應(yīng)的時間成本,實(shí)現(xiàn)了提高集成數(shù)據(jù)聯(lián)動反應(yīng)準(zhǔn)確度與效率的目的。
[1]MezniH,ChainbiW,GhediraK.AWS-Policy:anextensionforautonomicwebservicedescription[J].ProcediaComputerScience,2002,10:915-920.
[2] 劉 威,楊 丹.基于虛擬視圖的異構(gòu)數(shù)據(jù)庫集成平臺的研究[J].計(jì)算機(jī)技術(shù)與發(fā)展,2009,19(6):91-94.
[3] 宋洪濤.基于SDO的異構(gòu)數(shù)據(jù)集成系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D].北京:北京郵電大學(xué),2009.
[4] 豐江帆,李林,楊富平,武志濤,袁正午.基于ServiceGIS的震害應(yīng)急數(shù)據(jù)集成方法研究與應(yīng)用[J].重慶郵電大學(xué)學(xué)報(bào):自然科學(xué)版,2011,23(1):111-114.
[5] 徐俊剛,裴 瑩.數(shù)據(jù)ETL研究綜述[J].計(jì)算機(jī)科學(xué),2011,38(4):15-20.
[6] 丁衛(wèi)亮.基于本體異構(gòu)數(shù)據(jù)集成方法的研究[D].杭州:浙江工業(yè)大學(xué),2009.
[7] 徐 晶,許 煒.消息中間件綜述[J].計(jì)算機(jī)工程,2005,31(16):73-76.
[8] 曹洋洋.空間數(shù)據(jù)庫增量聯(lián)動更新辦法研究[D].杭州:浙江大學(xué),2014.
[9] 林 源,陳志泊.分布式異構(gòu)數(shù)據(jù)庫同步系統(tǒng)的研究與應(yīng)用[J].計(jì)算機(jī)工程與設(shè)計(jì),2010,31(24):5278-5281.
[10] 黃建平.基于SQLServer數(shù)據(jù)庫日志的信息源監(jiān)測方法的研究與實(shí)現(xiàn)[D].廣州:暨南大學(xué),2007.
[11] 高雅田,李春生,富 宇.基于關(guān)系數(shù)據(jù)分析的知識服務(wù)模型[J].計(jì)算機(jī)工程,2011,37(5):56-58.
[12] 張 鋒,張莉莉.觸發(fā)器在數(shù)據(jù)處理過程中的應(yīng)用研究[J].計(jì)算機(jī)工程與科學(xué),2008,30(5):156-158.
[13]HuJ,KhalilI,HanS,etal.SeamlessintegrationofdependabilityandsecurityconceptsinSOA:afeedbackcontrolsystembasedframeworkandtaxonomy[J].JournalofNetworkandComputerApplications,2011,34:1150-1159.
[14] 徐小玲,彭 京,石葆梅,等.一種基于邊序列的任意兩點(diǎn)間最短路徑算法[J].計(jì)算機(jī)工程與應(yīng)用,2005,41(29):88-90.
[15] 袁鼎榮,張師超,朱曉峰,等.基于相對等待時間的代價敏感決策樹[J].計(jì)算機(jī)科學(xué)與探索,2007(3):314-324.
Research on Response Mechanism of Data Behavior Based on Radiation Relationship
LI Chun-sheng,LI Shao-long,DI Jing-hua,ZHANG Ke-jia
(College of Computer and Information Technology,Northeast Petroleum University,Daqing 163318,China)
In the process of applying data integration in building an intelligent platform,with the continuous expansion of scale,the high frequency change of large amounts of data has caused a bottleneck in the work stability and efficiency of the platform.In order to improve accuracy and effectiveness in data linkage model,a radiation relationship is proposed and referring to classification analysis method,rules of behavior response for different situations is formulated,drawing up a complete response rule based on its complexity and radiation range.At the same time,the RD-TCO model is designed to optimize the feedback efficiency and shorten time cost of response,finishing the response mechanism of data behavior based on radiation relationship.To achieve the purpose that increase the accuracy of data and improve the efficiency of the data integration platform.Finally,in combination with the three oil recovery operation platform of a production plant in Daqing Oilfield,the design of data integration system in the platform via RDBR mechanism is implemented.
data radiation;behavioral response;optimization of time cost;RD-TCO model
2015-09-11
2015-12-11
時間:2016-05-25
黑龍江省科學(xué)基金項(xiàng)目(F2015020)
李春生(1960-),男,博士,教授,博士生導(dǎo)師,研究方向?yàn)槿斯ぶ悄芗捌鋺?yīng)用、模式識別與人工智能;李少龍(1990-),男,碩士研究生,通訊作者,研究方向?yàn)槿斯ぶ悄芘c信息處理技術(shù)。
http://www.cnki.net/kcms/detail/61.1450.TP.20160525.1706.032.html
TP312
A
1673-629X(2016)06-0146-05
10.3969/j.issn.1673-629X.2016.06.032