孫麗君
(山東省科技服務(wù)發(fā)展推進中心,山東 濟南 250101)
由于信息技術(shù)和網(wǎng)絡(luò)技術(shù)的快速發(fā)展,電爐企業(yè)面對的數(shù)據(jù)規(guī)模和多樣性不斷增長,涉及的數(shù)據(jù)類型也更加豐富[1]。因此,電爐企業(yè)亟需提高自身的競爭力和市場適應(yīng)性,這就要求企業(yè)能夠?qū)Υ罅繑?shù)據(jù)進行準確的分析和挖掘,以獲取有用的信息和洞察。因此,電爐企業(yè)需要開發(fā)出更加高效、準確、可靠的數(shù)據(jù)挖掘系統(tǒng),從而提高生產(chǎn)效率、資源利用率和企業(yè)利潤。然而,電爐企業(yè)數(shù)據(jù)本身存在不同結(jié)構(gòu)和異構(gòu)性的問題,加之?dāng)?shù)據(jù)規(guī)模不斷增大,這些都為挖掘和分析帶來了諸多困難和挑戰(zhàn)[2]。對于電爐企業(yè)異構(gòu)網(wǎng)絡(luò)而言,在其運行過程中,如何實現(xiàn)共享數(shù)據(jù)的跨級傳輸,并根據(jù)事務(wù)長度標準對其進行挖掘處理成為一項亟待解決的問題。
文獻[3]提出基于改進粒子群優(yōu)化算法的挖掘系統(tǒng)。根據(jù)粒子節(jié)點選擇思想,在高效用項集中確定數(shù)據(jù)樣本初始優(yōu)化系數(shù)的取值,再通過效用值比較的方式,確定數(shù)據(jù)挖掘指令的執(zhí)行強度。文獻[4]采用N-list結(jié)構(gòu)的混合并行挖掘系統(tǒng)通過設(shè)計負載量估計函數(shù)的方式,確定共享數(shù)據(jù)的跨級傳輸能力,再聯(lián)合N-list結(jié)構(gòu),生成最終的高效項集挖掘結(jié)果。
然而上述兩類系統(tǒng)并不能有效控制事務(wù)長度,故而很難大幅提升電爐企業(yè)網(wǎng)絡(luò)共享數(shù)據(jù)的跨級傳輸能力。針對上述情況,設(shè)計新型電爐企業(yè)異構(gòu)網(wǎng)絡(luò)共享數(shù)據(jù)跨級高效項集挖掘系統(tǒng)。
電爐企業(yè)的網(wǎng)絡(luò)通常由多個不同類型的設(shè)備(如PLC、CNC、DCS等)組成,并可能采用不同的通訊協(xié)議,導(dǎo)致網(wǎng)絡(luò)結(jié)構(gòu)復(fù)雜,難以維護。因此在設(shè)計電爐企業(yè)異構(gòu)網(wǎng)絡(luò)體系中,利用關(guān)系圖譜清晰地顯示企業(yè)內(nèi)部設(shè)備結(jié)構(gòu),以文字信息或者數(shù)字信息表示,使其明確且清楚地展示企業(yè)內(nèi)部關(guān)系。
電爐企業(yè)異構(gòu)網(wǎng)絡(luò)體系負責(zé)整理Update主機輸出的電爐企業(yè)文字信息與電爐企業(yè)數(shù)字信息,并可以在Bi-GRU節(jié)點、RGCN節(jié)點的作用下,生成電爐企業(yè)關(guān)系圖譜與電爐企業(yè)內(nèi)部職能關(guān)系圖譜[5]。Bi-GRU節(jié)點負責(zé)梳理電爐企業(yè)文字信息與電爐企業(yè)數(shù)字信息,并可以將其中與共享數(shù)據(jù)相關(guān)的信息樣本提取處理,以用于構(gòu)造符合跨級傳輸需求的高效項集指標。RGCN節(jié)點可以同時調(diào)度n個Node下級附屬結(jié)構(gòu),當(dāng)文字信息與數(shù)字信息累積量達到一定數(shù)值標準后,Node結(jié)構(gòu)進入輸出狀態(tài),而這些信息樣本則可以根據(jù)電爐企業(yè)關(guān)系圖譜的表現(xiàn)形式,展示電爐企業(yè)內(nèi)部的職能關(guān)系[6]。具體的電爐企業(yè)異構(gòu)網(wǎng)絡(luò)體系結(jié)構(gòu)如圖1所示。
圖1 電爐企業(yè)異構(gòu)網(wǎng)絡(luò)體系結(jié)構(gòu)圖
為避免共享數(shù)據(jù)在電爐企業(yè)異構(gòu)網(wǎng)絡(luò)體系中出現(xiàn)混亂傳輸?shù)那闆r,Bi-GRU節(jié)點、RGCN節(jié)點都具備存儲數(shù)據(jù)樣本的能力。
電爐企業(yè)的各項系統(tǒng)需要緊密協(xié)作,實現(xiàn)數(shù)據(jù)共享和集中管理,這就要求不同系統(tǒng)之間具備良好的互通性。因此設(shè)計數(shù)據(jù)跨級共享模塊可以有效實現(xiàn)電爐企業(yè)不同系統(tǒng)的緊密協(xié)作功能。數(shù)據(jù)跨級共享模塊兼容代理服務(wù)組件、異構(gòu)網(wǎng)絡(luò)管理組件、跨級傳輸組件等多個應(yīng)用結(jié)構(gòu),可以在控制共享數(shù)據(jù)傳輸方向的同時,分析電爐企業(yè)異構(gòu)網(wǎng)絡(luò)信息的組成情況。代理服務(wù)組件作為數(shù)據(jù)跨級共享模塊的頂層應(yīng)用結(jié)構(gòu),同時控制Web主機與Sip主機,決定了共享數(shù)據(jù)的跨級傳輸方向[7-8]。異構(gòu)網(wǎng)絡(luò)管理組件同時處理共享數(shù)據(jù)存檔文本與歷史數(shù)據(jù)存檔文本,可以聯(lián)合跨級傳輸組件,利用已獲取到的共享數(shù)據(jù)樣本,定義高效項集組織。挖掘處理組件作為數(shù)據(jù)跨級共享模塊底層應(yīng)用結(jié)構(gòu),可以根據(jù)電爐企業(yè)異構(gòu)子網(wǎng)絡(luò)的布局形式,分析共享信息樣本的跨級傳輸需求。圖2反映了數(shù)據(jù)跨級共享模塊的基本布局形式。
圖2 數(shù)據(jù)跨級共享模塊簡圖
出于維持電爐企業(yè)異構(gòu)網(wǎng)絡(luò)運行穩(wěn)定性的考慮,共享數(shù)據(jù)的跨級傳輸方向只能由代理服務(wù)組件端指向挖掘處理組件端。
電爐企業(yè)的生產(chǎn)過程通常受到嚴格的安全標準和法規(guī)的監(jiān)管,同時,電爐企業(yè)的生產(chǎn)過程通常需要實時采集和處理大量數(shù)據(jù),需要保證數(shù)據(jù)實時性,所以網(wǎng)絡(luò)的時延和帶寬要求比較高,對數(shù)據(jù)進行分類可以有效提高數(shù)據(jù)的后續(xù)分析與處理效率,因此設(shè)計電爐數(shù)據(jù)邏輯分析模塊,負責(zé)確定電爐企業(yè)異構(gòu)網(wǎng)絡(luò)共享數(shù)據(jù)的傳輸目的,對電爐企業(yè)異構(gòu)網(wǎng)絡(luò)中的數(shù)據(jù)進行邏輯分析,實現(xiàn)對數(shù)據(jù)的自動分類和處理,能夠根據(jù)高效項集定義標準,制定系統(tǒng)主機所需執(zhí)行的挖掘指令,實現(xiàn)電爐數(shù)據(jù)的實時查詢和深度挖掘[9-10]。同時,該模塊的主要分析部分同時執(zhí)行共享信息查詢、數(shù)據(jù)跨級高效項集定義、深度挖掘的指令文本,能夠準確提取電爐企業(yè)異構(gòu)網(wǎng)絡(luò)中的所有共享數(shù)據(jù)信息樣本,并按照電爐數(shù)據(jù)邏輯分析原則,能夠準確提取電爐企業(yè)異構(gòu)網(wǎng)絡(luò)中的各類數(shù)據(jù)信息,并進行按需處理,滿足電爐企業(yè)對數(shù)據(jù)挖掘的需求。電爐數(shù)據(jù)邏輯分析模塊執(zhí)行原則如圖3所示。
圖3 電爐數(shù)據(jù)邏輯分析模塊執(zhí)行原則
電爐企業(yè)異構(gòu)網(wǎng)絡(luò)共享數(shù)據(jù)跨級高效項集挖掘系統(tǒng)運行過程中,如果數(shù)據(jù)信息默認傳輸方向與共享文檔傳輸方向不一致,首先要對信息傳輸方向進行統(tǒng)一,然后再根據(jù)挖掘系統(tǒng)執(zhí)行需求,定義高效項集結(jié)構(gòu)。
對于電爐企業(yè)的異構(gòu)網(wǎng)絡(luò),MP節(jié)點可以被看作是一個數(shù)據(jù)發(fā)射器和接收器,它可以從不同的設(shè)備和系統(tǒng)節(jié)點獲取數(shù)據(jù),并將這些數(shù)據(jù)匯聚到一個數(shù)據(jù)池中,供上層的系統(tǒng)主機進行數(shù)據(jù)挖掘處理。由于MP節(jié)點具有強大的跨級傳輸作用能力,它可以根據(jù)挖掘?qū)ο笏幬恢?實現(xiàn)快速、準確的電爐運行過程中環(huán)境監(jiān)測或設(shè)備運行數(shù)據(jù)傳輸和共享,從而使得系統(tǒng)主機能夠在短時間內(nèi)對大量的數(shù)據(jù)信息樣本進行挖掘處理。在實際應(yīng)用中,MP節(jié)點可以通過與其他網(wǎng)絡(luò)設(shè)備和系統(tǒng)節(jié)點進行協(xié)作,實現(xiàn)數(shù)據(jù)的實時傳輸和動態(tài)共享,為企業(yè)的生產(chǎn)和管理提供必要的數(shù)據(jù)支持和決策參考。此外,MP節(jié)點還具有良好的擴展性和可靠性,可以根據(jù)電爐企業(yè)的實際需求進行個性化的定制和優(yōu)化,以適應(yīng)不同應(yīng)用場景下的特殊需求[11-12]。由于電爐企業(yè)異構(gòu)網(wǎng)絡(luò)允許數(shù)據(jù)并列傳輸行為的出現(xiàn),所以MP節(jié)點在單位時間內(nèi)所承擔(dān)的數(shù)據(jù)樣本總量相對較大。設(shè)c、x、z表示三個隨機選取的數(shù)據(jù)樣本共享系數(shù),其取值滿足式(1)所示的計算結(jié)果。
c≠x≠z
(1)
(2)
如果共享數(shù)據(jù)的跨級傳輸目的地不同,那么在傳輸過程中,這些信息樣本所占用的MP共享節(jié)點也就不同。
在電爐企業(yè)異構(gòu)網(wǎng)絡(luò)中,可能存在多個應(yīng)用程序同時進行數(shù)據(jù)傳輸?shù)那闆r,涉及大量的數(shù)據(jù)傳輸和處理操作。此時,如果采用普通的數(shù)據(jù)傳輸方式,可能會遇到數(shù)據(jù)過大而無法一次性傳輸?shù)膯栴},導(dǎo)致數(shù)據(jù)傳輸失敗,影響電爐企業(yè)的生產(chǎn)和管理流程。而采用AP數(shù)據(jù)分片技術(shù),可以將大的數(shù)據(jù)包分為若干個小的數(shù)據(jù)分片,逐一將這些數(shù)據(jù)分片傳輸過去,最終實現(xiàn)整個數(shù)據(jù)的完整傳輸。一般來說,分片標準的定義標準越細致,電爐企業(yè)異構(gòu)網(wǎng)絡(luò)共享數(shù)據(jù)的單位累積量就越小,當(dāng)前情況下,系統(tǒng)主機所需處理的高效項集結(jié)構(gòu)總量也就相對較少[13-14]。規(guī)定s1、s2、…、sn表示電爐企業(yè)異構(gòu)網(wǎng)絡(luò)中n個待共享的數(shù)據(jù)信息樣本,且取值標準滿足式(3)。
s1,s2,…,sn∈[1,+∞)
(3)
聯(lián)立式(2)、式(3),推導(dǎo)高效項集挖掘系統(tǒng)所遵循的AP數(shù)據(jù)分片標準表達式為
(4)
式中:α為分類項系數(shù);ε為共享數(shù)據(jù)賦值系數(shù);β為電爐企業(yè)異構(gòu)網(wǎng)絡(luò)對于共享數(shù)據(jù)的分配權(quán)限。在電爐企業(yè)異構(gòu)網(wǎng)絡(luò)空間中,共享數(shù)據(jù)樣本的累積量不可能為零,所以β系數(shù)的取值恒大于自然數(shù)“1”。
RCAUL調(diào)用是挖掘系統(tǒng)針對高效項集結(jié)構(gòu)所制定的執(zhí)行指令,在電爐企業(yè)異構(gòu)網(wǎng)絡(luò)環(huán)境中,共享數(shù)據(jù)的目標傳輸位置直接影響RCAUL調(diào)用指令的執(zhí)行結(jié)果[15-16]。高效項集RCAUL調(diào)用指令的制定包含三個處理流程,具體定義式如下。
第一流程:
(5)
第二流程:
l2=K2·l1
(6)
第三流程:
(7)
聯(lián)立式(5)~式(7),可將高效項集的RCAUL調(diào)用表達式定義為
(8)
在電爐企業(yè)異構(gòu)網(wǎng)絡(luò)環(huán)境中,事務(wù)長度影響主機元件對數(shù)據(jù)項參量的挖掘處理能力,在網(wǎng)絡(luò)運行能力保持穩(wěn)定的前提下,事務(wù)長度越大,主機元件在處理數(shù)據(jù)項參量時所能到達的挖掘深度也就越淺,而這種情況則會明顯抑制電爐企業(yè)網(wǎng)絡(luò)共享數(shù)據(jù)的跨級傳輸能力。因此,促進電爐企業(yè)網(wǎng)絡(luò)共享數(shù)據(jù)的跨級傳輸能力就是實現(xiàn)對事務(wù)長度的有效壓縮。
首先,選擇電爐企業(yè)異構(gòu)網(wǎng)絡(luò)共享數(shù)據(jù)跨級高效項集挖掘系統(tǒng)作為實驗組檢測方法,將該系統(tǒng)執(zhí)行程序輸入Windows主機中,分析該方法對數(shù)據(jù)集參量事務(wù)長度的挖掘處理能力;其次,選擇基于改進粒子群優(yōu)化算法的挖掘系統(tǒng)作為第一對照組檢測方法,選擇采用N-list結(jié)構(gòu)的混合并行挖掘系統(tǒng)作為第二對照組檢測方法,分析該方法對數(shù)據(jù)集參量事務(wù)長度的挖掘處理能力;最后,統(tǒng)計所有實驗結(jié)果,總結(jié)實驗規(guī)律。
表1記錄了電爐企業(yè)不同數(shù)據(jù)集參量的初始事務(wù)長度。
表1 電爐企業(yè)數(shù)據(jù)集參量的初始事務(wù)長度
電爐企業(yè)異構(gòu)網(wǎng)絡(luò)對于事務(wù)長度挖掘處理的表達式如下:
(9)
圖4反映了不同挖掘系統(tǒng)作用下,數(shù)據(jù)集參量事務(wù)長度的具體數(shù)值水平。
圖4 事務(wù)長度實驗結(jié)果
實驗組:當(dāng)數(shù)據(jù)集參量初始事務(wù)長度等于1 024 kB時,經(jīng)實驗組挖掘系統(tǒng)作用后,這些數(shù)據(jù)集參量的事務(wù)長度水平被控制在500 kB以下,小于標準值512 kB。當(dāng)數(shù)據(jù)集參量初始事務(wù)長度等于512 kB時,經(jīng)實驗組挖掘系統(tǒng)作用后,質(zhì)量、人員數(shù)據(jù)集參量的事務(wù)長度等于0,加熱數(shù)據(jù)集參量的事務(wù)長度也只能達到50 kB,遠小于標準值512 kB。綜上實驗組挖掘系統(tǒng)作用下,數(shù)據(jù)集參量長度始終處于0~512 kB的數(shù)值范圍之內(nèi)。
第一對照組:當(dāng)數(shù)據(jù)集參量初始事務(wù)長度等于1 024 kB時,這些數(shù)據(jù)集參量的事務(wù)長度最小值為500 kB、最大值為525 kB。當(dāng)數(shù)據(jù)集參量初始事務(wù)長度等于512 kB時,這些數(shù)據(jù)集參量的事務(wù)長度最小值為375 kB、最大值為425 kB。綜上第一對照組挖掘系統(tǒng)作用下,數(shù)據(jù)集參量長度處于375~525 kB的數(shù)值范圍之內(nèi),高于實驗組實驗結(jié)果
第二對照組:當(dāng)數(shù)據(jù)集參量初始事務(wù)長度等于1 024 kB時,這些數(shù)據(jù)集參量的事務(wù)長度最小值為700 kB、最大值為800 kB。當(dāng)數(shù)據(jù)集參量初始事務(wù)長度等于512 kB時,這些數(shù)據(jù)集參量的事務(wù)長度最小值為325 kB、最大值為450 kB。綜上第二對照組挖掘系統(tǒng)作用下,數(shù)據(jù)集參量長度處于325 ~800 kB的數(shù)值范圍之內(nèi),遠高于實驗組實驗結(jié)果。
上述實驗結(jié)果表明,所設(shè)計系統(tǒng)可以有效解決因事務(wù)長度過大導(dǎo)致的數(shù)據(jù)項挖掘深度不達標的問題,能夠有效提升電爐企業(yè)網(wǎng)絡(luò)共享數(shù)據(jù)跨級傳輸能力。
所設(shè)計挖掘系統(tǒng)在電爐企業(yè)異構(gòu)網(wǎng)絡(luò)體系的基礎(chǔ)上,聯(lián)合數(shù)據(jù)邏輯分析模塊與數(shù)據(jù)跨級共享模塊,求解MP節(jié)點與AP數(shù)據(jù)分片標準表達式,從而實現(xiàn)對高效項集RCAUL調(diào)用指令的精準定義。實驗結(jié)果表明,在這種新型挖掘系統(tǒng)的作用下,因事務(wù)長度過大導(dǎo)致的數(shù)據(jù)項挖掘深度不達標的問題得到較好解決,符合提升電爐企業(yè)網(wǎng)絡(luò)共享數(shù)據(jù)跨級傳輸能力的實際應(yīng)用需求。