摘要:為了解決工業(yè)生產(chǎn)數(shù)據(jù)集成結果可信度較低的問題,文章基于關聯(lián)規(guī)則算法的工業(yè)生產(chǎn)數(shù)據(jù)智能集成方法展開研究:統(tǒng)一定義各數(shù)據(jù)源中的狀態(tài)信息和位置信息描述形式,完成對工業(yè)生產(chǎn)數(shù)據(jù)冗余的預處理;以車間為關聯(lián)規(guī)則的制定基礎,同時考慮不同數(shù)據(jù)的獨立性和特異性,細化生產(chǎn)服務節(jié)點,借助生產(chǎn)制造任務對生產(chǎn)服務節(jié)點之間的邏輯關系加以描述,實現(xiàn)對數(shù)據(jù)的集成。測試結果證明,集成數(shù)據(jù)的查準率和召回率始終穩(wěn)定在0.9以上,具有較高的可信度。
關鍵詞:關聯(lián)規(guī)則算法;工業(yè)生產(chǎn)數(shù)據(jù);智能集成;數(shù)據(jù)冗余;生產(chǎn)服務節(jié)點;邏輯關系
doi:10.3969/J.ISSN.1672-7274.2023.06.018
中圖分類號:TP 399" " " " " "文獻標志碼:A" " " " " " "文章編碼:1672-7274(2023)06-00-03
Abstract: In order to solve the problem of low reliability of industrial production data integration results, this paper conducts research on intelligent integration methods of industrial production data based on association rule algorithms: Uniformly define the description form of state information and position information in each data source, and pre-process the redundancy of industrial production data; Taking the workshop as the basis for the formulation of association rules, taking into account the independence and specificity of different data, the production service nodes are refined, and the logical relationship between the production service nodes is described with the help of manufacturing tasks to achieve data integration. The test results proved that the accuracy and recall rate of the integrated data were always stable above 0.9, with high confidence.
Key words: association rule algorithm; industrial production data; intelligent integration; data redundancy; production service node; logical relationship
隨著信息技術的不斷發(fā)展,以工業(yè)生產(chǎn)為基礎的多元化數(shù)據(jù)系統(tǒng)建設逐漸加快[1,2]。針對不同應用環(huán)境與信息系統(tǒng)中的信息,建立合理有效的存儲、轉換以及共享管理機制成為極為重要的工作內容之一[3]。受到數(shù)據(jù)間異構性的影響,在某種程度上,數(shù)據(jù)的異構性增加了訪問相關數(shù)據(jù)過程的復雜程度和時間成本[4],為數(shù)據(jù)管理帶來了一定的困難[5]。在此基礎上,本文基于關聯(lián)規(guī)則算法,設計工業(yè)生產(chǎn)數(shù)據(jù)智能集成方法。
1" 工業(yè)生產(chǎn)數(shù)據(jù)智能集成方法設計
1.1 工業(yè)生產(chǎn)數(shù)據(jù)冗余處理
為了保障后續(xù)工業(yè)生產(chǎn)數(shù)據(jù)智能集成的可靠性,對于采集到的工業(yè)生產(chǎn)車間實時數(shù)據(jù)進行冗余處理是十分必要的[6]。分析該操作的本質,其主要是對數(shù)據(jù)采集中的無效數(shù)據(jù)加以清除,通過這樣的方式實現(xiàn)在不影響工業(yè)生產(chǎn)數(shù)據(jù)真實映射的基礎上,最大限度縮減數(shù)據(jù)采集和傳輸階段的粒度大小[7]。在具體的執(zhí)行過程中,本文以數(shù)據(jù)的相關度融合為基礎,實施對無效冗余信息的處理。假設在工業(yè)生產(chǎn)車間中,物理車間RFID、環(huán)境傳感器對于各類設備數(shù)據(jù)的展現(xiàn)形式均為數(shù)據(jù)流,那么其分別可以表示為
式中,為物理車間RFID中的數(shù)據(jù)信息;為環(huán)境傳感器采集到的數(shù)據(jù)信息;為生產(chǎn)設備的運行狀態(tài)數(shù)據(jù)信息;為RFID標簽的唯一編碼信息;為RFID讀寫器和天線編號信息;為環(huán)境傳感器編號信息;為環(huán)境傳感器的感知范圍參數(shù);為環(huán)境傳感器采集到的數(shù)據(jù)信息;為工業(yè)生產(chǎn)車間的設備編號信息;為工業(yè)生產(chǎn)車間設備所在區(qū)域信息;為生產(chǎn)車間設備狀態(tài)的數(shù)據(jù)集合參數(shù);t為讀取生產(chǎn)車間數(shù)據(jù)對應的時間參量。在此基礎上,本文通過定義某狀態(tài)信息,以位置信息將式(1)~式(3)中的數(shù)據(jù)進行統(tǒng)一化描述,其可以表示為
式中,為統(tǒng)一化描述后的生產(chǎn)車間數(shù)據(jù)信息;為編碼信息;為位置信息。按照這樣的方式,對于任意數(shù)據(jù)采集設備而言,在任意時間段內,形成的原始數(shù)據(jù)形式均為式(4)。當數(shù)據(jù)狀態(tài)不發(fā)生改變時,僅起始時刻和結束時刻的數(shù)據(jù)具有集成價值[8]。以此為基礎,對于數(shù)據(jù)狀態(tài)不改變時間段內無效數(shù)據(jù)的處理流程如圖1所示。
按照圖1所示的方式,根據(jù)數(shù)據(jù)編碼信息對當前生產(chǎn)的狀態(tài)進行搜索,通過比較不同時間對應狀態(tài)參數(shù),確定其是否為冗余數(shù)據(jù),實現(xiàn)數(shù)據(jù)的預處理,為后續(xù)的數(shù)據(jù)集成提供可靠基礎。
1.2 基于關聯(lián)規(guī)則算法的數(shù)據(jù)集成
以空間尺度和單元級為基礎,對車間生產(chǎn)任務特征進行提取,組合車間內的元素,以動態(tài)的形式描述整個物理車間的狀態(tài)[9]。對生產(chǎn)服務節(jié)點之間的關系加以描述,根據(jù)生產(chǎn)任務、計劃,對物理車間的邏輯關系進行實時描述,此時生產(chǎn)任務進行動態(tài)調整帶來的最直接影響就是物理車間也會相應地發(fā)生狀態(tài)改變。除此之外,按照空間尺度關聯(lián)規(guī)則進行數(shù)據(jù)集成??臻g對象構成的多個生產(chǎn)服務節(jié)點以及生產(chǎn)服務節(jié)點之間的活動組成最終的物理車間。
考慮到不同數(shù)據(jù)的獨立性和特異性,本文對生產(chǎn)服務節(jié)點進行細化,分別劃分為流動生產(chǎn)服務節(jié)點、工位生產(chǎn)服務節(jié)點,以及緩存生產(chǎn)服務節(jié)點。此時整個物理車間數(shù)據(jù)之間的關系可以表示為
式中,為整體物理車間的狀態(tài)數(shù)據(jù)信息;為流動生產(chǎn)服務節(jié)點的狀態(tài)數(shù)據(jù)信息;為工位生產(chǎn)服務節(jié)點的狀態(tài)數(shù)據(jù)信息;為緩存生產(chǎn)服務節(jié)點的狀態(tài)數(shù)據(jù)信息。生產(chǎn)服務節(jié)點自身的動態(tài)特性決定了物理車間狀態(tài)數(shù)據(jù)信息中,各生產(chǎn)服務節(jié)點的空間關系也是以相對變化的形式存在的。針對此,本文借助生產(chǎn)制造任務對生產(chǎn)服務節(jié)點之間的邏輯關系加以描述。那么車間生產(chǎn)數(shù)據(jù)可以集成為
2" 測試與分析
2.1 測試環(huán)境
以某數(shù)字孿生車間為基礎開展對比測試,對于測試數(shù)字孿生車間生產(chǎn)數(shù)據(jù)的實時采集等相關功能是通過3個子系統(tǒng)實現(xiàn)的。利用OPC UA服務器實現(xiàn)整個車間的信息傳輸和交互,利用Demo3D可視化仿真軟件實現(xiàn)對車間時間運行情況的模擬和監(jiān)控,利用總體管理系統(tǒng)實現(xiàn)對生產(chǎn)數(shù)據(jù)的存儲和管理,并具有延伸性和拓展性,確保其運行參數(shù)可實現(xiàn)靈活調整。
分別采用本文所提出的設計數(shù)據(jù)集成方法以及文獻[2]提出的以機器學習為基礎的數(shù)據(jù)集成方法、文獻[3]提出的以大數(shù)據(jù)為基礎的數(shù)據(jù)集成方法開展對比測試。在測試過程中,通過差異化設置生產(chǎn)數(shù)據(jù)的異構程度,統(tǒng)計不同方法的集成效果。
2.2 測試結果與分析
以上述測試環(huán)境為基礎,分別統(tǒng)計不同數(shù)據(jù)集成方法下,對于測試數(shù)據(jù)的管理效果。在評價指標設置方面,本文分別以查準率和召回率作為基準,二者的計算方式分別可以表示為
式中,為查準率;為召回率;為數(shù)據(jù)集成中未建立的匹配結果;為數(shù)據(jù)集成中實際為正確的卻預測為錯誤的匹配結果;為數(shù)據(jù)集成中實際為錯誤的卻預測為正確的匹配結果。結合上述的評價指標設置情況可以看出,集成方法的查準率越高,則對于工業(yè)生產(chǎn)數(shù)據(jù)集成效果的可信度也就越高;集成方法的召回率越高,則對于工業(yè)生產(chǎn)數(shù)據(jù)集成效果的準確性也就越高。以此為基礎,得到的測試結果如表1所示。
結合表1中測試結果對三種不同方法的數(shù)據(jù)集成效果進行分析,其中機器學習集成方法的集成效果受數(shù)據(jù)本體異構數(shù)量的影響較為明顯,當數(shù)據(jù)本體異構數(shù)量在15以下時,對應的查準率在0.8以上,而當數(shù)據(jù)本體異構數(shù)量在18以上時,查準率下降至0.80以下,最小值僅為0.72(數(shù)據(jù)本體異構數(shù)量為20時)。不僅如此,召回率也表現(xiàn)出了隨著數(shù)據(jù)本體異構數(shù)量的增加顯著下降的趨勢。當數(shù)據(jù)本體異構數(shù)量為4時,召回率為0.902。當數(shù)據(jù)本體異構數(shù)量為20時,召回率下降至0.870。大數(shù)據(jù)集成方法的測試結果與機器學習集成方法相比表現(xiàn)出了更高的穩(wěn)定性,但是其整體水平存在進一步提升的空間,在測試過程中,查準率的區(qū)間范圍為0.862~0.846,召回率的區(qū)間范圍為0.886~0.866。相比之下,在本文所提出的設計集成方法的測試結果中,不僅查準率和召回率始終穩(wěn)定在較高水平,并且并未受到數(shù)據(jù)本體異構數(shù)量的明顯影響,當數(shù)據(jù)本體異構數(shù)量為20時,查準率分別高于對照組0.181和0.155,召回率分別高于對照組0.03和0.034。綜合上述測試數(shù)據(jù)以及對比結果可以得出結論,本文基于關聯(lián)規(guī)則算法的工業(yè)生產(chǎn)數(shù)據(jù)智能集成方法可以實現(xiàn)對多源化工業(yè)生產(chǎn)數(shù)據(jù)的有效管理,具有良好的應用價值。
3" 結束語
本文所提的基于關聯(lián)規(guī)則算法的工業(yè)生產(chǎn)數(shù)據(jù)智能集成方法,充分考慮了在實際工業(yè)生產(chǎn)過程中輸出數(shù)據(jù)信息的多源化特征,結合其自身的獨立性與分布情況,對數(shù)據(jù)進行集成處理。設計集成方法不僅顯著提高了工業(yè)數(shù)據(jù)的管理效率,同時也降低了數(shù)據(jù)訪問階段操作的復雜性,大大提高了數(shù)據(jù)在利用階段的訪問便捷性。
參考文獻
[1] 徐德馨,彭漢發(fā),肖杰,等.城市全空間三維模型數(shù)據(jù)一體化集成管理關鍵技術及應用[J].地質科技通報,2023(1):388-397.
[2] 詹勝,楊先睿,曹湘華.基于機器學習的鉆井工程設計文檔識別及數(shù)據(jù)集成系統(tǒng)研究[J].中國信息化,2023(1):65-67.
[3] 黃勇光,黃兵.基于大數(shù)據(jù)技術的電力分區(qū)多源異構數(shù)據(jù)集成系統(tǒng)設計[J].電子設計工程,2023(2):34-37,42.
[4] 張莉,丁毛毛,李瑋,等.基于決策樹算法的客服終端冗余數(shù)據(jù)迭代消除方法[J].計算技術與自動化,2022(4):118-122.
[5] 張維,張浩晨.一種基于最優(yōu)集成隨機森林的小樣本數(shù)據(jù)特征提取方法[J].西北工業(yè)大學學報,2022(6):1261-1268.
[6] 楊杰,王茜.E-Science環(huán)境下高校圖書館科研數(shù)據(jù)的集成管理與共享模型研究[J].河南圖書館學刊,2022(11):62-66.
[7] 覃俊霖,楊雪薇.基于大數(shù)據(jù)技術和多源數(shù)據(jù)集成的經(jīng)濟運行平臺建設與探析[J].長江信息通信,2022(11):93-96.
[8] 張振山,肖聲,郝明明.城市軌道交通綜合調度指揮系統(tǒng)自感應數(shù)據(jù)集成方案的實現(xiàn)[J].城市軌道交通研究,2022(10):224-227.
[9] 張留留,賀震,何鳴一,等.基于服務調用和消息隊列的營配數(shù)據(jù)集成方法及實現(xiàn)[J].電工技術,2022(18):116-120.