摘 要:隨著制造業(yè)趨向于數(shù)字化、網(wǎng)絡(luò)化、智能化發(fā)展,企業(yè)中大量的產(chǎn)品設(shè)計、生產(chǎn)制造、維修服務(wù)數(shù)據(jù)在不斷地堆疊積累,對此引入知識圖譜技術(shù)對這些數(shù)據(jù)進(jìn)行管理和挖掘,可以為實(shí)現(xiàn)新一代智能制造提供有力支撐。文章首先針對制造領(lǐng)域知識圖譜的構(gòu)建及關(guān)鍵技術(shù)進(jìn)行敘述,包括知識抽取、知識融合、知識推理等;然后將知識圖譜在制造領(lǐng)域中的應(yīng)用分為語義關(guān)聯(lián)和決策輔助兩大類,并探究其具體的應(yīng)用場景,希望能為相關(guān)企業(yè)構(gòu)建及應(yīng)用知識圖譜提供參考。
關(guān)鍵詞:智能制造;知識圖譜;知識抽取;知識融合;知識推理
中圖分類號:TP391.1 文獻(xiàn)標(biāo)識碼:A 文章編號:2096-4706(2024)08-0186-09
DOI:10.19850/j.cnki.2096-4706.2024.08.040
0 引 言
面臨新時代嚴(yán)峻的資源和環(huán)境挑戰(zhàn),需要不斷推進(jìn)大數(shù)據(jù)、工業(yè)物聯(lián)網(wǎng)、人工智能等新一代信息技術(shù)與制造業(yè)的結(jié)合發(fā)展,對產(chǎn)品設(shè)計、生產(chǎn)裝配、管理服務(wù)等制造全生命周期及相應(yīng)系統(tǒng)進(jìn)行集成優(yōu)化,推動未來全球制造業(yè)向數(shù)字化、網(wǎng)絡(luò)化、智能化創(chuàng)新發(fā)展[1]。據(jù)工業(yè)和信息化部公布的數(shù)據(jù)顯示,我國制造業(yè)規(guī)模已經(jīng)連續(xù)13年居世界首位,是當(dāng)之無愧的世界制造大國。但目前我國仍然不是制造強(qiáng)國,在國際競爭市場中四郊多壘,為此,深入發(fā)展智能制造成為實(shí)現(xiàn)我國建設(shè)制造強(qiáng)國的重要舉措,這將關(guān)乎我國制造業(yè)未來的全球地位。
智能制造的核心問題是信息集成,包括企業(yè)內(nèi)部不同層級信息系統(tǒng)和涉及產(chǎn)品制造全生命周期的生產(chǎn)設(shè)備間的縱向集成;不同企業(yè)之間研發(fā)、采購、制造和服務(wù)的橫向集成;圍繞特定產(chǎn)品制造全生命周期相互關(guān)聯(lián)合作的企業(yè)之間端到端集成[2]。其中,獲取數(shù)據(jù)作為信息集成的首要任務(wù),是實(shí)現(xiàn)智能制造的基礎(chǔ)保障。在實(shí)際生產(chǎn)制造中,產(chǎn)品每天在制造流程的各個階段都會產(chǎn)生海量的數(shù)據(jù),這些數(shù)據(jù)的語義在制造信息的提取和應(yīng)用中起著重要作用。國內(nèi)外眾多學(xué)者針對這些生產(chǎn)數(shù)據(jù),已經(jīng)開展大量的學(xué)術(shù)研究及應(yīng)用探索,希望通過新技術(shù)來完成信息融合,逐步開發(fā)具有自感知、自學(xué)習(xí)、自適應(yīng)等功能的新式生產(chǎn)模式。目前已經(jīng)能夠基于大數(shù)據(jù)實(shí)現(xiàn)在制造過程系統(tǒng)、工藝設(shè)計、維修服務(wù)等多個層面進(jìn)行在線識別定位、監(jiān)控、輔助決策等任務(wù)[3]。對此如何從語義層面實(shí)現(xiàn)數(shù)據(jù)的認(rèn)知、關(guān)聯(lián)、理解與推理成為解決問題的關(guān)鍵,然而,在輔助決策過程中,面對加工工藝自適應(yīng)調(diào)整、生產(chǎn)調(diào)度實(shí)時優(yōu)化、生產(chǎn)異常處理等復(fù)雜問題時智能化程度較低,仍需要借助于專家的實(shí)踐經(jīng)驗(yàn)和專業(yè)知識。有實(shí)現(xiàn)制造系統(tǒng)對人類經(jīng)驗(yàn)知識的理解、管理和自學(xué)習(xí),才能更好的提供決策支持。知識圖譜作為人工智能的分支技術(shù),能實(shí)現(xiàn)海量知識的獲取、組織與利用,為重用人類知識和經(jīng)驗(yàn)解決決策支持問題提供基礎(chǔ)。近年來,關(guān)于知識圖譜的研究與應(yīng)用不斷涌現(xiàn),已經(jīng)逐漸成為熱點(diǎn)問題。尤其是在金融、醫(yī)療、教育等行業(yè)得到了廣泛應(yīng)用,且發(fā)揮著重要作用,比如醫(yī)療領(lǐng)域的阿里巴巴“醫(yī)知鹿”;教育領(lǐng)域的清華大學(xué)出版社“文泉制造”等。然而,制造領(lǐng)域的知識圖譜相較匱乏,因?yàn)橹圃祛I(lǐng)域的知識具有封閉復(fù)雜、獲取困難、不同制造差異顯著等特點(diǎn),其知識圖譜的構(gòu)建十分困難。同時,知識圖譜在制造領(lǐng)域中的應(yīng)用需求較為模糊,應(yīng)用優(yōu)勢不突出,也極大地限制了落地應(yīng)用。針對上述問題,本文將探討構(gòu)建制造領(lǐng)域知識圖譜所需的關(guān)鍵技術(shù)及應(yīng)用實(shí)例,為知識圖譜在制造領(lǐng)域進(jìn)一步發(fā)展提供理論參考和啟迪。
1 制造領(lǐng)域知識圖譜概述
知識圖譜的概念,最早是在2012年由谷歌公司提出,當(dāng)時主要用于優(yōu)化搜索引擎,實(shí)現(xiàn)在多來源數(shù)據(jù)中高效智能搜索。之后,其概念演化又經(jīng)歷了長達(dá)數(shù)十年的時間,可以將其歸納總結(jié)為三個發(fā)展階段,如圖1(b)所示。早期,傳統(tǒng)專家系統(tǒng)需要依靠專家手工輸入經(jīng)驗(yàn)知識和建立推理規(guī)則,人工和時間成本較高;隨著本體論和語義網(wǎng)的引入,知識庫可以構(gòu)建成規(guī)范化和形式化的知識語義模型,同時支持基于語義邏輯的自動推理;如今,知識圖譜已經(jīng)發(fā)展為計算機(jī)自動獲取、理解知識并進(jìn)行推理演繹。相較于傳統(tǒng)知識庫,知識圖譜的優(yōu)勢體現(xiàn)在:1)存儲能力更強(qiáng)。知識圖譜采用有向圖結(jié)構(gòu),以節(jié)點(diǎn)和邊的表現(xiàn)形式,更有效的存儲實(shí)體之間的關(guān)聯(lián)關(guān)系;2)處理效率更快。知識圖譜基于本體論和自然語言處理(NLP)技術(shù),能夠?qū)崿F(xiàn)對數(shù)據(jù)和知識的語義解析,大大提升知識庫構(gòu)建的效率;3)搜索質(zhì)量更高。知識圖譜通過圖匹配算法、圖嵌入技術(shù)等,實(shí)現(xiàn)數(shù)據(jù)的匹配和推理。
與此同時,制造業(yè)也追隨著信息技術(shù)的進(jìn)步而逐漸發(fā)展,周濟(jì)院士[4]根據(jù)信息技術(shù)在智能制造中的應(yīng)用特征,將其發(fā)展總結(jié)為三個階段,如圖1所示。第一個階段是從傳統(tǒng)制造走向數(shù)字化,主要指企業(yè)從產(chǎn)品、技術(shù)層面實(shí)現(xiàn)數(shù)字化,通過數(shù)據(jù)分析完成對生產(chǎn)過程的集成優(yōu)化;第二個階段是邁向“互聯(lián)網(wǎng)+制造”也稱為數(shù)字化網(wǎng)絡(luò)化制造,主要指利用網(wǎng)絡(luò)將企業(yè)制造過程中涉及的人、物、服務(wù)連接起來,推動基于互聯(lián)網(wǎng)的協(xié)同制造;第三階段是發(fā)展成為新一代智能制造也稱為數(shù)字化網(wǎng)絡(luò)化智能化制造,通過人工智能技術(shù)不斷推進(jìn)人機(jī)一體化的智能系統(tǒng),顛覆傳統(tǒng)生產(chǎn)模式逐漸實(shí)現(xiàn)無人制造。
制造領(lǐng)域的知識圖譜不同于通用知識圖譜,更注重于知識的專業(yè)性、準(zhǔn)確性,獲取的數(shù)據(jù)結(jié)構(gòu)更為多樣復(fù)雜,應(yīng)用在不同場景下進(jìn)行復(fù)雜分析及智能決策,其構(gòu)建過程對關(guān)鍵技術(shù)的要求也非常嚴(yán)格[5]。本文所研究的制造領(lǐng)域知識圖譜是將知識圖譜與制造系統(tǒng)相結(jié)合的應(yīng)用,主要通過獲取以往生產(chǎn)的案例和經(jīng)驗(yàn),進(jìn)行推理發(fā)現(xiàn)新的知識,輔助決策者掌握生產(chǎn)要素,甚至提供決策方案以供參考。
1.1 制造領(lǐng)域知識圖譜數(shù)據(jù)來源
當(dāng)前,制造系統(tǒng)與信息技術(shù)相結(jié)合不斷快速發(fā)展,使得在制造過程中產(chǎn)品在全生命周期各個環(huán)節(jié)都會有大量的數(shù)據(jù)產(chǎn)生,這些數(shù)據(jù)的來源廣泛并不統(tǒng)一,比如企業(yè)內(nèi)部生產(chǎn)數(shù)據(jù)、運(yùn)維數(shù)據(jù)、外部互聯(lián)網(wǎng)數(shù)據(jù)等。根據(jù)數(shù)據(jù)形式的不同,可以分為結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)以及非結(jié)構(gòu)化數(shù)據(jù)三類。結(jié)構(gòu)化數(shù)據(jù)可以使用關(guān)系型數(shù)據(jù)庫進(jìn)行存儲,包括生產(chǎn)監(jiān)測的數(shù)據(jù)、產(chǎn)品質(zhì)量檢測的數(shù)據(jù)以及能源消耗的數(shù)據(jù)等;半結(jié)構(gòu)化數(shù)據(jù)包括員工個人信息、設(shè)備操作說明書、接口數(shù)據(jù)等;非結(jié)構(gòu)化數(shù)據(jù)包括各種格式的辦公文檔、生產(chǎn)監(jiān)控的圖片和視頻等數(shù)據(jù)。在不同類型的生產(chǎn)制造過程中,除人工采集數(shù)據(jù)外,要想獲取制造業(yè)生產(chǎn)過程中的多源異構(gòu)數(shù)據(jù),還需要借助多種采集方法和工具[6]。根據(jù)在生產(chǎn)過程的應(yīng)用場景及數(shù)據(jù)類型,舉例五種典型數(shù)據(jù)采集方式,如RFID技術(shù)、條碼技術(shù)、傳感器技術(shù)、Flume、流媒體服務(wù)器。
數(shù)據(jù)模型也稱為知識表達(dá)模型,是構(gòu)建知識圖譜的底層架構(gòu)。因?yàn)橹R圖譜是一種有向圖結(jié)構(gòu)的知識庫,本質(zhì)是表示實(shí)體聯(lián)系的語義網(wǎng)絡(luò),由實(shí)體、關(guān)系和語義描述組成,所以其基本組成單位是“頭實(shí)體-關(guān)系-尾實(shí)體”的三元組,圖2展現(xiàn)了以生產(chǎn)推土機(jī)為例的制造領(lǐng)域數(shù)據(jù)模型的特征。
在制造領(lǐng)域的數(shù)據(jù)采集方面,知識圖譜對知識的精度與深度具有很高的要求,因?yàn)槠髽I(yè)的利益和生產(chǎn)的安全依賴于數(shù)據(jù)的準(zhǔn)確性,然而非結(jié)構(gòu)化數(shù)據(jù)并不能直接被計算機(jī)所理解,無法直接實(shí)現(xiàn)形式化表達(dá),需要通過知識抽取技術(shù)去轉(zhuǎn)化為結(jié)構(gòu)數(shù)據(jù),這將會增加時間和經(jīng)濟(jì)成本。
1.2 制造領(lǐng)域知識圖譜構(gòu)建框架
目前,知識圖譜的構(gòu)建方法有自底向上法和自頂向下法兩種[7]。自底向上的構(gòu)建方式是先將獲取的海量數(shù)據(jù)進(jìn)行知識抽取,組成知識三元組,再經(jīng)過知識融合篩選后作為數(shù)據(jù)層,最后進(jìn)行概念抽象形成模式層;自頂向下的構(gòu)建方式是先定義頂層概念本體,再從數(shù)據(jù)源中抽取實(shí)體及關(guān)系進(jìn)行匹配。通常應(yīng)用既定本體庫構(gòu)建圖譜的方式較為廣泛,但在構(gòu)建對專業(yè)知識要求嚴(yán)苛,且本體框架要求準(zhǔn)確完整的知識圖譜時,也可以采用將兩種構(gòu)建方式相結(jié)合的混合構(gòu)建法,在建立模式層后,不斷挖掘新知識迭代更新模式層,如圖3所示。
根據(jù)上述構(gòu)建知識圖譜的方法,結(jié)合制造行業(yè)生產(chǎn)流程具有完整性的特點(diǎn),基于全生命周期建立知識圖譜的構(gòu)建框架,如圖4所示。
2 制造領(lǐng)域知識圖譜構(gòu)建的關(guān)鍵技術(shù)
2.1 知識抽取
知識抽取是將人類使用自然語言表述的異構(gòu)數(shù)據(jù)轉(zhuǎn)化為由實(shí)體、關(guān)系和屬性等知識要素組成的結(jié)構(gòu)化數(shù)據(jù),并儲存在知識圖譜中。其中資源描述框架(Resource Description Framework, RDF)是對語義知識進(jìn)行規(guī)范化描述和存儲的典型應(yīng)用,它為結(jié)構(gòu)化數(shù)據(jù)的發(fā)布提供一個標(biāo)準(zhǔn)的數(shù)據(jù)描述框架。如圖5所示,以RDF形式對汽車仰望U8的知識進(jìn)行表示。根據(jù)知識抽取目標(biāo)對象的不同,知識抽取的主要工作包括實(shí)體抽取、關(guān)系抽取以及屬性抽取。
2.1.1 實(shí)體抽取
實(shí)體抽取也可以稱為命名實(shí)體識別,旨在文本中識別實(shí)體并將具有相似屬性的實(shí)體進(jìn)行分類加以標(biāo)注區(qū)分。以售后維修場景中“客戶反饋發(fā)動機(jī)聲音異常,經(jīng)過返廠檢測后發(fā)現(xiàn),系連桿變形損壞導(dǎo)致敲缸,更換連桿后問題解決。”這句文本為例,實(shí)體抽取示例如表1所示。
在制造領(lǐng)域中,實(shí)體抽取的精確度將影響知識圖譜的準(zhǔn)確性,但實(shí)體抽取工作面臨著很多難點(diǎn),例如存在諸多由中文、英文、阿拉伯?dāng)?shù)字以及特殊符號組合來命名的實(shí)體,比如“VMC650加工中心”“CT-6數(shù)控車床”的設(shè)備型號、操作行程等,無法采用簡單的中文實(shí)體抽取方法識別實(shí)體跨度;存在嵌套型實(shí)體,比如零件“彈簧墊圈”是由兩個命名實(shí)體嵌套組合而成,“彈簧”和“墊圈”都可以是獨(dú)立的實(shí)體,此時無法用傳統(tǒng)的序列標(biāo)記法識別例句中的嵌套實(shí)體。實(shí)體抽取的實(shí)現(xiàn)方法最早是基于規(guī)則和字典的方法,后來隨著機(jī)器學(xué)習(xí)算法的引入,形成基于傳統(tǒng)機(jī)器學(xué)習(xí)的方法和基于深度學(xué)習(xí)的方法。
1)基于規(guī)則和字典的實(shí)體抽取。根據(jù)專家提前制定的文本規(guī)則和詞典,抽取相似度高的實(shí)體和屬性。該方法主要用于文本數(shù)據(jù)的抽取,高度依賴抽取規(guī)則的準(zhǔn)確性,時間成本較高,適用于小規(guī)模數(shù)據(jù)集。
2)基于傳統(tǒng)機(jī)器學(xué)習(xí)的實(shí)體抽取。傳統(tǒng)機(jī)器學(xué)習(xí)的實(shí)體抽取采用具有領(lǐng)域數(shù)據(jù)特征且已標(biāo)注的語料數(shù)據(jù)作為訓(xùn)練集,然后訓(xùn)練分類器去學(xué)習(xí)訓(xùn)練集的數(shù)據(jù)特征,以實(shí)現(xiàn)對數(shù)據(jù)集進(jìn)行自動標(biāo)注。該方法往往被認(rèn)為是序列標(biāo)注問題,常見的模型有隱馬爾可夫(Hidden Markov Model, HMM)模型[8]、條件隨機(jī)場(Conditional Random Field, CRF)模型[9]、支持向量機(jī)(Support Vector Machines, SVM)模型[10]等,其中CRF模型最受歡迎,可以在給出觀測序列標(biāo)簽情況下,計算訓(xùn)練標(biāo)簽數(shù)據(jù)的條件概率分布,取得較好的應(yīng)用效果。
3)基于深度學(xué)習(xí)的實(shí)體抽取。深度學(xué)習(xí)的實(shí)體抽取延伸自傳統(tǒng)機(jī)器學(xué)習(xí),但不同于傳統(tǒng)機(jī)器學(xué)習(xí)依賴人工標(biāo)注的特征,它通過自身的隱含層對輸入信息進(jìn)行特征提取,是目前最為流行的實(shí)體抽取方法。常見的模型有循環(huán)神經(jīng)網(wǎng)絡(luò)(Rerrent Neural Network, RNN)模型、卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks, CNN)模型、雙向長短期記憶網(wǎng)絡(luò)(Bi-directional Long Short-Term Memory, BiLSTM)模型等,這些神經(jīng)網(wǎng)絡(luò)模型具有較強(qiáng)的適用性與數(shù)據(jù)擬合性,能有效提升工作的效率與精度。其中具有代表性的是LSTM+CRF模型[11],該組合模型能夠結(jié)合以往的輸入特征,并使用句子級別的標(biāo)注信息,提高了實(shí)體抽取準(zhǔn)確率。之后,大多學(xué)者在該模型基礎(chǔ)上進(jìn)行改進(jìn)應(yīng)用,例如結(jié)合預(yù)訓(xùn)練模型(Bidirectional Encoder Representation from Transformers, BERT)等。周雷[12]在構(gòu)建電機(jī)故障知識圖譜時,提出BERT+BiLSTM+MHA+CRF組合模型來解決雙向長短記憶網(wǎng)絡(luò)(BiLSTM)無法捕捉到長距離依賴的問題,實(shí)驗(yàn)證明該模型對完成命名實(shí)體識別具有優(yōu)越性。胡杰[13]等人在構(gòu)建汽車故障知識圖譜時,提出BERT+BiLSTM+MUL+CRF模型來解決文本中的嵌套實(shí)體問題和非連續(xù)實(shí)體問題。
2.1.2 關(guān)系抽取
通過實(shí)體抽取所得到的實(shí)體,往往是還沒有被分割,也沒有進(jìn)行關(guān)聯(lián)的,并不能直接組成三元組,需要通過關(guān)系抽取進(jìn)一步挖掘?qū)嶓w之間的關(guān)系。制造領(lǐng)域中,數(shù)據(jù)往往具有強(qiáng)關(guān)聯(lián)性,研發(fā)設(shè)計、生產(chǎn)、服務(wù)等不同環(huán)節(jié)的數(shù)據(jù)之間相互關(guān)聯(lián),關(guān)系復(fù)雜度較高,例如“PUMA562型機(jī)器人可以完成復(fù)雜結(jié)構(gòu)空間曲面的弧焊作業(yè)”中“PUMA562型機(jī)器人”與“弧焊作業(yè)”兩個實(shí)體之間存在復(fù)雜嵌套的關(guān)系,這增加了關(guān)系抽取準(zhǔn)確的難度。實(shí)現(xiàn)關(guān)系抽取常見的方法包括基于有監(jiān)督學(xué)習(xí)法、基于半監(jiān)督學(xué)習(xí)法以及無監(jiān)督學(xué)習(xí)法。
有監(jiān)督學(xué)習(xí)的關(guān)系抽取,需要將大量人工標(biāo)注的語料數(shù)據(jù)投入模型中進(jìn)行訓(xùn)練。無監(jiān)督學(xué)習(xí)的實(shí)體抽取方法需要先將大量語料信息做聚類分析,再根據(jù)聚類的結(jié)果給定關(guān)系。其效果相對較差,因?yàn)榫垲惐旧砭痛嬖陔y以描述的關(guān)系和召回率低的問題,與有監(jiān)督抽取方法相比召回率和準(zhǔn)確率普遍低10%左右。半監(jiān)督學(xué)習(xí)又叫做弱監(jiān)督學(xué)習(xí),只需要少量的人工標(biāo)注數(shù)據(jù),但需要先了解實(shí)體關(guān)系的類型,然而實(shí)際操作中實(shí)體關(guān)系的類型往往并不能完全被知道。但人工構(gòu)造數(shù)據(jù)特征提取往往時間、經(jīng)濟(jì)成本較高,還存在邊緣界定不清等問題。為避免特征構(gòu)造帶來的誤差,大量研究學(xué)者開始探究基于端到端的深度學(xué)習(xí)方法。其中,遞歸神經(jīng)網(wǎng)絡(luò)(RNN)在序列化方面表現(xiàn)較好;卷積神經(jīng)網(wǎng)絡(luò)(CNN)雖然無法對長句分析建模,但在實(shí)體關(guān)系抽取上效果顯著。長短期記憶人工神經(jīng)網(wǎng)絡(luò)(Long Short-Term Memory, LSTM)可以通過與聚類技術(shù)結(jié)合來降低訓(xùn)練和測試時間[14]。張彤[15]等人在研究工業(yè)制造領(lǐng)域質(zhì)量文本實(shí)體關(guān)系抽取中,以加入中文分詞預(yù)處理的方式改進(jìn)的分段卷積神經(jīng)網(wǎng)絡(luò)(PCNN),提出C-PCNN模型,該模型具有更好的抽取效果。段文昱[16]等人在研究武器裝配領(lǐng)域?qū)嶓w關(guān)系抽取中,利用BERT+BiGRU+CNN模型抽取實(shí)體間的關(guān)系,再對抽取結(jié)果進(jìn)行過濾和調(diào)整,最后設(shè)計強(qiáng)領(lǐng)域性的關(guān)系抽取規(guī)則進(jìn)行補(bǔ)充關(guān)系抽取,使關(guān)系抽取的準(zhǔn)確性得到提升。
遠(yuǎn)程監(jiān)督屬于半監(jiān)督學(xué)習(xí)的一種,它不依賴于人工標(biāo)注語料,相對而言是較為可行的方法,所以目前有關(guān)遠(yuǎn)程監(jiān)督的研究最為流行。遠(yuǎn)程監(jiān)督是在2009年由Mintz [17]等人提出的方法,它假設(shè)在外部知識庫中,對于已有的一個知識圖譜的三元組,任何包含該三元組實(shí)體的句子,都在一定程度上反映該三元組中的關(guān)系。但該方法也有很大的不足,因?yàn)檫@個假設(shè)關(guān)系在實(shí)際中并不絕對,不一定適用于所有實(shí)體。所以解決遠(yuǎn)程監(jiān)督學(xué)習(xí)對實(shí)體間關(guān)系的忽略問題、關(guān)系抽取的精確問題,也是當(dāng)前研究遠(yuǎn)程監(jiān)督學(xué)習(xí)的熱點(diǎn)問題。賴冠宇[18]等人提出一種遠(yuǎn)程監(jiān)督中文關(guān)系提取方法,該方法將基于中文訓(xùn)練數(shù)據(jù)改進(jìn)的BERT模型作為嵌入層,并利用BiLSTM神經(jīng)網(wǎng)絡(luò)增強(qiáng)特征提取能力,結(jié)果表明提升了關(guān)系抽取性能。袁泉[19]等人在面臨詞向量語義信息不全以及實(shí)體一詞多義的問題,提出基于BERT的詞向量的兩次注意力加權(quán)算法,首先使用自注意力動態(tài)編碼算法,為詞向量識別文本前后語義信息,然后在模型輸出句子級特征向量后,構(gòu)建注意力矩陣,最后運(yùn)用注意力算法為每個句子級特征向量添加不同的注意力分?jǐn)?shù),以提高句子級特征的抗噪能力。
2.1.3 屬性抽取
在制造領(lǐng)域中,屬性抽取是為實(shí)體服務(wù)的,從文本中抽取出與實(shí)體相關(guān)的屬性和屬性值,如產(chǎn)品材料的屬性包括物理性能、化學(xué)性質(zhì)、工藝等,通過屬性描述可以讓實(shí)體更加準(zhǔn)確、豐富。因?yàn)閷?shí)體與屬性的關(guān)系常被界定為指代性關(guān)系,關(guān)系抽取的思路也適用于屬性抽取。但屬性抽取相較于關(guān)系抽取也有區(qū)別,因?yàn)閷?shí)體屬性值的結(jié)構(gòu)是不確定的。目前較為常用的方法是基于深度學(xué)習(xí)的序列標(biāo)注,序列標(biāo)注將實(shí)體屬性值比作較長的實(shí)體,然后對數(shù)據(jù)進(jìn)行標(biāo)注,再使用序列標(biāo)注模型進(jìn)行訓(xùn)練和抽取。袁芳怡[20]在研究制造領(lǐng)域知識圖譜的屬性提取時,提出將個性化Page Rank嵌入BiLSTM+CRF模型,再與無監(jiān)督學(xué)習(xí)的方法相結(jié)合的抽取方式,可以無須提前指定屬性類別,還可以減少人力標(biāo)注的成本。
2.2 知識融合
通過知識表示與抽取,獲取到大量三元組數(shù)據(jù),但這些數(shù)據(jù)可能存在有知識重復(fù)或者歧義,還需要進(jìn)行知識融合,使相同的知識具有統(tǒng)一的描述。例如由于地域差別或是術(shù)語表述、手寫記錄不規(guī)范,導(dǎo)致同一實(shí)體存在不同的稱呼,“發(fā)動機(jī)”又稱“引擎”或“Engine”“夾具”又名“卡具”“功率不足”有時也會表述為“動力不足”等,當(dāng)出現(xiàn)這種情況時,需要進(jìn)行實(shí)體對齊來消去歧義。
2.2.1 實(shí)體對齊
實(shí)體對齊的目的主要是判斷不同語義表述的實(shí)體是否表征真實(shí)世界的同一對象。實(shí)現(xiàn)實(shí)體對齊的方法可以分為傳統(tǒng)實(shí)體對齊法和基于知識表示學(xué)習(xí)的實(shí)體對齊法。
傳統(tǒng)的實(shí)體對齊通過字符串的各種特征來進(jìn)行工作,包括基于屬性相似性計算和基于關(guān)系推理的實(shí)體對齊法。屬性相似性計算的方法只考慮實(shí)體對之間的屬性相似度,并沒有將實(shí)體之間的關(guān)系納入考慮;基于關(guān)系推理的方法需要提前獲取實(shí)體類別、屬性等信息,需要做大量的數(shù)據(jù)標(biāo)注工作。許駒熊[21]等人在構(gòu)建發(fā)動機(jī)故障知識圖譜時,采用編輯距離和Jaccard相關(guān)系數(shù)法進(jìn)行實(shí)體相似度計算,并將保留相似度得分高于設(shè)定閾值的一個實(shí)體,并更新圖譜中的三元組中。王雅林[22]等人為補(bǔ)充工業(yè)制造領(lǐng)域知識圖譜,構(gòu)建注塑知識圖譜,以缺陷-表觀-原因-方案的形式設(shè)計本體,再結(jié)合屬性相似度進(jìn)行兩級實(shí)體對齊,提高了發(fā)現(xiàn)冗余知識的概率。
基于知識表示的實(shí)體對齊法是目前解決實(shí)體對齊的重要方法,利用機(jī)器學(xué)習(xí)技術(shù)將實(shí)體和關(guān)系映射到低維的向量空間,實(shí)現(xiàn)用向量表示實(shí)體之間的關(guān)系。常見的模型有翻譯模型或圖神經(jīng)網(wǎng)絡(luò)(Graph Neural Networks, GNN)模型,它們具備較強(qiáng)的魯棒性和泛化能力。劉璐[23]等人先采用預(yù)訓(xùn)練模型完成多視圖知識表示,再結(jié)合卷積神經(jīng)網(wǎng)絡(luò)(CNN)進(jìn)行相似度計算,提高了計算精確率,高效完成實(shí)體對齊的任務(wù)。
2.2.2 語義融合
在生產(chǎn)制造過程中,通過多環(huán)節(jié)或多角度獲取到的文本、圖片、視頻等多模態(tài)數(shù)據(jù),具有內(nèi)部關(guān)聯(lián)性。語義融合算法抽象多模態(tài)數(shù)據(jù)的語義內(nèi)涵,理解不同模態(tài)數(shù)據(jù)之間的特征關(guān)系,以模仿大腦思考的方式完成多模態(tài)數(shù)據(jù)的知識融合。胡小溪[24]等人在處理設(shè)備故障文本數(shù)據(jù)時,提出一種基于詞項(xiàng)和語義融合的文本自動預(yù)處理方法,分別對故障記錄進(jìn)行詞項(xiàng)和語義融合,再基于規(guī)則模板應(yīng)用K-近鄰算法對其統(tǒng)一描述,解決故障記錄模糊問題。高知新[25]等人提出基于隱馬爾科夫模型(HMM)與語義融合的文本分類方法,將特征詞語義整合到HMM模型中,得到更好的分類效果。李立[26]等人對大型車聯(lián)網(wǎng)數(shù)據(jù)庫提出高效查詢技術(shù),利用關(guān)聯(lián)語義融合方法提取檢索的特征量,再結(jié)合模糊C-均值聚類算法對提取的語義本體特征進(jìn)行分類檢索。
2.3 知識推理
知識推理的目的是在已建立的知識庫基礎(chǔ)上,繼續(xù)挖掘推理隱含的新知識或者未知關(guān)系,用以補(bǔ)充和豐富知識庫,讓構(gòu)建的知識圖譜更加完整。制造領(lǐng)域的數(shù)據(jù)具有特殊性,數(shù)據(jù)量龐大、實(shí)體間關(guān)系復(fù)雜,很難總結(jié)成統(tǒng)一的推理規(guī)律,需要專家經(jīng)驗(yàn)輔助推理復(fù)雜規(guī)律。目前常見的知識推理方法主要有基于邏輯規(guī)則推理和基于圖結(jié)構(gòu)推理。
基于邏輯規(guī)則的推理是通過專家制定規(guī)則和統(tǒng)計的特征來進(jìn)行推理,適用于抽象概念,主要方法有一階謂詞邏輯規(guī)則推理和描述邏輯推理法[27]。一階謂詞邏輯規(guī)則推理通過設(shè)定約束條件實(shí)現(xiàn)知識推理,其中個體表示具體的事物或抽象的概念,可以定義為實(shí)體或泛實(shí)體,謂詞表示個體性質(zhì)或個體間的關(guān)系。描述邏輯推理可以理解為一階謂詞邏輯推理的一個可判定子集,可以模擬大腦的推理能力,利用先驗(yàn)知識來輔助推理,極大地提高了知識推理的準(zhǔn)確性。方喜峰[28]等人在構(gòu)建的CAM數(shù)控編程知識圖譜中,基于本體和語義Web規(guī)則語言的知識推理方法可以有效獲取知識圖譜中隱含知識。
基于圖結(jié)構(gòu)的知識推理,是根據(jù)知識圖譜的圖結(jié)構(gòu)特點(diǎn),讓“邊”成為其特有的特征,推理出隱藏的“邊”也就是推理出兩個實(shí)體間的關(guān)系。其中路徑排序算法[29]作為經(jīng)典的推理算法,將關(guān)系路徑作為特征進(jìn)行推理,通過發(fā)現(xiàn)兩個實(shí)體間的路徑來推測實(shí)體間可能存在的某種聯(lián)系,這種方法可解釋性強(qiáng),并且可以自動發(fā)現(xiàn)推理規(guī)則。尹昱東[30]等人在構(gòu)建裝配知識圖譜時,通過探索某一節(jié)點(diǎn)以及其周圍的關(guān)系標(biāo)簽來推理其周圍的引用節(jié)點(diǎn)之間的關(guān)系,實(shí)現(xiàn)潛在關(guān)系的挖掘。邢曉宇[31]等人在對航天器性能和故障關(guān)系補(bǔ)全時,提出一種基于實(shí)體的語義和位置信息的推理模型,并利用主成分分析對高維語義信息進(jìn)行降維,提高了推理的準(zhǔn)確性。王佳皓[32]等人在構(gòu)建自動色環(huán)機(jī)設(shè)計知識圖譜時,基于強(qiáng)化算法和蟻群算法建立框架模型,將蟻群算法中的信息素作為策略網(wǎng)絡(luò)進(jìn)行實(shí)體間的路徑選擇,挖掘潛在路徑。
3 制造領(lǐng)域知識圖譜的應(yīng)用
基于上述理論知識,知識圖譜作為一種可以從海量數(shù)據(jù)中抽取結(jié)構(gòu)化知識的手段,為制造系統(tǒng)中動態(tài)、海量、異構(gòu)的數(shù)據(jù)處理提供了一種有效的方式,它可以清晰有效地表達(dá)出實(shí)體內(nèi)部的聯(lián)系。換言之,利用知識圖譜建立起包含各種相關(guān)知識的知識網(wǎng)絡(luò),讓人們能夠做到基于知識間的聯(lián)系來分析問題,讓系統(tǒng)實(shí)現(xiàn)智能化。調(diào)研現(xiàn)有文獻(xiàn),發(fā)現(xiàn)知識圖譜技術(shù)在制造領(lǐng)域的應(yīng)用場景主要有智能制造問答系統(tǒng)、制造決策支持系統(tǒng)、車間生產(chǎn)調(diào)度優(yōu)化、產(chǎn)品設(shè)計與開發(fā)、設(shè)備故障診斷系統(tǒng)及其他應(yīng)用制造場景等。根據(jù)應(yīng)用場景的共性可以分為兩大類,分別為語義關(guān)聯(lián)、決策輔助。
3.1 語義關(guān)聯(lián)
制造系統(tǒng)中的多源異構(gòu)數(shù)據(jù)可以通過知識圖譜來實(shí)現(xiàn)語義關(guān)聯(lián)和共享利用。新一代智能制造強(qiáng)調(diào)企業(yè)信息集成,致力于智慧工廠一體化發(fā)展,工廠信息化系統(tǒng)主要包括企業(yè)資源計劃系統(tǒng)(ERP)、制造執(zhí)行系統(tǒng)(MES)、產(chǎn)品生命周期管理系統(tǒng)(PLM)和倉庫管理系統(tǒng)(WES)等,但在實(shí)際生產(chǎn)中,這些信息系統(tǒng)收集和積累的過程數(shù)據(jù)和資料,往往相互孤立,需要構(gòu)建知識圖譜,來助力企業(yè)數(shù)據(jù)整合。通過知識圖譜提取相關(guān)數(shù)據(jù),在語義層面建立統(tǒng)一表示并相互關(guān)聯(lián),從而將這些信息系統(tǒng)連接起來。宋鄧強(qiáng)[33]提出基于知識圖譜的船舶加工資源與流程動態(tài)建模與融合分析方法,實(shí)現(xiàn)工位動態(tài)時序數(shù)據(jù)與知識圖譜的語義關(guān)聯(lián)。楊愷霖[34]提出基于知識圖譜的復(fù)雜制造數(shù)據(jù)關(guān)聯(lián)關(guān)系構(gòu)建方法,實(shí)現(xiàn)面向用戶的自定義復(fù)雜關(guān)系模型動態(tài)構(gòu)建,可以高效的為系統(tǒng)的制造數(shù)據(jù)搭建復(fù)雜的關(guān)聯(lián)關(guān)系。曾左英[35]提出了一種基于知識圖譜的“數(shù)據(jù)-知識”雙向特征驅(qū)動的非智能物聯(lián)設(shè)備自發(fā)現(xiàn)模型,將設(shè)備運(yùn)行數(shù)據(jù)與機(jī)理知識融合驅(qū)動,實(shí)現(xiàn)了對非智能物聯(lián)設(shè)備的互聯(lián)互通。路松峰[36]等人提出基于知識圖譜的數(shù)控裝備信息模型的建模方法,實(shí)現(xiàn)對信息系統(tǒng)多源異構(gòu)數(shù)據(jù)的實(shí)時采集。
3.2 決策輔助
根據(jù)在制造過程中的決策需求,知識圖譜可以為決策支持提供知識發(fā)現(xiàn)與關(guān)系推理。知識圖譜具備優(yōu)秀的相似匹配和查詢功能,將歷史積累的經(jīng)驗(yàn)和以往的案例通過知識圖譜進(jìn)行表示和存儲,可以及時、準(zhǔn)確、全面地提供解決制造問題所需要的知識,輔助生成決策方案。應(yīng)用較為廣泛的場景有輔助產(chǎn)品設(shè)計、生產(chǎn)計劃與調(diào)度、質(zhì)量管理與控制、設(shè)備故障診斷等。針對不同的制造問題,提取不同階段的制造數(shù)據(jù),構(gòu)建“定制化”知識圖譜,在通過開發(fā)知識問答、語義檢索以及知識推理等服務(wù),搭建交互式應(yīng)用平臺,實(shí)現(xiàn)答案反饋,輔助生成決策方案。
3.2.1 輔助產(chǎn)品設(shè)計
基于知識圖譜輔助產(chǎn)品設(shè)計,可以將企業(yè)內(nèi)積累的設(shè)計案例以及經(jīng)驗(yàn)知識進(jìn)行重用,為工作人員提供設(shè)計知識和參考案例,降低設(shè)計成本,提高工作效率和質(zhì)量?,F(xiàn)有文獻(xiàn)通常將設(shè)計功能、形態(tài)、加工工藝等產(chǎn)品設(shè)計要素建立統(tǒng)一語義表示,進(jìn)而構(gòu)建出知識圖譜。李寶清[37]等人提出了一種模具設(shè)計知識表示方法,構(gòu)建了以凸模結(jié)構(gòu)形式知識為例的知識圖譜,提高了模具設(shè)計的效率和質(zhì)量,實(shí)現(xiàn)了知識的共享和重用。崔碩[38]等人融合設(shè)計歷史模型庫和文本資源庫,構(gòu)建了機(jī)械設(shè)計領(lǐng)域知識圖譜并建立問答系統(tǒng)方便查詢,極大地提升了產(chǎn)品設(shè)計效率。徐進(jìn)[39]等人面向裝配設(shè)計,從三維圖面檔案中進(jìn)行零件實(shí)體抽取和知識融合,構(gòu)建了發(fā)動機(jī)裝配知識圖譜。張思超[40]等人為輔助生成柴油機(jī)零部件的生產(chǎn)工藝設(shè)計方案,基于知識圖譜提出對加工過程中的工藝知識進(jìn)行重構(gòu)。
3.2.2 生產(chǎn)計劃與調(diào)度
基于知識圖譜輔助優(yōu)化生產(chǎn)計劃與調(diào)度方案的制訂,可以及時地為現(xiàn)場工作人員做出科學(xué)決策提供所需信息?,F(xiàn)有文獻(xiàn)將企業(yè)資源配置、生產(chǎn)計劃要素、工藝流程規(guī)劃等方面的信息進(jìn)行語義集成,進(jìn)而構(gòu)建出知識圖譜。鐘紅燕[41]構(gòu)建離線車間知識圖譜,對以往人工排產(chǎn)經(jīng)驗(yàn)和車間歷史生產(chǎn)數(shù)據(jù)進(jìn)行重用,實(shí)現(xiàn)對加工工藝和可選設(shè)備等離線信息的查詢,解決多目標(biāo)多約束柔性作業(yè)車間調(diào)度問題。郭興勇[42]等人通過提取飛機(jī)制造工藝流程規(guī)劃知識,建立知識圖譜并研究工藝路線推薦方法,提高飛機(jī)制造工藝流程規(guī)劃效率及質(zhì)量,縮短飛機(jī)研制周期。武群惠[43]等人構(gòu)建了面向航天制造企業(yè)的供應(yīng)鏈知識圖譜,涵蓋采購、物流、合同、質(zhì)量、倉儲等信息,輔助企業(yè)對斷供影響進(jìn)行分析,保障供應(yīng)鏈安全。李昊[44]針對緊急訂單的插單排產(chǎn)情況,建立了混流裝配線訂單知識圖譜,能夠?qū)⒂唵?、企業(yè)資源以及企業(yè)效益間的關(guān)聯(lián)程度表示出來,并作為制定訂單優(yōu)先級順序的依據(jù)。
3.2.3 質(zhì)量管理與控制
基于知識圖譜的質(zhì)量管理與控制,可以輔助生產(chǎn)過程中質(zhì)量的智能管控;同時,在出現(xiàn)質(zhì)量異常情況時,可以根據(jù)生產(chǎn)過程中產(chǎn)生的歷史數(shù)據(jù)和以往經(jīng)驗(yàn)知識,分析質(zhì)量問題的成因,從而提出解決方案以供參考。現(xiàn)有文獻(xiàn)將質(zhì)量控制的體系、設(shè)備參數(shù)、工藝參數(shù)、資源變量等影響質(zhì)量的因素進(jìn)行語義關(guān)聯(lián),輔助工作人員完善質(zhì)量控制的體系,在生產(chǎn)過程中及時控制和調(diào)整參數(shù),以保證產(chǎn)品質(zhì)量滿足生產(chǎn)目標(biāo)。謝生同[45]構(gòu)建了機(jī)械加工知識圖譜,并運(yùn)用圖算法和圖神經(jīng)網(wǎng)絡(luò)等方法研究工藝參數(shù)推薦方法,從而輔助參數(shù)優(yōu)化決策。孟令達(dá)[46]通過構(gòu)建生產(chǎn)環(huán)節(jié)的質(zhì)量風(fēng)險知識圖譜,推理生產(chǎn)環(huán)節(jié)中風(fēng)險源之間的關(guān)聯(lián)關(guān)系,當(dāng)出現(xiàn)某一質(zhì)量風(fēng)險時,及時預(yù)測可能發(fā)生的伴隨風(fēng)險及影響,以便迅速響應(yīng)并采取應(yīng)急措施。蔣軍威[47]構(gòu)建了零件制造質(zhì)量形成知識圖譜提出一種用于關(guān)鍵工序評價的方法,實(shí)現(xiàn)了對制造質(zhì)量形成過程的智能化管控,為新一代質(zhì)量管理模式提供了新的思路。王贊贊[48]以變速箱裝配過程為研究對象,分析裝配過程中常見的質(zhì)量問題,建立過程質(zhì)量控制的體系框架,并提出基于知識圖譜的變速箱裝配質(zhì)量控制方法,實(shí)現(xiàn)對裝配過程的質(zhì)量預(yù)測與控制。
3.2.4 設(shè)備故障診斷
在制造領(lǐng)域,基于知識圖譜的設(shè)備故障診斷,是當(dāng)前知識圖譜技術(shù)應(yīng)用研究的熱點(diǎn)問題。設(shè)備故障診斷需要了解設(shè)備狀態(tài)、故障發(fā)生機(jī)理、故障表現(xiàn)及影響和接觸故障方案等諸多信息,所以在無專業(yè)維修人員指導(dǎo)下很難查找故障原因,也無法及時維修。知識圖譜可以整合各類故障診斷報表以及以往故障案例,以“故障現(xiàn)象—原因—解決方案”的形式構(gòu)建故障知識圖譜,輔助故障原因的定位和診斷,并為故障的排除提供參考方案。劉勁松[49]通過整理企業(yè)內(nèi)零散的設(shè)備故障維護(hù)知識,構(gòu)建機(jī)床故障知識圖譜。利用該圖譜可以對機(jī)床的故障發(fā)生原因進(jìn)行檢索推理,得出相應(yīng)的維修參考方案,提高了故障處理效率。胡晨陽[50]以西門子、發(fā)那科等數(shù)控制造廠商的維修技術(shù)手冊以及企業(yè)數(shù)控機(jī)床故障維修案例為研究對象,構(gòu)建數(shù)控機(jī)床故障診斷知識圖譜,根據(jù)故障描述相似度為用戶匹配故障維修案例。周佳樂[51]重點(diǎn)研究了工業(yè)機(jī)器人故障診斷知識圖譜的構(gòu)建方法,通過推理故障間的復(fù)雜關(guān)聯(lián)關(guān)系,為維修人員提供輔助推理診斷,提高了故障排查的準(zhǔn)確率。
4 結(jié) 論
通過調(diào)研現(xiàn)有的制造領(lǐng)域知識圖譜相關(guān)文獻(xiàn),發(fā)現(xiàn)構(gòu)建知識圖譜相關(guān)的理論和技術(shù)框架正在不斷完善,應(yīng)用場景也正在不斷豐富,應(yīng)用層次和應(yīng)用效果也在不斷提升,同時發(fā)現(xiàn)在落地應(yīng)用實(shí)施方面,還有很大的不足,當(dāng)前大都停留在學(xué)術(shù)研究層面,距離實(shí)際廣泛應(yīng)用還需要繼續(xù)努力。本文首先總結(jié)了構(gòu)建制造領(lǐng)域知識圖譜的關(guān)鍵技術(shù)及研究進(jìn)展,再將目前知識圖譜在制造領(lǐng)域最為廣泛的應(yīng)用案例分為兩類,分別探究了其具體的應(yīng)用場景,希望能為相關(guān)企業(yè)構(gòu)建及應(yīng)用知識圖譜提供參考。
參考文獻(xiàn):
[1] 周濟(jì).以智能制造為主攻方向 堅定不移建設(shè)制造強(qiáng)國 [J].中國工業(yè)和信息化,2022(9):34-40.
[2] 朱鐸先,趙敏.機(jī)智:從數(shù)字化車間走向智能制造 [M].北京:機(jī)械工業(yè)出版社,2018.
[3] 張應(yīng)剛,夏威屹,尹伊,等.對新一代智能制造的幾點(diǎn)思索 [J].制造業(yè)自動化,2022,44(10):124-126+220.
[4] 周濟(jì),李培根,周艷紅,等.走向新一代智能制造 [J].Engineering,2018(1):28-47.
[5] 劉悅悅,李燕.醫(yī)學(xué)知識圖譜研究綜述 [J].軟件導(dǎo)刊,2023,22(5):241-247.
[6] 陳世超,崔春雨,張華,等.制造業(yè)生產(chǎn)過程中多源異構(gòu)數(shù)據(jù)處理方法綜述 [J].大數(shù)據(jù),2020,6(5):55-81.
[7] 趙彤宇.醫(yī)學(xué)知識圖譜構(gòu)建方法研究及在疾病診斷中的應(yīng)用 [D].濟(jì)南:齊魯工業(yè)大學(xué),2020.
[8] 張航.泥石流災(zāi)害領(lǐng)域知識圖譜的構(gòu)建與應(yīng)用 [D].昆明:云南師范大學(xué),2021.
[9] SONG S,ZHANG N,HUANG H. Named entity recognition based on conditional random fields [J].Cluster Computing,2017(1):1-12.
[10] 賈美云.基于知識圖譜的汽車交易智能推薦系統(tǒng)研究 [D].太原:中北大學(xué),2020.
[11] WINTAKA D C,BIJAKSANA M A,ASROR I. Named-Entity Recognition on Indonesian Tweets using Bidirectional LSTM-CRF [J].Procedia Computer Science,2019,157:221-228.
[12] 周雷.基于知識圖譜的電機(jī)故障診斷方法 [D].重慶:重慶郵電大學(xué),2022.
[13] 胡杰,李源潔,耿號,等.基于深度學(xué)習(xí)的汽車故障知識圖譜構(gòu)建 [J].汽車工程,2023,45(1):52-60+85.
[14] SUNDERMEYER M,RALF SCHLüTER,NEY H. LSTM Neural Networks for Language Modeling [C]//Interspeech.ISCA:2012:194-197.
[15] 張彤,宋明艷,王俊,等.基于PCNN的工業(yè)制造領(lǐng)域質(zhì)量文本實(shí)體關(guān)系抽取方法 [J].信息技術(shù)與網(wǎng)絡(luò)安全,2021,40(3):8-13.
[16] 段文昱,朱繼召,趙浩楠,等.面向武器裝備領(lǐng)域的實(shí)體及關(guān)系抽取方法研究 [J].中國電子科學(xué)研究院學(xué)報,2022,17(12):1165-1172.
[17] MINTZ M,BILLS S,SNOW R,et al. Distant supervision for relation extraction without labeled data [C]//Proc of International Joint Conference on Natural Language Processing.Stroudsburg:Association for Computational Linguistics,2009:1003-1011.
[18] 賴冠宇,張旭,童浩卓.基于BERT-wwm-ext和BiLSTM模型的遠(yuǎn)程監(jiān)督關(guān)系提取 [J].電腦編程技巧與維護(hù),2022(9):42-44.
[19] 袁泉,陳昌平,陳澤,等.基于BERT的兩次注意力機(jī)制遠(yuǎn)程監(jiān)督關(guān)系抽取 [J/OL].計算機(jī)應(yīng)用:1-8[2023-07-26].http://kns.cnki.net/kcms/detail/51.1307.TP.20230712.1331.002.html.
[20] 袁芳怡.面向制造業(yè)的知識圖譜表示模型與構(gòu)建技術(shù)研究 [D].哈爾濱:哈爾濱工業(yè)大學(xué),2019.
[21] 許駒雄,李敏波,劉孟珂,等.發(fā)動機(jī)故障領(lǐng)域知識圖譜構(gòu)建與應(yīng)用 [J].計算機(jī)系統(tǒng)應(yīng)用,2022,31(7):66-76.
[22] 王雅琳,鄒江楓,王凱,等.基于本體引導(dǎo)的注塑知識圖譜構(gòu)建及缺陷溯因應(yīng)用 [J].電子與信息學(xué)報,2022,44(5):1521-1529.
[23] 劉璐,飛龍,高光來.基于多視圖知識表示和神經(jīng)網(wǎng)絡(luò)的旅游領(lǐng)域?qū)嶓w對齊方法 [J].計算機(jī)應(yīng)用研究,2023,40(4):1044-1051.
[24] 胡小溪,牛儒,唐濤.基于詞項(xiàng)和語義融合的地鐵信號設(shè)備故障文本預(yù)處理 [J].鐵道學(xué)報,2021,43(2):78-85.
[25] 高知新,徐林會.基于隱馬爾科夫模型與語義融合的文本分類 [J].計算機(jī)應(yīng)用與軟件,2017,34(7):303-307.
[26] 李立,張修軍.大型車聯(lián)網(wǎng)數(shù)據(jù)庫的高效查詢技術(shù) [J].現(xiàn)代電子技術(shù),2017,40(22):60-62+65.
[27] 于慧琳,陳煒,王琪,等.使用子圖推理實(shí)現(xiàn)知識圖譜關(guān)系預(yù)測 [J].計算機(jī)科學(xué)與探索,2022,16(8):1800-1808.
[28] 方喜峰,柳大坤,龔嬋媛,等.面向CAM數(shù)控編程領(lǐng)域的知識圖譜構(gòu)建方法 [J].中國機(jī)械工程,2023,34(12):1486-1494.
[29] LAO N,MITCHELL T,COHEN W W.Random walk inference and learning in a large scale knowledge base [C]//Proceedings of the 2011 Conference on Empirical Methods in Natural Language Processing.Stroudsburg.PA:Association for Computational Linguistics,2011:529-539.
[30] 尹昱東,王保建.半結(jié)構(gòu)裝配數(shù)據(jù)的知識抽取及機(jī)床裝配知識圖譜構(gòu)建方法研究 [J].制造技術(shù)與機(jī)床,2022(11):97-101.
[31] 邢曉宇,王淑一,劉文靜.考慮語義和位置信息的航天器知識圖譜關(guān)系預(yù)測方法 [J].空間控制技術(shù)與應(yīng)用,2022,48(6):32-39.
[32] 王佳皓,張?zhí)A.基于數(shù)字孿生自動色環(huán)機(jī)的設(shè)計知識圖譜研究 [J].組合機(jī)床與自動化加工技術(shù),2022(4):15-19.
[33] 宋鄧強(qiáng),周彬,申興旺,等.面向船舶分段制造過程的動態(tài)知識圖譜建模方法 [J].上海交通大學(xué)學(xué)報,2021,55(5):544-556.
[34] 楊愷霖.制造數(shù)據(jù)與工藝知識庫構(gòu)建及應(yīng)用技術(shù)研究 [D].西安:西安電子科技大學(xué),2022.
[35] 曾左英.基于數(shù)據(jù)與知識雙向驅(qū)動的非智能物聯(lián)設(shè)備發(fā)現(xiàn)方法研究 [D].昆明:云南大學(xué),2022.
[36] 路松峰,李祎明,屠向陽,等.基于知識圖譜的數(shù)控裝備信息模型建模方法 [J].華中科技大學(xué)學(xué)報:自然科學(xué)版,2022,50(6):39-47.
[37] 李寶清,王運(yùn)平,曹立林,等.模具設(shè)計知識表示方法 [J].鍛壓技術(shù),2023,48(6):176-184.
[38] 崔碩,張春燕,賈家樂,等.基于深度學(xué)習(xí)的機(jī)械領(lǐng)域知識圖譜構(gòu)建及應(yīng)用 [J].制造技術(shù)與機(jī)床,2023(2):83-89.
[39] 徐進(jìn).面向工業(yè)裝配的知識圖譜構(gòu)建與應(yīng)用研究 [J].計算機(jī)科學(xué),2021,48(S1):285-288.
[40] 張思超,孔紹然,孔憲光,等.基于知識圖譜的典型零件加工工藝知識構(gòu)建方法 [J].自動化應(yīng)用,2023,64(1):53-57.
[41] 鐘紅燕.基于知識圖譜的多目標(biāo)多約束柔性作業(yè)車間調(diào)度問題的研究[D].西安:西安理工大學(xué),2022.
[42] 郭興勇,盛國紅,舒鑾理,等.基于知識圖譜的飛機(jī)制造工藝路線推薦方法研究 [J].設(shè)備管理與維修,2022(7):41-44.
[43] 武群惠,田廣.面向航天制造企業(yè)的供應(yīng)鏈知識圖譜研究與智能輔助分析示范建設(shè) [J].軍民兩用技術(shù)與產(chǎn)品,2021(9):50-55.
[44] 李昊.多品種小批量混流裝配線自適應(yīng)排產(chǎn)方法研究 [D].太原:中北大學(xué),2021.
[45] 謝生同.基于知識圖譜的機(jī)加工藝參數(shù)推薦方法研究 [D].西安:西安電子科技大學(xué),2022.
[46] 孟令達(dá).A公司光纖傳感產(chǎn)品生產(chǎn)環(huán)節(jié)的風(fēng)險知識圖譜構(gòu)建研究 [D].北京:北京交通大學(xué),2021.
[47] 蔣軍威.基于知識圖譜的核電裝備零件制造質(zhì)量形成及關(guān)鍵工序評價 [D].重慶:重慶大學(xué),2022.
[48] 王贊贊.基于深度學(xué)習(xí)與知識圖譜的變速箱裝配過程質(zhì)量控制方法與應(yīng)用研究 [D].合肥:合肥工業(yè)大學(xué),2022.
[49] 劉勁松.高檔數(shù)控機(jī)床數(shù)字孿生關(guān)鍵技術(shù)研究與應(yīng)用 [D].中國科學(xué)院大學(xué)(中國科學(xué)院沈陽計算技術(shù)研究所),2023.
[50] 胡晨陽.面向數(shù)控機(jī)床故障診斷領(lǐng)域的知識圖譜構(gòu)建與應(yīng)用 [D].武漢:華中科技大學(xué),2022.
[51] 周佳樂.工業(yè)機(jī)器人故障診斷知識圖譜構(gòu)建方法研究 [D].廣州:廣東工業(yè)大學(xué),2023.
作者簡介:吳潔(1998—),女,漢族,河北邢臺人,碩士研究生在讀,主要研究方向:智能制造、數(shù)據(jù)分析。
收稿日期:2023-08-17
Construction and Application of Knowledge Graph in the Manufacturing Field
WU Jie
(School of Economics and Management, Hebei University of Science and Technology, Shijiazhuang 050018, China)
Abstract: With the development of the manufacturing industry towards digitalization, networking and intelligence, a large amount of product design, manufacturing and maintenance service data in enterprises is constantly stacked and accumulated. The introduction of Knowledge Graph technology to manage and mine the data can provide strong support for the realization of the new-generation intelligent manufacturing. Firstly, this paper reviews the construction and core technologies of knowledge graph in manufacturing field including knowledge extraction, knowledge fusion, knowledge reasoning, and so on. Then, the application of Knowledge Graph in the field of manufacturing is divided into two categories: semantic association and decision aid, and its specific application scenarios are explored. It is hoped that it can provide reference for the construction and application of Knowledge Graph for relevant enterprises.
Keywords: intelligent manufacturing; Knowledge Graph; knowledge extraction; knowledge fusion; knowledge reasoning