亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        卷包設(shè)備故障檢修業(yè)務(wù)知識圖譜的構(gòu)建

        2023-10-26 11:35:52偉,張玉,胡
        設(shè)備管理與維修 2023年17期
        關(guān)鍵詞:數(shù)據(jù)資料本體圖譜

        韋 偉,張 玉,胡 亮

        (安徽工業(yè)大學(xué)管理科學(xué)與工程學(xué)院,安徽馬鞍山 210012)

        0 引言

        卷包設(shè)備具有高精密、高自動化、資產(chǎn)價值高等特點,是卷煙生產(chǎn)企業(yè)的核心生產(chǎn)設(shè)備。設(shè)備故障檢修時,檢修人員通常需要查詢設(shè)備故障維修手冊、故障案例庫等檢修業(yè)務(wù)資料。然而這些設(shè)備故障數(shù)據(jù)資料大部分存儲在各信息系統(tǒng)、系統(tǒng)日志、紙質(zhì)文件及設(shè)備維修專家的頭腦中,存在查詢不便、查詢準(zhǔn)確率不高、檢修工作效率較低、數(shù)據(jù)知識價值不能得到有效利用等問題。知識圖譜作為對知識進行有效管理的一個重要工具,它可以將多源異構(gòu)的故障數(shù)據(jù)相互聯(lián)系,以圖的形式存儲,大大方便卷包設(shè)備故障數(shù)據(jù)資料的檢索復(fù)用,同時也使故障數(shù)據(jù)知識價值得到充分利用。

        1 知識圖譜相關(guān)介紹

        知識圖譜最早由谷歌公司提出,旨在提升搜索引擎性能,使搜索結(jié)果以精準(zhǔn)的方式反饋給用戶,然而知識圖譜目前還沒有統(tǒng)一的官方定義,劉嶠等人[1]將知識圖譜定義為:以符號形式對現(xiàn)實世界中概念與關(guān)系進行結(jié)構(gòu)化展示的語義知識庫。知識圖譜在數(shù)據(jù)結(jié)構(gòu)上表現(xiàn)為,“節(jié)點和邊”聯(lián)系在一起的有向圖結(jié)構(gòu),通過把所有不同類的實體和關(guān)系以,諸多類似上述形式的三元組通過實體(節(jié)點)關(guān)系(邊)相互鏈接,從而構(gòu)成較為復(fù)雜的、像網(wǎng)一樣的網(wǎng)狀知識結(jié)構(gòu)即知識圖譜。

        依據(jù)應(yīng)用領(lǐng)域與應(yīng)用場景的不同,知識圖譜可以分為通用知識圖譜和領(lǐng)域知識圖譜。知識圖譜搭建方式分為自頂向下、從下向上、上下相結(jié)合3 種,而領(lǐng)域知識圖譜常用自頂向下的構(gòu)建方式,首先定義故障知識圖譜本體,其次基于本體相關(guān)概念關(guān)系的定義對故障數(shù)據(jù)資料進行知識抽取,獲取故障數(shù)據(jù)實例,最后將基于本體概念獲取的數(shù)據(jù)實例經(jīng)知識消歧、知識分類、知識融合、知識存儲導(dǎo)入圖數(shù)據(jù)庫。

        在知識圖譜構(gòu)建過程中,知識抽取獲取數(shù)據(jù)實例的質(zhì)量對后續(xù)故障知識圖譜的應(yīng)用尤為重要,為知識圖譜構(gòu)建過程中的研究重點。

        2 卷包設(shè)備故障知識圖譜的構(gòu)建

        2.1 故障數(shù)據(jù)預(yù)處理

        收集與整理卷包機組設(shè)備在檢修業(yè)務(wù)中涉及的相關(guān)數(shù)據(jù)資料,如設(shè)備維修技術(shù)手冊、設(shè)備故障檢修報告、設(shè)備故障檢修分析數(shù)據(jù)、安裝或拆除的部件信息等數(shù)據(jù)資料作為故障知識圖譜的數(shù)據(jù)源。這些數(shù)據(jù)資料大多為以自然語言記錄設(shè)備故障相關(guān)知識,以PDF、Word 形式存儲的非結(jié)構(gòu)化數(shù)據(jù),故該類數(shù)據(jù)的知識抽取較為負復(fù)雜,需要對數(shù)據(jù)資料進行預(yù)處理,首先需要讀取故障數(shù)據(jù)資料內(nèi)容,其次通過正則表達式、自定義規(guī)則將數(shù)據(jù)整理轉(zhuǎn)化為規(guī)則完整的數(shù)據(jù),最后將處理后的數(shù)據(jù)存儲為txt 格式。

        2.2 故障知識圖譜本體構(gòu)建

        基于檢修業(yè)務(wù)相關(guān)故障知識范圍以及檢修業(yè)務(wù)中需要重用的知識信息,定義檢修業(yè)務(wù)中知識本體相關(guān)概念與關(guān)系。首先,定義需要重用的故障知識本體概念?;诒倔w構(gòu)建不交類和避免類循環(huán)的原則,定義概念如設(shè)備(EQUIPMENT)、設(shè)備機型(EQUIPTYPE)、故障(FAULT)、檢修物料(EQUIPBOM)、故障現(xiàn)象(EQUIPFAULTPHEN)、故障原因(EQUIPDAULTCAUSE)、故障措施(EQUIPFAULTMEASURE)、處理效果(EQUIPFAULTEFFECT)、人員(PERSON)等共9 類。

        其次,定義本體概念間的關(guān)系,如屬于、就職于、組成、包含、并發(fā)、引發(fā)、影響部位、影響物料、原因、措施、現(xiàn)象、產(chǎn)生、預(yù)防建議、修復(fù)效果、最終結(jié)果等共15 種。

        2.3 訓(xùn)練卷包設(shè)備故障知識抽取模型

        故障數(shù)據(jù)知識抽取需要借助自然語言處理(NLP)相關(guān)方法,BERT+BILSTM+CRF 聯(lián)合模型為當(dāng)前NLP 知識抽取中使用較多、知識抽取準(zhǔn)確率較高的模型[2]。模型訓(xùn)練的數(shù)據(jù)集來源于故障數(shù)據(jù)預(yù)處理后的.txt 數(shù)據(jù)資料,從中選取1000 項故障頻次較高、對檢修業(yè)務(wù)影響較大的數(shù)據(jù),并對.txt 數(shù)據(jù)資料中的每行字?jǐn)?shù)進行限定,避免模型訓(xùn)練過程中因過擬合而影響訓(xùn)練結(jié)果。對處理后的模型數(shù)據(jù)集借助“標(biāo)注精靈”,按照B-I-O 方法標(biāo)注本體中定義的9 類概念、19 種概念標(biāo)簽(表1)。

        表1 數(shù)據(jù)標(biāo)注的標(biāo)簽

        將標(biāo)注的數(shù)據(jù)集按7:3 分為訓(xùn)練集和測試集,模型訓(xùn)練環(huán)境Python 為3.6,Tensorflow 為1.5.0。模型參數(shù)設(shè)置如表2 所示。BERT-BILSTM-CRF 模型訓(xùn)練效果的判別借助混淆矩陣(Confusion Matrix)分別計算出模型的Accuracy(準(zhǔn)確率)、P(精確率)、R(召回率)和F1 值。模型訓(xùn)練(train)數(shù)據(jù)集和測試(test)數(shù)據(jù)集的最優(yōu)訓(xùn)練結(jié)果如表3 所示。

        表2 知識抽取模型參數(shù)設(shè)置

        表3 知識抽取模型訓(xùn)練結(jié)果

        模型經(jīng)訓(xùn)練后,訓(xùn)練集準(zhǔn)確率達98.75,F(xiàn)1 值為91.32,測試集的準(zhǔn)確率達98.59,F(xiàn)1 值為90.75。對該模型的識別效果通過自然語句進一步驗證,可以準(zhǔn)確識別出語句中相關(guān)知識標(biāo)簽(圖1)。

        圖1 知識抽取模型效果驗證

        2.4 卷包設(shè)備故障知識抽取與融合

        (1)故障知識抽取。借助BERT-BILSTM-CRF 模型結(jié)合定義的知識抽取規(guī)則,從文本數(shù)據(jù)資料中抽取故障知識。

        (2)故障知識消歧。因不同數(shù)據(jù)源獲取的故障知識,可能會存在知識表達方式不同但表示同一類知識,故需要對此類數(shù)據(jù)進行知識消岐、刪除重復(fù)信息以避免故障知識重復(fù)。

        (3)故障知識分類。將經(jīng)過消歧的故障知識,按照標(biāo)簽自動劃分?jǐn)?shù)據(jù)類別。

        (4)故障知識融合。主要解決數(shù)據(jù)沖突問題,如一個短語對應(yīng)多個實體的情況。

        2.5 故障知識存儲

        本文故障知識存儲選擇Neo4j圖數(shù)據(jù)庫[3],因該數(shù)據(jù)庫以圖的形式存儲和管理知識,在檢索數(shù)據(jù)庫中知識時,只遍歷與檢索知識相關(guān)的節(jié)點,不受總數(shù)據(jù)集大小影響,知識檢索效率較高,且數(shù)據(jù)庫中主要以節(jié)點和邊將知識聯(lián)系組織在一起便于對獲取的知識直觀展示。將獲取的卷包機組設(shè)備故障知識存儲為csv 格式,再以系統(tǒng)中的load 批量導(dǎo)入方式將故障知識導(dǎo)入Neo4j 圖數(shù)據(jù)庫,再借助match 查詢語句獲取知識圖譜相關(guān)故障知識。

        以查詢故障知識圖譜中的“煙支破損”為例,match 查詢后獲取到故障知識圖譜中有關(guān)煙支破損相關(guān)知識將以節(jié)點和邊的形式直觀展示(圖2)。

        圖2 故障知識圖譜檢索結(jié)果示例

        3 結(jié)論

        通過構(gòu)建卷包設(shè)備故障知識圖譜,一方面可以使卷煙企業(yè)存儲多年的多源異構(gòu)的設(shè)備故障數(shù)據(jù)資料發(fā)揮信息價值,另一方面還可以輔助設(shè)備故障檢修人員的檢修工作,提高檢修工作效率。此外,還可以通過Neo4j 的cypher 相關(guān)語句對故障知識進行增、刪、改、查等,使故障知識圖譜持續(xù)更新與完善。

        猜你喜歡
        數(shù)據(jù)資料本體圖譜
        Abstracts and Key Words
        做好普查數(shù)據(jù)資料開發(fā)利用的思考與建議——以“七人普”數(shù)據(jù)資料開發(fā)為例
        繪一張成長圖譜
        對姜夔自度曲音樂本體的現(xiàn)代解讀
        數(shù)字化測量技術(shù)在礦山測量中的應(yīng)用研究
        智富時代(2018年9期)2018-10-19 18:51:44
        補腎強身片UPLC指紋圖譜
        中成藥(2017年3期)2017-05-17 06:09:01
        “羌年”的文化數(shù)據(jù)與命名原則
        戲劇之家(2016年15期)2016-08-15 20:33:56
        主動對接你思維的知識圖譜
        《我應(yīng)該感到自豪才對》的本體性教學(xué)內(nèi)容及啟示
        Care about the virtue moral education
        卷宗(2013年6期)2013-10-21 21:07:52
        亚洲另类激情综合偷自拍图| 亚洲天堂精品一区入口 | 91九色最新国产在线观看| 视频一区视频二区亚洲免费观看| 亚洲中文字幕成人无码| 人妻制服丝袜中文字幕| 日本不卡的一区二区三区| 亚洲欧美一区二区三区国产精| 国产精品人妻一码二码尿失禁| 国产高清在线观看av片 | 久久综网色亚洲美女亚洲av| 91国内偷拍一区二区三区| 亚洲国产成人精品激情资源9| 狠狠躁夜夜躁人人爽天天天天97| 老师露出两个奶球让我吃奶头| 国产av剧情刺激对白| 亚洲五码av在线观看| 丝袜人妻无码中文字幕综合网| 国产最新进精品视频| 成人试看120秒体验区| 午夜国产精品视频在线观看| 91情侣在线精品国产免费| 国产精品一区二区久久| 麻豆久久久9性大片| 亚洲综合偷自成人网第页色| 国产AV秘 无码一区二区三区 | 亚洲国产性夜夜综合另类| 偷窥偷拍一区二区三区| 国产97色在线 | 免| 水蜜桃精品一二三| 日韩女优av一区二区| 一卡二卡国产av熟女| 中文字幕日本韩国精品免费观看| 91久久国产情侣真实对白| 藏春阁福利视频| 午夜性无码专区| 亚洲精品v欧洲精品v日韩精品| 插鸡网站在线播放免费观看| 亚洲一区二区三区码精品色| 国产日韩午夜视频在线观看 | 百合av一区二区三区|