亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        智能制造型企業(yè)知識圖譜的構(gòu)建

        2022-04-09 02:17:28韓少恒楊家榮
        上海電氣技術(shù) 2022年1期
        關(guān)鍵詞:文本方法

        韓少恒 楊家榮

        上海電氣集團(tuán)股份有限公司 中央研究院 上海 200070

        1 知識圖譜概述

        近年來,知識圖譜的開發(fā)與研究引起了人們的關(guān)注[1]。知識圖譜最早于2012年由美國谷歌等多家公司研制發(fā)布,其初始目的主要是進(jìn)一步完善、優(yōu)化、提高企業(yè)用戶的知識搜索效率,增強(qiáng)企業(yè)用戶對知識搜索的使用體驗(yàn)[2]。目前,知識圖譜沒有統(tǒng)一的定義,可接受的定義為:一個(gè)知識圖譜是一種能夠用來準(zhǔn)確描繪各個(gè)知識實(shí)體之間相互關(guān)系的一種語義信息網(wǎng)絡(luò)[3],是知識處理技術(shù)和信息工程學(xué)研究中的一種主要理論特征和基本表現(xiàn)形式。知識圖譜的一種更為寬泛的定義是:知識圖譜使用圖作為媒介來組織與利用大規(guī)模不同類型的數(shù)據(jù),并表達(dá)明確的通用或領(lǐng)域知識,同時(shí)又不同于二十世紀(jì)五六十年代產(chǎn)生的語義網(wǎng)絡(luò)。知識圖譜之所以成為新興技術(shù),關(guān)鍵是知識規(guī)模的大小。

        知識圖譜最常見的表示形式是三元組,即“實(shí)體×關(guān)系×另一實(shí)體”或“實(shí)體×屬性×屬性值”。知識圖譜三元組示例如圖1所示,圓圈代表實(shí)體或者概念,圓圈間的連線代表實(shí)體或概念之間的各種語義關(guān)系[4]。人類知識圖譜中富含知識實(shí)體、知識概念、知識屬性,以及三者之間的相互關(guān)系等多種信息,在此基礎(chǔ)上,知識圖譜對整個(gè)現(xiàn)實(shí)知識世界的詮釋變得可能。

        圖1 知識圖譜三元組示例

        在傳統(tǒng)制造型企業(yè)中,經(jīng)驗(yàn)和知識的傳承方式主要以師傅帶徒弟為主。隨著我國人口紅利逐漸消失,加之人們對工作選擇的多樣性,制造型企業(yè)或多或少面臨用工荒。企業(yè)中老師傅逐漸退休,豐富的知識和經(jīng)驗(yàn)也將逐漸流失。為了使積累的知識財(cái)富得到傳承,有效解決知識在線、知識互聯(lián)、知識沉淀,提升獲取行業(yè)專家工作和知識的效率,建立一套知識圖譜,成為了很好的解決方法。筆者從知識建模、知識抽取、知識推理、知識存儲(chǔ)、知識應(yīng)用五個(gè)方面介紹知識圖譜的構(gòu)建過程。

        2 知識建模

        知識建模的核心是明確實(shí)體概念中的屬性、約束條件,以及概念之間的層次關(guān)系。建模方法是從實(shí)際角度出發(fā),構(gòu)建多層級的知識體系,對抽象的知識、屬性、關(guān)聯(lián)關(guān)系等信息進(jìn)行定義、組織、管理,將它們轉(zhuǎn)化為現(xiàn)實(shí)數(shù)據(jù),最終形成數(shù)據(jù)庫。如在某工程機(jī)械故障診斷項(xiàng)目中,定義零部件、故障現(xiàn)象、故障原因等實(shí)體,以及這些實(shí)體之間的關(guān)聯(lián)關(guān)系。

        3 知識抽取

        知識抽取的主要工作之一是獲取面向社會(huì)開放的大量知識數(shù)據(jù),通過應(yīng)用各種自動(dòng)化分析方法和計(jì)算技術(shù),從中自動(dòng)抽取可用的各種知識單元。知識單元主要由信息實(shí)體、數(shù)據(jù)關(guān)系、知識屬性三個(gè)基本知識結(jié)構(gòu)要素組成,并以這些基本知識結(jié)構(gòu)要素為主要基礎(chǔ),形成一系列具有高標(biāo)準(zhǔn)質(zhì)量的知識事實(shí)關(guān)系表述,為上層知識模型和下層知識構(gòu)造的設(shè)計(jì)奠定理論基礎(chǔ)。

        從不同數(shù)據(jù)來源、不同數(shù)據(jù)結(jié)構(gòu)的數(shù)據(jù)中抽取所需要的信息實(shí)體和數(shù)據(jù)關(guān)系,實(shí)現(xiàn)的方法主要包括三種,分別為基于規(guī)則與詞典的實(shí)體抽取方法、基于機(jī)器學(xué)習(xí)的實(shí)體抽取方法、基于面向數(shù)據(jù)開放域的實(shí)體抽取方法[5]。

        3.1 基于規(guī)則與詞典的實(shí)體抽取方法

        根據(jù)編寫好的文本語義劃分規(guī)則和實(shí)體詞典,提取實(shí)體和屬性,主要用于文本領(lǐng)域的實(shí)體提取,如通過特殊符號識別對文本進(jìn)行拆分,通過詞典匹配提取出文本中的實(shí)體名稱、地址、描述等信息。這一方法需要大量專業(yè)人員提前編寫文本規(guī)則和實(shí)體詞典,應(yīng)用的范圍有限,不適用于多元場景的數(shù)據(jù)轉(zhuǎn)換。

        3.2 基于機(jī)器學(xué)習(xí)的實(shí)體抽取方法

        以使用自然語言處理模型為基礎(chǔ),通過對一定規(guī)模已標(biāo)注好實(shí)體和實(shí)體之間關(guān)系的語料數(shù)據(jù)進(jìn)行訓(xùn)練?;谟?xùn)練好的模型,完成相應(yīng)實(shí)體和實(shí)體關(guān)系的提取。這一方法發(fā)展比較成熟,大多是對經(jīng)典算法的改進(jìn),并且提升空間有限,面對開放領(lǐng)域的適應(yīng)性較弱。

        3.3 基于面向數(shù)據(jù)開放域的實(shí)體抽取方法

        這是目前常用的實(shí)體抽取方法,根據(jù)實(shí)體類別是否有提前定義分為限定域?qū)嶓w抽取和開放域?qū)嶓w抽取。在限定域?qū)嶓w抽取中,系統(tǒng)所抽取的實(shí)體類別是提前定義好的,如名稱、職業(yè)、所在公司等幾種實(shí)體類別,抽取的實(shí)體類別較為局限。開放域?qū)嶓w抽取由于沒有提前定義,抽取實(shí)體更自由,主要使用無監(jiān)督的方法抽取實(shí)體,如模式匹配和文本分析等,通常以文本中的某個(gè)詞語來代表實(shí)體類型[6]。這種方法抽取更加自由,可以發(fā)現(xiàn)更多新的實(shí)體。但是,由于自然語言的復(fù)雜性和實(shí)體的多樣性,使用模式匹配和文本分析的方法準(zhǔn)確率較低。針對這一問題,采用有監(jiān)督學(xué)習(xí)的算法進(jìn)行實(shí)體抽取,能夠更有效地提高開放域?qū)嶓w抽取的準(zhǔn)確率。

        4 知識推理

        知識推理的重點(diǎn)為在已有的知識庫基礎(chǔ)上,進(jìn)一步發(fā)現(xiàn)和挖掘其中所隱含的知識,從而豐富、拓寬、完善知識庫[7]。在推理的整個(gè)過程中,往往需要相應(yīng)的關(guān)聯(lián)規(guī)則來支撐。由于實(shí)體、實(shí)體的屬性和相互關(guān)系的多元化,很難窮舉任何一個(gè)推理規(guī)律,一些比較復(fù)雜的推理規(guī)律往往都是手動(dòng)總結(jié)出來的。推理法則的研究和發(fā)展,仍然取決于實(shí)體和關(guān)系之間的資源豐富程度。

        知識推理的研究對象大致可以分為實(shí)體、實(shí)體屬性、實(shí)體之間的關(guān)系、本體庫中各個(gè)概念的層次結(jié)構(gòu)等[8]。知識推理可以劃分為基于業(yè)務(wù)推理準(zhǔn)則的知識推理和基于機(jī)器學(xué)習(xí)的知識推理。前者根據(jù)用戶所描述的問題表現(xiàn)形式推斷出背后的原因,后者主要適用于規(guī)則無法解決的推理問題。知識推理主要通過歸納推理、概率圖、神經(jīng)網(wǎng)絡(luò)等技術(shù)手段來實(shí)現(xiàn)。

        5 知識存儲(chǔ)

        知識存儲(chǔ)的主要目的是完成各種知識的存儲(chǔ),便于支持對大規(guī)模數(shù)據(jù)進(jìn)行有效管理和統(tǒng)計(jì)。存儲(chǔ)的對象主要是基本屬性知識、相互關(guān)聯(lián)知識、事件知識、時(shí)間順序知識、資源型知識。存儲(chǔ)模式的好壞直接影響知識圖譜中知識查詢、知識計(jì)算、知識更新的準(zhǔn)確性。

        根據(jù)存儲(chǔ)結(jié)構(gòu),知識存儲(chǔ)分為基于表結(jié)構(gòu)的存儲(chǔ)和基于圖結(jié)構(gòu)的存儲(chǔ),如圖2所示。

        基于表結(jié)構(gòu)的存儲(chǔ)指利用二維數(shù)據(jù)表對知識圖譜中的數(shù)據(jù)進(jìn)行存儲(chǔ)。根據(jù)不同的設(shè)計(jì)原則,可以具有不同的表結(jié)構(gòu),如三元組表、類型表、關(guān)系表?;诒斫Y(jié)構(gòu)的存儲(chǔ)結(jié)構(gòu)簡單,存在一定的數(shù)據(jù)冗余,查詢效率比較低。

        圖2 知識存儲(chǔ)分類

        基于圖結(jié)構(gòu)的存儲(chǔ)指利用圖的方式對知識圖譜中的數(shù)據(jù)進(jìn)行存儲(chǔ),主要形式有三種,分別為資源描述框架、屬性圖和三元組超圖?;趫D結(jié)構(gòu)的存儲(chǔ)以圖的方式來保存數(shù)據(jù),優(yōu)點(diǎn)在于查詢和搜索的速度比較快,并且實(shí)體節(jié)點(diǎn)可以保留屬性,進(jìn)而能夠保留更多的信息。

        6 知識應(yīng)用

        在工業(yè)領(lǐng)域,基于知識圖譜的故障維修應(yīng)用系統(tǒng)在語義檢索、問題歸類、預(yù)測等多個(gè)方面已經(jīng)有應(yīng)用?;诠收暇S修的知識圖譜歸納、總結(jié)了案例中存在的問題、維修經(jīng)驗(yàn),可以實(shí)現(xiàn)故障模式的挖掘與識別,為已經(jīng)開發(fā)和構(gòu)建的知識圖譜提供圖譜檢索、知識計(jì)算、圖譜可視化等分析與應(yīng)用能力[9],并且為已經(jīng)構(gòu)建的各類知識圖譜計(jì)算提供接口,包含知識圖譜基礎(chǔ)應(yīng)用類、圖結(jié)構(gòu)分析類、圖譜語義應(yīng)用類、自然語言處理類、圖數(shù)據(jù)獲取類、數(shù)據(jù)集統(tǒng)計(jì)類等。

        7 結(jié)束語

        工業(yè)知識圖譜總體目標(biāo)是將知識從散亂的紙質(zhì)文檔和電子文檔中抽取出來,用圖形化方式存儲(chǔ)下來,并提供可視化應(yīng)用來調(diào)取和使用。工業(yè)生產(chǎn)過程和工業(yè)運(yùn)維環(huán)節(jié)的數(shù)據(jù)量、知識量都很龐大,需要知識圖譜去梳理,并且這兩個(gè)環(huán)節(jié)可以產(chǎn)生價(jià)值,因此,生產(chǎn)過程和工業(yè)運(yùn)維場景是知識圖譜值得應(yīng)用的場合。比較常見的知識圖譜應(yīng)用場景包括設(shè)備和儀器儀表的故障診斷及處理、生產(chǎn)工藝問題診斷及處理。

        在場景選擇方面,可以選擇工業(yè)知識圖譜比較常見的場景,如焊接質(zhì)量診斷處理問答系統(tǒng)、設(shè)備智能檢修小助手,應(yīng)用時(shí)可以通過網(wǎng)頁或手機(jī)應(yīng)用的方式訪問。在技術(shù)準(zhǔn)備時(shí),需要能夠構(gòu)建工業(yè)領(lǐng)域知識圖譜的技術(shù)人才,并且需要有行業(yè)經(jīng)驗(yàn)知識的專家。構(gòu)建行業(yè)知識圖譜時(shí),最重要的是積累行業(yè)語料知識,也就是數(shù)據(jù)。要實(shí)現(xiàn)知識圖譜并達(dá)到令人滿意的準(zhǔn)確率,需要一定數(shù)量的帶標(biāo)簽數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),例如設(shè)備運(yùn)維工件單、設(shè)備狀態(tài)維護(hù)記錄等。

        綜合而言,工業(yè)領(lǐng)域知識圖譜的作用是建立知識管理、儲(chǔ)備、應(yīng)用的平臺(tái),使企業(yè)積累的知識實(shí)現(xiàn)系統(tǒng)化管理和保存,將復(fù)雜知識的應(yīng)用變得簡單,使新上手的專業(yè)人員快速獲得需要掌握的知識。

        猜你喜歡
        文本方法
        初中群文閱讀的文本選擇及組織
        甘肅教育(2020年8期)2020-06-11 06:10:02
        在808DA上文本顯示的改善
        學(xué)習(xí)方法
        基于doc2vec和TF-IDF的相似文本識別
        電子制作(2018年18期)2018-11-14 01:48:06
        可能是方法不對
        用對方法才能瘦
        Coco薇(2016年2期)2016-03-22 02:42:52
        文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學(xué)隱喻
        論《柳毅傳》對前代文本的繼承與轉(zhuǎn)化
        人間(2015年20期)2016-01-04 12:47:10
        四大方法 教你不再“坐以待病”!
        Coco薇(2015年1期)2015-08-13 02:47:34
        賺錢方法
        国产亚洲精品福利在线| 国产精品久久久久久久妇| 中文字幕日韩一区二区三区不卡| 国产无套视频在线观看香蕉| 亚洲天堂色婷婷一区二区| 日韩精品一区二区三区在线视频| 国产网红主播无码精品| 国模私拍福利一区二区| 国产精品一级av一区二区| 91九色最新国产在线观看| 亚洲av片在线观看| 亚洲美腿丝袜综合一区| 女同性恋亚洲一区二区| 女人天堂av人禽交在线观看| 日日碰狠狠添天天爽| 91精彩视频在线观看| 中文字幕精品乱码一二三区| 国产亚洲成人av一区| 天天躁狠狠躁狠狠躁夜夜躁| 人妻少妇无码中文幕久久| 在线观看亚洲视频一区二区| 国产精品videossex久久发布| 中日av乱码一区二区三区乱码| 中文亚洲成a人片在线观看| 亚洲国产精品国自拍av| 97久久超碰国产精品旧版| 亚洲一区二区在线| 亚洲中文字幕亚洲中文| 岳丰满多毛的大隂户| 比比资源先锋影音网| 色琪琪一区二区三区亚洲区 | 午夜亚洲国产精品福利| av在线天堂国产一区| 免费无码中文字幕a级毛片| 国产污污视频| av大片网站在线观看| 国产精品天干天干综合网| 中文无码精品一区二区三区| 国产特黄1区2区3区4区| 日本三级香港三级人妇99| 欧美人与动人物牲交免费观看|