亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于知識圖譜的標(biāo)準(zhǔn)知識管理研究

        2024-01-12 14:28:45楊德相李劍鋒
        標(biāo)準(zhǔn)科學(xué) 2023年4期
        關(guān)鍵詞:知識管理知識圖譜標(biāo)準(zhǔn)

        楊德相 李劍鋒

        摘 要:行業(yè)標(biāo)準(zhǔn)化體系構(gòu)建過程中,隨著標(biāo)準(zhǔn)的種類與數(shù)量不斷更新,人工加載以及查詢的方式已經(jīng)難以滿足標(biāo)準(zhǔn)查新跟進(jìn),知識服務(wù)手段較為單一。知識圖譜技術(shù)為整合標(biāo)準(zhǔn)知識提供了一種全新的知識互聯(lián)思路,為完善標(biāo)準(zhǔn)化建設(shè)路徑、標(biāo)準(zhǔn)文件結(jié)構(gòu)化查詢提供了全新的方向。本文分析了標(biāo)準(zhǔn)體系構(gòu)建現(xiàn)存的問題,以食品安全國家標(biāo)準(zhǔn)為例搭建了以食品產(chǎn)品標(biāo)準(zhǔn)為中心的標(biāo)準(zhǔn)引用知識圖譜,基于該圖譜展示了其可視化檢索、標(biāo)準(zhǔn)重要性等應(yīng)用,進(jìn)一步分析知識圖譜這一知識管理形式在標(biāo)準(zhǔn)體系建設(shè)上的優(yōu)勢,促進(jìn)標(biāo)準(zhǔn)知識智能服務(wù)與發(fā)展。標(biāo)準(zhǔn)領(lǐng)域知識圖譜強(qiáng)調(diào)對標(biāo)準(zhǔn)知識管理,有效集成各類標(biāo)準(zhǔn)文本知識、梳理標(biāo)準(zhǔn)信息,同時結(jié)構(gòu)化知識有益于精確標(biāo)準(zhǔn)查詢和關(guān)聯(lián)標(biāo)準(zhǔn)挖掘從而助力推動標(biāo)準(zhǔn)的數(shù)字化發(fā)展。

        關(guān)鍵詞:標(biāo)準(zhǔn),知識圖譜,知識管理

        DOI編碼:10.3969/j.issn.1674-5698.2023.04.005

        1 引 言

        標(biāo)準(zhǔn)是在一定范圍內(nèi)獲得最佳秩序,對活動或其結(jié)果規(guī)定共同的和重復(fù)使用的規(guī)則、導(dǎo)則或特性的文件。起到規(guī)范和約束行為的功能,在推動行業(yè)和社會穩(wěn)定發(fā)展向前方面有著不可或缺的作用。隨著信息技術(shù)、人工智能以及大數(shù)據(jù)技術(shù)的持續(xù)發(fā)展和不斷變革,新興技術(shù)賦能更豐富的新應(yīng)用使數(shù)據(jù)呈現(xiàn)規(guī)模式增長[1]。新興行業(yè)、新興技術(shù)需要新標(biāo)準(zhǔn)規(guī)范約束,原標(biāo)準(zhǔn)也需要順應(yīng)發(fā)展技術(shù)等因素不斷更新完善,因而標(biāo)準(zhǔn)智能化知識管理更加需要與時俱進(jìn)跟上行業(yè)飛速發(fā)展的步伐。知識圖譜提供了一種全新的知識互聯(lián)思路,為整合標(biāo)準(zhǔn)體系與完善標(biāo)準(zhǔn)化建設(shè)提供實現(xiàn)標(biāo)準(zhǔn)聯(lián)結(jié)、梳理標(biāo)準(zhǔn)框架和標(biāo)準(zhǔn)動態(tài)更新的新方向。

        知識圖譜本質(zhì)上是一種語義網(wǎng)絡(luò)知識庫,旨在描述客觀世界的概念、實體、事件及其間的關(guān)系,提供了一種讓用戶快速獲取相關(guān)知識及其邏輯關(guān)系的渠道。其核心要義是以圖形方式向用戶返回經(jīng)過加工和推理的知識,揭示實體之間關(guān)系的語義網(wǎng)絡(luò)[2]。知識圖譜分為未聚焦于特定領(lǐng)域的開放知識圖譜和聚焦特定領(lǐng)域的垂直領(lǐng)域知識圖譜,前者追求知識廣泛度,深度較淺,后者則主要面向?qū)I(yè)領(lǐng)域,追求知識深度與準(zhǔn)確度。在垂直領(lǐng)域知識圖譜的研究中,知識圖譜通過表示領(lǐng)域內(nèi)部的知識聯(lián)系用以輔助復(fù)雜的分析,在生物醫(yī)學(xué)領(lǐng)域的智能問診[3 - 4]與金融領(lǐng)域的風(fēng)險評估[5]、防欺詐[6]以及電商領(lǐng)域[7 ]等有較多的研究發(fā)展。在數(shù)據(jù)時代,知識圖譜通過對數(shù)據(jù)的整合與規(guī)范,向人們提供有價值的結(jié)構(gòu)化信息,已被廣泛應(yīng)用于信息搜索、自動問答、決策分析等領(lǐng)域,是推動數(shù)據(jù)價值挖掘和支撐智能信息服務(wù)的重要基礎(chǔ)技術(shù)[8]。

        隨著社會、行業(yè)的進(jìn)步與發(fā)展,標(biāo)準(zhǔn)體系在不斷壯大,各種數(shù)字共享標(biāo)準(zhǔn)平臺層出不窮,但是檢索方式本質(zhì)上仍是單條目人工檢索,最終呈現(xiàn)的是單一的標(biāo)準(zhǔn),缺少標(biāo)準(zhǔn)之間的關(guān)聯(lián)和分析。使用知識圖譜技術(shù)管理標(biāo)準(zhǔn)知識,一方面可以整合標(biāo)準(zhǔn)知識,對于指定的信息給予精確查詢和關(guān)聯(lián)標(biāo)準(zhǔn)的鏈接呈現(xiàn),提高檢索的準(zhǔn)確性和效率,另一方面知識圖譜將文檔層次的粗粒度知識拆分為細(xì)粒度的切片化知識,更有益于針對行業(yè)標(biāo)準(zhǔn)體系的構(gòu)建與完善。以標(biāo)準(zhǔn)知識圖譜作為知識庫為智能查詢等提供業(yè)務(wù)支持,為標(biāo)準(zhǔn)起草人員分析標(biāo)準(zhǔn)信息、檢索標(biāo)準(zhǔn)關(guān)聯(lián)、排查標(biāo)準(zhǔn)的重復(fù)等漏洞問題,也給各行業(yè)相關(guān)企業(yè)提供標(biāo)準(zhǔn)研讀與制定的信息參考。

        本文分析了標(biāo)準(zhǔn)知識管理存在的問題,提出構(gòu)建標(biāo)準(zhǔn)領(lǐng)域知識圖譜實現(xiàn)標(biāo)準(zhǔn)知識管理與智能應(yīng)用。在食品安全國家標(biāo)準(zhǔn)上進(jìn)行實證,構(gòu)建了基于食品產(chǎn)品標(biāo)準(zhǔn)知識圖譜,實現(xiàn)了知識查詢和關(guān)聯(lián)分析。證明了知識圖譜這一知識管理形式在促進(jìn)標(biāo)準(zhǔn)體系智能化建設(shè)與知識服務(wù)上的優(yōu)勢。

        2 標(biāo)準(zhǔn)知識管理現(xiàn)狀

        2.1 標(biāo)準(zhǔn)制定存在信息差異

        標(biāo)準(zhǔn)本身的分類中,國家標(biāo)準(zhǔn)、行業(yè)標(biāo)準(zhǔn)和企業(yè)標(biāo)準(zhǔn)涉及的標(biāo)準(zhǔn)制定方不同。我國標(biāo)準(zhǔn)化工作開展較晚,不同標(biāo)準(zhǔn)委員會的信息不完全共享等情況會導(dǎo)致對于標(biāo)準(zhǔn)術(shù)語的定義、量度等可能有所不同,進(jìn)而導(dǎo)致在進(jìn)行追責(zé)時出現(xiàn)負(fù)責(zé)部門權(quán)責(zé)模糊、推諉懶政的現(xiàn)象。以食品安全標(biāo)準(zhǔn)為例:肖有明等[11]提出食品安全標(biāo)準(zhǔn)因涉及制定部門較多而導(dǎo)致追責(zé)困難,于航宇等[10]指出食品安全標(biāo)準(zhǔn)中對于尚無權(quán)威定義的食品品類,后續(xù)的標(biāo)準(zhǔn)制定工作無法高效開展。標(biāo)準(zhǔn)制定中的信息差異阻礙了標(biāo)準(zhǔn)化進(jìn)程與發(fā)展,不利于標(biāo)準(zhǔn)的知識整合與管理應(yīng)用。

        2.2 標(biāo)準(zhǔn)資源獲取效率低下

        標(biāo)準(zhǔn)覆蓋范圍廣、分類依據(jù)多。每個行業(yè)中涉及的標(biāo)準(zhǔn)數(shù)量龐大,近幾年標(biāo)準(zhǔn)文本進(jìn)入數(shù)字化管理時代,市面上已有較成熟完備的標(biāo)準(zhǔn)文本數(shù)據(jù)平臺,對標(biāo)準(zhǔn)進(jìn)行存儲并實現(xiàn)簡單單條目的查詢和下載。但各級標(biāo)準(zhǔn)化管理部門在進(jìn)行標(biāo)準(zhǔn)化工作時通過該方式獲取的標(biāo)準(zhǔn)相對分散,企業(yè)實際獲取標(biāo)準(zhǔn)過程中往往需要多渠道多次獲取,費(fèi)時費(fèi)力。部分標(biāo)準(zhǔn)詞匯并不局限于某一行業(yè),因此當(dāng)使用標(biāo)準(zhǔn)中的詞匯查詢時無法避免其他無關(guān)行業(yè)對于標(biāo)準(zhǔn)查詢的干擾,人工檢索的效率較低。

        2.3 標(biāo)準(zhǔn)知識管理智能化受限

        當(dāng)前新興產(chǎn)業(yè)和新興技術(shù)發(fā)展迅速,對應(yīng)的各級各類標(biāo)準(zhǔn)更新與維護(hù)會愈發(fā)頻繁?,F(xiàn)實情況是標(biāo)準(zhǔn)的編制單位和各專業(yè)標(biāo)準(zhǔn)化技術(shù)委員會分布于多家企業(yè),受到管理的局限性,往往不能做到實時更新,標(biāo)準(zhǔn)的發(fā)布相對滯后[12]。在標(biāo)準(zhǔn)的更新過程中,靠人工篩查重復(fù)或沖突的標(biāo)準(zhǔn)效率低、準(zhǔn)確性也難以保證。并且在該過程中,標(biāo)準(zhǔn)制定部門主要采取的手段仍是人工上載,在數(shù)據(jù)信息爆炸增長的時代,面對大量的標(biāo)準(zhǔn)維護(hù)工作,非智能的信息維護(hù)手段給標(biāo)準(zhǔn)化建設(shè)和標(biāo)準(zhǔn)體系的構(gòu)建造成了較大的阻力。

        另一方面如今標(biāo)準(zhǔn)化行業(yè)發(fā)展呈現(xiàn)多行業(yè)、多維度的全新局面。由于各專業(yè)標(biāo)準(zhǔn)化技術(shù)委員會相對獨(dú)立,有的專業(yè)劃分界線并不十分明確,導(dǎo)致部分專業(yè)交叉、工作重復(fù)、標(biāo)準(zhǔn)多頭歸口、體系交叉重復(fù)、技術(shù)指標(biāo)不一致等問題依然存在[13]?,F(xiàn)有標(biāo)準(zhǔn)數(shù)據(jù)共享平臺建設(shè)過程中,其主要查詢方式缺陷在于無法獲得標(biāo)準(zhǔn)與標(biāo)準(zhǔn)的關(guān)聯(lián),無法直接獲取關(guān)聯(lián)標(biāo)準(zhǔn)的相關(guān)信息。在標(biāo)準(zhǔn)體系中標(biāo)準(zhǔn)與標(biāo)準(zhǔn)之間并非獨(dú)立,其標(biāo)準(zhǔn)建立過程存在清晰的邏輯思路,標(biāo)準(zhǔn)文檔直接堆疊整理并不能體現(xiàn)出標(biāo)準(zhǔn)體系搭建過程中的整體邏輯,當(dāng)前我國標(biāo)準(zhǔn)知識管理智能化有待深化。

        3 標(biāo)準(zhǔn)知識圖譜架構(gòu)

        3.1 標(biāo)準(zhǔn)知識圖譜整體框架

        通過標(biāo)準(zhǔn)知識圖譜實現(xiàn)標(biāo)準(zhǔn)文本知識管理,即按照一定的規(guī)則對標(biāo)準(zhǔn)進(jìn)行知識重組和知識管理,以圖數(shù)據(jù)庫形式對標(biāo)準(zhǔn)進(jìn)行結(jié)構(gòu)化的整合與可視呈現(xiàn),挖掘標(biāo)準(zhǔn)與標(biāo)準(zhǔn)之間的關(guān)聯(lián)性,以實現(xiàn)標(biāo)準(zhǔn)的深層次信息處理和挖掘。標(biāo)準(zhǔn)知識圖譜構(gòu)建流程如圖1所示,從原始數(shù)據(jù)層逐步深入,本體概念層涉及知識的規(guī)則制定,實體數(shù)據(jù)層包含知識深加工與知識動態(tài)更新需求,最后以此作為知識庫實現(xiàn)各類與標(biāo)準(zhǔn)知識相關(guān)的智能應(yīng)用。

        標(biāo)準(zhǔn)知識圖譜的架構(gòu)主要包括概念層與數(shù)據(jù)層兩部分。概念層存儲的是概念化的結(jié)構(gòu)知識,又稱為本體,這一部分是知識圖譜的概念基礎(chǔ)框架,所有存儲的數(shù)據(jù)以該層面定義的知識結(jié)構(gòu)來存儲。數(shù)據(jù)層則是根據(jù)概念層規(guī)則,在原始數(shù)據(jù)中提煉出的知識。知識應(yīng)區(qū)別于原始文本,是對標(biāo)準(zhǔn)文本進(jìn)行拆分細(xì)化后形成的“碎化”信息。高質(zhì)量的數(shù)據(jù)知識對于標(biāo)準(zhǔn)知識圖譜以及后續(xù)的智能應(yīng)用效果至關(guān)重要,因此原始數(shù)據(jù)的知識抽取與加工轉(zhuǎn)換為結(jié)構(gòu)化的知識元是搭建標(biāo)準(zhǔn)知識圖譜的關(guān)鍵步驟。

        3.2 本體概念層

        概念層設(shè)計就是本體設(shè)計,是對最終呈現(xiàn)知識結(jié)構(gòu)的整體把控。本體的構(gòu)建應(yīng)以具體的項目領(lǐng)域和任務(wù)作為起點,以便于進(jìn)行本體功能的描述和知識的獲取。本體構(gòu)建技術(shù)分為人工[14]、自動[15]和半自動[16 -17]3類,在自動構(gòu)建本體方面,目前還極少有方法能夠得到覆蓋率和準(zhǔn)確率都表現(xiàn)良好的本體,并且沒有專門針對中文文檔知識的成熟方法。大多構(gòu)建本體過程都需要人工參與,考慮到標(biāo)準(zhǔn)的結(jié)構(gòu)一致性等特征,采取人工構(gòu)建本體中的七步法[18]作為標(biāo)準(zhǔn)領(lǐng)域知識圖譜本體構(gòu)建的主要方法。七步法本體構(gòu)建方法的流程包括:確定標(biāo)準(zhǔn)本體構(gòu)建領(lǐng)域及范圍、獲取并分析領(lǐng)域信息、定義本體概念和概念層次、定義概念的屬性和屬性約束、本體更新評估、本體實例化、文檔化說明。該過程中充分結(jié)合標(biāo)準(zhǔn)起草人的起草邏輯等專家知識,參照標(biāo)準(zhǔn)編寫規(guī)則,對標(biāo)準(zhǔn)的內(nèi)容結(jié)構(gòu)以及特點進(jìn)行分析,借助工具方法定義本體概念以及屬性約束,并對處理后的標(biāo)準(zhǔn)本體進(jìn)行文檔化說明。

        標(biāo)準(zhǔn)按照要素的類型和位置共分為4類:資料性概述要素、資料性補(bǔ)充要素、規(guī)范性一般要素和規(guī)范性技術(shù)要素。資料性概述要素包括標(biāo)準(zhǔn)封面、目次、引言以及前言中的內(nèi)容;資料性補(bǔ)充要素包括標(biāo)準(zhǔn)資料性附錄、參考文獻(xiàn)以及索引中的內(nèi)容;規(guī)范性一般要素包括標(biāo)準(zhǔn)的名稱、范圍和規(guī)范性引用文件中的內(nèi)容;規(guī)范性技術(shù)要素包括術(shù)語和定義、符號、代號和縮略語以及規(guī)范性附錄等內(nèi)容。結(jié)合標(biāo)準(zhǔn)編排要求,標(biāo)準(zhǔn)的一般內(nèi)容組成如圖2所示。

        參照標(biāo)準(zhǔn)的一般結(jié)構(gòu),標(biāo)準(zhǔn)實體的基本屬性來源于資料性概述要素、資料性補(bǔ)充要素,包含標(biāo)準(zhǔn)的類型、名稱、發(fā)行時間、起草單位等信息,可以以此直接定義其基本屬性概念。規(guī)范性一般要素和規(guī)范性技術(shù)要素中涉及與行業(yè)緊密相關(guān)的術(shù)語、適用范圍以及細(xì)化的行業(yè)技術(shù)要素,并不適合直接使用其屬性概念,故而參照同行業(yè)的標(biāo)準(zhǔn)文件中存在必要的共同元素,以共同元素作為參考進(jìn)行本體設(shè)計。比如:在食品安全標(biāo)準(zhǔn)中,技術(shù)內(nèi)容包含:理化指標(biāo)要求、污染物限量等共同要素,則“污染物限量”可以作為一個關(guān)系概念用以指向該標(biāo)準(zhǔn)與引用標(biāo)準(zhǔn)之間的關(guān)系屬性。標(biāo)準(zhǔn)文件的專業(yè)特性與已有編著邏輯性,決定了其本體建模主要結(jié)合專業(yè)性知識,以語義判斷為根本原理施行[19]。

        3.3 實體數(shù)據(jù)層

        標(biāo)準(zhǔn)知識管理應(yīng)注重標(biāo)準(zhǔn)的知識完整性、準(zhǔn)確性,唐爽等[13]提出標(biāo)準(zhǔn)知識庫應(yīng)具有信息時效性,趙丹[20]構(gòu)建企業(yè)標(biāo)準(zhǔn)體系時強(qiáng)調(diào)系統(tǒng)需保證標(biāo)準(zhǔn)體系的動態(tài)更新確保標(biāo)準(zhǔn)體系對于企業(yè)的準(zhǔn)確指導(dǎo),均強(qiáng)調(diào)了對于標(biāo)準(zhǔn)知識的完整性與準(zhǔn)確性要求。因此標(biāo)準(zhǔn)實體數(shù)據(jù)層的知識質(zhì)量也決定了標(biāo)準(zhǔn)知識圖譜的整體質(zhì)量以及采信度。標(biāo)準(zhǔn)實體數(shù)據(jù)層主要包括知識抽取、知識融合、知識存儲以及更新。其中知識抽取是將標(biāo)準(zhǔn)文本中的必要關(guān)鍵信息進(jìn)行格式轉(zhuǎn)換后結(jié)合自然語言處理技術(shù)得到實體、關(guān)系屬性等信息,初步獲得結(jié)構(gòu)化知識實現(xiàn)。從而實體間語義鏈接。知識融合需要對冗余的知識進(jìn)一步處理簡化,對三元組在統(tǒng)一框架標(biāo)準(zhǔn)下進(jìn)行整合、消歧,簡化知識體系,形成標(biāo)準(zhǔn)知識網(wǎng)絡(luò)。知識存儲環(huán)節(jié)采取開源Neo4j圖數(shù)據(jù)庫作為工具,導(dǎo)入精簡化后的結(jié)構(gòu)化知識,通過標(biāo)準(zhǔn)節(jié)點之間的引用關(guān)聯(lián)將標(biāo)準(zhǔn)知識組合成可以系統(tǒng)查詢與更新的知識網(wǎng)絡(luò)。

        4 食品標(biāo)準(zhǔn)知識圖譜實證

        4.1 食品標(biāo)準(zhǔn)知識圖譜構(gòu)建

        食品安全標(biāo)準(zhǔn)是相關(guān)權(quán)威機(jī)構(gòu)依照程序制定的規(guī)范性文件,對推動食品安全發(fā)展起到至關(guān)重要的作用。我國已有食品、食品添加劑、食品相關(guān)產(chǎn)品國家標(biāo)準(zhǔn)1,30 0 余項,行業(yè)標(biāo)準(zhǔn)2,90 0 余項,地方標(biāo)準(zhǔn)1,200余項,形成了相對完善的食品標(biāo)準(zhǔn)體系。但是食品安全標(biāo)準(zhǔn)種類多、層次豐富,一定程度上給標(biāo)準(zhǔn)系統(tǒng)知識管理造成了一定的困難。其配套法規(guī)政策不足,制定范圍、定位不明確 ,內(nèi)容龐雜,并且相互引用形式多樣,在信息公開性上仍有欠缺,這些都對于消費(fèi)者合理維權(quán),企業(yè)有效生產(chǎn)經(jīng)營產(chǎn)生不良影響。

        食品安全標(biāo)準(zhǔn)是眾多的食品標(biāo)準(zhǔn)中唯一強(qiáng)制執(zhí)行的標(biāo)準(zhǔn),因此本文以現(xiàn)行食品安全國家標(biāo)準(zhǔn)作為研究對象。根據(jù)食品安全標(biāo)準(zhǔn)與監(jiān)測評估司發(fā)布的食品安全國家標(biāo)準(zhǔn)目錄顯示,食品安全國家標(biāo)準(zhǔn)分為通用標(biāo)準(zhǔn)、食品產(chǎn)品標(biāo)準(zhǔn)、特殊膳食食品標(biāo)準(zhǔn)、食品添加劑質(zhì)量規(guī)格及相關(guān)標(biāo)準(zhǔn)等共計12類。由于食品安全標(biāo)準(zhǔn)制定底層邏輯是圍繞食品的生產(chǎn)制造過程進(jìn)行的,故而選擇食品產(chǎn)品和特殊膳食食品標(biāo)準(zhǔn)共計8 0 份標(biāo)準(zhǔn)文件用作實證,以下將上述國家安全標(biāo)準(zhǔn)統(tǒng)稱為食品產(chǎn)品標(biāo)準(zhǔn)。

        對食品產(chǎn)品文件分析,以標(biāo)準(zhǔn)作為實體,對其主要共有元素進(jìn)行分析設(shè)計本體。其封面中包含的標(biāo)準(zhǔn)名稱、編號以及發(fā)行時間作為標(biāo)準(zhǔn)的基礎(chǔ)屬性。以食品產(chǎn)品標(biāo)準(zhǔn)GB 5420為例,標(biāo)準(zhǔn)名稱為《干酪》,標(biāo)準(zhǔn)編號為GB 5420,發(fā)行時間為“2021”。食品產(chǎn)品標(biāo)準(zhǔn)的內(nèi)容屬性包括適用范圍、相關(guān)術(shù)語以及術(shù)語定義,位于文件正文部分“1 范圍”以及“2 術(shù)語和定義”。參照“3 技術(shù)要求”部分定義食品產(chǎn)品標(biāo)準(zhǔn)與其他標(biāo)準(zhǔn)的關(guān)系屬性,食品產(chǎn)品技術(shù)要求包含原料要求、感官要求、理化指標(biāo)、污染物限量和真菌毒素限量、微生物限量、食品添加劑和食品營養(yǎng)強(qiáng)化劑,其中微生物限量常細(xì)分為致病菌限量和微生物限量。文件“4 其他”包含食品外包裝等其他相關(guān)要求,綜合上述內(nèi)容結(jié)合食品安全國家標(biāo)準(zhǔn)的12個大類別,定義食品產(chǎn)品標(biāo)準(zhǔn)同其他標(biāo)準(zhǔn)的關(guān)系屬性見表1,食品產(chǎn)品標(biāo)準(zhǔn)知識圖譜本體模型如圖3所示。根據(jù)本體設(shè)計邏輯,基于規(guī)則對標(biāo)準(zhǔn)原始數(shù)據(jù)的進(jìn)行知識抽取與加工,并將簡化后的結(jié)構(gòu)化三元組進(jìn)行存儲。

        4.2 食品產(chǎn)品標(biāo)準(zhǔn)知識圖譜可視化

        食品產(chǎn)品知識圖譜可視化通過Neo4j圖數(shù)據(jù)庫實現(xiàn),Neo4j圖數(shù)據(jù)庫可以清晰地展示出節(jié)點之間的依賴關(guān)系以及顯性關(guān)系屬性。對食品產(chǎn)品標(biāo)準(zhǔn)以其本體模型進(jìn)行知識抽取與知識融合后,形成食品產(chǎn)品標(biāo)準(zhǔn)與其他食品安全標(biāo)準(zhǔn)的關(guān)聯(lián)數(shù)據(jù)資源導(dǎo)入圖數(shù)據(jù)庫中,實現(xiàn)食品產(chǎn)品標(biāo)準(zhǔn)資源的可視化存儲與訪問。通過py2neo工具包可通過Python應(yīng)用程序內(nèi)部和命令行直接使用Neo4j,實現(xiàn)批量結(jié)構(gòu)化知識導(dǎo)入。數(shù)據(jù)導(dǎo)入后在Neo4j圖數(shù)據(jù)庫中可使用Cypher查詢語言檢索食品產(chǎn)品標(biāo)準(zhǔn)知識圖譜中節(jié)點及其關(guān)聯(lián)關(guān)系,相關(guān)Cypher語句示例見表2。

        圖譜示例如圖4所示,實體節(jié)點共計212個,關(guān)系數(shù)量789。通過進(jìn)一步點擊訪問可以查詢各節(jié)點具體情況基本屬性以及關(guān)聯(lián)標(biāo)準(zhǔn)情況。

        4.3 食品產(chǎn)品標(biāo)準(zhǔn)關(guān)聯(lián)查詢

        食品產(chǎn)品標(biāo)準(zhǔn)知識圖譜的主要優(yōu)勢在于以知識網(wǎng)絡(luò)直觀呈現(xiàn)了食品產(chǎn)品標(biāo)準(zhǔn)與其他標(biāo)準(zhǔn)之間的引用關(guān)系,為標(biāo)準(zhǔn)的查找和分析提供便捷的知識管理可視化工具。標(biāo)準(zhǔn)關(guān)聯(lián)查詢的首要作用,對于食品生產(chǎn)過程中需要參照標(biāo)準(zhǔn)針對性地進(jìn)行匯總,對產(chǎn)品涉及的各技術(shù)要素以及檢驗方法實現(xiàn)“一圖直達(dá)”。標(biāo)準(zhǔn)“GB 25570 輔食營養(yǎng)補(bǔ)充品”的關(guān)聯(lián)圖譜,以該產(chǎn)品標(biāo)準(zhǔn)為中心的網(wǎng)狀結(jié)構(gòu)直觀地整理了該標(biāo)準(zhǔn)存在有28項關(guān)聯(lián),主要的19項標(biāo)準(zhǔn)關(guān)聯(lián)產(chǎn)生在理化指標(biāo)檢驗方法上,對于食品添加劑、營養(yǎng)劑以及外包裝均有相關(guān)的標(biāo)準(zhǔn)要求(如圖5所示)。

        其次,關(guān)聯(lián)查詢給標(biāo)準(zhǔn)的修訂提供了重要性數(shù)據(jù)參考。食品生產(chǎn)與人民群眾生命安全息息相關(guān),知識圖譜可以通過節(jié)點出度、入度,從數(shù)據(jù)層面標(biāo)記標(biāo)準(zhǔn)重要性以及關(guān)聯(lián)程度。以“微生物檢驗方法標(biāo)準(zhǔn)”為例,在Neo4j中直接查詢“MATCH (a)-[r:`微生物檢驗方法`]->(b)RETURN b, COUNT(r) ORDERBY COUNT(r) DESC”,圖譜如圖6所示,數(shù)據(jù)結(jié)果見表3。結(jié)果顯示與食品產(chǎn)品直接關(guān)聯(lián)的微生物檢驗方法標(biāo)準(zhǔn)重要性前三分別為GB 4789.3、GB 4789.2、GB 4789.4,關(guān)聯(lián)數(shù)目分別為50項、40項以及21項,因此在修訂相關(guān)標(biāo)準(zhǔn)時對于關(guān)聯(lián)程度較廣的標(biāo)準(zhǔn)應(yīng)更加謹(jǐn)慎、多方考慮。

        5 結(jié) 語

        我國標(biāo)準(zhǔn)的領(lǐng)域知識深度廣,有效的知識管理對于提高標(biāo)準(zhǔn)文件信息管理水平、促進(jìn)標(biāo)準(zhǔn)化工作成果具有重要意義。標(biāo)準(zhǔn)知識圖譜的核心在于標(biāo)準(zhǔn)知識單元的重組與細(xì)化,對標(biāo)準(zhǔn)文檔邏輯化的拆分的知識管理優(yōu)勢在于,對于實體不僅囊括其涉及屬性的長文本,還能夠基于標(biāo)準(zhǔn)的制定邏輯對標(biāo)準(zhǔn)之間引用關(guān)系進(jìn)行存儲,對于標(biāo)準(zhǔn)文檔做到了知識概括性、引用關(guān)聯(lián)性同時把握。知識圖譜的語義網(wǎng)絡(luò)特性在描述標(biāo)準(zhǔn)的語義關(guān)系上充分發(fā)揮效能,做到更深層、更高細(xì)粒度的知識管理,并為以此作為底層知識庫開展的智能應(yīng)用打下基礎(chǔ)。

        知識圖譜的組織模式提供了標(biāo)準(zhǔn)管理的框架和底層邏輯,后續(xù)研究方向聚焦于構(gòu)建圖譜的效率。探索具有通用性的標(biāo)準(zhǔn)本體構(gòu)建方法、提高標(biāo)準(zhǔn)知識抽取加工過程精確度以及如何深度利用標(biāo)準(zhǔn)知識圖譜實現(xiàn)智能應(yīng)用,例如:精準(zhǔn)問答等擴(kuò)展。

        參考文獻(xiàn)

        楊波,楊美芳. 知識圖譜研究綜述及其在風(fēng)險管理領(lǐng)域應(yīng)用[J]. 小型微型計算機(jī)系統(tǒng), 2021,42(08):1610-1618.

        劉嶠,李楊,段宏,等. 知識圖譜構(gòu)建技術(shù)綜述[J]. 計算機(jī)研究與發(fā)展, 2016,53(03):582-600.

        Cheng B, Zhang J, Liu H, et al. Research on medical knowledgegraph for stroke[J]. Journal of Healthcare Engineering, 2021,2021.

        Zhang D, Jia Q, Yang S, et al. Traditional Chinese MedicineAutomated Diagnosis Based on Knowledge Graph Reasoning[J].CMC-COMPUTERS MATERIALS & CONTINUA, 2022,71(1): 159-170.

        Yang B, Liao Y. Research on enterprise risk knowledge graphbased on multi-source data fusion[J]. Neural Computing andApplications, 2022, 34(4): 2569-2582.

        袁俊,劉國柱,梁宏濤,等. 知識圖譜在商業(yè)銀行風(fēng)控領(lǐng)域的研究與應(yīng)用綜述[J/OL]. 計算機(jī)工程與應(yīng)用: 1-16[2022-08-11].

        王思宇,邱江濤,洪川洋,等. 基于知識圖譜的在線商品問答研究[J]. 中文信息學(xué)報, 2020,34(11):104-112.

        孫佳琛,王金龍,丁國如,等. 頻譜知識圖譜:面向未來頻譜管理的智能引擎[J].通信學(xué)報,2021,42(05):1-12.

        胡琳,楊建軍,韋莎,等. 工業(yè)互聯(lián)網(wǎng)標(biāo)準(zhǔn)體系構(gòu)建與實施路徑[J]. 中國工程科學(xué), 2021,23(02):88-94.

        黃持偉,吳學(xué)科,陽如坤,等. 鋰電池智能制造裝備標(biāo)準(zhǔn)體系研究[J]. 中國標(biāo)準(zhǔn)化, 2021(07):57-62+93.

        肖有明,賴森森. 我國的食品安全標(biāo)準(zhǔn)體系建設(shè)[J]. 現(xiàn)代食品, 2020(17):145-147.

        于航宇,樊永祥,王家祺. 我國現(xiàn)行食品安全地方標(biāo)準(zhǔn)分析[J]. 中國食品衛(wèi)生雜志, 2019,31(05):485-489.

        唐爽,韓義萍,張玉,等. 標(biāo)準(zhǔn)知識庫構(gòu)建研究[J]. 中國標(biāo)準(zhǔn)化, 2020(S1):46-50.

        趙雪芹,李天娥. 面向數(shù)字人文的檔案領(lǐng)域本體構(gòu)建研究——以萬里茶道檔案資料為例[J/OL].情報理論與實踐:1-9[2022-08-09].

        熊勵,王成文,王錕. 基于事件本體的疫情知識庫構(gòu)建策略[J]. 圖書情報工作, 2021,65(14):138-148.DOI:10.13266/j.issn.0252-3116.2021.14.016.

        劉博,張佳慧,李建強(qiáng),等. 大氣污染領(lǐng)域本體的半自動構(gòu)建及語義推理[J]. 北京工業(yè)大學(xué)學(xué)報, 2021,47(03):246-259.

        唐琳,郭崇慧,陳靜鋒,等. 基于中文學(xué)術(shù)文獻(xiàn)的領(lǐng)域本體概念層次關(guān)系抽取研究[J].情報學(xué)報,2020,39(04):387-398.

        Wang P, Mao Y, Song W, et al. A Comprehensive and ScientificallyAccurate Pharmaceutical Knowledge Ontology based on MultisourceData[C]//BIOINFORMATICS. 2022: 168-175.

        劉慧琳,牛力. 標(biāo)準(zhǔn)文件的知識圖譜組織模式探究[J]. 檔案學(xué)通訊, 2021(05):58-65.

        趙丹. 大慶油田標(biāo)準(zhǔn)體系動態(tài)管理系統(tǒng)的研究[J]. 中國標(biāo)準(zhǔn)化, 2017(17):114-118.

        猜你喜歡
        知識管理知識圖譜標(biāo)準(zhǔn)
        2022 年3 月實施的工程建設(shè)標(biāo)準(zhǔn)
        忠誠的標(biāo)準(zhǔn)
        美還是丑?
        近十五年我國小學(xué)英語教學(xué)研究的熱點、問題及對策
        基于知識圖譜的產(chǎn)業(yè)集群創(chuàng)新績效可視化分析
        智富時代(2016年12期)2016-12-01 16:28:41
        基于知識圖譜的智慧教育研究熱點與趨勢分析
        提升企業(yè)知識管理能力 增強(qiáng)企業(yè)的強(qiáng)勁發(fā)展態(tài)勢
        檔案管理與知識管理的關(guān)系研究
        從《ET&S》與《電化教育研究》對比分析中管窺教育技術(shù)發(fā)展
        大數(shù)據(jù)時代高校學(xué)生知識管理
        科技視界(2016年21期)2016-10-17 18:42:37
        日韩av高清无码| 亚洲精品女同一区二区三区| 免费的日本一区二区三区视频| 色婷婷亚洲精品综合影院| 84pao强力打造免费视频34| 亚洲成a人片在线观看高清| 精品人妻码一区二区三区红楼视频| 无码中文字幕日韩专区| 在线观看国产成人av片| аⅴ天堂一区视频在线观看| 在线观看国产自拍视频| 亚洲a∨无码精品色午夜| 性高朝久久久久久久| 精品久久久久久电影院| 亚洲av成人永久网站一区 | 日韩精品无码一区二区| 国精产品一品二品国在线| 亚洲欧洲美洲无码精品va| 五月婷婷开心六月激情| 乱色精品无码一区二区国产盗| 欧美成人形色生活片| 91精品人妻一区二区三区蜜臀| 亚洲国产成人久久精品不卡| 粗大的内捧猛烈进出视频| 在线观看视频一区| 青青青草视频手机在线| 久久久久亚洲av成人人电影| 囯产精品一品二区三区| 国产成人精品cao在线| 亚洲三级中文字幕乱码| 国产精品兄妹在线观看麻豆 | 亚洲二区精品婷婷久久精品| 人妻中文字幕乱人伦在线| 亚洲爆乳少妇无码激情| 国产高清一区在线观看| 男女主共患难日久生情的古言| 樱桃视频影视在线观看免费| 调教在线播放黄| 精品久久中文字幕一区| 欧美变态另类刺激| 1769国产精品短视频|