岳高峰 劉繼紅 高亮 溫娜
摘 要:智能制造領域的標準涵蓋設備、機床、計算機系統(tǒng)、智能傳感器等多種類型。以工業(yè)化、數(shù)字化、智能化為特征的智能制造對標準的數(shù)字化和機器可讀提出了內在要求。為了滿足智能制造標準的數(shù)字化、網(wǎng)絡化、智能化發(fā)展要求,基于知識圖譜技術和本體建模理論,本文提出了用于智能制造標準數(shù)字化轉型的本體模型,包括類、屬性、關系和規(guī)則庫。在此基礎上,通過在行業(yè)應用的典型示例,解釋和驗證了本文所提的模型和方法。
關鍵詞:知識圖譜,標準數(shù)字化,本體
DOI編碼:10.3969/j.issn.1002-5944.2023.15.005
基金項目:本文受市場監(jiān)管總局科技計劃項目(項目編號:2022MK188)及中國標準化研究院院長基金項目“面向智能制造數(shù)據(jù)知識標準的數(shù)字化轉型方法和一致性測試研究”(項目編號:532022Y-9424)資助。
A Digital Transformation Method of Standard for Intelligent Manufacturing Data Based on Knowledge Graph Technology
YUE Gao-feng1,2 LIU Ji-hong1* GAO Liang2 WEN Na2
(1. Beihang University; 2. China National Institute of Standardizationn)
Abstract: Standards in the fi eld of intelligent manufacturing cover equipment, machine tools, computer systems, intelligent sensors and other types of products. Intelligent manufacturing, characterized by industrialization, digitalization and intellectualization, puts forward inherent requirements for the digitalization and machine readability of standards. In order to meet the requirements of digitalization, network and intelligent development of intelligent manufacturing standards, based on knowledge graph technology and ontology modeling theory, this paper proposes an ontology model for the digital transformation of intelligent manufacturing standards, including classes, attributes, relationships and rule base. On this basis, the model and method proposed in this paper are verifi ed through typical examples of industrial applications.
Keywords: knowledge graph, standards digitization, ontology
0 引 言
歐美發(fā)達國家在將新技術用于推動制造業(yè)的變革發(fā)展。在世界經(jīng)濟持續(xù)低速增長態(tài)勢的背景下,西方國家推動將新一輪科技變革帶動產業(yè)變革,提升國家核心競爭力,并將標準化作為推動技術創(chuàng)新、產業(yè)變革的支撐和保障。德國在2020年3月發(fā)布了第四版《工業(yè)4.0標準化路線圖》;美國在2022年10月發(fā)布了《先進制造業(yè)國家戰(zhàn)略》,提出為美國制造業(yè)注入新活力、構建制造業(yè)供應鏈彈性,并建議制定數(shù)據(jù)兼容性標準,實現(xiàn)智能制造的無縫集成,引領智能制造未來發(fā)展。
我國提出了智能制造發(fā)展戰(zhàn)略。2015年以來,工業(yè)和信息化部聯(lián)合國家標準化管理委員會先后印發(fā)了《國家智能制造標準體系建設指南》的2015、2018和2021版,提出了智能制造標準體系,涵蓋船舶、紡織、石化等14個細分行業(yè)。智能制造是基于先進制造技術與新一代信息技術深度融合,貫穿于設計、生產、管理、服務等產品全生命周期,具有自感知、自決策、自執(zhí)行、自適應、自學習等特征,旨在提高制造業(yè)質量、效率效益和柔性的先進生產方式[1]。智能制造系統(tǒng)架構從生命周期、系統(tǒng)層級和智能特征等3個維度對智能制造所涉及的要素、裝備、活動等內容進行描述,主要用于明確智能制造的標準化對象和范圍。
黨中央、國務院[2]提出發(fā)展機器可讀標準、開源標準,推動標準化工作向數(shù)字化、網(wǎng)絡化、智能化轉型。同時,對于智能制造提出實施高端裝備制造標準化強基工程,健全智能制造、綠色制造、服務型制造標準,形成產業(yè)優(yōu)化升級的標準群。智能制造涉及到的多種類型的“機器”,涵蓋設備、機床、計算機系統(tǒng)、智能傳感器等多種類型,涉及到機器可讀標準也最多。智能制造涵蓋了設計、生產、物流、商貿等業(yè)務活動,與車間自動化生產、自動搬運、自動貨物運輸、智能機床、自動包裝、倉儲自動化等工業(yè)智能緊密關聯(lián),這都為標準的機器可讀,以及標準的數(shù)字化、網(wǎng)絡化、智能化轉型提出了內在要求。鑒于制造行業(yè)的智能化發(fā)展需求,包括工業(yè)互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、自動化設備設施等在內的制造資源對機器自動化智能化解析處理,提出了數(shù)字化要求。如何讓機器更好地理解和執(zhí)行標準,推動標準化工作向數(shù)字化、網(wǎng)絡化、智能化轉型,是當前數(shù)字經(jīng)濟時代的迫切發(fā)展需求。
1 現(xiàn)狀綜述
1.1 國外標準數(shù)字化情況
ISO將數(shù)字化技術作為重要的影響因素列入ISO發(fā)展戰(zhàn)略,指出數(shù)字基礎設施發(fā)展以及數(shù)字技術與其他傳統(tǒng)技術結合,正在迅速而顯著地改變世界各地的人們生活和工作方式[3]。標準數(shù)字化有助于提高企業(yè)的生產效率,創(chuàng)造競爭優(yōu)勢并促進創(chuàng)新;可以幫助社會和企業(yè)以可持續(xù)的方式促進新技術的傳播。此外,ISO還將利用數(shù)字技術的力量來改善自己的價值鏈和敏捷性。IEC和ISO聯(lián)合提出了IEC/ISO smart計劃[4],包括著名的標準成熟度模型。在此基礎上,德國標準化機構DIN/DKE進一步拓展了該模型[5],如圖1所示。DIN將數(shù)字標準的定義為“數(shù)字標準包含標準化任務的所有相關信息,并以適合特定應用的方法和范圍提供這些信息。數(shù)字標準可以由人和機器啟動、創(chuàng)建、處理、實施和調整”[5]。同時,認為當前的標準僅以文檔形式提供,包括紙質文檔、電子文檔;提出規(guī)范和標準也應以數(shù)字形式提供,以便于機器或其他自動化系統(tǒng)可以自動讀取和應用[6]。歐盟[7]提出通過標準化支持數(shù)字化轉型,提高全球市場競爭力。標準數(shù)字化可以促進產品和服務的安全性;建立對新興技術的信任;努力尋求共識并為歐洲提供最先進的解決方案。
綜上所述,國際上將標準數(shù)字化轉型都作為標準化的發(fā)展戰(zhàn)略和前沿技術。在智能制造領域,面向機器可解釋、可執(zhí)行的文檔是標準數(shù)字化轉型的重點研究方向。
1.2 基于本體理論的知識圖譜技術
Gruber等[8]將本體定義為“概念化的顯式規(guī)范”。本體作為一種形式化的知識表示,在知識的獲取、存儲、共享和重用過程中起著重要作用。W3C制定了基于XML的語義網(wǎng)技術,推動了本體理論的應用。資源描述框架(Resource Description Framework,RDF)使用XML語法表示互聯(lián)網(wǎng)上的數(shù)據(jù)模型。RDF圖由三元組(Turtle)組成,包括主語、謂語和賓語,可以實現(xiàn)互聯(lián)網(wǎng)范圍的知識網(wǎng)絡。在RDF 的基礎上,W3C推出了一種語義表達能力更強的知識網(wǎng)絡本體語言(Web Ontology Language,OWL),可以支持類、屬性、個體和數(shù)據(jù)值。語義網(wǎng)規(guī)則語言(Semantic Web Rule Language,SWRL)是基于OWL的規(guī)則邏輯語言,并且支持演繹推理能力。2012年5月,Google公司提出知識圖譜(Knowledge Graph,KG)的概念,用于對收集的各方面信息進行結構化組織,以提高搜索引擎的性能[9]。Hogan等[10]將知識圖譜定義為旨在積累和傳達現(xiàn)實世界知識的數(shù)據(jù)圖譜,其節(jié)點表示相關實體,邊表示這些實體間的關系。Neo4j是一個支持原子性、一致性、隔離性和持久性事務的知識圖譜管理系統(tǒng)。Neo4j通過圖(graph)、Nodes(節(jié)點)、Lables(標簽)、Relationship(關系)、Relationship type(關系類型)、Properties(特性)等來構建知識圖譜。語義網(wǎng)絡和知識圖譜為本體三元組建模提供了基本方法,可以方便地實現(xiàn)知識網(wǎng)絡的表示和構建。
本體理論和知識圖譜技術為標準數(shù)字化轉型提供了堅實的技術基礎,也為實現(xiàn)標準機器可解讀、可解析實現(xiàn)高級別成熟度提供了技術實現(xiàn)的方法和工具。
2 智能制造數(shù)據(jù)標準本體及知識圖譜構建
2.1 概述
數(shù)據(jù)標準是一種重要的智能制造標準,包括普通標準、術語標準、分類代碼標準、元數(shù)據(jù)標準和接口標準等。數(shù)據(jù)標準通常是實現(xiàn)自動化設備和系統(tǒng)等機器解讀和處理的一種資源,數(shù)據(jù)標準的數(shù)字化轉型對智能制造標準數(shù)字化轉型起到重要的示范和帶動效應。當前,我國的智能制造標準中的技術內容,大多數(shù)以文檔格式存在,包括紙質文檔、PDF等電子文檔以及html網(wǎng)頁格式的文檔。智能制造標準中的內容,大略相當于圖1所示的成熟度模型中二三四級的內容為主。為此,本文在綜合調研我國智能制造數(shù)據(jù)標準現(xiàn)狀的基礎上,通過本體技術和知識圖譜技術,提出了一種面向機器可解讀、可執(zhí)行、可解釋文檔的標準化數(shù)字化轉型技術和方法。
數(shù)據(jù)標準可以分為普通標準、術語標準、分類代碼標準、元數(shù)據(jù)標準和應用接口標準等若干種類型。不同數(shù)據(jù)標準,根據(jù)標準包含的技術內容又可以拆分為若干標準組成模塊,包括標準文獻模塊、范圍模塊、規(guī)范性引用文件模塊、術語模塊、通用條款模塊、代碼模塊、元數(shù)據(jù)模塊、接口模塊、參考文獻模塊等。
普通標準包含標準文獻模塊、范圍模塊、規(guī)范性引用文件、術語模塊、通用條款模塊、參考文獻模塊。術語標準、元數(shù)據(jù)標準、分類代碼標準、接口標準等可以是專業(yè)的普通標準,除普通標準的一般內容之外,更多的是專業(yè)性模塊。分類與代碼標準主要技術內容是分類與代碼模塊;元數(shù)據(jù)標準主要技術內容是元數(shù)據(jù)模塊;接口標準主要技術內容是接口模塊。還有一類綜合性數(shù)據(jù)標準,可能會包含這幾種專業(yè)模塊。
2.2 數(shù)據(jù)標準本體
式中,類、實體或節(jié)點(C);類、實體、或節(jié)點在此處被看作同義詞,表示為:“(類)”;
屬性(P),指有關類的相關信息;例如,標準號、標準名稱、起草人和其他相關信息可以是標準文獻的屬性;
關系(R)或邊;關系表示節(jié)點或類之間的連線、邏輯關系;包括:OWL或Protégé工具中定義的通用關系(如IS-A);知識圖譜中的一些特定的邏輯關系,如“規(guī)定”“起草”等,以有向箭頭的形式表示:-[關系]->;
公理規(guī)則(A);公理規(guī)則主要采用語義網(wǎng)規(guī)則語言(SWRL)表示,如自反(reverse)關系。例如,“規(guī)范性引用”與“被規(guī)范性引用”是自反關系。
2.3 數(shù)據(jù)標準類和屬性
2.3.1 標準文獻
標準文獻是將標準作為一個整體,是一種技術文件。標準文獻信息主要是標準元數(shù)據(jù)信息,從描述性角度的數(shù)據(jù)標準相關信息,是一種標準的外在信息。與標準文獻相關的類(或節(jié)點)主要是描述標準文獻元數(shù)據(jù)信息的類,包括標準文獻、起草人、起草單位等類。此外,標準正文中的范圍模塊、規(guī)范性引用文件、參考文獻等模塊,也屬于從總體上描述標準文獻之間關系的內容,也歸入標準文獻類(見圖2)。
標準文獻一般包括下列類:
標準文獻類,主要是從文獻角度定義和描述標準的相關信息;標準文獻指以文件的形式存儲了特定專業(yè)領域的知識;標準文獻是標準內容承載的文件媒介;標準文獻通過描述性信息來表達標準文獻的相關信息;包括標準號、標準名稱、發(fā)布日期、實施日期、發(fā)布部門、起草單位名稱、起草人姓名等屬性。
起草人類,參與標準起草的人員信息,包括起草人的姓名、隸屬單位、身份證號碼、職務/職稱、聯(lián)系電話等屬性;
起草單位類,參與標準起草的組織機構、社會團體或部門,包括起草人的單位名稱、統(tǒng)一社會信用代碼、所在省份、聯(lián)系人名稱、聯(lián)系人電話等屬性。
規(guī)范性引用文件類,通常是一種標準文獻的相關信息,一般包含文獻代碼(主要是標準號)、文獻名稱(主要是標準名稱)等屬性。
參考文獻類,一般包含標準文獻在內的文獻,例如標準、著作、期刊文章、技術報告、法律法規(guī)等,一般包括文獻的作者、文獻名稱、編號、出版單位等相關屬性。
2.3.2 標準內容
標準內容是將標準作為一個知識載體所包含的信息和知識。根據(jù)前文所述,根據(jù)模塊化原理,除范圍、規(guī)范性引用文件、參考文獻等模塊納入標準文獻類之外,將數(shù)據(jù)標準內容可以分為:通用條款模塊、術語模塊、元數(shù)據(jù)模塊、代碼模塊、接口模塊等,這些模塊通過通用條款、術語、代碼、數(shù)據(jù)元、接口等類,以及相關的屬性、關系、規(guī)則庫等表示。
條款類,是一種標準內容,是標準中最小的知識單元,可以體現(xiàn)為數(shù)據(jù)分類代碼、軟件接口、數(shù)據(jù)元、術語、或其它技術要求等。通常包含章條號、條款內容等屬性。條款可以是規(guī)范性條款或描述條款,用以表達要求、指示、陳述或推薦等技術內容。對于數(shù)據(jù)標準來說,除了通用條款之外,還可能包含術語、代碼、數(shù)據(jù)元、接口等特定的格式化數(shù)據(jù)。
術語類,表達術語定義技術內容的最小知識單元。通常包含中文名稱、英文名稱、定義、注、出處等標準屬性。
縮略語類,表達縮略語的最小基本單元。通常包含縮略語、中文詞匯、英文詞匯等屬性。
數(shù)據(jù)元類,數(shù)據(jù)元是構成數(shù)據(jù)的最小單元。通常包含數(shù)據(jù)元的標識符、中文名稱、英文名稱、縮寫名、說明、表示、值域、是否必選、語境等屬性(見圖3)。
代碼類,是信息代碼類的簡稱,用于標記信息的類別或個體的標識方式。例如標準號、身份證代碼、物品代碼、行政區(qū)劃代碼、學科代碼等都是代碼。通常標準中可以有若干種代碼,例如阿拉伯數(shù)字代碼、拉丁字母代碼等多種代碼。代碼類的屬性可以有代碼1、…、代碼n、代碼類型、信息實體名稱、信息實體說明。
接口類,是軟件工程中應用訪問接口或數(shù)據(jù)接口,是實現(xiàn)不同軟件模塊集成的一種方式,也是軟件工程中模塊化理念的一種體現(xiàn)。通常,不同軟件開發(fā)協(xié)議或不同的機器語言,具有不同的接口表達方式。接口類一般包含類名稱、功能描述、輸入?yún)?shù)、輸入?yún)?shù)類型、輸入?yún)?shù)說明、輸出參數(shù)、返值類型、返值說明等屬性(見圖4)。
2.3.3 標準內容類和屬性
標準文獻之間、標準文獻與應用場景之間、標準文獻與內容條款之間的關系,見表1。
2.4 規(guī)則庫
在《OWL語義本體語言快速指南(第二版)》(Web Ontology Language Direct Semantics (Second Edition))中定義了一組公理。本文采用了其中的一部分通用性的公理,如繼承關系或稱為IS-A關系、相反關系(Inverse)。此外,還為標準知識圖譜定義了一些公理規(guī)則。
繼承關系,例如:
(代碼類)-[IS-A]->(條款類)
相反關系,例如:
規(guī)定關系和源自關系是相關關系;
規(guī)范性引用和被規(guī)范性引用是相反關系。
為了便于理解,用自然語言表達的相關基本規(guī)則:
規(guī)則1:規(guī)范性引用文件不能放在參考文獻。如果標準文獻1中技術條款被標準文獻2規(guī)范性引用,那么,標準文獻1不能出現(xiàn)在標準文獻2的參考文獻中。
規(guī)則2:代碼唯一性。如果標準文獻中的代碼1是信息實體1的代碼,那么,標準文獻中的代碼1不能作為信息實體2的代碼。
規(guī)則3:數(shù)據(jù)元標識符唯一性。如果標準文獻中的數(shù)據(jù)元1的標識符為A,那么數(shù)據(jù)元2的標識符不能為A。
規(guī)則4:數(shù)據(jù)元縮寫名合法性校驗。數(shù)據(jù)元縮寫名,或者英文名,經(jīng)常作為數(shù)據(jù)建模的實體名稱,一般應符合XML語法或其他機器語言的語法規(guī)則。數(shù)據(jù)元英文名稱或短名稱通常不宜出現(xiàn)特定字符,例如“?”、空格等。
規(guī)則5:英文術語大小寫規(guī)則。標準文獻中的英文術語指稱不用大寫。
規(guī)則6:縮略語大小寫規(guī)則??s略語用大寫,英文名稱首字母或相應的字母應大寫,其它字母小寫。
2.5 標準知識圖譜示例
課題組按照采用本體建模的方法,采用NEO4J的社區(qū)版作為開發(fā)工具,對某信息化數(shù)據(jù)標準進行了分析研究,提出了初步的標準知識圖譜構建的示例圖。分別從術語標準、元數(shù)據(jù)標準等做了示例,如圖5~6所示。
元數(shù)據(jù)標準知識圖譜示例如圖6所示。
3 總結和展望
本文面向智能制造領域數(shù)據(jù)標準的數(shù)字化轉型,提出了一種標準文獻及標準內容數(shù)字化轉型的方法。該方法采用本體建模方法,以知識圖譜技術為實現(xiàn)手段,符合ISO smart成熟度等級的三四級,即機器可解讀的內容、可解析的文檔的相關要求。但是,本文的不足之處在于,主要針對現(xiàn)有標準的數(shù)字化轉型提出的一種方法,還沒有完全實現(xiàn)最高等級的標準自決策的智能化水平。
參考文獻
[1]工業(yè)和信息化部 國家標準化管理委員會關于印發(fā)《國家智能制造標準體系建設指南(2021版)》的通知[Z/OL].(2021-11-17)[2023-05-16].http://www.gov.cn/zhengce/ zhengceku/2021-12/09/content_5659548.htm.
[2]國家標準化發(fā)展綱要[Z/OL].(2021-10-10)[2023-05-16]. http://www.gov.cn/zhengce/2021-10/10/content_5641727. htm.
[3]ISO Standardization Foresight Framework - Trend Report 2022[R/OL].[2023-05-16].https://www.iso.org/ publication/PUB100470.html.
[4]IEC、ISO. IEC/ISO SMART——Unleashing the digital power of international standards[EB/OL].[2023-05-16]. https://www.iso.org/smart.
[5]SCENARIOS FOR DIGITIZING STANDARDIZATION AND STANDARDS[R/OL]. DIN、DKE, 2021[2023-05-16].https://www.dke.de/de/normen-standards/normungstrategie/deutsche-normungsstrategie/idis.
[6]DIN and DKE make great progress in achieving digital standards and standardization[N/OL].(2022-05-31)[2023-05-16]. https://www.din.de/en/din-and-ourpartners/press/press-releases/din-and-dke-makegreat-progress-in-achieving-digital-standards-andstandardization-879458.
[7]Digital in Standards: supporting the Digital Transition through standardization[EB/OL].(2021-09-29)[2023-05-16].https://www.cencenelec.eu/news-and-events/ news/2021/publications/2021-09-29-digital-instandards/.
[8]GRUBER T R. A translation approach to portable ontology specifications[J/OL].Knowledge Acquisition,1993,5(2): 199-220.
[9]SINGHAL A. Introducing the knowledge graph: things, not strings[J/OL].[2023-05-16].https://www.blog.google/ products/search/introducing-knowledge-graph-things-not/.
[10]HOGAN A,BLOMQVIST E,COCHEZ M,et al.Knowledge graphs[J].ACM Computing Surveys,2021,54(4):1-37.
作者簡介
岳高峰,副研究員,研究方向為知識管理、工業(yè)數(shù)據(jù)、標準體系理論與方法等領域。
(責任編輯:張佩玉)