摘 要:知識(shí)圖譜技術(shù)是實(shí)現(xiàn)標(biāo)準(zhǔn)數(shù)字化、網(wǎng)絡(luò)化、智能化和知識(shí)化發(fā)展的關(guān)鍵核心技術(shù)。標(biāo)準(zhǔn)知識(shí)圖譜對(duì)標(biāo)準(zhǔn)數(shù)智化轉(zhuǎn)型而言至關(guān)重要,目前尚處于起步階段。本文從概念、應(yīng)用現(xiàn)狀、技術(shù)路徑、發(fā)展趨勢(shì)和典型應(yīng)用場(chǎng)景這五方面入手,梳理并總結(jié)了標(biāo)準(zhǔn)知識(shí)圖譜的重要概念,在深入分析其現(xiàn)狀后,結(jié)合標(biāo)準(zhǔn)的實(shí)際發(fā)展需求,提出標(biāo)準(zhǔn)知識(shí)圖譜的主要技術(shù)路徑和典型的應(yīng)用場(chǎng)景,探討了標(biāo)準(zhǔn)知識(shí)圖譜的理論基礎(chǔ)和未來前景,為相關(guān)工作者提供技術(shù)參考。
關(guān)鍵詞:標(biāo)準(zhǔn)知識(shí)圖譜,數(shù)智化,技術(shù)路徑
DOI編碼:10.3969/j.issn.1002-5944.2023.11.001
0 引 言
當(dāng)前社會(huì)正處于大數(shù)據(jù)、人工智能、物聯(lián)網(wǎng)等技術(shù)掀起的新一輪科技革命中,以知識(shí)智能為典型特征的技術(shù)浪潮正前所未有地改變著各行各業(yè)的生態(tài)面貌,數(shù)智化轉(zhuǎn)型成為各領(lǐng)域搶占戰(zhàn)略制高點(diǎn)和擺脫發(fā)展瓶頸的重要途徑,標(biāo)準(zhǔn)也不例外。加快推動(dòng)標(biāo)準(zhǔn)的數(shù)字化、網(wǎng)絡(luò)化、智能化和知識(shí)化轉(zhuǎn)型已逐漸成為標(biāo)準(zhǔn)領(lǐng)域的共識(shí)。作為知識(shí)智能的熱點(diǎn)方向和自然語言處理與理解的重要環(huán)節(jié),知識(shí)圖譜(Knowledge graph, KG)是實(shí)現(xiàn)標(biāo)準(zhǔn)數(shù)智化轉(zhuǎn)型的關(guān)鍵核心技術(shù)。目前標(biāo)準(zhǔn)知識(shí)圖譜的研究與應(yīng)用還處于起步階段,本文梳理并總結(jié)了標(biāo)準(zhǔn)知識(shí)圖譜的概念,分析了標(biāo)準(zhǔn)知識(shí)圖譜的應(yīng)用現(xiàn)狀,基于標(biāo)準(zhǔn)文本的特性提出了標(biāo)準(zhǔn)知識(shí)圖譜的技術(shù)路徑,在此基礎(chǔ)上結(jié)合標(biāo)準(zhǔn)文本的發(fā)展需要研判其發(fā)展趨勢(shì)并預(yù)設(shè)典型應(yīng)用場(chǎng)景,以期能為相關(guān)工作者提供一定的技術(shù)性參考。
1 標(biāo)準(zhǔn)知識(shí)圖譜的應(yīng)用現(xiàn)狀
1.1 標(biāo)準(zhǔn)知識(shí)圖譜的定義及相關(guān)概念
目前學(xué)界和工業(yè)界尚未對(duì)標(biāo)準(zhǔn)知識(shí)圖譜的定義取得統(tǒng)一的共識(shí)。澤連濤等人[1]將標(biāo)準(zhǔn)知識(shí)圖譜定義為基于標(biāo)準(zhǔn)文本數(shù)據(jù)的知識(shí)圖譜,由標(biāo)準(zhǔn)知識(shí)庫(kù)和推理搜索引擎組成。在楊躍翔等人[2]的研究中,標(biāo)準(zhǔn)知識(shí)圖譜被視為知識(shí)圖譜技術(shù)在標(biāo)準(zhǔn)文獻(xiàn)知識(shí)組織中的應(yīng)用。趙偉等人[3]認(rèn)為標(biāo)準(zhǔn)知識(shí)圖譜是用于揭示標(biāo)準(zhǔn)知識(shí)關(guān)聯(lián)性的領(lǐng)域知識(shí)圖譜。郝文建等人[4]對(duì)標(biāo)準(zhǔn)知識(shí)圖譜的概念進(jìn)行了較為深入的探索,將標(biāo)準(zhǔn)知識(shí)圖譜概括為源于標(biāo)準(zhǔn)數(shù)據(jù)和基于標(biāo)準(zhǔn)知識(shí)模型,經(jīng)抽取和鏈接知識(shí)要素所得的知識(shí)網(wǎng)絡(luò)。
綜上所述,本文對(duì)標(biāo)準(zhǔn)知識(shí)圖譜的概念做出以下界定:標(biāo)準(zhǔn)知識(shí)圖譜是領(lǐng)域知識(shí)圖譜在標(biāo)準(zhǔn)文獻(xiàn)領(lǐng)域的一大分支,它是以標(biāo)準(zhǔn)文本及相關(guān)數(shù)據(jù)為來源,經(jīng)由一定技術(shù)所形成的結(jié)構(gòu)化知識(shí)庫(kù),通過圖的形式組織和存儲(chǔ)標(biāo)準(zhǔn)知識(shí)。與其它類型的知識(shí)圖譜類似,標(biāo)準(zhǔn)知識(shí)圖譜在邏輯架構(gòu)上也可以劃分為模式層和數(shù)據(jù)層,其中數(shù)據(jù)層是用來存儲(chǔ)標(biāo)準(zhǔn)文本中大量知識(shí)的實(shí)例層,而模式層則是位于數(shù)據(jù)層之上的概念本體層,由類模式信息組成,用于存儲(chǔ)經(jīng)過提煉的標(biāo)準(zhǔn)知識(shí)。
1.2 標(biāo)準(zhǔn)知識(shí)圖譜的發(fā)展現(xiàn)狀分析
總體而言,當(dāng)前標(biāo)準(zhǔn)知識(shí)圖譜的研究還處于起步階段,尚未大規(guī)模投入應(yīng)用,在現(xiàn)階段整體呈現(xiàn)出以下特點(diǎn):
1.2.1 標(biāo)準(zhǔn)知識(shí)圖譜的理論體系尚未明晰
已有研究尚未在標(biāo)準(zhǔn)知識(shí)圖譜的定義和相關(guān)概念上取得一致的共識(shí),尤其是在涉及知識(shí)圖譜核心概念的實(shí)體和關(guān)系方面,現(xiàn)有的研究結(jié)論仍存在一定的爭(zhēng)議。部分研究嘗試對(duì)標(biāo)準(zhǔn)知識(shí)圖譜及其相關(guān)概念進(jìn)行明確的定義,但其實(shí)體的界定和命名方式與標(biāo)準(zhǔn)化領(lǐng)域約定俗成的專業(yè)術(shù)語存在較大的差異,例如澤連濤等人將標(biāo)準(zhǔn)號(hào)作為單獨(dú)的標(biāo)準(zhǔn)知識(shí)圖譜實(shí)體,并將其命名為“標(biāo)準(zhǔn)文件”,該實(shí)體的界定方式也與標(biāo)準(zhǔn)命名實(shí)體識(shí)別研究中的實(shí)體單元不同,后者更傾向于將標(biāo)準(zhǔn)要素視為多個(gè)標(biāo)準(zhǔn)實(shí)體的組合體。此外,由于標(biāo)準(zhǔn)知識(shí)圖譜研究和應(yīng)用的起步較晚,目前也尚未形成演化歷程供研究者分析。
1.2.2 標(biāo)準(zhǔn)知識(shí)圖譜的技術(shù)路線尚不成熟
目前標(biāo)準(zhǔn)知識(shí)圖譜的路徑研究多處于理論設(shè)想和初步探索階段。由于標(biāo)準(zhǔn)知識(shí)圖譜的構(gòu)建與數(shù)據(jù)質(zhì)量和信息抽取技術(shù)密切相關(guān),當(dāng)前我國(guó)標(biāo)準(zhǔn)文獻(xiàn)數(shù)字化程度較低的現(xiàn)狀已成為制約標(biāo)準(zhǔn)知識(shí)圖譜技術(shù)快速發(fā)展的重要因素。作為標(biāo)準(zhǔn)知識(shí)圖譜的重要基礎(chǔ),標(biāo)準(zhǔn)命名實(shí)體抽取和實(shí)體關(guān)系抽取研究仍存在大量的空白和不足,這導(dǎo)致了我國(guó)標(biāo)準(zhǔn)知識(shí)圖譜的相關(guān)研究只能停留在理論推演和小范圍探索的局面。目前只有少數(shù)研究團(tuán)隊(duì)探索了標(biāo)準(zhǔn)知識(shí)圖譜的構(gòu)建方式,且路線各異,未能形成規(guī)范化的模式投入大規(guī)模量產(chǎn)。郝文建等人在理論層面初步制定了標(biāo)準(zhǔn)知識(shí)圖譜的構(gòu)建流程和知識(shí)標(biāo)注模式,具體的落地方向還未明確。李臻等人[5]前瞻性地預(yù)設(shè)了構(gòu)建標(biāo)準(zhǔn)知識(shí)圖譜的關(guān)鍵技術(shù)和主要流程。楊躍翔等人基于XML標(biāo)準(zhǔn)標(biāo)簽集的拓展形式解析XML格式的標(biāo)準(zhǔn)文獻(xiàn),開展知識(shí)抽取,在自然災(zāi)害應(yīng)急國(guó)家標(biāo)準(zhǔn)領(lǐng)域?qū)崿F(xiàn)了標(biāo)準(zhǔn)知識(shí)圖譜的落地應(yīng)用。宋立博[6]根據(jù)標(biāo)準(zhǔn)文獻(xiàn)共性元素的結(jié)構(gòu)和編排特點(diǎn),通過文本切分的方式抽取生態(tài)環(huán)境標(biāo)準(zhǔn)中的信息,構(gòu)建生態(tài)環(huán)境標(biāo)準(zhǔn)知識(shí)圖譜。尹亮等人[7]采用IDEF3方法探索了裝備標(biāo)準(zhǔn)知識(shí)圖譜的構(gòu)建過程。近年來,深度學(xué)習(xí)技術(shù)開始逐漸在標(biāo)準(zhǔn)知識(shí)圖譜研究中興起。張鵬飛等人[8]采用BERTTCNN-LSTM模型構(gòu)建了綠色標(biāo)準(zhǔn)知識(shí)庫(kù)。呂東東等人[9]采用OREM-AF模型實(shí)現(xiàn)了農(nóng)產(chǎn)品標(biāo)準(zhǔn)的實(shí)體關(guān)系自動(dòng)抽取,在此基礎(chǔ)上形成了農(nóng)產(chǎn)品標(biāo)準(zhǔn)知識(shí)圖譜。楊鶴[10]基于雙重注意力機(jī)制構(gòu)建了在漁業(yè)領(lǐng)域開展標(biāo)準(zhǔn)知識(shí)圖譜的核心抽取技術(shù)探索。整體而言,基于深度學(xué)習(xí)的標(biāo)準(zhǔn)知識(shí)圖譜技術(shù)是近年來的研究熱點(diǎn),但與其它領(lǐng)域相比,基于深度學(xué)習(xí)和機(jī)器學(xué)習(xí)的標(biāo)準(zhǔn)文獻(xiàn)自動(dòng)化信息抽取技術(shù)尚未形成產(chǎn)品化的成果。
1.2.3 標(biāo)準(zhǔn)知識(shí)圖譜的信息和規(guī)模有限
現(xiàn)有的標(biāo)準(zhǔn)知識(shí)圖譜研究大多聚焦于標(biāo)準(zhǔn)共性元素,例如標(biāo)準(zhǔn)號(hào)、標(biāo)準(zhǔn)名稱、標(biāo)準(zhǔn)發(fā)布時(shí)間等要素[11],少數(shù)研究關(guān)注面向重點(diǎn)領(lǐng)域產(chǎn)業(yè)的標(biāo)準(zhǔn)知識(shí)圖譜應(yīng)用,且目前的應(yīng)用領(lǐng)域均為相對(duì)小眾的產(chǎn)業(yè),尚未涉及我國(guó)重點(diǎn)領(lǐng)域的產(chǎn)業(yè)體系。標(biāo)準(zhǔn)是社會(huì)經(jīng)濟(jì)發(fā)展的重要技術(shù)支撐,與產(chǎn)業(yè)結(jié)合是標(biāo)準(zhǔn)發(fā)揮自身效益的必由之路。由此可見,當(dāng)前標(biāo)準(zhǔn)知識(shí)圖譜的信息不夠全面,在數(shù)據(jù)規(guī)模上也存在明顯的局限性。
2 標(biāo)準(zhǔn)知識(shí)圖譜的技術(shù)路徑
2.1 標(biāo)準(zhǔn)知識(shí)圖譜的構(gòu)建方式
當(dāng)前知識(shí)圖譜的構(gòu)建方式主要包括自上而下(Top-down)、自下而上(Bottom-up)和混合方式。在以往的研究中,通用型知識(shí)圖譜大多采用自下而上的方式搭建,而專用型知識(shí)圖譜則更多采用自下而上的方式搭建。近年來,越來越多的研究開始關(guān)注混合模式下的知識(shí)圖譜構(gòu)建方式,通過“小步快跑、快速迭代”的方式探索構(gòu)建知識(shí)圖譜的合理路徑[12]。作為領(lǐng)域知識(shí)圖譜在標(biāo)準(zhǔn)文獻(xiàn)領(lǐng)域的應(yīng)用,標(biāo)準(zhǔn)知識(shí)圖譜宜采用混合方式構(gòu)建,可采用自上而下的方式搭建標(biāo)準(zhǔn)知識(shí)圖譜的模式層,以自下而上的方式半自動(dòng)化地搭建標(biāo)準(zhǔn)知識(shí)圖譜的數(shù)據(jù)層。
2.2 標(biāo)準(zhǔn)知識(shí)圖譜的技術(shù)架構(gòu)
與其它領(lǐng)域的知識(shí)圖譜類似,標(biāo)準(zhǔn)知識(shí)圖譜的構(gòu)建是一個(gè)系統(tǒng)性工程。一個(gè)完整的標(biāo)準(zhǔn)知識(shí)圖譜構(gòu)建流程涉及多個(gè)環(huán)節(jié),主要包括標(biāo)準(zhǔn)數(shù)據(jù)的獲取、抽取、存儲(chǔ)和應(yīng)用等,其主要的技術(shù)架構(gòu)如圖1所示。
2.2.1 標(biāo)準(zhǔn)知識(shí)表示
標(biāo)準(zhǔn)知識(shí)表示是標(biāo)準(zhǔn)知識(shí)圖譜構(gòu)建的重要基礎(chǔ)性工作,其目的在于將標(biāo)準(zhǔn)文獻(xiàn)中的知識(shí)轉(zhuǎn)化為計(jì)算機(jī)語言理解的結(jié)構(gòu)化形式[13]。知識(shí)表示歷來是人工智能領(lǐng)域的核心問題之一。標(biāo)準(zhǔn)知識(shí)表示需遵循可處理模糊性知識(shí)、達(dá)到機(jī)器可讀水平和具有可供后續(xù)知識(shí)擴(kuò)充的模塊結(jié)構(gòu)等基本原則。目前知識(shí)表示主要有基于網(wǎng)絡(luò)的方法、基于邏輯的方法和基于分布式表示的方法。
2.2.2 標(biāo)準(zhǔn)知識(shí)建模
標(biāo)準(zhǔn)知識(shí)建模是構(gòu)建標(biāo)準(zhǔn)知識(shí)圖譜模式層的重要基礎(chǔ),包括知識(shí)獲取和知識(shí)結(jié)構(gòu)化兩大步驟,旨在確定知識(shí)范圍后構(gòu)建機(jī)器可解釋的知識(shí)模型,對(duì)標(biāo)準(zhǔn)知識(shí)圖譜的效益發(fā)揮至關(guān)重要[14]。在知識(shí)建模方法中,基于本體構(gòu)建的技術(shù)適用于數(shù)據(jù)范圍相對(duì)較小的領(lǐng)域知識(shí)圖譜,目前七步法是本體構(gòu)建中最為常見的知識(shí)建模方法,具有步驟清晰、實(shí)踐性強(qiáng)等優(yōu)點(diǎn),適合被應(yīng)用于標(biāo)準(zhǔn)知識(shí)圖譜的本體構(gòu)建。
2.2.3 標(biāo)準(zhǔn)知識(shí)抽取
標(biāo)準(zhǔn)知識(shí)抽取是構(gòu)建標(biāo)準(zhǔn)知識(shí)圖譜數(shù)據(jù)層的重要基礎(chǔ)。知識(shí)抽取隸屬于信息抽?。↖nformationExtraction, IE)技術(shù),被視為知識(shí)圖譜構(gòu)建的首要任務(wù),其目的在于從多源異構(gòu)數(shù)據(jù)中抽取構(gòu)建知識(shí)圖譜所需的實(shí)體、關(guān)系以及實(shí)體屬性等關(guān)鍵信息。知識(shí)抽取主要包括實(shí)體抽取、關(guān)系抽取、事件或片段抽取、屬性抽取等子任務(wù),其中又以實(shí)體抽取和關(guān)系抽取最為核心[15-17]。知識(shí)抽取的具體技術(shù)方案需根據(jù)數(shù)據(jù)的結(jié)構(gòu)化程度而定。標(biāo)準(zhǔn)文本是具有明確編寫格式的非結(jié)構(gòu)化技術(shù)文本,可采用基于規(guī)則和深度學(xué)習(xí)相結(jié)合的方法實(shí)現(xiàn)標(biāo)準(zhǔn)知識(shí)抽取。
2.2.4 標(biāo)準(zhǔn)知識(shí)融合
標(biāo)準(zhǔn)知識(shí)融合(Standard Knowledge Fusion,SKF)是消除標(biāo)準(zhǔn)知識(shí)歧義性、提高標(biāo)準(zhǔn)知識(shí)準(zhǔn)確性的關(guān)鍵環(huán)節(jié),通過高層次的知識(shí)組織方式將來自于不同知識(shí)源的知識(shí)在同一個(gè)框架下經(jīng)沖突檢測(cè)和一致性檢查后整合成結(jié)構(gòu)化知識(shí)庫(kù)[18]。在標(biāo)準(zhǔn)知識(shí)圖譜的不同層級(jí),作為一個(gè)多源異構(gòu)特點(diǎn)的結(jié)構(gòu)化知識(shí)庫(kù),需要在不同層級(jí)上對(duì)標(biāo)準(zhǔn)知識(shí)圖譜開展知識(shí)融合。在標(biāo)準(zhǔn)知識(shí)圖譜的模式層,可采用本體匹配來發(fā)現(xiàn)異構(gòu)本體之間的匹配關(guān)系,而在標(biāo)準(zhǔn)知識(shí)圖譜的數(shù)據(jù)層,知識(shí)融合的任務(wù)主要集中于實(shí)體對(duì)齊(Entity Alignment, EA)、實(shí)體消歧(EntityDisambiguation, ED)、實(shí)體鏈接、關(guān)系對(duì)齊等[19],近年來基于深度學(xué)習(xí)的算法逐漸成為知識(shí)融合在數(shù)據(jù)層的主流技術(shù),標(biāo)準(zhǔn)知識(shí)融合同樣也可借鑒此類技術(shù)思路。
2.2.5 標(biāo)準(zhǔn)知識(shí)推理
標(biāo)準(zhǔn)知識(shí)推理是根據(jù)標(biāo)準(zhǔn)知識(shí)圖譜中已有知識(shí)推測(cè)出隱含知識(shí)或識(shí)別錯(cuò)誤知識(shí)從而對(duì)標(biāo)準(zhǔn)知識(shí)進(jìn)行糾錯(cuò)和補(bǔ)全的過程[20]。根據(jù)推理的性質(zhì),又可將標(biāo)準(zhǔn)知識(shí)推理分為標(biāo)準(zhǔn)知識(shí)圖譜補(bǔ)全和標(biāo)準(zhǔn)知識(shí)圖譜去噪,主要的方法包括基于邏輯、基于關(guān)系路徑、基于統(tǒng)計(jì)、基于知識(shí)表示和基于分布式表示學(xué)習(xí)的技術(shù)。目前標(biāo)準(zhǔn)知識(shí)推理研究尚存在大量空白,可根據(jù)標(biāo)準(zhǔn)知識(shí)圖譜的數(shù)據(jù)現(xiàn)狀選取最適宜的標(biāo)準(zhǔn)知識(shí)推理方法。
2.2.6 標(biāo)準(zhǔn)知識(shí)更新
標(biāo)準(zhǔn)文本數(shù)據(jù)更新較快,靜態(tài)知識(shí)圖譜的管理模式已無法滿足標(biāo)準(zhǔn)文本數(shù)據(jù)日益增長(zhǎng)的發(fā)展需要。標(biāo)準(zhǔn)知識(shí)更新(Standard Knowledge Update,SKU )能實(shí)現(xiàn)標(biāo)準(zhǔn)知識(shí)圖譜全生命周期管理的關(guān)鍵。已有研究認(rèn)為知識(shí)更新需要綜合考慮多個(gè)因素,包括時(shí)序、頻率、準(zhǔn)確率等。目前已形成三種主要的知識(shí)更新機(jī)制,分別為全面更新、周期更新和增量更新。研究者可根據(jù)實(shí)際應(yīng)用需求選擇最適宜的標(biāo)準(zhǔn)知識(shí)更新機(jī)制。
3 標(biāo)準(zhǔn)知識(shí)圖譜的應(yīng)用場(chǎng)景及發(fā)展趨勢(shì)研判
3.1 標(biāo)準(zhǔn)知識(shí)圖譜的應(yīng)用場(chǎng)景預(yù)設(shè)
標(biāo)準(zhǔn)知識(shí)圖譜能夠?yàn)闃?biāo)準(zhǔn)文獻(xiàn)提供更為高效準(zhǔn)確的數(shù)據(jù)檢索、治理和存儲(chǔ)方式,促使標(biāo)準(zhǔn)文獻(xiàn)向智能化和知識(shí)化方向發(fā)展。結(jié)合標(biāo)準(zhǔn)文獻(xiàn)的發(fā)展需求和知識(shí)圖譜技術(shù)的主要功能,本文預(yù)設(shè)了以下標(biāo)準(zhǔn)知識(shí)圖譜的典型應(yīng)用場(chǎng)景,為相關(guān)工作者提供一定的參考。
3.1.1 標(biāo)準(zhǔn)智能檢索與推薦
縱觀已有的標(biāo)準(zhǔn)文獻(xiàn)信息服務(wù)平臺(tái),大多只能提供基于標(biāo)準(zhǔn)號(hào)、標(biāo)準(zhǔn)名稱、分類號(hào)等標(biāo)準(zhǔn)共性元素的簡(jiǎn)單信息檢索,對(duì)于用戶所輸入的關(guān)鍵詞尚無法進(jìn)行深度的關(guān)聯(lián)性文本加工,導(dǎo)致了現(xiàn)階段標(biāo)準(zhǔn)文獻(xiàn)的檢索友好度不夠高、檢索速度不夠快,致使缺乏經(jīng)驗(yàn)的用戶無法在短時(shí)間內(nèi)實(shí)現(xiàn)標(biāo)準(zhǔn)文獻(xiàn)的精確檢索。融入標(biāo)準(zhǔn)知識(shí)圖譜的標(biāo)準(zhǔn)智能檢索能夠?yàn)橛脩籼峁z索關(guān)鍵詞的相關(guān)重要信息,根據(jù)標(biāo)準(zhǔn)知識(shí)圖譜提供關(guān)鍵詞的關(guān)聯(lián)信息,由此在提高用戶的標(biāo)準(zhǔn)文獻(xiàn)檢索精確度和推薦準(zhǔn)確度的基礎(chǔ)上提高用戶的體驗(yàn)感。
3.1.2 標(biāo)準(zhǔn)客服智能問答
問答和對(duì)話系統(tǒng)歷來是知識(shí)圖譜的典型應(yīng)用場(chǎng)景之一,已在電子商務(wù)、醫(yī)療問診等領(lǐng)域投入大規(guī)模的使用[21],但在標(biāo)準(zhǔn)文獻(xiàn)領(lǐng)域還存在大量的應(yīng)用空白。目前的標(biāo)準(zhǔn)文獻(xiàn)服務(wù)高度依賴人工問答的模式,以標(biāo)準(zhǔn)知識(shí)圖譜為基礎(chǔ)的標(biāo)準(zhǔn)智能問答系統(tǒng)能夠接受用戶的自然提問,通過查找和推理標(biāo)準(zhǔn)知識(shí)圖譜來獲取用戶所需的精確答案,將在標(biāo)準(zhǔn)知識(shí)服務(wù)中逐漸成為問答和對(duì)話系統(tǒng)的主流模式。
3.1.3 標(biāo)準(zhǔn)用戶畫像
用戶畫像是根據(jù)用戶的人口學(xué)特征、消費(fèi)動(dòng)態(tài)和歷史行為特征等綜合形成的標(biāo)簽化模型[22]。近年來,知識(shí)圖譜技術(shù)開始滲入用戶畫像領(lǐng)域,誕生了用戶畫像知識(shí)圖譜研究,以企業(yè)用戶畫像和產(chǎn)品畫像知識(shí)圖譜為代表的用戶個(gè)性化推薦應(yīng)用已在金融行業(yè)取得了良好的效果[23]。與金融行業(yè)類似,標(biāo)準(zhǔn)文獻(xiàn)領(lǐng)域同樣存在大量的企業(yè)用戶和專業(yè)產(chǎn)品,基于標(biāo)準(zhǔn)知識(shí)圖譜的標(biāo)準(zhǔn)用戶畫像有助于標(biāo)準(zhǔn)化服務(wù)人員及時(shí)掌握用戶的需求,從而根據(jù)用戶的實(shí)際情況實(shí)現(xiàn)更精準(zhǔn)的動(dòng)態(tài)智能服務(wù)和個(gè)性化推薦[24]。
3.1.4 標(biāo)準(zhǔn)編寫輔助
標(biāo)準(zhǔn)是遵循明確編寫格式的技術(shù)性文本,通常由標(biāo)準(zhǔn)對(duì)象的專家和標(biāo)準(zhǔn)化專業(yè)從業(yè)人員參與制修訂,專家群體的標(biāo)準(zhǔn)化經(jīng)驗(yàn)不一,因不熟悉標(biāo)準(zhǔn)文獻(xiàn)的用語體系和編寫規(guī)則而導(dǎo)致部分標(biāo)準(zhǔn)表述不夠嚴(yán)謹(jǐn)、可讀性不強(qiáng)等問題?;跇?biāo)準(zhǔn)知識(shí)圖譜所開發(fā)的標(biāo)準(zhǔn)編寫平臺(tái)能夠有助于標(biāo)準(zhǔn)編寫者快速查詢標(biāo)準(zhǔn)制修訂的規(guī)則、檢查內(nèi)容的沖突、獲取引用文件的信息,進(jìn)而大幅提高編寫者的標(biāo)準(zhǔn)編寫質(zhì)量,有效降低審查和評(píng)定者的工作成本。
3.1.5 標(biāo)準(zhǔn)查新輔助
標(biāo)準(zhǔn)查新是科技查新在標(biāo)準(zhǔn)領(lǐng)域的一大分支,由標(biāo)準(zhǔn)化工作人員根據(jù)委托者的需求,依托權(quán)威的標(biāo)準(zhǔn)信息數(shù)據(jù)來源,基于標(biāo)準(zhǔn)檢索和調(diào)研方法對(duì)查新點(diǎn)的新穎性做出綜合分析和審查判斷[25],已成為打造標(biāo)準(zhǔn)信息服務(wù)競(jìng)爭(zhēng)力的重要知識(shí)產(chǎn)品。當(dāng)前標(biāo)準(zhǔn)查新服務(wù)的質(zhì)量與查新者的主觀判斷密切相關(guān),其效率和精準(zhǔn)率也受限于人工查詢的模式,已日益無法滿足標(biāo)準(zhǔn)數(shù)據(jù)快速發(fā)展的需要。近年來,部分研究者開始探索快速標(biāo)準(zhǔn)查新的方法,提升標(biāo)準(zhǔn)查新的自動(dòng)化水平。聶旭和陳燕林[26]以檢驗(yàn)檢測(cè)標(biāo)準(zhǔn)為例,提出了通過計(jì)算機(jī)編程來提高標(biāo)準(zhǔn)查新效率的技術(shù)。鑒于此,開發(fā)基于標(biāo)準(zhǔn)知識(shí)圖譜的標(biāo)準(zhǔn)查新輔助工具將為標(biāo)準(zhǔn)查新工作提供更為客觀的判斷依據(jù),也能顯著提高標(biāo)準(zhǔn)查新的工作效率和精準(zhǔn)性,從而有效突破標(biāo)準(zhǔn)查新的瓶頸性問題。
3.1.6 標(biāo)準(zhǔn)科技咨詢
標(biāo)準(zhǔn)是重要的基礎(chǔ)性戰(zhàn)略資源,構(gòu)建以標(biāo)準(zhǔn)知識(shí)圖譜為基礎(chǔ)的標(biāo)準(zhǔn)大數(shù)據(jù)平臺(tái)將成為標(biāo)準(zhǔn)知識(shí)服務(wù)的必然選擇。新一代的標(biāo)準(zhǔn)大數(shù)據(jù)平臺(tái)將基于標(biāo)準(zhǔn)數(shù)據(jù),打造標(biāo)準(zhǔn)輔助決策、支撐科創(chuàng)、服務(wù)產(chǎn)業(yè)的全新范式。在產(chǎn)業(yè)發(fā)展上,面向重點(diǎn)領(lǐng)域產(chǎn)業(yè)的標(biāo)準(zhǔn)知識(shí)圖譜能有助于相關(guān)從業(yè)者快速而準(zhǔn)確地分析產(chǎn)業(yè)發(fā)展現(xiàn)狀,分析產(chǎn)業(yè)鏈標(biāo)準(zhǔn)化的優(yōu)勢(shì)、空缺和短板,明確產(chǎn)業(yè)鏈的標(biāo)準(zhǔn)研制需求和標(biāo)準(zhǔn)體系的完善方向,從而通過標(biāo)準(zhǔn)化手段為產(chǎn)業(yè)縱向發(fā)展深度賦能。在企業(yè)發(fā)展上,標(biāo)準(zhǔn)知識(shí)圖譜能夠幫助企業(yè)快速掌握核心業(yè)務(wù)所需的標(biāo)準(zhǔn)要點(diǎn),包括國(guó)內(nèi)外標(biāo)準(zhǔn)研制情況、重要的標(biāo)準(zhǔn)技術(shù)性指標(biāo)等,同時(shí)也能為企業(yè)構(gòu)建自身的企業(yè)標(biāo)準(zhǔn)體系提供技術(shù)參考。
3.2 標(biāo)準(zhǔn)知識(shí)圖譜的發(fā)展趨勢(shì)
結(jié)合標(biāo)準(zhǔn)知識(shí)圖譜的應(yīng)用現(xiàn)狀和發(fā)展需求,從數(shù)據(jù)基礎(chǔ)、構(gòu)建技術(shù)和應(yīng)用方向這三方面對(duì)標(biāo)準(zhǔn)知識(shí)圖譜的發(fā)展趨勢(shì)做出如下研判。
3.2.1 標(biāo)準(zhǔn)知識(shí)圖譜的數(shù)據(jù)基礎(chǔ)發(fā)展趨勢(shì)
標(biāo)準(zhǔn)文本數(shù)據(jù)是標(biāo)準(zhǔn)知識(shí)圖譜的重要數(shù)據(jù)來源,其質(zhì)量的提升對(duì)標(biāo)準(zhǔn)知識(shí)圖譜的構(gòu)建至關(guān)重要[27]。當(dāng)前我國(guó)國(guó)內(nèi)標(biāo)準(zhǔn)仍處于紙質(zhì)為主、電子為輔的局面,處于機(jī)器可讀標(biāo)準(zhǔn)的初級(jí)階段。標(biāo)準(zhǔn)文本數(shù)據(jù)需經(jīng)由人工協(xié)作的OCR模式獲取,在現(xiàn)有技術(shù)框架下存在一定的誤差率。隨著標(biāo)準(zhǔn)數(shù)字化、網(wǎng)絡(luò)化和知識(shí)化轉(zhuǎn)型的推進(jìn),標(biāo)準(zhǔn)文獻(xiàn)的數(shù)字文本基礎(chǔ)將進(jìn)一步夯實(shí),標(biāo)準(zhǔn)知識(shí)圖譜的數(shù)據(jù)基礎(chǔ)也將逐漸向數(shù)字化方向發(fā)展。與此同時(shí),標(biāo)準(zhǔn)知識(shí)圖譜作為標(biāo)準(zhǔn)數(shù)智化的核心驅(qū)動(dòng)力也將進(jìn)一步反哺標(biāo)準(zhǔn)的數(shù)智化發(fā)展,成為機(jī)器可讀標(biāo)準(zhǔn)的重要載體[28],與標(biāo)準(zhǔn)數(shù)智化轉(zhuǎn)型構(gòu)成相輔相成的關(guān)系。
3.2.2 標(biāo)準(zhǔn)知識(shí)圖譜的構(gòu)建技術(shù)發(fā)展趨勢(shì)
隨著大數(shù)據(jù)和人工智能技術(shù)的發(fā)展,標(biāo)準(zhǔn)知識(shí)圖譜構(gòu)建方式的自動(dòng)化程度將逐步提升,基于機(jī)器學(xué)習(xí)和深度學(xué)習(xí)相結(jié)合的技術(shù)將逐漸成為標(biāo)準(zhǔn)知識(shí)圖譜構(gòu)建技術(shù)的主流方法。與傳統(tǒng)的人工模式相比,基于機(jī)器學(xué)習(xí)和深度學(xué)習(xí)相結(jié)合的構(gòu)建模式更適用于大規(guī)模標(biāo)準(zhǔn)文本數(shù)據(jù),在特征工程上極大地節(jié)省了人力,在模型遷移性上也表現(xiàn)更為優(yōu)異,能夠滿足大數(shù)據(jù)環(huán)境下數(shù)字標(biāo)準(zhǔn)快速發(fā)展的時(shí)代需要。
3.2.3 標(biāo)準(zhǔn)知識(shí)圖譜的應(yīng)用方向發(fā)展趨勢(shì)
標(biāo)準(zhǔn)知識(shí)圖譜能夠?qū)?biāo)準(zhǔn)知識(shí)合理組織、挖掘并可視化呈現(xiàn)。作為知識(shí)管理和發(fā)現(xiàn)的重要方式,標(biāo)準(zhǔn)知識(shí)圖譜將創(chuàng)新市場(chǎng)監(jiān)管的科技手段、豐富市場(chǎng)監(jiān)管的科技箱,其應(yīng)用方向?qū)⒃谝韵聝煞矫嫔钊氚l(fā)展。
(1)改善標(biāo)準(zhǔn)數(shù)據(jù)管理
在步入大數(shù)據(jù)時(shí)代后,標(biāo)準(zhǔn)數(shù)據(jù)管理體系也面臨全新的挑戰(zhàn)和機(jī)遇。與傳統(tǒng)的關(guān)系型數(shù)據(jù)庫(kù)相比,存儲(chǔ)標(biāo)準(zhǔn)知識(shí)圖譜數(shù)據(jù)的圖數(shù)據(jù)庫(kù)被業(yè)內(nèi)人士稱為“大數(shù)據(jù)時(shí)代的高鐵”,在關(guān)系網(wǎng)處理、應(yīng)用范圍和模型簡(jiǎn)易性上都享有明顯的優(yōu)勢(shì)。標(biāo)準(zhǔn)知識(shí)圖譜能夠催生標(biāo)準(zhǔn)數(shù)據(jù)管理由扁平式的關(guān)系型數(shù)據(jù)邁向多元鏈接的開放式形式,更有利于打通不同類型標(biāo)準(zhǔn)數(shù)據(jù)的孤島,挖掘隱藏的信息,提高并發(fā)數(shù)據(jù)處理的效率。
(2)與垂直領(lǐng)域相結(jié)合
標(biāo)準(zhǔn)是融合科技創(chuàng)新鏈與產(chǎn)業(yè)發(fā)展鏈的關(guān)鍵橋梁,被視為加快新技術(shù)產(chǎn)業(yè)化步伐的重要助推劑。產(chǎn)業(yè)標(biāo)準(zhǔn)知識(shí)圖譜是標(biāo)準(zhǔn)知識(shí)圖譜與特定垂直領(lǐng)域相結(jié)合的應(yīng)用成果。面向重點(diǎn)產(chǎn)業(yè)體系的產(chǎn)業(yè)知識(shí)圖譜能促進(jìn)相關(guān)企業(yè)的標(biāo)準(zhǔn)化建設(shè)工作,為我國(guó)重點(diǎn)領(lǐng)域產(chǎn)業(yè)鏈的數(shù)據(jù)分析、標(biāo)準(zhǔn)體系構(gòu)建和相關(guān)決策提供支撐。以政府監(jiān)管和服務(wù)流程為應(yīng)用對(duì)象的標(biāo)準(zhǔn)知識(shí)圖譜能夠優(yōu)化流程的組織和呈現(xiàn)模式,通過打造“智慧標(biāo)準(zhǔn)”助力“智慧政府”,在“一網(wǎng)通辦”“一網(wǎng)監(jiān)管”等場(chǎng)景中或?qū)l(fā)揮提效的作用。
(3)優(yōu)化標(biāo)準(zhǔn)知識(shí)服務(wù)
近年來,標(biāo)準(zhǔn)文獻(xiàn)信息服務(wù)的知識(shí)化進(jìn)程獲得研究者關(guān)注[29]。標(biāo)準(zhǔn)知識(shí)服務(wù)是標(biāo)準(zhǔn)信息服務(wù)在數(shù)字經(jīng)濟(jì)時(shí)代的發(fā)展目標(biāo)。標(biāo)準(zhǔn)知識(shí)圖譜是標(biāo)準(zhǔn)知識(shí)服務(wù)的關(guān)鍵核心技術(shù),能為標(biāo)準(zhǔn)知識(shí)服務(wù)的多項(xiàng)重要功能提供必要的技術(shù)支撐,例如優(yōu)化標(biāo)準(zhǔn)智能搜索引擎、生成用戶個(gè)性化推薦等。
4 結(jié) 語
標(biāo)準(zhǔn)知識(shí)圖譜是標(biāo)準(zhǔn)數(shù)智化轉(zhuǎn)型的關(guān)鍵環(huán)節(jié)之一,未來將在標(biāo)準(zhǔn)知識(shí)服務(wù)、標(biāo)準(zhǔn)數(shù)據(jù)管理、標(biāo)準(zhǔn)智能編寫等方面發(fā)揮重要的技術(shù)性支撐作用。本文系統(tǒng)梳理了標(biāo)準(zhǔn)知識(shí)圖譜的發(fā)展現(xiàn)狀,提出了具有一定可操作性的構(gòu)建路徑并預(yù)設(shè)了若干典型應(yīng)用場(chǎng)景,在后續(xù)研究中將在戰(zhàn)略性新興產(chǎn)業(yè)中選取應(yīng)用落地的垂直領(lǐng)域,驗(yàn)證并調(diào)整標(biāo)準(zhǔn)知識(shí)圖譜技術(shù)路線的具體方案。
參考文獻(xiàn)
連澤濤,蔡毅,任浩鵬.標(biāo)準(zhǔn)知識(shí)圖譜構(gòu)建與推薦算法[J].信息技術(shù)與標(biāo)準(zhǔn)化,2022(10):47-50.
楊躍翔,涂新雨,劉文玲.標(biāo)準(zhǔn)文獻(xiàn)知識(shí)圖譜構(gòu)建與應(yīng)用研究[J].數(shù)字圖書館論壇,2022(6):22-30.
趙偉,張覽,望俊成.標(biāo)準(zhǔn)文獻(xiàn)知識(shí)圖譜構(gòu)建的模型設(shè)計(jì)與集成方法[J].情報(bào)工程,2021,7(6):58-66.
郝文建,魏梅,張浩,等.標(biāo)準(zhǔn)知識(shí)圖譜的構(gòu)建與應(yīng)用[J].信息技術(shù)與標(biāo)準(zhǔn)化,2021(8):44-47.
李臻,劉彥林,馬小雯,等.基于標(biāo)準(zhǔn)知識(shí)圖譜構(gòu)建前瞻性研究[J].標(biāo)準(zhǔn)科學(xué),2021(12):63-68.
宋立博. 生態(tài)環(huán)境標(biāo)準(zhǔn)圖譜構(gòu)建研究[D].哈爾濱:哈爾濱工業(yè)大學(xué),2020.
尹亮,何明利,謝文波,等.裝備-標(biāo)準(zhǔn)知識(shí)圖譜的過程建模研究[J].計(jì)算機(jī)科學(xué),2018,45(S1):502-505.
張鵬飛,袁志祥,鮑威,等.面向綠色標(biāo)準(zhǔn)的知識(shí)圖譜構(gòu)建方法的應(yīng)用研究[J].標(biāo)準(zhǔn)科學(xué),2020(6):68-73.
呂東東,陳俊華,毛典輝,等.農(nóng)產(chǎn)品標(biāo)準(zhǔn)領(lǐng)域知識(shí)圖譜實(shí)體關(guān)系抽取及關(guān)聯(lián)性分析[J].農(nóng)業(yè)工程學(xué)報(bào),2022,38(9):315-323.
楊鶴. 面向漁業(yè)標(biāo)準(zhǔn)知識(shí)圖譜構(gòu)建的實(shí)體識(shí)別與關(guān)系抽取[D].大連:大連海洋大學(xué),2022.
張慧,侯霞.基于知識(shí)圖譜的標(biāo)準(zhǔn)文獻(xiàn)分析[J].計(jì)算機(jī)工程與設(shè)計(jì),2017,38(4):1103-1109.
付雷杰,曹巖,白瑀,等.國(guó)內(nèi)垂直領(lǐng)域知識(shí)圖譜發(fā)展現(xiàn)狀與展望[J].計(jì)算機(jī)應(yīng)用研究,2021,38(11):3201-3214..
田玲,張謹(jǐn)川,張晉豪,等.知識(shí)圖譜綜述——表示、構(gòu)建、推理與知識(shí)超圖理論[J].計(jì)算機(jī)應(yīng)用,2021,41(8):2161-2186.
欒瑞鵬,張靜,劉立坤.面向裝備試驗(yàn)鑒定領(lǐng)域數(shù)據(jù)治理的知識(shí)圖譜本體構(gòu)建[J/OL].(2022-12-29) [2023-03-02]系統(tǒng)工程與電子技術(shù):1-10.http://kns.cnki.net/kcms/detail/11.2422.TN.20221228.2006.024.html.
董美,常志軍.一種面向中醫(yī)領(lǐng)域科技文獻(xiàn)的實(shí)體關(guān)系抽取方法[J].圖書情報(bào)工作,2022,66(18):105-113.
李代祎,李忠良,嚴(yán)麗.一種面向中文的實(shí)體關(guān)系聯(lián)合抽取方法研究[J].小型微型計(jì)算機(jī)系統(tǒng),2022,43(12):2479-2486.
范媛媛,李忠民.中文醫(yī)學(xué)知識(shí)圖譜研究及應(yīng)用進(jìn)展[J].計(jì)算機(jī)科學(xué)與探索,2022,16(10):2219-2233.
杭婷婷,馮鈞,陸佳民.知識(shí)圖譜構(gòu)建技術(shù):分類、調(diào)查和未來方向[J].計(jì)算機(jī)科學(xué),2021,48(2):175-189.
張富,楊琳艷,李健偉,等.實(shí)體對(duì)齊研究綜述[ J ] .計(jì)算機(jī)學(xué)報(bào),2022,45(6):1195-1225.
官賽萍,靳小龍,賈巖濤,等.面向知識(shí)圖譜的知識(shí)推理研究進(jìn)展[J].軟件學(xué)報(bào),2018,29(10):2966-2994.
翟姍姍,胡畔,潘英增,等.融合知識(shí)圖譜與用戶病情畫像的在線醫(yī)療社區(qū)場(chǎng)景化信息推薦研究[J].情報(bào)科學(xué),2021,39(5):97-105.余傳明,田鑫,郭亞靜,等.基于行為-內(nèi)容融合模型的用戶畫像研究[J].圖書情報(bào)工作,2018,62(13):54-63.
王杰,謝忠局,趙建濤,等.基于知識(shí)圖譜和用戶畫像的金融產(chǎn)品推薦系統(tǒng)[J].計(jì)算機(jī)應(yīng)用,2022,42(S1):43-47.
王一禾,呂千千,祝賀.標(biāo)準(zhǔn)數(shù)字化轉(zhuǎn)型關(guān)鍵技術(shù)及其應(yīng)用分析[J].信息技術(shù)與標(biāo)準(zhǔn)化,2022(10):51-55+59.
趙青青,顧曉虹.淺析知識(shí)經(jīng)濟(jì)時(shí)代的標(biāo)準(zhǔn)查新工作[J].中國(guó)標(biāo)準(zhǔn)化,2021(7):101-104.
聶旭,陳燕林.利用計(jì)算機(jī)編程對(duì)檢驗(yàn)檢測(cè)標(biāo)準(zhǔn)進(jìn)行快速查新[C]//.中國(guó)水利學(xué)會(huì)2021學(xué)術(shù)年會(huì)論文集第三分冊(cè),2021:295-297.
李翔宇,傅田,潘鑫,等.標(biāo)準(zhǔn)數(shù)字化在航空行業(yè)應(yīng)用探索與實(shí)踐[J].信息技術(shù)與標(biāo)準(zhǔn)化,2022(10):68-72+78.
穆天楊,陳華達(dá),楊玉婷,等.知識(shí)圖譜技術(shù)在機(jī)器可讀標(biāo)準(zhǔn)中的應(yīng)用[J].信息技術(shù)與標(biāo)準(zhǔn)化,2022(10):56-59.
丁恒,陸偉.標(biāo)準(zhǔn)文獻(xiàn)知識(shí)服務(wù)系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[J].現(xiàn)代圖書情報(bào)技術(shù),2016(Z1):120-128.
作者簡(jiǎn)介
方思怡,碩士研究生,助理工程師,研究方向?yàn)闃?biāo)準(zhǔn)文獻(xiàn)數(shù)據(jù)挖掘與分析。
(責(zé)任編輯:張佩玉)