(北京機電工程研究所,北京 100074)
復(fù)雜產(chǎn)品研制過程技術(shù)含量高,多專業(yè)耦合復(fù)雜,蘊涵著大量的基礎(chǔ)科學和前沿技術(shù),研制過程中的每個業(yè)務(wù)活動都貫穿著設(shè)計經(jīng)驗、原理、規(guī)范等知識的處理、應(yīng)用與創(chuàng)新,是典型的技術(shù)密集、知識密集的復(fù)雜產(chǎn)品研制過程。在研制過程中,沉淀和積累了大量的研制案例、成功經(jīng)驗、設(shè)計方法等知識資源,這些知識以文檔、報告、模型或結(jié)構(gòu)化數(shù)據(jù)等方式廣泛存在于研發(fā)使用的各類信息系統(tǒng)中或富有經(jīng)驗的各領(lǐng)域?qū)<翌^腦中,知識來源不同,結(jié)構(gòu)各異。如何從各種系統(tǒng)中采集知識、從專家的頭腦中獲取知識并持續(xù)積累與更新,提高知識的重復(fù)利用率,是推動技術(shù)創(chuàng)新,提升產(chǎn)品研制效率與水平的關(guān)鍵。在此背景下,本文對復(fù)雜產(chǎn)品研發(fā)過程中的多源異構(gòu)知識獲取技術(shù)進行了深入研究與探討。
國外先進的航空航天企業(yè)較早開展了知識獲取、管理與應(yīng)用的研究實踐,從人員、過程和技術(shù)的角度出發(fā),以網(wǎng)絡(luò)、數(shù)據(jù)庫等信息技術(shù)作為手段,對產(chǎn)品研發(fā)知識進行了有效采集和統(tǒng)一管理,并在產(chǎn)品的創(chuàng)新設(shè)計、制造、維護等環(huán)節(jié)進行了應(yīng)用,從而提高產(chǎn)品研發(fā)創(chuàng)新程度、提高研發(fā)效率、降低研制成本。波音公司通過構(gòu)建實踐社區(qū)(Community of Practice)、知識管理Wiki等方式實現(xiàn)員工隱性知識的傳遞和共享,并征聘退休專家作為知識提供者,向波音提供人才培訓(xùn)、技術(shù)咨詢、第三方分析等知識服務(wù);同時,波音公司推出了知識管理平臺,以數(shù)字化方式為航空公司客戶提供產(chǎn)品研發(fā)、制造、維修、運營等方面的綜合數(shù)據(jù)查詢知識服務(wù),將歷史知識經(jīng)驗有效管理起來用于新產(chǎn)品的設(shè)計過程,在此支持下開發(fā)的波音777創(chuàng)造了波音公司歷史上最成功、無差錯的開發(fā)記錄[1]。NASA面向分布在全國的相關(guān)機構(gòu)和合作伙伴,推出研究和工程網(wǎng)(NREN,Research and Engineering Network),使得這些專家、工程師和研究人員能在一起協(xié)作,獲取到相關(guān)的工程資源,并重點記錄了不同型號任務(wù)、不同機構(gòu)和不同年份的相關(guān)經(jīng)驗教訓(xùn),方便工程師學習和借鑒,降低了知識的流失風險,為保持MSFC火箭推進系統(tǒng)設(shè)計的世界領(lǐng)先地位發(fā)揮了重要作用[2,3]。
知識管理已經(jīng)成為國內(nèi)各大軍工集團競相發(fā)展的領(lǐng)域,經(jīng)過二十多年的發(fā)展國內(nèi)軍工企業(yè)也取得了相當?shù)某煽儭F渲泻娇?01推出知識管理平臺,采集了老一輩科研人員的技術(shù)工作體會和經(jīng)驗及專業(yè)技術(shù)文件指南,收集了世界上各個國家三代以上戰(zhàn)斗機的有關(guān)設(shè)計資料,有效的積累了研發(fā)知識,促進了技術(shù)創(chuàng)新[4,5]。航天科工二院23所將近10個信息系統(tǒng)中的數(shù)據(jù)、信息資源處理整合成統(tǒng)一的索引格式,實現(xiàn)了跨系統(tǒng)知識采集與統(tǒng)一檢索,提升了技術(shù)人員知識獲取的快速性和準確性,為支撐復(fù)雜產(chǎn)品研發(fā)發(fā)揮了重要作用。
面向復(fù)雜產(chǎn)品研發(fā)的知識管理過程中,知識獲取是將存在于信息系統(tǒng)中的信息和存在于人腦中的知識轉(zhuǎn)化為可復(fù)用、可檢索的知識資源。知識獲取技術(shù)的研究可以分為顯性知識獲取和隱性知識獲取兩種,顯性知識獲取是對已有信息系統(tǒng)中存在的知識進行采集,即基于索引的跨系統(tǒng)知識采集;隱性知識是對專家經(jīng)驗等未進行管理的知識進行采集,即基于模板的隱性知識采集。
在復(fù)雜產(chǎn)品研發(fā)過程中,顯性知識主存儲在PDM、TDM等產(chǎn)品全生命周期管理系統(tǒng)、標準規(guī)范系統(tǒng)及其他系統(tǒng)各類信息系統(tǒng)中,以技術(shù)報告、三維模型、工藝文件、結(jié)構(gòu)化字段等多種類型存在。為實現(xiàn)知識資源的統(tǒng)一管理與應(yīng)用,需要在不改變各異構(gòu)信息系統(tǒng)的基礎(chǔ)上,對各信息系統(tǒng)中的異構(gòu)知識資源進行采集并處理成統(tǒng)一的格式。本文提出了一種基于索引的跨系統(tǒng)知識采集技術(shù),如圖1所示,采用分層架構(gòu)的思想,通過構(gòu)建適用于不同類型數(shù)據(jù)源的數(shù)據(jù)采集器對數(shù)據(jù)資源層的各類知識進行統(tǒng)一處理與整合,最終形成可統(tǒng)一應(yīng)用的知識索引庫。
采集架構(gòu)分為數(shù)據(jù)資源層、數(shù)據(jù)處理層和信息系統(tǒng)索引層,具體如下:
1)數(shù)據(jù)資源層:數(shù)據(jù)資源層包括PDM、TDM、標準規(guī)范等信息系統(tǒng),根據(jù)信息系統(tǒng)中數(shù)據(jù)的存儲方式,歸集為關(guān)系型數(shù)據(jù)庫、文件服務(wù)器、html網(wǎng)頁、其他類型數(shù)據(jù)源四種類型的異構(gòu)資源。
2)數(shù)據(jù)處理層:針對四種異構(gòu)資源,建立不同的知識采集器,主要包括關(guān)系型數(shù)據(jù)庫類知識采集器、html網(wǎng)頁類知識采集器、文件服務(wù)器類知識采集器及其他類知識采集器,通過采集器配置各信息系統(tǒng)服務(wù)器或數(shù)據(jù)庫地址、數(shù)據(jù)采集方式、采集字段、索引存儲地址、更新機制等。
3)信息系統(tǒng)索引層:通過索引數(shù)據(jù)生成服務(wù),對采集的知識進行封裝,形成統(tǒng)一格式的索引庫。
1)關(guān)系型數(shù)據(jù)庫類知識采集機制
關(guān)系型數(shù)據(jù)類知識采集器在不改變源數(shù)據(jù)庫的數(shù)據(jù)結(jié)構(gòu)、數(shù)據(jù)內(nèi)容和工作方式的情況下,獲取數(shù)據(jù)庫中的屬性信息,采集過程如圖2所示。首先,確認各信息系統(tǒng)知識采集范圍和內(nèi)容,根據(jù)各信息系統(tǒng)的表結(jié)構(gòu),利用SQL創(chuàng)建包含知識采集內(nèi)容的數(shù)據(jù)庫視圖,其中數(shù)據(jù)庫視圖中應(yīng)包含的基本信息如表1所示;然后,通過關(guān)系型數(shù)據(jù)庫知識采集器接入數(shù)據(jù)庫視圖,配置提取的字段、標注的特征與權(quán)限并進行格式處理后,形成統(tǒng)一的索引格式存儲到索引庫中。
圖1 基于索引的跨系統(tǒng)知識采集架構(gòu)
圖2 關(guān)系型數(shù)據(jù)庫知識采集機制
表1 數(shù)據(jù)庫視圖結(jié)構(gòu)
2)文件服務(wù)器類知識采集機制
文件服務(wù)器類知識采集器對文件服務(wù)器目錄進行自動掃描,按照目錄形式或者列表形式對文檔進行分類組織,將目錄作為文檔分類標引項自動提取。然后,依據(jù)文件后綴名對文件的種類進行確定(如word、xls、ppt、pdf、htm、txt、zip,rar,tar等),針對每一類型文檔通過相應(yīng)的數(shù)據(jù)讀取接口提取文件的特征內(nèi)容,如標題、作者、單位、摘要等,最終對文檔全文內(nèi)容進行自動掃描與抓取,與特征內(nèi)容合并生成索引文件進行存儲,采集機制如圖3所示所示。
圖3 文件服務(wù)器類知識采集機制
3)html網(wǎng)頁類知識采集機制
html網(wǎng)頁類知識采集器通過http請求方式,訪問與獲取網(wǎng)頁中的知識資源,采集機制如圖4所示。首先,需確認與配置要抓取的網(wǎng)頁地址及抓取深度,抓取深度是影響抓取的一個重要因素,設(shè)置深度越大,那么抓取的網(wǎng)頁數(shù)量越多。若設(shè)置深度為1且當前網(wǎng)頁的深度為0,則從當前網(wǎng)頁可直接到達的網(wǎng)頁的深度為1,依此類推。然后,通過html網(wǎng)頁類知識采集器獲取所有網(wǎng)頁并保存到本地,再解析網(wǎng)頁中的URL轉(zhuǎn)換成純文本內(nèi)容,按照索引文件結(jié)構(gòu)存儲到索引庫中。
圖4 HTML網(wǎng)頁類知識采集機制
4)其他類型知識采集機制
針對特殊類型的知識資源,如即包含關(guān)系型數(shù)據(jù)庫又包含文件服務(wù)器的知識資源,可在關(guān)系型數(shù)據(jù)庫類知識采集器、文件服務(wù)器類知識采集器或html網(wǎng)頁類知識采集器的基礎(chǔ)上定制開發(fā)特殊的知識采集器,接入統(tǒng)一的數(shù)據(jù)庫視圖讀取結(jié)構(gòu)化數(shù)據(jù),利用文件讀取接口讀取文件服務(wù)器中的文檔,并通過文檔唯一標識與文件服務(wù)器文件路徑的對應(yīng)關(guān)系實現(xiàn)結(jié)構(gòu)化數(shù)據(jù)與文檔的關(guān)聯(lián),最終處理成統(tǒng)一的索引格式存儲到索引庫中。
在復(fù)雜產(chǎn)品研發(fā)過程中,隱性知識采集的過程也就是將隱性知識顯性化的過程。本文提出了一種基于模板的隱性知識采集技術(shù),通過配置不同類型的知識錄入模板,實現(xiàn)隱性知識的錄入與管理。
隱性知識錄入模板應(yīng)包括基本屬性、業(yè)務(wù)屬性和擴展屬性,屬性說明如表2所示。其中基本屬性用于描述知識的物理特征,業(yè)務(wù)屬性用于描述知識的分類,擴展屬性用戶描述知識的特征內(nèi)容,是某類知識的特有屬性。隱性知識采集時,首先應(yīng)定義知識基本屬性庫、業(yè)務(wù)屬性庫和擴展屬性庫,通過組合基本屬性庫、業(yè)務(wù)屬性庫和擴展屬性庫中的屬性創(chuàng)建指定類型知識的錄入模板,然后在通過知識錄入模板將專家頭腦中的研制經(jīng)驗、設(shè)計方法、計算工具等知識錄入系統(tǒng)中,形成可查找、可應(yīng)用的顯性知識。
表2 隱性知識模錄入模板屬性說明
在面向復(fù)雜產(chǎn)品研發(fā)的工程知識管理系統(tǒng)中,部署了關(guān)系型數(shù)據(jù)庫類知識采集器、文件服務(wù)器類知識采集器和HTML網(wǎng)頁類知識采集器,對PDM、標準規(guī)范管理系統(tǒng)中的顯性知識進行采集;建立了隱性知識錄入模板,對設(shè)計經(jīng)驗類知識進行采集。
1)顯性知識采集示例
在工程知識管理系統(tǒng)中,采集PDM系統(tǒng)中顯性知識的過程如下:
用戶通過工程知識管理系統(tǒng)的左側(cè)導(dǎo)航欄點擊“應(yīng)用系統(tǒng)配置”下的“索引服務(wù)器配置”,展示出右側(cè)的索引服務(wù)器配置頁面;在索引服務(wù)器配置點擊“新增”按鈕,創(chuàng)建PDM系統(tǒng)的索引服務(wù)器,填寫配置ID、名稱、采集端口、IP地址等信息;信息填寫完成并點擊“確定”后,系統(tǒng)會依據(jù)配置信息自動對PDM系統(tǒng)中的知識進行采集,如圖5所示;同時,在索引庫中可查看通過知識采集器采集到的全部知識索引,如圖6所示。
圖5 配置PDM知識采集器
圖6 查看采集的知識索引
2)隱性知識錄入示例
在工程知識管理系統(tǒng)中,通過經(jīng)驗規(guī)則類知識模板,錄入隱性知識的過程如下:
用戶通過工程知識管理系統(tǒng)的左側(cè)導(dǎo)航欄點擊“知識創(chuàng)建”下的“經(jīng)驗規(guī)則庫”,展示出右側(cè)的知識錄入頁面;在知識錄入頁面中點擊“新增”按鈕,打開經(jīng)驗規(guī)格類知識錄入模板;填寫名稱、專業(yè)、類別、所屬產(chǎn)品、階段、業(yè)務(wù)活動等信息,如圖7所示,填寫完成并點擊“保存”后,系統(tǒng)中新增一條經(jīng)驗規(guī)則類隱性知識。
圖7 經(jīng)驗規(guī)則類知識錄入界面
【】【】
本文以軍工企業(yè)的需求為背景,以國家科技支撐計劃課題(課題編號2015BAF18B01)為支撐,緊密圍繞復(fù)雜產(chǎn)品的研制特點和需求,提出了一種面向復(fù)雜產(chǎn)品研發(fā)的多源異構(gòu)知識獲取技術(shù),并通過工程知識管理系統(tǒng)對知識采集過程進行了分析與示例,為復(fù)雜產(chǎn)品研發(fā)企業(yè)的知識獲取與應(yīng)用提供了很好的解決思路。多源異構(gòu)知識獲取技術(shù)通過基于索引的跨系統(tǒng)知識采集技術(shù)和基于模板的隱性知識采集技術(shù),實現(xiàn)企業(yè)內(nèi)部大量產(chǎn)品數(shù)據(jù)資源及專家經(jīng)驗知識的管理與應(yīng)用,對提升產(chǎn)品研發(fā)效率與研制水平,促進企業(yè)可持續(xù)發(fā)展具有重要意義。
[1]Strategic Plan for Knowledge Management[R].NASA Knowledge Management Team,2002.
[2]Coogan J.Boeing Knowledge Management[R].Boeing Management Company,2008.
[3]劉征,魯娜,孫凌云.面向概念設(shè)計過程的隱性知識獲取方法[J].機械工程學報,2011.
[4]高大成.知識管理-中國航空工業(yè)企業(yè)面向未來的戰(zhàn)略選擇[M].中國經(jīng)濟出版社,2006.
[5]施榮明,趙敏,孫聰.知識工程與創(chuàng)新[M].航空工業(yè)出版社,2009.