祝德剛,宮 琳,2+,唐 圣,謝 劍,莫振沖,朱明仁
(1.北京理工大學(xué) 機(jī)械與車輛學(xué)院,北京 100081;2.北京理工大學(xué)長(zhǎng)三角研究院(嘉興),浙江 嘉興 314011)
產(chǎn)品概念設(shè)計(jì)是需求驅(qū)動(dòng)的創(chuàng)造性工作,其核心是將需求轉(zhuǎn)化為產(chǎn)品功能,是通過(guò)從功能到結(jié)構(gòu)的映射實(shí)現(xiàn)求解功能對(duì)應(yīng)結(jié)構(gòu)的過(guò)程[1]。在產(chǎn)品生命周期中,概念設(shè)計(jì)階段決定了70%~80%的成本、性能和質(zhì)量[2],因而起著至關(guān)重要的作用[3]。傳統(tǒng)的產(chǎn)品概念設(shè)計(jì)依賴人的知識(shí)和經(jīng)驗(yàn),而互聯(lián)網(wǎng)環(huán)境中積累了巨量的個(gè)性化、多樣化的需求數(shù)據(jù),新產(chǎn)品的復(fù)雜度也隨之提高,受限于設(shè)計(jì)者個(gè)人經(jīng)驗(yàn)和知識(shí)的局限性,產(chǎn)品設(shè)計(jì)過(guò)程中難免出現(xiàn)設(shè)計(jì)方案客觀性不足、質(zhì)量參差不齊以及設(shè)計(jì)效率低等問(wèn)題。為提高設(shè)計(jì)質(zhì)量、縮短設(shè)計(jì)周期、控制研發(fā)成本,國(guó)內(nèi)外學(xué)者在概念設(shè)計(jì)理論與方法方面開(kāi)展了大量研究[4],主要包括基于過(guò)程的方法、基于類比的方法和基于知識(shí)的方法。
(1)基于過(guò)程的方法 是以建立標(biāo)準(zhǔn)的設(shè)計(jì)過(guò)程模型為核心,指導(dǎo)設(shè)計(jì)者完成產(chǎn)品方案的設(shè)計(jì)。PAHL等[5]提出了經(jīng)典的功能—結(jié)構(gòu)(Function-Structure, FS)模型。考慮到FS模型的方案評(píng)價(jià)困難、主觀性強(qiáng)等問(wèn)題,又有學(xué)者提出了FS模型的改進(jìn)模型,如功能—結(jié)構(gòu)反復(fù)映射模型[6]、功能—行為—結(jié)構(gòu)模型(Function-Behavior-Structure, FBS)[7],以及FBS的幾種演化模型[8,9]?;谶^(guò)程的概念設(shè)計(jì)方法還融入了不同的工具以提升設(shè)計(jì)效果,例如考慮顧客需求偏好的概念設(shè)計(jì)方法[10],基于矩陣的產(chǎn)品概念方案求解方法[11],基于相似性的產(chǎn)品設(shè)計(jì)模型[12]等?;谶^(guò)程的方法為設(shè)計(jì)活動(dòng)提供了流程框架,讓設(shè)計(jì)活動(dòng)的規(guī)范性大大提升,設(shè)計(jì)人員可以專注于最依賴創(chuàng)造性的環(huán)節(jié),從而提升了設(shè)計(jì)過(guò)程整體的效率,但設(shè)計(jì)方案的創(chuàng)新性仍然對(duì)設(shè)計(jì)者有著絕對(duì)的依賴,并沒(méi)有從根本上解決設(shè)計(jì)者的主觀性帶來(lái)的問(wèn)題,且缺乏量化評(píng)價(jià)其創(chuàng)新性的手段。
(2)基于類比的方法 其基本思想是找到類比對(duì)象,然后模仿設(shè)計(jì)。此類設(shè)計(jì)理論并不追求標(biāo)準(zhǔn)化的設(shè)計(jì)流程、也不追求結(jié)構(gòu)化的設(shè)計(jì)知識(shí),而著眼于尋找與目標(biāo)產(chǎn)品功能最相似的已有產(chǎn)品或案例,如基于模型的類比設(shè)計(jì)創(chuàng)新方法[13]、自適應(yīng)仿生結(jié)構(gòu)優(yōu)化設(shè)計(jì)方法[14]、仿生幾何重構(gòu)方法[15]等?;陬惐鹊姆椒▽⒁延邪咐龖?yīng)用到設(shè)計(jì)活動(dòng)中,并產(chǎn)生了許多非常成功的方案,且具有很強(qiáng)的創(chuàng)造力,但該方法的應(yīng)用具有局限性,適用于對(duì)產(chǎn)品局部結(jié)構(gòu)的設(shè)計(jì)改進(jìn),并不能直接用于產(chǎn)品的整體設(shè)計(jì),且此類方法對(duì)不同類別產(chǎn)品的普適性不強(qiáng)。
(3)基于知識(shí)的方法 主要基于設(shè)計(jì)師的經(jīng)驗(yàn)總結(jié)及科技成果的描述[16]?,F(xiàn)代概念設(shè)計(jì)理論和方法認(rèn)為設(shè)計(jì)知識(shí)是創(chuàng)新和解決設(shè)計(jì)問(wèn)題的基礎(chǔ),MA[17]將創(chuàng)新定義為帶來(lái)新的、令人驚訝的和有價(jià)值的想法,設(shè)計(jì)創(chuàng)新很大一部分是對(duì)已有知識(shí)的組合或轉(zhuǎn)移,從而實(shí)現(xiàn)組合和改進(jìn)設(shè)計(jì);文獻(xiàn)[18]指出ALTSHULLER提出的發(fā)明問(wèn)題解決理論(TRIZ)的核心思想是通過(guò)分析大量專利,獲取能夠解決設(shè)計(jì)過(guò)程中創(chuàng)新問(wèn)題的知識(shí),幫助設(shè)計(jì)師完成決策。隨著信息技術(shù)的發(fā)展,基于知識(shí)的設(shè)計(jì)方法涌現(xiàn)出越來(lái)越多的研究成果,雖然其中權(quán)威且通用的方法仍然有待討論,但這些方法都在不同程度上提高了設(shè)計(jì)過(guò)程的客觀性,突破了設(shè)計(jì)者自身的知識(shí)經(jīng)驗(yàn)的局限性。
專利作為豐富的設(shè)計(jì)知識(shí)載體,如何更有效地利用專利知識(shí)已成為設(shè)計(jì)領(lǐng)域重要的研究方向[19]。目前,專利挖掘的相關(guān)研究主要包括基于關(guān)鍵詞的挖掘方法以及基于主體—?jiǎng)幼鳌獙?duì)象(Subject-Action-Object, SAO)三元組的挖掘方法兩類?;陉P(guān)鍵詞的專利挖掘的相關(guān)研究中,基于遺傳算法和決策樹(shù)的GeneX算法[20]、自動(dòng)提取關(guān)鍵短語(yǔ)的關(guān)鍵短語(yǔ)提取算法(Keyphase Extraction Algorithm,KEA)[21]、摘要關(guān)鍵詞有監(jiān)督提取算法[22]等都取得了不錯(cuò)的知識(shí)挖掘效果。SAO三元組結(jié)構(gòu)是為了提取關(guān)鍵詞之間的語(yǔ)義關(guān)系而出現(xiàn)的,該結(jié)構(gòu)彌補(bǔ)了關(guān)鍵詞挖掘方法的缺陷[23]。許多基于SAO結(jié)構(gòu)的專利挖掘模型都取得了優(yōu)于關(guān)鍵詞挖掘的表現(xiàn),如YOON等[24]提出的基于語(yǔ)義分析的SAO結(jié)構(gòu)專利知識(shí)網(wǎng)絡(luò)。此外,一些研究還利用SAO結(jié)構(gòu)描述文檔中實(shí)體之間的相互作用[25],用SAO結(jié)構(gòu)結(jié)合技術(shù)路線圖SAO結(jié)構(gòu)結(jié)合技術(shù)路線圖(Technology Road Map, TRM)分析未來(lái)科技的發(fā)展方向[26]、結(jié)合形態(tài)學(xué)矩陣來(lái)提高形態(tài)分析的性能[27]、結(jié)合TRIZ演化趨勢(shì)模型分析專利的發(fā)展趨勢(shì)[28]、結(jié)合分析樹(shù)模型識(shí)別核心組件[29]。SAO結(jié)構(gòu)的有效性已被廣泛論證,因此本文將SAO結(jié)構(gòu)作為基本組成單元與專利知識(shí)圖譜相結(jié)合,發(fā)揮了二者在知識(shí)挖掘中各自的優(yōu)勢(shì)。
知識(shí)圖譜用實(shí)體—關(guān)系—實(shí)體三元組結(jié)構(gòu)表達(dá)知識(shí),具有良好的關(guān)系表達(dá)和可視化效果[30]。2008年,STERNITZKE等[31]斷定社會(huì)網(wǎng)絡(luò)分析在專利分析中有重要的應(yīng)用意義。借助圖論的方法,知識(shí)圖譜可以用于分析、挖掘、構(gòu)建、展示知識(shí)以及不同知識(shí)之間的關(guān)系[32],因而已經(jīng)廣泛應(yīng)用于數(shù)據(jù)和知識(shí)的存儲(chǔ)、管理、檢索和展示中[33]。本文構(gòu)建的專利知識(shí)圖譜中,每個(gè)SAO結(jié)構(gòu)均對(duì)應(yīng)知識(shí)圖譜中實(shí)體—關(guān)系—實(shí)體的三元組基本單元[34]。產(chǎn)品設(shè)計(jì)知識(shí)與知識(shí)圖譜的結(jié)合,利于設(shè)計(jì)知識(shí)自動(dòng)提取,且保證了設(shè)計(jì)知識(shí)的完整性和準(zhǔn)確性。
知識(shí)圖譜的構(gòu)建可分為命名實(shí)體識(shí)別和關(guān)系抽取兩個(gè)步驟。為避免耗費(fèi)過(guò)多的人工、避免規(guī)則構(gòu)造者語(yǔ)言能力的局限性,機(jī)器學(xué)習(xí)越來(lái)越多地被應(yīng)用到這兩個(gè)步驟中。命名實(shí)體識(shí)別中典型的方法包括:K最近鄰算法和條件隨機(jī)場(chǎng)模型[35]、使用詞庫(kù)輔助的最大熵算法[36]、利用自適應(yīng)感知機(jī)的算法[37]、基于本體的文獻(xiàn)知識(shí)圖譜自動(dòng)建模方法[38]等。關(guān)系抽取步驟中主要包括基于最大熵模型的無(wú)規(guī)則硬編碼的實(shí)體關(guān)系抽取方法[39]、基于bootstrap算法的半監(jiān)督學(xué)習(xí)方法[40]等。本文將在各項(xiàng)自然語(yǔ)言處理任務(wù)中表現(xiàn)優(yōu)異的雙向長(zhǎng)短期記憶網(wǎng)絡(luò)(Bi-directional Long Short Term Memory, BiLSTM)應(yīng)用到專利知識(shí)的抽取中,相比于已有抽取方法,該方法精度更高。此外,本文基于句法和語(yǔ)義信息的關(guān)系模板抽取方法、圖譜補(bǔ)全方法,均使得構(gòu)建的專利知識(shí)圖譜在知識(shí)的準(zhǔn)確性層面更有優(yōu)勢(shì),用于輔助提高產(chǎn)品設(shè)計(jì)的可靠性。
上述研究從建立更有效的設(shè)計(jì)方法、提高設(shè)計(jì)知識(shí)重用率等角度取得了大量的研究成果。不難發(fā)現(xiàn),基于知識(shí)的方法逐漸成為主流的概念設(shè)計(jì)方法,但指數(shù)級(jí)增長(zhǎng)的設(shè)計(jì)知識(shí)也為基于知識(shí)的設(shè)計(jì)方法帶來(lái)了挑戰(zhàn)。為解決大規(guī)模設(shè)計(jì)知識(shí)重用效率低、自動(dòng)生成的設(shè)計(jì)方案創(chuàng)新性不強(qiáng)等問(wèn)題,本文提出一種基于專利知識(shí)圖譜的產(chǎn)品創(chuàng)新概念設(shè)計(jì)方法。該方法包含面向概念設(shè)計(jì)的專利知識(shí)圖譜構(gòu)建技術(shù),該技術(shù)利用命名實(shí)體識(shí)別技術(shù)提取專利文本中的實(shí)體,基于句法和語(yǔ)義信息抽取實(shí)體間關(guān)系,并基于圖論和邏輯回歸補(bǔ)全了知識(shí)圖譜。此外,該方法還包含基于專利知識(shí)圖譜的產(chǎn)品概念設(shè)計(jì)方案生成技術(shù),該技術(shù)以產(chǎn)品初始功能拆解和功能表達(dá)模型為輸入,用網(wǎng)絡(luò)分析的方式來(lái)求解產(chǎn)品功能對(duì)應(yīng)的結(jié)構(gòu)。最后,以自動(dòng)引導(dǎo)車(Automated Guided Vehicle,AGV)為例,驗(yàn)證了方法的有效性。
基于專利知識(shí)圖譜的產(chǎn)品創(chuàng)新概念設(shè)計(jì)方法主要框架如圖1所示,主要分為專利知識(shí)圖譜構(gòu)建過(guò)程和產(chǎn)品概念設(shè)計(jì)方案生成過(guò)程兩部分。
本文第2章主要介紹面向概念設(shè)計(jì)的專利知識(shí)圖譜構(gòu)建過(guò)程,該過(guò)程首先從專利數(shù)據(jù)庫(kù)中收集專利文獻(xiàn),從專利文獻(xiàn)中提取實(shí)體(2.1節(jié)),然后通過(guò)功能關(guān)系抽取建立專利知識(shí)圖譜中實(shí)體之間的關(guān)系,形成主體—?jiǎng)幼鳌獙?duì)象三元組(2.2節(jié))。在專利知識(shí)圖譜的構(gòu)建中,采用SAO結(jié)構(gòu)描述設(shè)計(jì)知識(shí),并將其作為專利知識(shí)圖譜的基本組成單元。通過(guò)命名實(shí)體識(shí)別、關(guān)系抽取、圖譜補(bǔ)全等步驟,對(duì)專利中大量的知識(shí)進(jìn)行建模和集成,方便了專利的定量分析。此外,該過(guò)程還包含基于圖論和邏輯回歸的圖譜補(bǔ)全(2.3節(jié)),來(lái)補(bǔ)全專利中存在但圖譜中缺失的設(shè)計(jì)知識(shí)。
本文第3章介紹基于專利知識(shí)圖譜的產(chǎn)品概念設(shè)計(jì)方案生成過(guò)程,該過(guò)程首先參考功能—行為—結(jié)構(gòu)映射模型,進(jìn)行產(chǎn)品功能拆解(3.1節(jié)),在此基礎(chǔ)上,利用已構(gòu)建的專利知識(shí)圖譜求解現(xiàn)有的產(chǎn)品功能(3.2節(jié)和3.3節(jié)),從而形成最優(yōu)的產(chǎn)品設(shè)計(jì)方案。
建立包含大量設(shè)計(jì)知識(shí)的知識(shí)庫(kù),是實(shí)現(xiàn)產(chǎn)品設(shè)計(jì)自動(dòng)化的前提。面向概念設(shè)計(jì)的專利知識(shí)圖譜(簡(jiǎn)稱專利知識(shí)圖譜),是對(duì)專利中的設(shè)計(jì)知識(shí)進(jìn)行提取和加工后形成的知識(shí)圖譜,實(shí)現(xiàn)了大規(guī)模設(shè)計(jì)知識(shí)的集成,為挖掘、分析、展現(xiàn)設(shè)計(jì)知識(shí)之間的關(guān)系提供了便利,可以支撐產(chǎn)品概念設(shè)計(jì)。該圖譜的構(gòu)建過(guò)程如圖2所示。
具體構(gòu)建流程如下:
(1)輸入專利數(shù)據(jù)。輸入應(yīng)綜合考慮專利數(shù)量、格式規(guī)范等因素。
(2)采集專利名稱、摘要和權(quán)利要求。其中包含專利中最重要信息,是構(gòu)建專利知識(shí)圖譜的基本語(yǔ)料庫(kù)。
(3)訓(xùn)練Word2Vec模型[41]生成詞向量。Word2Vec模型能夠?qū)W習(xí)詞匯上下文語(yǔ)義信息,并將詞匯映射到向量空間,為后續(xù)命名實(shí)體識(shí)別、關(guān)系提取、關(guān)系推理等任務(wù)提供支持。
(4)針對(duì)設(shè)計(jì)知識(shí)的命名實(shí)體識(shí)別。利用自然語(yǔ)言處理算法模型,從專利文本中提取出專利知識(shí)圖譜中“主體”和“對(duì)象”對(duì)應(yīng)的實(shí)體,提高了設(shè)計(jì)知識(shí)識(shí)別的精度和效率,詳見(jiàn)2.1節(jié)。
(5)支持關(guān)系標(biāo)準(zhǔn)化的功能關(guān)系提取。功能關(guān)系指主體-動(dòng)作-對(duì)象語(yǔ)義單位中的“動(dòng)作”,通常是動(dòng)詞形式。提取實(shí)體間的功能關(guān)系后即可生成專利知識(shí)圖譜的三元組,詳見(jiàn)2.2節(jié)。模板泛化、關(guān)系標(biāo)準(zhǔn)化等操作減少了圖譜構(gòu)建過(guò)程的人工參與,且提高了圖譜的可用性。
(6)構(gòu)建初始專利知識(shí)圖譜。在三元組的基礎(chǔ)上,以v表示網(wǎng)絡(luò)節(jié)點(diǎn)(即實(shí)體),代表產(chǎn)品的“結(jié)構(gòu)”和功能的“對(duì)象”;以e表示實(shí)體之間的功能關(guān)系(即邊),構(gòu)建初始專利知識(shí)圖譜G=
(7)專利知識(shí)圖譜的補(bǔ)全。以上步驟構(gòu)建的專利知識(shí)圖譜還存在一些關(guān)系的缺失。本文基于圖論和邏輯回歸的關(guān)系推理方法在圖譜補(bǔ)全任務(wù)中的表現(xiàn)好于經(jīng)典的TransE推理算法,詳見(jiàn)2.3節(jié)。
以上針對(duì)設(shè)計(jì)知識(shí)的命名實(shí)體識(shí)別解決了設(shè)計(jì)知識(shí)的識(shí)別精度和效率不高的問(wèn)題、支持關(guān)系標(biāo)準(zhǔn)化的功能關(guān)系提取解決了圖譜可用性不高的問(wèn)題,圖譜補(bǔ)全則保證了圖譜中設(shè)計(jì)知識(shí)的完整性,下面進(jìn)行詳細(xì)介紹。
鑒于SAO結(jié)構(gòu)表征的設(shè)計(jì)知識(shí)在完整性、準(zhǔn)確性、簡(jiǎn)潔性等方面的優(yōu)勢(shì),本文以SAO結(jié)構(gòu)為基礎(chǔ)構(gòu)建專利知識(shí)圖譜。此外,本文BiLSTM模型的使用改變了需要人工制定大量規(guī)則的現(xiàn)狀,提高了命名實(shí)體識(shí)別過(guò)程的自動(dòng)化程度。命名實(shí)體識(shí)別的目的是從專利文本中提取“主體—?jiǎng)幼鳌獙?duì)象”語(yǔ)義單元中的“主體”和“對(duì)象”(SAO結(jié)構(gòu)中的“S”和“O”,即“Subject”和“Object”)?!爸黧w”指產(chǎn)品功能的載體,對(duì)應(yīng)產(chǎn)品的零部件等結(jié)構(gòu);“對(duì)象”表示產(chǎn)品功能作用的目標(biāo),同樣可以表示“主體”,識(shí)別流程如圖3所示。
具體流程如下:
(1)將專利名稱、摘要和權(quán)利要求文本構(gòu)造為語(yǔ)料庫(kù)。本文的命名實(shí)體識(shí)別以HIRTZ等[42]構(gòu)建的流詞庫(kù)以及KURTOGLU等[43]建立的組件詞庫(kù)為基礎(chǔ),與詞庫(kù)詞匯相同或相似的詞是標(biāo)注和命名實(shí)體識(shí)別的對(duì)象。
(2)將語(yǔ)料庫(kù)分劃為訓(xùn)練集與測(cè)試集。以十折交叉驗(yàn)證的方式將部分語(yǔ)料作為BiLSTM模型的訓(xùn)練集,其余語(yǔ)料庫(kù)作為測(cè)試集,以保證算法的有效性。
(3)數(shù)據(jù)標(biāo)注。采用BIO標(biāo)注規(guī)則,“B-SN”為實(shí)體中第一個(gè)單詞的標(biāo)注,“I-SN”表示實(shí)體中其他單詞,“O”為不屬于該實(shí)體的單詞,標(biāo)注后的數(shù)據(jù)即可作為訓(xùn)練和測(cè)試的基礎(chǔ)。
(4)訓(xùn)練BiLSTM模型。利用Word2Vec將文本轉(zhuǎn)換為詞向量形式,為模型提供數(shù)值型數(shù)據(jù)輸入。經(jīng)模型參數(shù)調(diào)優(yōu)后確定模型的最佳參數(shù)組合,得出最優(yōu)模型。
(5)將訓(xùn)練后的模型用于處理全部語(yǔ)料。模型工作流程如圖4所示,首先將詞向量輸入BiLSTM模型的前向和后向LSTM層,最終輸出命名實(shí)體識(shí)別結(jié)果,即實(shí)體集合。
以上步驟中,相較于典型的條件隨機(jī)場(chǎng)等模型,BiLSTM模型在設(shè)計(jì)知識(shí)實(shí)體識(shí)別中的應(yīng)用使專利挖掘的準(zhǔn)確性和效率大幅提升,在本文實(shí)驗(yàn)中,命名實(shí)體識(shí)別任務(wù)的F1值達(dá)到了90.63%,表明模型在的實(shí)體識(shí)別中的查準(zhǔn)率和查全率優(yōu)秀。經(jīng)以上步驟可以得到專利知識(shí)圖譜中的節(jié)點(diǎn),專利知識(shí)圖譜中的“主體”和“對(duì)象”元素得以從專利的題目、摘要以及權(quán)利要求中提取出來(lái),要構(gòu)建專利知識(shí)圖譜,還需要實(shí)體間關(guān)系的組織。
提取實(shí)體間關(guān)系是構(gòu)建實(shí)體—關(guān)系—實(shí)體三元組并進(jìn)一步生成專利知識(shí)圖譜的必要步驟。本文提出的基于句法和語(yǔ)義信息的模板抽取技術(shù),是一種弱監(jiān)督實(shí)體關(guān)系抽取技術(shù)。該技術(shù)解決了文本中關(guān)系非標(biāo)準(zhǔn)化的問(wèn)題,為專利知識(shí)圖譜的進(jìn)一步分析提供了便利。提取流程圖如圖5所示。
具體步驟如下:
(1)詞性標(biāo)注與依存句法分析。依存句法分析主要通過(guò)分析句子中詞與詞之間的依存關(guān)系來(lái)揭示句子的句法結(jié)構(gòu)[39],即提取句子中的主謂賓、定狀補(bǔ)等語(yǔ)法成分。
(2)候選三元組提取。在依存句法分析的基礎(chǔ)上,提取句子的謂語(yǔ)(verb)、主語(yǔ)(subj)和賓語(yǔ)(obj)。
(3)種子模板選擇。初始種子模板由人工決定,其數(shù)量較小。以少量的標(biāo)注數(shù)據(jù)作為種子集,將語(yǔ)料庫(kù)中所有匹配種子集的關(guān)系實(shí)例作為正例,從正樣本中提取模板進(jìn)行模板泛化,可以得到兼容性更強(qiáng)的抽取模板。
(4)模板泛化與匹配。在模板泛化過(guò)程中,關(guān)系通過(guò)字符串相等匹配,頭部實(shí)體和尾部實(shí)體(“頭部”和“尾部”實(shí)體分別對(duì)應(yīng)三元組開(kāi)頭和結(jié)尾的實(shí)體)采用正則表達(dá)式的形式匹配。泛化種子模板的部分信息可以擴(kuò)展三元組的解空間,進(jìn)而找到更多的實(shí)體—關(guān)系—實(shí)體三元組。
(5)新的種子模板生成。利用泛化的種子模板匹配候選三元組,將這些三元組作為新的種子模板。同時(shí),這些三元組被添加到實(shí)體—關(guān)系—實(shí)體三元組數(shù)據(jù)庫(kù)中,為后續(xù)篩選過(guò)程提供數(shù)據(jù)。
(6)模板相似性計(jì)算。為減少種子模板數(shù)據(jù)庫(kù)的冗余,當(dāng)新增模板已存在或存在具有高度相似性的歷史模板時(shí),丟棄新模板并繼續(xù)搜索種子模板。
(7)關(guān)系標(biāo)準(zhǔn)化。關(guān)系標(biāo)準(zhǔn)化可以避免同義詞的影響,減少數(shù)據(jù)冗余。本文利用HURTZ等[42]建立的功能標(biāo)準(zhǔn)詞庫(kù)對(duì)提取的功能關(guān)系進(jìn)行修正,使之更適合概念設(shè)計(jì)過(guò)程的表述形式。該過(guò)程主要計(jì)算關(guān)系詞和標(biāo)準(zhǔn)詞之間的相似度,以相似度最高的標(biāo)準(zhǔn)詞取代原始關(guān)系詞。
功能關(guān)系抽取實(shí)現(xiàn)了專利知識(shí)圖譜中實(shí)體間連邊的構(gòu)建,將離散的實(shí)體元素由具有實(shí)際含義的關(guān)系關(guān)聯(lián)起來(lái)。種子模板的使用減少了構(gòu)建過(guò)程中的人工參與,功能關(guān)系的標(biāo)準(zhǔn)化使專利文本中的設(shè)計(jì)知識(shí)真正轉(zhuǎn)化為可以定量分析的知識(shí)庫(kù),知識(shí)圖譜的補(bǔ)全將進(jìn)一步提升該知識(shí)庫(kù)的完整性。
專利中往往省略常識(shí)性的知識(shí),主體與對(duì)象之間的關(guān)系并不會(huì)全部顯式地體現(xiàn)在文本中。因而從專利中挖掘到SAO結(jié)構(gòu)的設(shè)計(jì)知識(shí)難免存在著“A”(即Action)的缺失,在專利知識(shí)圖譜上體現(xiàn)為節(jié)點(diǎn)間連邊的缺失,這對(duì)產(chǎn)品設(shè)計(jì)方案的可行性有嚴(yán)重的影響。因此,在構(gòu)建初始專利知識(shí)圖譜后,還需補(bǔ)全操作。
本文利用一種雙重隨機(jī)游走的方式預(yù)測(cè)網(wǎng)絡(luò)中缺失的鏈路。第一重隨機(jī)游走主要基于網(wǎng)絡(luò)結(jié)構(gòu),利用結(jié)構(gòu)信息預(yù)測(cè)網(wǎng)絡(luò)中節(jié)點(diǎn)間的傳播概率;第二重隨機(jī)游走主要基于相似性,利用節(jié)點(diǎn)的傳播概率和語(yǔ)義特性來(lái)獲取存在鏈接的可能性。最后,利用邏輯回歸模型將預(yù)測(cè)所得的未知關(guān)系分類,完成專利知識(shí)圖譜的補(bǔ)全?;趫D論和邏輯回歸的專利知識(shí)圖譜補(bǔ)全流程如圖6所示。
2.3.1 基于網(wǎng)絡(luò)結(jié)構(gòu)的隨機(jī)游走
隨機(jī)游走是一個(gè)描述隨機(jī)游走者訪問(wèn)節(jié)點(diǎn)序列的馬爾可夫鏈,基于網(wǎng)絡(luò)結(jié)構(gòu),為隨機(jī)過(guò)程定義轉(zhuǎn)移概率矩陣M=[mij]n×n,計(jì)算公式如下:
mij=aij·D(i),
(1)
D(i)=1/d(i)。
(2)
式中:aij為鄰接矩陣的元;當(dāng)節(jié)點(diǎn)i與節(jié)點(diǎn)j之間的邊eij存在時(shí),轉(zhuǎn)移概率mij等于起始點(diǎn)vi的度d(i)的倒數(shù),當(dāng)eij不存在時(shí),mij等于0。因此,從節(jié)點(diǎn)S出發(fā),每一條出邊都具有相同的概率,且所有出邊的概率之和為1,符合隨機(jī)過(guò)程。
(3)
每次隨機(jī)游走后,都會(huì)得到一個(gè)概率分布,該分布又可作為下一次游走的輸入,當(dāng)t→∞或滿足一定前提條件時(shí),該分布將收斂到一個(gè)穩(wěn)定值。隨機(jī)游走的收斂條件如下:
k=1~N,Δpi<θ。
(4)
即認(rèn)為當(dāng)傳播概率的變化值小于閾值θ時(shí),隨機(jī)游走過(guò)程收斂。以上基于網(wǎng)絡(luò)結(jié)構(gòu)的隨機(jī)游走,可以將圖譜中關(guān)系缺失的節(jié)點(diǎn)關(guān)聯(lián)起來(lái)。傳播概率從網(wǎng)絡(luò)結(jié)構(gòu)的角度反映了鏈路生成的概率,如果能將節(jié)點(diǎn)的語(yǔ)義信息也應(yīng)用到鏈路預(yù)測(cè)過(guò)程中,則可以進(jìn)一步提高網(wǎng)絡(luò)鏈路預(yù)測(cè)的準(zhǔn)確性。為此,進(jìn)行了基于相似性的第二重隨機(jī)游走。
2.3.2 基于鏈接相似性的隨機(jī)游走
對(duì)于節(jié)點(diǎn)vi和vj,它們的鄰域分別為L(zhǎng)(vi)和L(vj),用Sij表示鏈接相似性,即兩個(gè)節(jié)點(diǎn)連接同一個(gè)節(jié)點(diǎn)且產(chǎn)生鏈路的概率,如圖7所示,構(gòu)造隨機(jī)游走過(guò)程,當(dāng)Sij在整個(gè)網(wǎng)絡(luò)上達(dá)到穩(wěn)定狀態(tài),Sij即為最終節(jié)點(diǎn)鏈路強(qiáng)度的預(yù)測(cè)結(jié)果。vx和vi的傳播概率為pxi,vy和vj之間傳播概率為pyj,則vx和vy之間的Sxy可以通過(guò)傳播概率pxi和pyj影響vi和vj之間的Sij。
因此,定義基于余弦相似性的隨機(jī)游走規(guī)則如下:
∑vy∈L(vj)(pi+pj);
(5)
pi=∑vx∈L(vi)pxi,pj=∑vj∈L(vj)pyj。
(6)
隨機(jī)游走的收斂條件如下:
vx∈L(vi),vj∈L(vj),ΔS<θ。
(7)
經(jīng)過(guò)兩重隨機(jī)游走,可以認(rèn)為當(dāng)前的專利知識(shí)圖譜中已經(jīng)具有比較完備的實(shí)體與節(jié)點(diǎn)組合。隨機(jī)游走依據(jù)概率推測(cè)出節(jié)點(diǎn)間存在關(guān)系的可能性,還需要對(duì)推測(cè)出的關(guān)系做進(jìn)一步的分類,使關(guān)系具有實(shí)際意義。
2.3.3 基于邏輯回歸的未知關(guān)系分類
完成隨機(jī)游走后,可以得到節(jié)點(diǎn)間的鏈路強(qiáng)度Sij。當(dāng)某節(jié)點(diǎn)連接到另一節(jié)點(diǎn)的鏈路強(qiáng)度大于與其連接的邊的最大鏈路強(qiáng)度,則認(rèn)為該鏈路是專利知識(shí)圖譜中的隱藏邊。然后,利用邏輯回歸模型對(duì)這些邊的分類進(jìn)行預(yù)測(cè),確定每條邊的功能關(guān)系。
本文將二元邏輯回歸模型推廣到關(guān)系分類的多分類任務(wù)中,若x為訓(xùn)練樣本,y為對(duì)應(yīng)類別的真實(shí)值,在Logistic分布的基礎(chǔ)上,二元邏輯回歸模型滿足x的線性函數(shù)。令K表示類別數(shù)量,β=[w,b],x=[x,1],推導(dǎo)得多元分類邏輯回歸模型的形式如下:
(8)
通過(guò)與圖譜關(guān)系推理任務(wù)中經(jīng)典的TransE模型的對(duì)比實(shí)驗(yàn)(以公開(kāi)的WN18為數(shù)據(jù)集、HITS@10指標(biāo)為評(píng)價(jià)標(biāo)準(zhǔn)),在數(shù)據(jù)集中全部40 943個(gè)實(shí)體、13類節(jié)點(diǎn)中,TransE模型在HITS@10指標(biāo)下的準(zhǔn)確率為71.2%,而本文基于圖論和邏輯回歸的專利知識(shí)圖譜補(bǔ)全可以達(dá)到77.4%的準(zhǔn)確度,其有效性得到了支持。依照邏輯回歸的方法對(duì)未知關(guān)系進(jìn)行分類,將推測(cè)出的實(shí)體間關(guān)系補(bǔ)充到初始專利知識(shí)圖譜中,得到一個(gè)完善的專利知識(shí)圖譜,進(jìn)而對(duì)概念設(shè)計(jì)提供支持。
專利知識(shí)圖譜的構(gòu)建,為產(chǎn)品概念設(shè)計(jì)方案的生成提供了可靠的、可量化分析的設(shè)計(jì)知識(shí)庫(kù)。本文采用一種基于功能—行為—結(jié)構(gòu)映射模型(FBS)的產(chǎn)品功能拆解,以及融合功能流圖和組件配置流圖的產(chǎn)品功能表達(dá)模型作為方案生成的輸入。專利知識(shí)圖譜作為設(shè)計(jì)知識(shí)的載體,產(chǎn)品功能拆解及功能表達(dá)模型作為輸入,在二者的基礎(chǔ)上開(kāi)展概念設(shè)計(jì)工作,不僅提升了效率,還使得設(shè)計(jì)方案的生成(即求解功能對(duì)應(yīng)的結(jié)構(gòu))也變得有據(jù)可依。
此外,本文從網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)的角度出發(fā),定義了一種創(chuàng)新性定量指標(biāo)。在基于專利知識(shí)圖譜的產(chǎn)品概念設(shè)計(jì)方案生成過(guò)程中,首先將一種產(chǎn)品的功能拆解與功能表達(dá)模型作為產(chǎn)品初始設(shè)計(jì)方案,在此基礎(chǔ)上利用專利知識(shí)圖譜以相似性匹配的方式搜索功能對(duì)應(yīng)的結(jié)構(gòu)解集合,進(jìn)一步以方案創(chuàng)新性為依據(jù)篩選結(jié)構(gòu)解,實(shí)現(xiàn)新的設(shè)計(jì)方案的生成,即可對(duì)現(xiàn)有設(shè)計(jì)作出改進(jìn)與創(chuàng)新?;玖鞒倘鐖D8所示。
在基于專利知識(shí)圖譜的產(chǎn)品概念設(shè)計(jì)方案生成技術(shù)中,首先需要根據(jù)已有產(chǎn)品建立產(chǎn)品功能拆解,并利用產(chǎn)品功能表達(dá)模型明確功能之間的聯(lián)系,以此作為功能求解的輸入。
3.1.1 基于FBS模型的產(chǎn)品功能拆解
功能—行為—結(jié)構(gòu)映射模型可以幫助設(shè)計(jì)者構(gòu)建產(chǎn)品功能拆解。在該模型中,功能表示設(shè)計(jì)的原因和產(chǎn)品的具體用途;結(jié)構(gòu)是產(chǎn)品功能實(shí)現(xiàn)的基礎(chǔ),描述了設(shè)計(jì)對(duì)象的構(gòu)成;行為描述了結(jié)構(gòu)是如何實(shí)現(xiàn)功能的,是功能與結(jié)構(gòu)之間的橋梁。產(chǎn)品功能拆解如圖9所示,產(chǎn)品的結(jié)構(gòu)可以再一次拆分為子結(jié)構(gòu)。與設(shè)計(jì)者直接利用設(shè)計(jì)經(jīng)驗(yàn)直接完成的功能細(xì)分相比,由“結(jié)構(gòu)”和“行為”信息確定的“動(dòng)作—對(duì)象”的功能表述更加簡(jiǎn)潔且準(zhǔn)確。
3.1.2 產(chǎn)品功能表達(dá)模型
KURTOGLU等[43]提出設(shè)計(jì)方案最重要的信息是方案代表的功能和形式,并利用功能流圖和組件配置流圖分別反映方案的功能和形式,該方法通過(guò)圖語(yǔ)言對(duì)設(shè)計(jì)方案進(jìn)行建模。功能流圖可以表達(dá)產(chǎn)品各功能點(diǎn)之間的聯(lián)系,組件配置流圖可以表達(dá)產(chǎn)品功能對(duì)應(yīng)的結(jié)構(gòu)解。本文融合功能流圖和組件配置流圖構(gòu)建一種產(chǎn)品功能表達(dá)模型,如圖10所示。該模型包含3個(gè)重要的信息類別:功能、結(jié)構(gòu)和流信息。其中,功能是一組粒度相同的功能集,而產(chǎn)品功能拆解中所有以葉節(jié)點(diǎn)表示的功能都具有相同的粒度。以這些功能為產(chǎn)品方案表達(dá)模型的主體,采用黑箱法對(duì)各功能建模,并結(jié)合產(chǎn)品功能拆解確定各功能的結(jié)構(gòu)。最后,根據(jù)物質(zhì)、能量、信息流,設(shè)計(jì)人員將功能串聯(lián)起來(lái),形成最終的產(chǎn)品功能表達(dá)模型。
產(chǎn)品功能求解是概念設(shè)計(jì)方案生成的關(guān)鍵環(huán)節(jié),也是計(jì)算式設(shè)計(jì)方法中的核心步驟[44-45]。專利知識(shí)圖譜的功能求解過(guò)程可以轉(zhuǎn)化為搜索特定關(guān)系和尾部實(shí)體,并提取相應(yīng)的頭部實(shí)體(即三元組開(kāi)頭的實(shí)體)的過(guò)程。滿足要求的頭部實(shí)體集合即功能求解的候選方案,求解的具體過(guò)程如圖11所示。
具體步驟如下:
(1)輸入產(chǎn)品功能和專利知識(shí)圖譜。產(chǎn)品所有功能描述記為F=[Verb,Noun],生成功能集合A={F1,F2,…,Fn}。其中,Verb表示功能的“動(dòng)作”,以及Noun功能的“對(duì)象”。
(2)求解功能F=[Verb1,Noun1]。從專利知識(shí)圖譜中搜索與Verb1含義相近的功能關(guān)系的邊,提取這些邊對(duì)應(yīng)的三元組,生成候選三元組集合B。
(3)為B中的每個(gè)三元組“尾部實(shí)體”生成詞向量,以及Noun1的詞向量。用余弦相似度計(jì)算“尾部實(shí)體”和Noun1的相似度,如果相似性小于0.9,從B中剔除相應(yīng)的三元組。
(4)從B中提取剩余三元組的“頭部實(shí)體”,組成功能F1的候選解方案集合C1,如果C1是空集,則在C1中添加功能的結(jié)構(gòu)解。
(5)重復(fù)步驟(2)~步驟(4),直至集合A中的所有功能完成功能求解過(guò)程。
得到產(chǎn)品功能對(duì)應(yīng)的結(jié)構(gòu)解集合后,在已建立的專利知識(shí)圖譜的基礎(chǔ)上,定義方案創(chuàng)新性評(píng)價(jià)指標(biāo),進(jìn)而選擇最優(yōu)結(jié)構(gòu)解。其中,創(chuàng)新性求解步驟采用網(wǎng)絡(luò)分析方法完成。
3.3.1 設(shè)計(jì)方案創(chuàng)新性的定義
知識(shí)的融合指不同領(lǐng)域的知識(shí)跨越組織邊界,在更廣的范圍內(nèi)產(chǎn)生交叉與滲透融合,其本質(zhì)仍然是一種技術(shù)創(chuàng)新[46-48]。一般地,網(wǎng)絡(luò)中創(chuàng)新性較高的節(jié)點(diǎn)都是信息交互的中心,這些節(jié)點(diǎn)在網(wǎng)絡(luò)傳播信息時(shí)較為集中。相同領(lǐng)域或相同類型的點(diǎn)往往緊密相連,聚集為一個(gè)具有較強(qiáng)連通性的社團(tuán),信息交互中心通常位于每個(gè)社團(tuán)的邊緣,并與所有社團(tuán)相關(guān)聯(lián)。它源于不同領(lǐng)域的交叉,包含領(lǐng)域之間共通的信息。在圖12中,節(jié)點(diǎn)H是信息交互的中心,與節(jié)點(diǎn)A、B、C區(qū)別在于與其他節(jié)點(diǎn)的連邊數(shù)量(即節(jié)點(diǎn)度)。節(jié)點(diǎn)A、B和C連接社團(tuán)中的大多數(shù)節(jié)點(diǎn),而節(jié)點(diǎn)H只連接社團(tuán)中的少數(shù)節(jié)點(diǎn),起到橋梁的作用。觀察所構(gòu)建的專利知識(shí)圖譜,可以認(rèn)為在專利知識(shí)圖譜的信息交互中心相關(guān)領(lǐng)域交叉專利多、包含的設(shè)計(jì)知識(shí)創(chuàng)新性高,且兼顧了方案的可行性。
假設(shè)專利知識(shí)圖譜是一個(gè)無(wú)權(quán)異質(zhì)網(wǎng)絡(luò),表示為G=
(9)
(10)
式中:網(wǎng)絡(luò)G2為從原始網(wǎng)絡(luò)G1中移除節(jié)點(diǎn)v及其連接的邊后獲得的新網(wǎng)絡(luò);dvt為v到t之間的最短路徑長(zhǎng)度;N為網(wǎng)絡(luò)中的節(jié)點(diǎn)總數(shù);edg(v)表示節(jié)點(diǎn)v的度,即節(jié)點(diǎn)的連接邊數(shù);EF(G)表示網(wǎng)絡(luò)信息傳播的效率;EF(G1)-EF(G2)計(jì)算刪除特定節(jié)點(diǎn)后網(wǎng)絡(luò)信息傳播效率下降的程度。因此,節(jié)點(diǎn)創(chuàng)新性I與節(jié)點(diǎn)的度成反比,與刪除節(jié)點(diǎn)后網(wǎng)絡(luò)信息傳播效率下降程度成正比。
3.3.2 創(chuàng)新性評(píng)價(jià)與設(shè)計(jì)方案輸出
實(shí)際的生產(chǎn)活動(dòng)中,并非任何結(jié)構(gòu)解都可以實(shí)現(xiàn)組合和拼接,設(shè)計(jì)者需要依據(jù)產(chǎn)品的功能拆解和功能表達(dá)模型來(lái)篩選功能的結(jié)構(gòu)解,剔除無(wú)法實(shí)現(xiàn)相應(yīng)輸入輸出流的結(jié)構(gòu)來(lái)保證最終產(chǎn)品設(shè)計(jì)方案的有效性。該過(guò)程如圖13所示,包括以下步驟:
(1)將專利知識(shí)圖譜G=
(2)對(duì)于每個(gè)功能Fi,計(jì)算其候選解集合Ci中每項(xiàng)結(jié)構(gòu)解Sij的創(chuàng)新性,并基于創(chuàng)新性對(duì)結(jié)構(gòu)解排序。
(3)從功能F1開(kāi)始,確定C1最具創(chuàng)新性的結(jié)構(gòu)解S1,max,判斷S1,max是否能夠?qū)崿F(xiàn)原始產(chǎn)品功能表達(dá)中F1對(duì)應(yīng)的輸入輸出物質(zhì)、能量、信息流。若S1,max不滿足要求,則從C1中刪除S1,max,并重復(fù)此過(guò)程;若S1,max滿足要求,則視其為F1的最終求解方案。
(4)重復(fù)步驟(3),直到所有功能確定最終求解方案。將初始產(chǎn)品功能的結(jié)構(gòu)解替換為功能的最終求解方案,完成產(chǎn)品的概念設(shè)計(jì)與改進(jìn)。
基于網(wǎng)絡(luò)分析的設(shè)計(jì)方案創(chuàng)新性評(píng)價(jià)兼顧了設(shè)計(jì)方案的創(chuàng)新性與可行性,下面以AGV的設(shè)計(jì)改進(jìn)為例,對(duì)基于專利知識(shí)圖譜的產(chǎn)品創(chuàng)新概念設(shè)計(jì)方法進(jìn)行驗(yàn)證。
本文開(kāi)發(fā)了一個(gè)基于專利知識(shí)圖譜的概念設(shè)計(jì)輔助系統(tǒng)以驗(yàn)證上述方法。該系統(tǒng)主要分為專利管理、實(shí)體—關(guān)系—實(shí)體三元組提取、功能求解與創(chuàng)新性計(jì)算3個(gè)功能模塊。
AGV是一種具有安全防護(hù)和各種移動(dòng)運(yùn)輸功能的運(yùn)輸車輛,其結(jié)構(gòu)主要分為機(jī)械系統(tǒng)和電氣系統(tǒng)兩大類。其中,機(jī)械系統(tǒng)包括駕駛導(dǎo)航模塊和載體模塊,電氣系統(tǒng)包括安全控制模塊、通信模塊、能量模塊和輔助模塊。為了完成現(xiàn)有AGV產(chǎn)品的設(shè)計(jì)改進(jìn),需要輸入其初始功能拆解。由已有資料可知,AGV的功能拆解和功能表達(dá)模型分別如圖14和圖15所示。由于專利數(shù)據(jù)、功能標(biāo)準(zhǔn)詞庫(kù)、流詞庫(kù)以及組件詞庫(kù)均為英文,AGV的功能拆解和功能表達(dá)模型采用英文描述。
在已有AGV整體功能拆解以及功能表達(dá)模型的基礎(chǔ)上,進(jìn)一步構(gòu)建AGV專利知識(shí)圖譜,以支撐進(jìn)一步的產(chǎn)品概念設(shè)計(jì),具體步驟如下:
(1)獲取專利文檔。在USPTO數(shù)據(jù)庫(kù)中檢索與AGV相關(guān)的專利,檢索得到相關(guān)專利83.3萬(wàn)項(xiàng),選取2010年之后的約38萬(wàn)項(xiàng)專利作為原始數(shù)據(jù)。文本預(yù)處理后,共獲得1 095萬(wàn)句,包含1.8億詞。
(2)訓(xùn)練Word2Vec模型。為獲得更準(zhǔn)確的詞向量表示模型,在專利文獻(xiàn)的基礎(chǔ)上,添加維基百科的英文語(yǔ)料庫(kù),獲得了包括981萬(wàn)種類型和2.7億詞的Word2Vec模型訓(xùn)練數(shù)據(jù)。模型訓(xùn)練Word2Vec模型,詞向量維數(shù)設(shè)置為100。
(3)命名實(shí)體識(shí)別。從38萬(wàn)份專利文件中隨機(jī)選取16萬(wàn)項(xiàng)專利作為訓(xùn)練數(shù)據(jù),完成針對(duì)設(shè)計(jì)知識(shí)的命名實(shí)體識(shí)別任務(wù)。根據(jù)HURTZ等[42]構(gòu)造的流詞庫(kù),結(jié)合Kurtoglu構(gòu)造的組件詞庫(kù),選取與詞庫(kù)中的詞具有相似意義的專利中的詞作為命名實(shí)體,獲得21萬(wàn)個(gè)實(shí)體。根據(jù)BIO標(biāo)注規(guī)則來(lái)標(biāo)注專利文檔,用標(biāo)注后的文檔訓(xùn)練BiLSTM模型,再用模型自動(dòng)完成剩余22萬(wàn)項(xiàng)專利的命名實(shí)體識(shí)別與標(biāo)注。最后,獲得了258萬(wàn)個(gè)專利知識(shí)圖譜中的實(shí)體。
(4)提取實(shí)體—關(guān)系—實(shí)體三元組。通過(guò)依存關(guān)系分析和依存句法樹(shù)修剪,獲得466萬(wàn)個(gè)候選三元組。在候選三元組中,基于種子自搜索得到73萬(wàn)個(gè)實(shí)體—關(guān)系—實(shí)體三元組?;诠δ軜?biāo)準(zhǔn)詞庫(kù),完成了實(shí)體—關(guān)系—實(shí)體三元組的功能關(guān)系標(biāo)準(zhǔn)化。最后,得到了646 622個(gè)實(shí)體—關(guān)系—實(shí)體三元組,其中包括184 388個(gè)實(shí)體。
(5)圖譜補(bǔ)全。利用3.3節(jié)中的基于圖論和邏輯回歸的關(guān)系推理模型完成專利知識(shí)圖譜的補(bǔ)全過(guò)程,其中多分類邏輯回歸模型采用概率閾值為0.9,獲得隱藏的實(shí)體—關(guān)系—實(shí)體三元組22 676個(gè)(即較補(bǔ)全前的圖譜增加了22 676條邊),增加的關(guān)系數(shù)量達(dá)到補(bǔ)全前的3.5%。補(bǔ)全后的專利知識(shí)圖譜包含的三元組個(gè)數(shù)為669 298條。以單元控制“unit control”為例,專利知識(shí)圖譜與單元控制相關(guān)的部分如圖16所示。
基于初始產(chǎn)品功能表達(dá),已知需要求解的目標(biāo)功能為Provision rotary(提供旋轉(zhuǎn))、Move object(移動(dòng)物品)、Regulate rotary(調(diào)節(jié)旋轉(zhuǎn))、Stop rotary(停止旋轉(zhuǎn))、Emit location(發(fā)射位置)、Transport object(運(yùn)輸物品)、Position object(定位對(duì)象)、Secure object(保護(hù)物品)、Regulate status(調(diào)節(jié)狀態(tài))、Transfer signal(傳輸信號(hào))、Supply electricity(供電)、Transfer electricity(輸電)、Indicate voice(指示聲音)、Display electricity(顯示電量)和Prevent collision(防止碰撞)。設(shè)定相似度閾值為0.9,依據(jù)本文3.2節(jié)中的功能求解步驟完成AGV的功能求解,部分解集如表1所示,每個(gè)目標(biāo)功能可以求得很多對(duì)應(yīng)的功能解,將這些功能解組合,可以得到大量產(chǎn)品概念設(shè)計(jì)方案。經(jīng)3.3節(jié)中所述創(chuàng)新性評(píng)價(jià)步驟的選優(yōu),得到結(jié)果如表2所示。
表1 自動(dòng)引導(dǎo)車功能解與創(chuàng)新性(部分)
表2 功能求解結(jié)果
最終,AGV的產(chǎn)品概念設(shè)計(jì)方案如圖17所示,通過(guò)3D建模形象化表示AGV的設(shè)計(jì)方案,3D模型圖如圖18所示。
從功能求解結(jié)果來(lái)看,生成的概念設(shè)計(jì)方案在AGV共15個(gè)功能中的發(fā)射位置、運(yùn)輸物品、定位對(duì)象、保護(hù)物品、傳輸信號(hào)、供電、輸電、顯示電量等共8個(gè)功能對(duì)應(yīng)的結(jié)構(gòu)做出了創(chuàng)新性改進(jìn),改進(jìn)的結(jié)構(gòu)比例達(dá)到53.33%,且改進(jìn)的結(jié)構(gòu)創(chuàng)新性均有所提升,改進(jìn)后的概念設(shè)計(jì)方案總體創(chuàng)新性由初始的248 638.949 9提升到了406 959.745 9,提升比例達(dá)到63.67%。需要說(shuō)明的是,這些創(chuàng)新性結(jié)構(gòu)的求解并未考慮產(chǎn)品的成本等因素,但生成的設(shè)計(jì)方案仍能在很大程度上對(duì)現(xiàn)有產(chǎn)品進(jìn)行改進(jìn),突破產(chǎn)品新意不足的瓶頸。
本文在前人的研究基礎(chǔ)上,提出一種基于專利知識(shí)圖譜的產(chǎn)品創(chuàng)新概念設(shè)計(jì)方法。該方法包括專利知識(shí)圖譜的構(gòu)建和基于專利知識(shí)圖譜的產(chǎn)品概念設(shè)計(jì)方案生成兩個(gè)步驟。最后,以AGV為例,驗(yàn)證了該方法的可行性,且大幅提高了AGV概念設(shè)計(jì)方案的創(chuàng)新性。本文的主要結(jié)論如下:
(1)本文提出的面向概念設(shè)計(jì)的專利知識(shí)圖譜構(gòu)建過(guò)程,將設(shè)計(jì)知識(shí)以SAO結(jié)構(gòu)的形式與知識(shí)圖譜結(jié)合,兼容了SAO結(jié)構(gòu)的完整性、簡(jiǎn)潔性和知識(shí)圖譜便于知識(shí)管理和分析的特性。針對(duì)設(shè)計(jì)知識(shí)的命名實(shí)體識(shí)別、支持關(guān)系標(biāo)準(zhǔn)化的功能關(guān)系提取、基于圖論和邏輯回歸的圖譜補(bǔ)全等技術(shù),使得圖譜所包含的專利知識(shí)更加準(zhǔn)確且豐富,實(shí)體間關(guān)系相比于TransE等經(jīng)典推理算法得到的結(jié)果更加完善,因而圖譜的可用性更強(qiáng)。
(2)本文提出的基于專利知識(shí)圖譜的產(chǎn)品概念設(shè)計(jì)方案生成過(guò)程,以網(wǎng)絡(luò)分析方法定量評(píng)價(jià)了設(shè)計(jì)方案的創(chuàng)新性,其創(chuàng)新性計(jì)算結(jié)果可以為改進(jìn)設(shè)計(jì)方案提供指導(dǎo),從而大幅提升產(chǎn)品設(shè)計(jì)的創(chuàng)新性。相比于啟發(fā)式設(shè)計(jì)及產(chǎn)品特定結(jié)構(gòu)的改進(jìn),該方法對(duì)已有產(chǎn)品的整體創(chuàng)新提供了新的思路和定量評(píng)價(jià)的依據(jù),很大程度上改善了設(shè)計(jì)方案創(chuàng)新性依賴主觀定性評(píng)價(jià)的現(xiàn)狀。
(3)本文提出的以專利知識(shí)圖譜輔助概念設(shè)計(jì)的方法,不僅其專利知識(shí)圖譜的構(gòu)建過(guò)程、產(chǎn)品功能求解過(guò)程大大減少了人工參與,還包含以該圖譜輔助概念設(shè)計(jì)可以克服設(shè)計(jì)者自身知識(shí)、經(jīng)驗(yàn)、主觀認(rèn)知的局限性,同時(shí)提高了專利分析的效率。該方法不僅可以減少設(shè)計(jì)者的重復(fù)性勞動(dòng),還可為設(shè)計(jì)方案的創(chuàng)新性、可行性提供強(qiáng)有力的支撐。
雖然本文提出的方法在構(gòu)建設(shè)計(jì)知識(shí)庫(kù)的全面性、準(zhǔn)確性和設(shè)計(jì)方案的創(chuàng)新性等方面改進(jìn)了產(chǎn)品概念設(shè)計(jì)過(guò)程,但概念設(shè)計(jì)仍然是一個(gè)高度復(fù)雜的、綜合的過(guò)程,在更多領(lǐng)域的產(chǎn)品設(shè)計(jì)中,該方法還有待驗(yàn)證。此外,雖然本文用到的NLP模型的性能優(yōu)異,其準(zhǔn)確性和時(shí)間復(fù)雜度已可以滿足專利知識(shí)圖譜構(gòu)建的需要,但計(jì)算機(jī)領(lǐng)域的研究發(fā)展迅速,可以預(yù)見(jiàn),如果將性能更好的自然語(yǔ)言處理(Natural Language Processing, NLP)模型應(yīng)用于該方法,會(huì)使構(gòu)建的準(zhǔn)確性和效率更高。需要說(shuō)明的是,該方法側(cè)重對(duì)現(xiàn)有產(chǎn)品的功能結(jié)構(gòu)的改進(jìn),對(duì)于未知產(chǎn)品的設(shè)計(jì)研發(fā)還有一定的局限性。在未來(lái)研究中,將考慮挖掘潛在的用戶需求,重點(diǎn)關(guān)注用戶可能存在但尚未提出的需求,生成全新的產(chǎn)品功能以及相應(yīng)全新的功能結(jié)構(gòu)解決方案。
計(jì)算機(jī)集成制造系統(tǒng)2022年11期