王金鳳,徐正強(qiáng),馮立杰,李 康
(上海海事大學(xué),上海 201306)
黨的十八大以來,創(chuàng)新成為時代的主題。黨的十九大明確提出提高科技創(chuàng)新能力,加快建設(shè)創(chuàng)新型國家。我國“十四五”規(guī)劃則對加快科技創(chuàng)新提出了更為迫切的要求。企業(yè)作為國家技術(shù)創(chuàng)新的主體,更加凸顯了提高其科技創(chuàng)新能力的緊迫性及重要性[1]。Kim 等[2]、賴曉敏等[3]、陳欣然等[4]的研究均指出,專利作為技術(shù)創(chuàng)新的重要載體,通過挖掘并剖析專利,能夠研判企業(yè)的技術(shù)創(chuàng)新機(jī)會從而提升其創(chuàng)新能力。因此,研究如何從專利數(shù)據(jù)中精確識別并研判創(chuàng)新路徑,對企業(yè)提高技術(shù)創(chuàng)新能力和核心競爭力具有重要的理論研究和實(shí)踐指導(dǎo)意義。
在技術(shù)機(jī)會識別中,大數(shù)據(jù)、文本挖掘、機(jī)器學(xué)習(xí)和自然語言處理等信息處理技術(shù)和分析方法提升了技術(shù)創(chuàng)新路徑識別的自動化水平和效率,呈現(xiàn)出更加廣泛的應(yīng)用趨勢,但研判的創(chuàng)新路徑往往較為抽象和模糊,在很多情況下還需領(lǐng)域?qū)<覅⑴c并解讀才能加以識別,因而許多研究應(yīng)用專利地圖、技術(shù)形態(tài)組合、subject-action-object(SAO)技術(shù)鏈等手段解讀技術(shù)機(jī)會,在減少專家介入的同時大大提高技術(shù)機(jī)會的可解讀性及具體性。例如,李乾瑞等[5]采用SAO 語義挖掘方法構(gòu)建技術(shù)形態(tài)矩陣,以SAO 技術(shù)鏈完善技術(shù)細(xì)節(jié),改善創(chuàng)新路徑抽象問題;馮立杰等[6]將SAO 技術(shù)鏈與多維空間專利地圖進(jìn)行結(jié)合,構(gòu)建了多維導(dǎo)航的創(chuàng)新路徑識別模型,可具象識別創(chuàng)新路徑。多維空間專利地圖是通過捕捉客觀技術(shù)創(chuàng)新要素,耦合創(chuàng)新法則進(jìn)行迭代變換,映射于創(chuàng)新地圖的創(chuàng)新方法,可以識別技術(shù)創(chuàng)新機(jī)會并具象出系列創(chuàng)新路徑。例如,馮立杰等[7]應(yīng)用IDE 創(chuàng)新方法(工業(yè)設(shè)計ID 與工業(yè)工程IE 融合形成的IDE 創(chuàng)新方法)多維解析裝備研發(fā)領(lǐng)域的多維技術(shù)形態(tài)并構(gòu)建專利地圖,迭代產(chǎn)生技術(shù)研發(fā)方案;王金鳳等[8]基于多維技術(shù)專利地圖提出技術(shù)創(chuàng)新機(jī)會識別路徑,并以此解讀煤層氣開采技術(shù)創(chuàng)新機(jī)會;岳俊舉等[9]依據(jù)文本挖掘及關(guān)聯(lián)規(guī)則構(gòu)建了簡易技術(shù)識別路徑與多維空間專利地圖維法深入進(jìn)行技術(shù)識別,形成完整的技術(shù)形態(tài)。因此,通過構(gòu)建目標(biāo)領(lǐng)域多維空間專利地圖的方式,有利于增強(qiáng)技術(shù)機(jī)會的可讀性,具象出系列創(chuàng)新路徑。
鑒于此,本研究應(yīng)用多維空間專利地圖以識別具體技術(shù)創(chuàng)新路徑。首先通過詞頻-逆文檔頻率(TF-IDF)算法和隱含狄利克雷分布(LDA)模型,快速精確地提取創(chuàng)新要素,進(jìn)而運(yùn)用馮立杰[10]提出的“九法”進(jìn)行耦合異化,構(gòu)建多維空間專利地圖以識別具體技術(shù)創(chuàng)新路徑,并依據(jù)目標(biāo)技術(shù)問題和目標(biāo)優(yōu)選創(chuàng)新法則,更精準(zhǔn)地捕捉技術(shù)創(chuàng)新機(jī)會并具象其創(chuàng)新路徑,最后結(jié)合可拓學(xué)對創(chuàng)新路徑進(jìn)行綜合指標(biāo)關(guān)聯(lián)度評級,優(yōu)選出有價值、有前景、有現(xiàn)實(shí)意義的創(chuàng)新技術(shù)路徑,減少企業(yè)創(chuàng)新成本,提高創(chuàng)新效率。
在技術(shù)機(jī)會識別中,自然語言處理、統(tǒng)計分析等智慧手段呈現(xiàn)廣泛應(yīng)用。一是提高知識要素結(jié)構(gòu)化自動化水平。二是引入新的知識要素結(jié)構(gòu)化技術(shù)文本,拓展技術(shù)機(jī)會識別的表現(xiàn)形式,如,張??〉龋?1]用共詞分析法和謂詞樹分析法對論文與專利以及專利與專利進(jìn)行對比,以挖掘海洋科學(xué)領(lǐng)域的技術(shù)創(chuàng)新機(jī)會;李欣等[12]構(gòu)建了基于SAO 結(jié)構(gòu)的問題-解決路徑模型挖掘并聚類新興技術(shù)專利文本中的語義信息,以揭示新興技術(shù)形成過程中的進(jìn)化脈絡(luò)與演化軌跡;周健等[13]將文獻(xiàn)按時序劃分為不同的時間段,對不同時間段的文獻(xiàn)進(jìn)行主題識別,客觀展示了區(qū)塊鏈技術(shù)主題間的演化關(guān)系。另有學(xué)者通過構(gòu)建專利地圖來識別技術(shù)創(chuàng)新的空白領(lǐng)域,如Son 等[14]將生成拓?fù)溆成洌╣enerative topographic mapping,GTM)應(yīng)用于機(jī)器學(xué)習(xí),通過GTM 專利地圖研究技術(shù)空白區(qū)域的關(guān)鍵詞向量以預(yù)判目標(biāo)領(lǐng)域的技術(shù)創(chuàng)新機(jī)會;而Lee 等[15]、王翠波等[16]則利用可視化技術(shù)專利地圖,將地圖中的空白區(qū)域定義為技術(shù)創(chuàng)新機(jī)會。技術(shù)機(jī)會識別研究在借助各種智慧化、自動化手段減少專家參與的同時,技術(shù)機(jī)會表示及可讀性方面也在趨向于具體化、定量化,如李乾瑞等[5]在采用SAO 語義挖掘方法構(gòu)建技術(shù)形態(tài)矩陣基礎(chǔ)上開展了形態(tài)分析,以輸出技術(shù)形態(tài)組合備選集,然后引入模糊一致矩陣法對得到的技術(shù)形態(tài)組合進(jìn)行了綜合評價與排序;馮立杰等[6]抽取SAO 語義鏈結(jié)合多維空間專利地圖構(gòu)建三級技術(shù)創(chuàng)新識別路徑,多維、多層次精準(zhǔn)識別技術(shù)機(jī)會。
多維空間專利地圖是通過對具象專利信息進(jìn)行多維度導(dǎo)向分析,綜合運(yùn)用多種創(chuàng)新法則對影響各維度的創(chuàng)新要素進(jìn)行迭代變換,從而高效形成系列創(chuàng)新路徑的一種創(chuàng)新方法[17]。該方法綜合了TRIZ、系統(tǒng)創(chuàng)新思維(systematic inventive thinking,SIT)方法和檢核表法等創(chuàng)新理論,提出了人機(jī)關(guān)系維、功能維、動力體系維、環(huán)境維、空間維、結(jié)構(gòu)維、機(jī)理維、材料維和時序維等九大技術(shù)創(chuàng)新維度(以下簡稱“九維”),及智慧化、替代、自服務(wù)、動態(tài)化、分解與去除、組合與集成、局部優(yōu)化、柔性化和友好化等九大技術(shù)創(chuàng)新法則(以下簡稱“九法”),通過九維導(dǎo)航,借助九法對創(chuàng)新要素進(jìn)行耦合變換優(yōu)化,以形成系列技術(shù)創(chuàng)新路徑[10]。多維空間專利地圖的拓展性廣、文本結(jié)構(gòu)兼容性強(qiáng),例如,有研究利用功能-行為-結(jié)構(gòu)(function-behaviorstructure,F(xiàn)BS)結(jié)構(gòu)解析創(chuàng)新層次,并依據(jù)文本挖掘的熱點(diǎn)主題構(gòu)建多維空間專利地圖,解讀系列技術(shù)創(chuàng)新機(jī)會[18];有研究基于需求視角構(gòu)建Kano 模型識別關(guān)鍵需求,引入多維空間專利地圖,生成目標(biāo)APP 的系列技術(shù)創(chuàng)新機(jī)會[19];也有研究基于LDA主題聚類構(gòu)建多維空間專利地圖具象創(chuàng)新方案,并以TexRank-IDF新穎度指標(biāo)評價技術(shù)機(jī)會方案[20]。
綜上所述,多維空間專利地圖的運(yùn)用已經(jīng)逐漸成熟,但上述研究前期通過專家介入進(jìn)行解構(gòu),獲取技術(shù)結(jié)構(gòu)文本,存在主觀性強(qiáng)且效率低等問題;同時,上述研究存在自動化提取創(chuàng)新要素文本精確度不夠等問題。因此,本研究通過TF-IDF 及LDA文本挖掘方法進(jìn)行嵌套使用,對技術(shù)文本經(jīng)過二次精煉,提高多維空間專利地圖的創(chuàng)新要素及創(chuàng)新維度的精確性。
通過詞頻分析、共詞分析及 LDA 概率模型主題提取等文獻(xiàn)統(tǒng)計分析方法,能夠高效遍覽相關(guān)領(lǐng)域的專業(yè)文獻(xiàn)[21],而LDA 在主題詞篩選上能很好體現(xiàn)其間的語義關(guān)系,尤其是它能夠在大量異構(gòu)文本數(shù)據(jù)中提取關(guān)鍵主題的同時降低文本維度,避免維度災(zāi)難[22]。正因如此,LDA 主題模型應(yīng)用成為文獻(xiàn)計量方法的研究熱點(diǎn)。
式(1)中:θd、βk、k為未知參數(shù);θd和βk可通過Gibbs 抽取樣本估算;最優(yōu)主題數(shù)量k可通過困惑度(perplexity)確定。困惑度一般用于評估LDA 主題模型的優(yōu)劣程度以對模型性能進(jìn)行量化評價,計算公式如下:
參考譚春輝等[23]、Liang 等[24]的研究,困惑度表明文檔d從屬主題的不確定性,數(shù)值越小表明模型的性能越優(yōu),因此,將最低或拐點(diǎn)對應(yīng)的k值設(shè)為文本的最佳主題數(shù),但LDA 模型的主題詞項(xiàng)構(gòu)成中大多會存在一些不重要甚至是不相關(guān)的詞項(xiàng),因此,需要在輸出結(jié)果時借助領(lǐng)域?qū)<壹右藻噙x,或引入其他方法進(jìn)行預(yù)處理,以增強(qiáng)主題詞提取的準(zhǔn)確率[24]。如慎金花等[1]、馮立杰等[18]分別采用了Apriori 算法和FBS 模型對文本進(jìn)行挖掘和分解提取關(guān)鍵詞,為LDA 主題聚類提供技術(shù)文本數(shù)據(jù),提高了主題詞項(xiàng)的精度和準(zhǔn)確性;毛太田等[25]將關(guān)聯(lián)規(guī)則算法和LDA 融合,對政府相關(guān)信息文本進(jìn)行了主題提取與聚類以挖掘出相關(guān)用戶的興趣;劉自強(qiáng)等[26]通過引入chunk 模塊,通過名詞組塊的構(gòu)造進(jìn)行增強(qiáng)LDA 主題的可讀性,改善了LDA 中主題詞的信息不足問題。為進(jìn)一步在高效提取專利文本中最具代表性關(guān)鍵詞的同時減少無用的雜詞,提高主題和主題詞提取的精度和效率,本研究將通過TF-IDF 結(jié)合LDA 對專利文本進(jìn)行關(guān)鍵詞篩選,提高專利數(shù)據(jù)分析的客觀性及自動化水平。
TF-IDF 算法簡單直觀,而且在計算詞語的權(quán)值方面應(yīng)用較多且效果較好。該算法提取關(guān)鍵詞的總體思路是:某個詞或短語在某文檔中出現(xiàn)頻率較高而在其他文檔中出現(xiàn)頻率較低,則可認(rèn)為該詞或短語具有較好的區(qū)分能力,可作為該文檔的關(guān)鍵詞[27]。由此,可利用該方法進(jìn)行信息檢索、文本挖掘并確定用戶模型的權(quán)重[28]。如彭博[29]利用TF-IDF 算法提取了網(wǎng)絡(luò)文物信息資源文檔集中各文檔代表性的主題詞;彭郴等[30]等運(yùn)用TF-IDF 算法過濾高質(zhì)量的短語和詞以有效提取相關(guān)產(chǎn)品的質(zhì)量信息,并構(gòu)建了消費(fèi)品缺陷領(lǐng)域的詞典庫;唐曉波等[31]則運(yùn)用TF-IDF 算法抽取關(guān)鍵詞并進(jìn)行抽詞標(biāo)引,以發(fā)現(xiàn)關(guān)鍵詞句子內(nèi)部的特征。不難看出,該算法綜合考慮了文本中高頻詞和低頻詞對文本分類的貢獻(xiàn)。因此,借鑒譚金波[32]的做法,采用TF-IDF 提取的關(guān)鍵詞數(shù)據(jù)集作為 LDA 進(jìn)行主題聚類的數(shù)據(jù)源,在提高數(shù)據(jù)處理效率的同時增強(qiáng)主題詞項(xiàng)提取的精度、準(zhǔn)確性。
本研究以多維空間專利地圖具象出目標(biāo)領(lǐng)域的技術(shù)創(chuàng)新機(jī)會,通過TF-IDF 及LDA 高效精準(zhǔn)地提取目標(biāo)領(lǐng)域創(chuàng)新要素的維度,再結(jié)合多維空間專利地圖九法進(jìn)行耦合異化,構(gòu)建目標(biāo)領(lǐng)域的多維空間專利地圖,法維交織,可以清晰地識別目標(biāo)領(lǐng)域的技術(shù)創(chuàng)新機(jī)會。為進(jìn)一步提高技術(shù)創(chuàng)新的效率,減少盲目投入,先通過問題和目標(biāo)優(yōu)選相關(guān)創(chuàng)新法則,減少價值不高、前景不明的創(chuàng)新路徑,再通過可拓學(xué)計算各創(chuàng)新路徑的綜合評級關(guān)聯(lián)度進(jìn)行優(yōu)選。
本研究構(gòu)建的技術(shù)創(chuàng)新路徑識別框架主要由技術(shù)創(chuàng)新路徑的識別和評價組成,如圖1 所示。
圖1 技術(shù)創(chuàng)新路徑識別及評價框架
3.2.1 專利數(shù)據(jù)的預(yù)處理
(1)確定技術(shù)創(chuàng)新領(lǐng)域。鑒于每個技術(shù)創(chuàng)新領(lǐng)域包含的專利文本數(shù)據(jù)不一,涵蓋的關(guān)鍵詞不同,所以由此得到的創(chuàng)新要素和維度也不盡相同,因此首先應(yīng)明晰具體的技術(shù)創(chuàng)新領(lǐng)域。
(2)甄選專利。針對目標(biāo)技術(shù)創(chuàng)新領(lǐng)域確定專利搜索關(guān)鍵詞,并在特定專利檢索平臺收集相關(guān)專利數(shù)據(jù),在剔除與目標(biāo)技術(shù)創(chuàng)新領(lǐng)域關(guān)聯(lián)度較低的專利后,得到與之關(guān)聯(lián)度較高且代表該領(lǐng)域技術(shù)創(chuàng)新研發(fā)趨勢的專利文本數(shù)據(jù)。
(3)建立知識圖譜。將上述專利數(shù)據(jù)進(jìn)行分詞、停詞、清洗、篩選處理,可提取目標(biāo)技術(shù)領(lǐng)域的創(chuàng)新要素并建立知識圖譜,為萃取創(chuàng)新維度奠定基礎(chǔ)。
3.2.2 創(chuàng)新維度的萃取
(1)挖掘創(chuàng)新要素?;赥F-IDF 算法提取專利文本中的關(guān)鍵詞作為影響專利創(chuàng)新的要素。
(2)LDA 挖掘核心創(chuàng)新要素。對專利文本關(guān)鍵詞降維并提取主題文本及其核心要素,可將采用TF-IDF 方法得到的關(guān)鍵詞文本輸入LDA 模型,以提高基于LDA 降維分析的精準(zhǔn)度。
(3)依據(jù)專家意見,結(jié)合知識圖譜刪減或補(bǔ)充上述數(shù)據(jù)集,繼而萃取出影響目標(biāo)技術(shù)領(lǐng)域的創(chuàng)新維度。
3.2.3 技術(shù)創(chuàng)新路徑的生成
(1)構(gòu)建多維空間專利地圖。依據(jù)LDA 多維要素聚類最終結(jié)果將創(chuàng)新要素映射并標(biāo)注于多維空間,繪制出多維空間創(chuàng)新地圖,依此可視化分析現(xiàn)有要素組合的分布狀態(tài),而且能夠通過變化異化后的要素間組合觸發(fā)創(chuàng)新,進(jìn)而產(chǎn)生超出現(xiàn)有技術(shù)領(lǐng)域的創(chuàng)新要素組合,從而為探索目標(biāo)領(lǐng)域的潛在創(chuàng)新機(jī)會提供指引。
(2)通過問題和目標(biāo)確定創(chuàng)新法則。由于創(chuàng)新要素及創(chuàng)新法則組合分布數(shù)量龐大,存在價值及前景較小的創(chuàng)新路徑,因此需要對創(chuàng)新法則及維度組合進(jìn)行篩選,明確創(chuàng)新目標(biāo),提高技術(shù)創(chuàng)新的效率?;诂F(xiàn)實(shí)狀況中目標(biāo)技術(shù)存在的問題及對應(yīng)達(dá)到的目標(biāo),邀請專家優(yōu)選各創(chuàng)新維度選擇進(jìn)行耦合變換的創(chuàng)新法則,如智慧化、替代、自服務(wù)、分解與去除等。
(3)具象技術(shù)創(chuàng)新路徑。將上述創(chuàng)新維度與對應(yīng)的創(chuàng)新法則耦合,根據(jù)目標(biāo)技術(shù)存在的問題生成系列技術(shù)創(chuàng)新路徑。
為了進(jìn)一步提高創(chuàng)新效率,減少不必要的創(chuàng)新成本,應(yīng)用評價模型對以上生成的技術(shù)創(chuàng)新路徑進(jìn)行評價,以研判最佳技術(shù)創(chuàng)新機(jī)會的過程。鑒于可拓學(xué)方法在策略生成與評價技術(shù)中的廣泛應(yīng)用,如,Su 等[33]、Jiang 等[34]均指出,依據(jù)可拓學(xué)理論構(gòu)建的區(qū)域創(chuàng)新協(xié)調(diào)的測度模型、空氣質(zhì)量預(yù)警系統(tǒng)的評估模型,可以更好衡量創(chuàng)新對象或評估對象的性質(zhì)特征,因此本研究采用該方法進(jìn)行關(guān)聯(lián)度計算以實(shí)現(xiàn)對具體創(chuàng)新路徑的評價。詳細(xì)步驟如下。
(1)劃分評價等級。參照TRIZ 理論可將具象技術(shù)創(chuàng)新路徑劃分為5 個等級代表創(chuàng)新路徑的投入價值,即I 級(高級)、Ⅱ級(較高級)、Ⅲ級(一般)、Ⅳ級(較低級)和V 級(低級),各級別對應(yīng)的值域分別為I 級(4,5]、Ⅱ級(3,4]、Ⅲ級(2,3]、Ⅳ級(1,2]和V 級(0,1]。
(2)構(gòu)建待評物元。作為可拓學(xué)的邏輯細(xì)胞,物元可表述為R=(N,b,r)=(事物名稱,特征,特征值),由此對待評的技術(shù)創(chuàng)新路徑i構(gòu)建待評物元矩陣如下:
(3)計算關(guān)聯(lián)度。根據(jù)可拓學(xué)的關(guān)聯(lián)度計算規(guī)則,第k個指標(biāo)關(guān)于等級j的關(guān)聯(lián)函數(shù)可表述如下:
(5)通過計算上述各創(chuàng)新路徑的綜合關(guān)聯(lián)度判定其創(chuàng)新等級。首先計算各創(chuàng)新路徑的綜合關(guān)聯(lián)度如下:
最后,選取關(guān)聯(lián)度最高者作為最優(yōu)創(chuàng)新路徑。
冷庫作為肉禽類、果蔬、冷飲、藥品、化工原料和電子儀器儀表等必不可少的恒溫貯藏基礎(chǔ)設(shè)施[35],同時也是冷鏈物流中最重要的一環(huán),探究冷庫技術(shù)設(shè)施的創(chuàng)新路徑對冷鏈物流企業(yè)的創(chuàng)新發(fā)展極為重要。利用上述技術(shù)機(jī)會識別模型識別冷庫創(chuàng)新路徑,精準(zhǔn)把握冷庫技術(shù)領(lǐng)域創(chuàng)新規(guī)律,具象冷庫技術(shù)創(chuàng)新路徑,結(jié)合可拓學(xué)理論進(jìn)行關(guān)聯(lián)度綜合指標(biāo)計算并評級擇優(yōu),為冷鏈物流企業(yè)制定科學(xué)合理的技術(shù)創(chuàng)新研發(fā)方案提供決策參考。
4.1.1 數(shù)據(jù)收集及預(yù)處理
在中國知識產(chǎn)權(quán)網(wǎng)平臺檢索相關(guān)專利數(shù)據(jù),具體檢索方案見表1。
表1 冷庫技術(shù)專利檢索方案
將檢索到的專利文本數(shù)據(jù)進(jìn)行關(guān)聯(lián)度篩選,剔除不符合冷庫技術(shù)創(chuàng)新主題要求的專利數(shù)據(jù),共得到2 668 項(xiàng)有效專利文本數(shù)據(jù)(以下簡稱“樣本”)。為更精確地獲取目標(biāo)技術(shù)領(lǐng)域的創(chuàng)新要素,通過分詞及停詞處理對文檔清洗并進(jìn)行多次迭代構(gòu)建冷庫技術(shù)的專業(yè)停詞表,通過計算關(guān)鍵詞的共詞矩陣和詞頻并進(jìn)行可視化處理,繪制冷庫技術(shù)的創(chuàng)新要素共線網(wǎng)絡(luò)如圖2 所示。
圖2 冷庫技術(shù)創(chuàng)新要素共線
圖2 中,關(guān)鍵詞字體大小代表詞頻的高低;各關(guān)鍵詞及其之間的連線代表各專利文獻(xiàn)進(jìn)行創(chuàng)新的要素及其組合,連線粗細(xì)代表該組合的創(chuàng)新次數(shù),連線越粗越多代表創(chuàng)新的頻次越高、結(jié)構(gòu)也越緊密。由此看出,現(xiàn)有冷庫領(lǐng)域的技術(shù)創(chuàng)新熱點(diǎn)主要集中在制冷系統(tǒng)的各設(shè)備與構(gòu)件(如壓縮機(jī)、蒸發(fā)器、冷凝器及冷風(fēng)器等);在現(xiàn)有技術(shù)熱點(diǎn)四周密布的創(chuàng)新要素為冷庫技術(shù)專利研究的稀疏區(qū)或空白區(qū),這些創(chuàng)新要素的關(guān)注度較低,例如熱交換器、散熱器、截止閥、聲光報警器、增壓風(fēng)機(jī)等,但這些專利支持文檔少、出現(xiàn)頻率低的創(chuàng)新要素對冷庫的未來技術(shù)創(chuàng)新極為重要。
4.1.2 冷庫技術(shù)的創(chuàng)新要素挖掘
運(yùn)用TF-IDF 算法在樣本數(shù)據(jù)中提取得到各冷庫技術(shù)專利的創(chuàng)新要素(見表2)。
表2 冷庫技術(shù)專利文本創(chuàng)新要素
4.1.3 冷庫技術(shù)創(chuàng)新維度確定
選取最小困惑度對應(yīng)的主題數(shù)作為LDA 模型的最優(yōu)主題數(shù),計算得出1~10 個主題數(shù)對應(yīng)的困惑度(見圖3)。
圖3 冷庫技術(shù)專利文本主題個數(shù)與其對應(yīng)的困惑度
由圖3 可以看出,當(dāng)主題數(shù)為4 時困惑度最低,因此冷庫的LDA 模型最優(yōu)主題數(shù)為4。進(jìn)一步建立LDA 模型得到聚類的主題和主題關(guān)鍵詞,如表3 所示。
表3 冷庫技術(shù)專利文本的LDA 聚類數(shù)據(jù)
其次,運(yùn)用多維空間專利地圖對主題核心創(chuàng)新要素進(jìn)行分類,并將冷庫技術(shù)的創(chuàng)新維度劃分為材料維、機(jī)理維、結(jié)構(gòu)維和功能維。由于TF-IDF 和LDA 均為基于詞頻的智能算法,在提取聚類中可能會漏掉具有創(chuàng)新性的關(guān)鍵詞,因此將表3 結(jié)合知識圖譜進(jìn)行查驗(yàn),得到載冷劑、增壓風(fēng)機(jī)、油液分離器等創(chuàng)新要素。此外,邀請相關(guān)領(lǐng)域?qū)<夜惭a(bǔ)充了20 個創(chuàng)新要素,最終確定的創(chuàng)新維度見表4。
表4 冷庫技術(shù)的創(chuàng)新維度
4.1.4 構(gòu)建冷庫技術(shù)的多維空間專利地圖
依據(jù)LDA 多維要素聚類結(jié)果繪制出多維空間創(chuàng)新地圖(見圖4 和圖5),對現(xiàn)有要素組合的分布狀態(tài)進(jìn)行可視化分析;同時,通過變化異化后的要素間組合觸發(fā)創(chuàng)新,進(jìn)而產(chǎn)生超越現(xiàn)有技術(shù)領(lǐng)域的創(chuàng)新要素組合,為探索冷庫創(chuàng)新技術(shù)提供指引。
圖4 冷庫技術(shù)機(jī)理、功能、結(jié)構(gòu)維空間專利地圖
圖5 冷庫技術(shù)材料、功能、結(jié)構(gòu)維空間專利地圖
多維空間創(chuàng)新地圖蘊(yùn)含了豐富的 創(chuàng)新要素及創(chuàng)新法則組合分布,但推導(dǎo)出的一些技術(shù)創(chuàng)新路徑方案可能存在價值及前景較小的問題,為了避免創(chuàng)新盲目性和提升創(chuàng)新效率,從當(dāng)前我國冷庫技術(shù)存在的問題出發(fā),分析冷庫領(lǐng)域當(dāng)前急需解決的問題。我國生產(chǎn)的分體制冷器、庫體材料、冷凝材料、溴化鋰吸收式冷水機(jī)組等產(chǎn)品取得一定的優(yōu)勢,但在制冷壓縮機(jī)的研究開發(fā)、制冷空調(diào)系統(tǒng)、冷庫設(shè)施自動及智慧化設(shè)計、網(wǎng)絡(luò)化運(yùn)行等方面仍具有明顯的差距[36]。例如,存在冷庫設(shè)施功能單一,不能很好地適應(yīng)如今市場多樣化的要求;加之其自動化程度普遍偏低,與發(fā)達(dá)國家相比差距較大,整體冷庫技術(shù)大多僅針對某一制冷設(shè)備部件,較少系統(tǒng)考慮制冷循環(huán)的前沿領(lǐng)域,因此無法精細(xì)控制冷庫設(shè)施各個環(huán)節(jié),造成大量能量浪費(fèi)的情況[37]。在分析我國現(xiàn)有冷庫的問題后,邀請專家對此優(yōu)選耦合的創(chuàng)新法則(見表5),并分別從不同維度的不同創(chuàng)新要素與優(yōu)選的創(chuàng)新法則進(jìn)行迭代變換,具象出了6 種冷庫技術(shù)創(chuàng)新路徑(見圖6),其中每種路徑連線表示其所涉及的維度,不同的形狀表示該路徑涉及的創(chuàng)新法則,具體如表6 所示。
表5 我國冷庫存在問題與對應(yīng)創(chuàng)新法則
表6 冷庫技術(shù)的創(chuàng)新路徑
圖6 基于4 類維度的冷庫技術(shù)方案
分別從技術(shù)和市場兩個層面構(gòu)建指標(biāo)體系,通過可拓學(xué)建立評價物元,然后運(yùn)用關(guān)聯(lián)度計算規(guī)則計算各路徑的評價指標(biāo)對評價等級綜合關(guān)聯(lián)度,進(jìn)而優(yōu)選出最合理的技術(shù)創(chuàng)新路徑。其中,各路徑的潛在價值由技術(shù)層面諸如新穎度x1i、技術(shù)實(shí)現(xiàn)可能性x2i、市場價值層面的經(jīng)濟(jì)效益x3i、社會效益x4i等指標(biāo)共同決定。首先,邀請相關(guān)專家及企業(yè)技術(shù)人員對各具象指標(biāo)打分,以構(gòu)建冷庫技術(shù)各創(chuàng)新路徑的待評物元Ri(i=1,2,3,4,5,6)如下:
其次,通過式(4)~(6)分別計算冷庫技術(shù)各創(chuàng)新路徑評價指標(biāo)與各等級的關(guān)聯(lián)度。以路徑①為例,計算指標(biāo)x11的r11關(guān)于 I、Ⅱ等級的關(guān)聯(lián)度,其余計算結(jié)果見表7。由于所以r11關(guān)于 I、Ⅱ等級的關(guān)聯(lián)度為:
表7 冷庫技術(shù)待評創(chuàng)新路徑各指標(biāo)值對創(chuàng)新等級的關(guān)聯(lián)度
表7(續(xù))
則冷庫技術(shù)的各創(chuàng)新路徑關(guān)于各等級的最大關(guān)聯(lián)度為:
從上述創(chuàng)新路徑的最大關(guān)聯(lián)度可知,路徑①和路徑④為高級創(chuàng)新路徑的Ⅰ類創(chuàng)新等級;而路徑②③⑤⑥為較高級創(chuàng)新路徑Ⅱ類創(chuàng)新等級。其中,①、④相較于其他路徑,在冷庫的制冷系統(tǒng)和設(shè)備上,采用組合與集成或自服務(wù)創(chuàng)新法則對其進(jìn)行組合優(yōu)化實(shí)施難度小而且成本低,在冷庫節(jié)能和提高設(shè)備使用壽命等方面效果顯著,具有更高的創(chuàng)新價值。
本研究使用TF-IDF 及LDA 文本挖掘方法對技術(shù)文本經(jīng)過二次精煉,提高多維空間專利地圖的創(chuàng)新要素及創(chuàng)新維度的精確性,并依據(jù)目標(biāo)技術(shù)問題和目標(biāo)優(yōu)選創(chuàng)新法則建立可拓學(xué)評價體系,具象出符合現(xiàn)狀、有價值有前景的技術(shù)路徑?;诖思夹g(shù)機(jī)會識別評價模型,通過計算各創(chuàng)新路徑綜合評級關(guān)聯(lián)度進(jìn)行進(jìn)一步擇優(yōu),以減少盲目創(chuàng)新投入的成本,提高創(chuàng)新的效率和科學(xué)性。
但在完善創(chuàng)新要素以及確定方案評價權(quán)重時,本研究主要依據(jù)專家的經(jīng)驗(yàn)可能會加大擇優(yōu)結(jié)果的主觀性,后續(xù)研究需要從主客觀兩方面綜合考慮并確定其權(quán)重。