曹茹燁 曹樹金
關(guān)鍵詞: 高價(jià)值專利; 技術(shù)創(chuàng)新演化; 知識(shí)圖譜; 腦機(jī)接口
DOI:10.3969 / j.issn.1008-0821.2024.06.001
〔中圖分類號(hào)〕G255 53 〔文獻(xiàn)標(biāo)識(shí)碼〕A 〔文章編號(hào)〕1008-0821 (2024) 06-0003-15
隨著新一輪科技革命的加速推進(jìn), 科技創(chuàng)新已經(jīng)成為影響國家競爭力和世界發(fā)展格局的關(guān)鍵變量。
黨的二十大報(bào)告強(qiáng)調(diào), 要加快實(shí)施創(chuàng)新驅(qū)動(dòng)發(fā)展戰(zhàn)略, 集聚力量進(jìn)行原創(chuàng)性引領(lǐng)性科技攻關(guān), 堅(jiān)決打贏關(guān)鍵核心技術(shù)攻堅(jiān)戰(zhàn)[1] 。攻克關(guān)鍵核心技術(shù)領(lǐng)域難題, 首先需要把握技術(shù)的演進(jìn)特征和發(fā)展規(guī)律[2] 。鑒于高價(jià)值性是關(guān)鍵核心技術(shù)的主要特征[3] , 而專利又是科技創(chuàng)新的重要載體, 精準(zhǔn)識(shí)別高價(jià)值專利,分析技術(shù)創(chuàng)新演化態(tài)勢, 對國家科技戰(zhàn)略布局、科技機(jī)構(gòu)和企業(yè)的創(chuàng)新發(fā)展規(guī)劃, 以及科研人員理解技術(shù)核心要素并發(fā)現(xiàn)創(chuàng)新規(guī)律和創(chuàng)新機(jī)會(huì)具有重要意義。
“ 十四五” 規(guī)劃中首次將“每萬人口高價(jià)值發(fā)明專利擁有量” 納入經(jīng)濟(jì)社會(huì)發(fā)展的主要指標(biāo)[4] ,培育高價(jià)值專利、提升創(chuàng)新質(zhì)量越來越成為國家科技創(chuàng)新體系的重要一環(huán)。目前, 對高價(jià)值專利的研究主要集中在高價(jià)值專利的識(shí)別、價(jià)值評估、專利挖掘以及技術(shù)擴(kuò)散分析等方面, 少有針對高價(jià)值專利的技術(shù)創(chuàng)新演化研究, 較多的是在不區(qū)分專利價(jià)值高低的基礎(chǔ)上對專利技術(shù)的演化分析, 用于技術(shù)預(yù)測、優(yōu)勢技術(shù)或顛覆性技術(shù)識(shí)別。從方法上看,多從技術(shù)主題視角, 采用文本挖掘和社會(huì)網(wǎng)絡(luò)分析法實(shí)現(xiàn)。然而, 專利尤其是高價(jià)值專利的技術(shù)創(chuàng)新價(jià)值體現(xiàn)在多個(gè)維度, 蘊(yùn)藏在包含復(fù)雜語義關(guān)系的專利文本內(nèi)容中。若要對技術(shù)研判或未來技術(shù)研發(fā)提供更具體、明確的落點(diǎn), 就需要對專利文本進(jìn)行更加細(xì)粒度的揭示, 進(jìn)而從多維度、多視角挖掘高價(jià)值專利的技術(shù)演化規(guī)律。據(jù)此, 本研究擬解決的科學(xué)問題是如何挖掘一個(gè)領(lǐng)域內(nèi)高價(jià)值專利的多面的、細(xì)粒度的、具體的技術(shù)創(chuàng)新點(diǎn)并發(fā)現(xiàn)其演化規(guī)律, 從而為科技創(chuàng)新主體提供多維和具體的參考?具體包括3 個(gè)子研究問題: 一是如何設(shè)計(jì)一套新穎且合理的指標(biāo)體系來評估和識(shí)別高價(jià)值專利? 二是如何提取高價(jià)值專利文本中的細(xì)粒度技術(shù)要素并對其進(jìn)行語義化組織, 以便從多維視角理解專利技術(shù)的本質(zhì)和特征? 三是如何基于多維技術(shù)要素及其關(guān)聯(lián)關(guān)系, 從更加細(xì)微且多面而非僅僅是粗淺的主題角度來分析高價(jià)值專利的技術(shù)創(chuàng)新演化現(xiàn)象?
為解決以上問題, 本研究將以“腦機(jī)接口” 領(lǐng)域?yàn)槔?從優(yōu)化部分指標(biāo)測算方法及指標(biāo)組合的角度設(shè)計(jì)能夠反映技術(shù)價(jià)值、專利權(quán)利和市場前景的指標(biāo)體系以識(shí)別高價(jià)值專利, 并利用知識(shí)圖譜對高價(jià)值專利進(jìn)行細(xì)粒度的技術(shù)要素提取和關(guān)聯(lián)關(guān)系揭示, 在此基礎(chǔ)上從多角度分析技術(shù)創(chuàng)新演化的趨勢,旨在促進(jìn)關(guān)鍵技術(shù)領(lǐng)域的創(chuàng)新發(fā)展。
1 相關(guān)研究
1.1 高價(jià)值專利識(shí)別相關(guān)研究
現(xiàn)有研究多從技術(shù)、法律和市場3 個(gè)角度評估專利價(jià)值以識(shí)別高價(jià)值專利, 具體包括單一維度的縱深化評估和多維度的綜合評估。比如根據(jù)TRIZ的功能分析, 從技術(shù)價(jià)值視角識(shí)別高價(jià)值專利[5] ;或者基于技術(shù)的轉(zhuǎn)移轉(zhuǎn)化對專利價(jià)值進(jìn)行評估[6] ;但更多的是構(gòu)建高價(jià)值專利識(shí)別的多維指標(biāo)體系,如, 付振康等[7] 綜合了能夠反映技術(shù)價(jià)值的技術(shù)生命周期、引證數(shù)等指標(biāo), 反映法律維度的權(quán)利要求數(shù)、審查周期等指標(biāo), 以及反映市場價(jià)值的PCT申請等指標(biāo)篩選高價(jià)值專利。宋凱等[8] 從保護(hù)范圍、研發(fā)水平、市場前景和主體特征4 個(gè)維度構(gòu)建了一套專利價(jià)值評估的指標(biāo)體系。從高價(jià)值專利識(shí)別的方法來看, 常見的有基于指標(biāo)權(quán)重的綜合評價(jià)法, 如層次分析法和熵權(quán)法的結(jié)合[9] 、多目標(biāo)決策分析中的TOPSIS 方法[10] 以及Critic 賦權(quán)法的應(yīng)用[11] 。近年來, 較多研究使用機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的方法, 將高價(jià)值專利識(shí)別問題轉(zhuǎn)化為分類問題。王思培等[12] 基于隨機(jī)森林算法, 將反映專利價(jià)值的多維指標(biāo)作為輸入變量, 高價(jià)值專利類別作為分類變量, 構(gòu)建潛在高價(jià)值專利的預(yù)測模型。Liu WD 等[13] 提出了基于多任務(wù)學(xué)習(xí)的高價(jià)值專利識(shí)別模型。Woo H 等[14] 采用貝葉斯結(jié)構(gòu)方程模型, 從技術(shù)性、權(quán)利性和可用性3 個(gè)維度對專利價(jià)值進(jìn)行評估建模和分類識(shí)別。此外, 還有研究將綜合評價(jià)法與機(jī)器學(xué)習(xí)方法結(jié)合識(shí)別高價(jià)值專利, 如基于機(jī)器學(xué)習(xí)改進(jìn)的AHPSort Ⅱ方法[15] 。
1.2 基于專利分析的技術(shù)創(chuàng)新演化相關(guān)研究
基于專利的技術(shù)創(chuàng)新演化研究主要集中在兩個(gè)方面, 一是技術(shù)主題的演化分析; 二是技術(shù)創(chuàng)新網(wǎng)絡(luò)的演化分析。關(guān)于技術(shù)主題創(chuàng)新演化, 較多學(xué)者采用主題識(shí)別、機(jī)器學(xué)習(xí)的方法進(jìn)行分析。如基于Word2Vec 詞向量模型和LDA 主題模型的干細(xì)胞治療技術(shù)在“科學(xué)發(fā)現(xiàn)—技術(shù)創(chuàng)新—技術(shù)應(yīng)用” 全生命周期的演化脈絡(luò)與特征研究[16] ; 基于專利數(shù)據(jù),引入技術(shù)主題時(shí)序共現(xiàn)網(wǎng)絡(luò)和主題引用網(wǎng)絡(luò)的技術(shù)主題演化趨勢分析[17] ; 利用專利摘要, 結(jié)合LDA和隱馬爾科夫模型分析3D 打印技術(shù)主題的分布和演化模式[18] ; 以及融合SAO 三元組抽取、主題識(shí)別與相似度計(jì)算分析石墨烯超級(jí)電容器領(lǐng)域技術(shù)主題的創(chuàng)新演化路徑[19] 等。關(guān)于技術(shù)創(chuàng)新網(wǎng)絡(luò)的演化, 現(xiàn)有研究多利用網(wǎng)絡(luò)分析法, 對基于專利的技術(shù)創(chuàng)新合作網(wǎng)絡(luò)或引文網(wǎng)絡(luò)的演化路徑進(jìn)行探索。如HsuC W 等[20] 基于專利引用關(guān)系所產(chǎn)生的社會(huì)網(wǎng)絡(luò)來討論生物質(zhì)發(fā)酵產(chǎn)氫技術(shù)的演化; 束超慧等[21] 以專利申請人作為網(wǎng)絡(luò)節(jié)點(diǎn)構(gòu)建顛覆性技術(shù)創(chuàng)新網(wǎng)絡(luò), 從而分析了智能語音技術(shù)專利合作創(chuàng)新網(wǎng)絡(luò)的演化過程。趙靚等[22] 利用基于專利分類代碼構(gòu)建的專利共現(xiàn)網(wǎng)絡(luò)分析了軍事智能技術(shù)演化趨勢。
1.3 基于科技文獻(xiàn)的知識(shí)圖譜構(gòu)建與應(yīng)用研究
知識(shí)圖譜是谷歌在2012 年提出的概念, 本質(zhì)是一種語義網(wǎng)絡(luò), 被廣泛用于智能語義搜索、智能問答和信息推薦等領(lǐng)域。近年來, 諸多學(xué)者將其引入科技領(lǐng)域的知識(shí)組織和知識(shí)發(fā)現(xiàn)研究, 探索基于科技文獻(xiàn)(主要為專利、科技論文)的領(lǐng)域知識(shí)圖譜構(gòu)建方法, 以及在此基礎(chǔ)上的技術(shù)創(chuàng)新識(shí)別與創(chuàng)新知識(shí)檢索、新興技術(shù)預(yù)測、技術(shù)推薦等現(xiàn)實(shí)應(yīng)用。在面向科技文獻(xiàn)的知識(shí)圖譜構(gòu)建中, 有研究基于數(shù)據(jù)增強(qiáng)方法構(gòu)建了新能源汽車電池技術(shù)領(lǐng)域的知識(shí)圖譜[23] , 融合聯(lián)合抽取模型SpERT 以及關(guān)系抽取模型Aggcn 構(gòu)建了綠色合作領(lǐng)域的專利知識(shí)圖譜[24] , 以及基于圖嵌入算法構(gòu)建非全氟化質(zhì)子交換膜領(lǐng)域?qū)@R(shí)圖譜等[25] 。在知識(shí)圖譜的應(yīng)用中, 曹樹金等[26] 基于所構(gòu)建的專利文獻(xiàn)創(chuàng)新知識(shí)圖譜分析了其在創(chuàng)新知識(shí)檢索及專利文獻(xiàn)創(chuàng)新點(diǎn)對比中的應(yīng)用; Deng W W 等[27] 提出了一種在專利知識(shí)圖譜的基礎(chǔ)上對專利和公司進(jìn)行加權(quán)圖分析的方法, 用于向企業(yè)推薦專利; Doerpinghaus J 等[28] 基于PubMed 數(shù)據(jù)庫中的生物醫(yī)學(xué)論文數(shù)據(jù)構(gòu)建了大型的生物醫(yī)學(xué)領(lǐng)域知圖譜, 用于上下文挖掘、基于圖的知識(shí)查詢以及知識(shí)發(fā)現(xiàn); 還有將所構(gòu)建的知識(shí)圖譜用于產(chǎn)業(yè)新興技術(shù)預(yù)測[29] 、專利布局意圖挖掘中[25] 。此外, 也有研究構(gòu)建了技術(shù)演化圖譜, 用于識(shí)別優(yōu)勢專利的技術(shù)研發(fā)方向[30] 。
綜上所述, 現(xiàn)有研究已有相對成熟的高價(jià)值專利評估和篩選的方法, 然而測度技術(shù)價(jià)值的指標(biāo)較少深入到專利文本的潛在語義層面, 尤其是不易測度的主題新穎度之類的指標(biāo)。已有研究表明, 主題新穎性與專利質(zhì)量[31] 及專利影響力[32-33] 有較大關(guān)系。因此, 本研究將重點(diǎn)聚焦于專利技術(shù)主題新穎性, 結(jié)合反映技術(shù)價(jià)值的其他指標(biāo), 以及專利權(quán)利和市場前景來識(shí)別高價(jià)值專利。鑒于已有的主題新穎度測度方法較多以專利技術(shù)出現(xiàn)時(shí)間遠(yuǎn)近為依據(jù),并未從主題本身考慮, 本研究將提出一種新的測度方法加以優(yōu)化; 另一方面, 從專利文本內(nèi)容層面開展的技術(shù)創(chuàng)新演化研究多從主題角度切入, 分析的粒度較粗, 維度較單一。而將知識(shí)圖譜用于科技文獻(xiàn)挖掘的相關(guān)研究為該問題的解決提供了新的思路和理論依據(jù)。基于此, 本文將結(jié)合知識(shí)圖譜的優(yōu)勢,對高價(jià)值專利的技術(shù)演化趨勢進(jìn)行更加具體和多角度的分析, 為科技創(chuàng)新的各類主體提供更明確的參考。
2 研究設(shè)計(jì)
2.1 研究思路
本研究總體思路如圖1 所示。主要分為4 個(gè)階段: 數(shù)據(jù)收集與預(yù)處理、高價(jià)值專利識(shí)別、高價(jià)值專利知識(shí)圖譜構(gòu)建、高價(jià)值專利的技術(shù)創(chuàng)新演化分析。首先, 在數(shù)據(jù)集的選取上, 鑒于腦機(jī)接口是新一代人機(jī)交互和人機(jī)混合智能的關(guān)鍵核心技術(shù), 被美國商務(wù)部列為14 項(xiàng)出口管制技術(shù)之一[34] 。因此, 本研究采集了“腦機(jī)接口” 領(lǐng)域的專利文獻(xiàn)作為樣本, 經(jīng)過預(yù)處理后形成語料集; 其次, 在高價(jià)值專利識(shí)別過程中, 重點(diǎn)考慮技術(shù)主題的新穎性,借助KeyBERT 模型從專利標(biāo)題和摘要中抽取關(guān)鍵詞, 采用一種新的方法設(shè)計(jì)主題新穎性測度的指標(biāo),該方法主要通過與申請年以前的專利技術(shù)進(jìn)行對比,而非僅依據(jù)申請年遠(yuǎn)近來判斷新穎性, 如此能夠評估在專利申請的當(dāng)下所體現(xiàn)的價(jià)值, 以便識(shí)別出在技術(shù)發(fā)展的各個(gè)不同階段具有高新穎性的專利。與此同時(shí), 結(jié)合技術(shù)維度的其他指標(biāo)以及反映專利權(quán)利和市場前景的指標(biāo), 利用Critic 權(quán)重法綜合評估專利價(jià)值, 從而篩選出高價(jià)值專利。然后, 針對識(shí)別出的高價(jià)值專利構(gòu)建知識(shí)圖譜, 具體包括實(shí)體及關(guān)系類型定義、數(shù)據(jù)標(biāo)注、采用CasRel 聯(lián)合抽取模型進(jìn)行訓(xùn)練、利用訓(xùn)練好的模型對未標(biāo)注語料進(jìn)行知識(shí)抽取、知識(shí)融合與消歧, 并利用Neo4j 圖數(shù)據(jù)庫實(shí)現(xiàn)知識(shí)圖譜的存儲(chǔ)與可視化; 最后, 基于所構(gòu)建的知識(shí)圖譜進(jìn)行技術(shù)創(chuàng)新演化分析, 分析的維度依據(jù)知識(shí)圖譜中所涉及的不同類型的實(shí)體及關(guān)系。
2.2專利價(jià)值評估指標(biāo)設(shè)計(jì)與綜合評價(jià)
明確高價(jià)值專利的內(nèi)涵是識(shí)別高價(jià)值專利的前提。對于高價(jià)值專利的內(nèi)涵存在多種說法, 尚未形成統(tǒng)一的定義。國家知識(shí)產(chǎn)權(quán)局曾對高價(jià)值發(fā)明專利的范圍進(jìn)行了說明[35] , 在此基礎(chǔ)上綜合學(xué)者們的不同觀點(diǎn), 發(fā)現(xiàn)領(lǐng)域內(nèi)普遍認(rèn)為高價(jià)值專利應(yīng)具有較高的技術(shù)創(chuàng)新性、較穩(wěn)定的專利權(quán)利、較高的市場應(yīng)用價(jià)值幾大特征[7,36-37] 。因此, 根據(jù)相關(guān)研究中所涉及的多種指標(biāo), 從中歸納出3 個(gè)重要維度作為本研究指標(biāo)設(shè)計(jì)的基準(zhǔn), 即技術(shù)價(jià)值、專利權(quán)利和市場前景。技術(shù)維度的指標(biāo)主要包括技術(shù)主題新穎性、技術(shù)覆蓋范圍和技術(shù)投入。關(guān)于技術(shù)新穎性有多種度量方法, 比如采用專利授權(quán)的時(shí)間度量,即時(shí)間越近新穎度越高[11,29] ; 也有以新詞的早期出現(xiàn)率低于15%作為度量依據(jù); 以主題詞組合在專利申請年之前的所有專利中出現(xiàn)的頻次來度量技術(shù)新穎性[38] ; 以及通過與歷史主題的相似度計(jì)算進(jìn)行度量[39] 等??梢姡?技術(shù)新穎度大都反映在時(shí)間維度的對比中。鑒于關(guān)鍵詞是判斷文獻(xiàn)主題的重要依據(jù)[40] , 本研究設(shè)計(jì)兩個(gè)指標(biāo)來反映技術(shù)主題的新穎性, 即關(guān)鍵詞早期出現(xiàn)率X1 與關(guān)鍵詞相似度X2。關(guān)鍵詞通過KeyBERT 從專利標(biāo)題和摘要中抽取。X1 計(jì)算方法如式(1): 對于某一專利, 第i 個(gè)關(guān)鍵詞在其申請年之前出現(xiàn)的專利總數(shù)ni 與申請年之前所有專利總數(shù)N 的比值設(shè)為K, 參考Por?ter A L 等[41] 的經(jīng)驗(yàn), 當(dāng)K≤0 15 時(shí)認(rèn)為該詞具有新穎性, 記為1, 該專利的總新穎度得分為所有關(guān)鍵詞新穎性計(jì)數(shù)的總和S。指標(biāo)X2 的計(jì)算方式為:將抽取出的專利關(guān)鍵詞組合與申請年之前的每份專利的關(guān)鍵詞組合進(jìn)行相似度計(jì)算, 按照相似度遞減排列, 獲得與該專利關(guān)鍵詞組合相似度最高的前15%個(gè)專利, 以其相似度得分的平均值作為X2 的值。根據(jù)付振康等[7] 和張彪等[11] 的研究, 技術(shù)覆蓋范圍可由IPC 小類的個(gè)數(shù)(X3)來反映, 技術(shù)投入可由發(fā)明人數(shù)量(X4)反映。綜合宋凱等[8] 和王思培等[37] 提出的專利價(jià)值評估指標(biāo), 專利權(quán)利維度主要由權(quán)利要求數(shù)(X5)來測度, 而市場前景維度則由簡單同族數(shù)量(X6)測度。
在對各項(xiàng)指標(biāo)進(jìn)行測度后, 采用Critic 賦權(quán)法確定指標(biāo)權(quán)重。Critic 賦權(quán)法利用指標(biāo)間的沖突性和信息量大小來確定指標(biāo)權(quán)重值, 是一種利用數(shù)據(jù)自身的客觀屬性進(jìn)行科學(xué)評價(jià)的方法。最后將專利價(jià)值得分降序排列, 選取高于平均值的專利作為高價(jià)值專利。
在構(gòu)建了此套高價(jià)值專利識(shí)別的指標(biāo)體系之后,為了驗(yàn)證其合理性、科學(xué)性和適用性, 首先邀請科學(xué)評價(jià)領(lǐng)域的兩名專家對指標(biāo)本身進(jìn)行定性評估;其次, 由于本研究對評價(jià)指標(biāo)的優(yōu)化主要體現(xiàn)在專利技術(shù)主題新穎性的測度上, 為了驗(yàn)證該方法相較于根據(jù)時(shí)間遠(yuǎn)近評價(jià)的方法更為合理, 隨機(jī)選取了腦機(jī)接口領(lǐng)域若干篇專利文獻(xiàn), 利用該方法計(jì)算反映主題新穎性的兩項(xiàng)指標(biāo)值, 即上述的X1 和X2,結(jié)果發(fā)現(xiàn)有部分近些年(2020 年以后)申請的專利新穎性并不高, 如“基于腦機(jī)接口的設(shè)備控制方法、裝置XXX” “一種XXX 的半侵入式腦機(jī)接口模塊”。經(jīng)領(lǐng)域?qū)<遗袛噙@些專利技術(shù)的新穎性的確相對較低, 若僅用時(shí)間遠(yuǎn)近判斷并不合理, 由此也驗(yàn)證了本研究所提方法的優(yōu)越性; 最后, 將所設(shè)計(jì)的整套指標(biāo)體系分別用于腦機(jī)接口和教育機(jī)器人領(lǐng)域的高價(jià)值專利識(shí)別, 并由各自領(lǐng)域的專家對篩選出的高價(jià)值專利文獻(xiàn)進(jìn)行了評估, 結(jié)果較好。
2.3 高價(jià)值專利知識(shí)圖譜構(gòu)建
以高價(jià)值專利的摘要作為知識(shí)圖譜構(gòu)建的語料。首先, 需要對摘要文本進(jìn)行分析, 歸納出實(shí)體及關(guān)系類型。此過程主要依據(jù)已有研究中關(guān)于專利特征的總結(jié)以及專利摘要構(gòu)成要素的概括, 并根據(jù)特定領(lǐng)域?qū)@墨I(xiàn)自身的特點(diǎn)進(jìn)行設(shè)計(jì); 其次, 知識(shí)圖譜構(gòu)建最重要的就是知識(shí)抽取環(huán)節(jié), 針對非結(jié)構(gòu)化文本的知識(shí)抽取一般涉及實(shí)體識(shí)別與關(guān)系抽取。本研究將采用CasRel 聯(lián)合抽取模型同時(shí)進(jìn)行以上兩種抽取任務(wù)。CasRel 聯(lián)合抽取模型是吉林大學(xué)人工智能學(xué)院的Wei Z P 等[42] 提出的模型, 主要解決三元組重疊的問題, 即一個(gè)句子中的多個(gè)三元組共用同一實(shí)體。該模型的本質(zhì)是基于參數(shù)共享的聯(lián)合實(shí)體關(guān)系抽取方法, 一般又被稱為層疊指針網(wǎng)絡(luò)。模型架構(gòu)如圖2 所示, 包括編碼端和解碼端, 其中編碼端是基于BERT 的編碼層, 解碼端包括頭實(shí)體識(shí)別層和關(guān)系與尾實(shí)體聯(lián)合識(shí)別層。在進(jìn)行實(shí)體關(guān)系聯(lián)合抽取時(shí)主要涉及兩個(gè)步驟: 一是對句子中所有可能的主語進(jìn)行識(shí)別; 二是在每個(gè)關(guān)系類別下再去抽取與主語(即頭實(shí)體)對應(yīng)的尾實(shí)體。鑒于本研究所涉及的專利文本涵蓋復(fù)雜的語義關(guān)系, 存在較多三元組重疊的問題, 選用CasRel 聯(lián)合抽取模型較為合適。確定采用的知識(shí)抽取模型之后, 對專利摘要進(jìn)行分句, 提取部分語料進(jìn)行人工標(biāo)注與訓(xùn)練, 并利用訓(xùn)練好的模型對未標(biāo)注的語料進(jìn)行三元組抽取。在完成知識(shí)抽取工作以后, 參照領(lǐng)域?qū)I(yè)詞典進(jìn)行實(shí)體對齊、消歧與知識(shí)融合。最后, 利用Python 中的Pandas、Py2neo 等工具包將所有的實(shí)體關(guān)系數(shù)據(jù)導(dǎo)入至Neo4j 圖數(shù)據(jù)庫中, 形成高價(jià)值專利知識(shí)圖譜。
2.4 高價(jià)值專利的技術(shù)創(chuàng)新演化分析
高價(jià)值專利的技術(shù)創(chuàng)新演化分析基于所構(gòu)建的知識(shí)圖譜。首先需要確定技術(shù)創(chuàng)新演化分析的維度,鑒于知識(shí)圖譜對高價(jià)值專利進(jìn)行了更加細(xì)粒度的揭示, 涵蓋技術(shù)的多個(gè)方面(如應(yīng)用領(lǐng)域、性能優(yōu)勢、方法基礎(chǔ)等)。因此, 技術(shù)創(chuàng)新演化分析的維度可根據(jù)知識(shí)圖譜中涉及的各個(gè)實(shí)體及關(guān)系類型確定,同時(shí)也可涉及粗粒度的主題分析; 其次, 在每個(gè)分析維度下, 提取不同時(shí)間段的高價(jià)值專利文本子圖,總結(jié)每個(gè)階段的技術(shù)創(chuàng)新特征。進(jìn)而揭示隨著時(shí)間推移, 在技術(shù)創(chuàng)新的各個(gè)維度上, 哪些內(nèi)容逐漸縮減, 哪些內(nèi)容被持續(xù)關(guān)注, 以及某個(gè)時(shí)間段新出現(xiàn)的內(nèi)容有哪些, 以便更加具體地反映高價(jià)值專利的技術(shù)創(chuàng)新演化態(tài)勢?;谥R(shí)圖譜而非簡單的技術(shù)實(shí)體識(shí)別來開展技術(shù)創(chuàng)新演化分析的優(yōu)勢在于: 專利摘要中的技術(shù)實(shí)體所屬類型依關(guān)系而定, 如一個(gè)系統(tǒng)設(shè)備或器件可能是專利本身也可能是專利的組件, 一種方法可能是發(fā)明專利本身也可能是專利所依賴的技術(shù), 抽取三元組而非單個(gè)實(shí)體有助于明確區(qū)分這些技術(shù)實(shí)體。此外, 知識(shí)圖譜還可用于考察具有關(guān)聯(lián)關(guān)系的技術(shù)組合的演化現(xiàn)象。
3 實(shí)證研究
3.1 數(shù)據(jù)采集與預(yù)處理
選取“腦機(jī)接口” 領(lǐng)域的專利文獻(xiàn)作為分析樣本, 以incoPat 全球?qū)@麛?shù)據(jù)庫作為數(shù)據(jù)源。首先,參考已有相關(guān)研究制定檢索策略: TIABC=(腦機(jī)接口OR 腦-機(jī)接口OR 腦機(jī)交互OR 腦-機(jī)交互OR神經(jīng)控制接口OR 直接神經(jīng)接口) OR ((“braincomputer” OR “ brain - computer” OR “ brain ma?chine” OR “brain-machine” OR “neural control” OR“mind machine” OR “direct neural”) AND (inter?face? OR communicat?)), 專利類型限定為發(fā)明專利和實(shí)用新型專利, 檢索日期為2023 年5 月3 日,共獲得相關(guān)專利文獻(xiàn)4 060篇。之后將本研究所需的專利題名、摘要、IPC 分類號(hào)、申請日、權(quán)利要求數(shù)、公開號(hào)等字段信息導(dǎo)出作為初始語料集。在數(shù)據(jù)預(yù)處理階段, 對數(shù)據(jù)進(jìn)行清洗和去噪, 去除重復(fù)專利。少數(shù)專利的摘要字段缺失, 對此采用簡單同族專利的摘要替代, 并利用翻譯軟件對部分僅有外文摘要的專利進(jìn)行處理, 統(tǒng)一為中文摘要。經(jīng)過預(yù)處理之后共獲得3 927篇專利文獻(xiàn), 以此作為最終的語料集。
形成語料集后, 因分詞處理需要加載專業(yè)領(lǐng)域詞典, 但目前并沒有“腦機(jī)接口” 領(lǐng)域的專門詞典?!澳X機(jī)接口” 具有交叉學(xué)科研究的特性, 涉及生物醫(yī)學(xué)工程、電子、材料、信息技術(shù)等多個(gè)學(xué)科。因此, 本研究獲取了“腦機(jī)接口” 研究論文中的關(guān)鍵詞, 結(jié)合神經(jīng)病學(xué)、人工智能以及微電子等領(lǐng)域的現(xiàn)有詞典, 人工構(gòu)建了“腦機(jī)接口” 領(lǐng)域詞典,共包括5 586個(gè)詞。
3.2 “腦機(jī)接口”領(lǐng)域高價(jià)值專利識(shí)別
3.2.1 技術(shù)主題新穎性指標(biāo)測度
根據(jù)本研究設(shè)計(jì)的高價(jià)值專利評估指標(biāo)體系,專利技術(shù)主題新穎性需要計(jì)算關(guān)鍵詞的早期出現(xiàn)率與關(guān)鍵詞相似度。由于專利文本缺少作者標(biāo)注的關(guān)鍵詞集, 本文采用KeyBERT 模型從標(biāo)題和摘要中進(jìn)行提取。KeyBERT 是一種易用的關(guān)鍵詞提取模型, 原理是利用BERT 嵌入來創(chuàng)建與文檔最為相似的關(guān)鍵短語。在關(guān)鍵詞提取過程中, 將專利的標(biāo)題和摘要拼接為TIAB 字段, 利用加載了自定義詞典的Jieba 進(jìn)行分詞處理, 詞嵌入模型選擇“para?phrase-multilingual-MiniLM-L12-v2”, 超參數(shù)設(shè)置為use_mmr=True, diversity=0 4, top_n= 6, 即每個(gè)專利抽取6 個(gè)關(guān)鍵詞, 抽取結(jié)果示例如表1。提取關(guān)鍵詞之后, 按照式(1) 計(jì)算指標(biāo)X1(關(guān)鍵詞早期出現(xiàn)頻率)的得分值。指標(biāo)X2 采用余弦相似度計(jì)算, 詞向量模型同上。需要特別說明的是, 本研究對技術(shù)主題新穎性的度量是與先前專利對比實(shí)現(xiàn)的, 而獲取的專利數(shù)據(jù)集最早年份為1986 年,最早的專利沒有對比項(xiàng), 鑒于2003 年以前的專利數(shù)不足30 篇, 因此在進(jìn)行專利價(jià)值評估時(shí)僅計(jì)算2003年以后的專利。
3.2.2 專利價(jià)值綜合評估
除技術(shù)主題新穎性指標(biāo)以外, 技術(shù)覆蓋范圍、技術(shù)投入、專利權(quán)利和市場前景維度的指標(biāo)均可從incoPat 數(shù)據(jù)庫中直接獲取。之后, 利用Critic 賦權(quán)法對6 類指標(biāo)進(jìn)行加權(quán), 在計(jì)算綜合得分時(shí)采用百分制。表2 呈現(xiàn)了部分專利6 個(gè)指標(biāo)的初始分值和專利價(jià)值的綜合得分。按照綜合得分值降序排列,篩選出高于平均值的專利, 即高價(jià)值專利共2 500個(gè)。
3.3 “腦機(jī)接口”領(lǐng)域高價(jià)值專利知識(shí)圖譜構(gòu)建
3.3.1 確定實(shí)體及關(guān)系類型
有研究總結(jié)了專利摘要包括的一般內(nèi)容, 主要有技術(shù)的新穎性、技術(shù)功效、用途、詳細(xì)描述等,涉及對技術(shù)結(jié)構(gòu)、應(yīng)用領(lǐng)域、性能提升情況、關(guān)鍵組成部件等技術(shù)特征的概括說明[43-44] 。本研究以此作為依據(jù), 結(jié)合“腦機(jī)接口” 領(lǐng)域?qū)@猩婕暗膶I(yè)術(shù)語及語義關(guān)系對需要抽取的實(shí)體與關(guān)系類型進(jìn)行定義, 考慮到后續(xù)技術(shù)創(chuàng)新演化分析需要時(shí)間要素, 因此將專利申請年作為了實(shí)體類型之一。共歸納出12 類實(shí)體和12 類關(guān)系, 具體如表3 所示。這些實(shí)體及關(guān)系類型是“腦機(jī)接口” 領(lǐng)域的專利摘要中普遍存在的, 而非所有的。
3.3.2 數(shù)據(jù)標(biāo)注與知識(shí)抽取
訓(xùn)練CasRel 深度學(xué)習(xí)模型需要先對原始的部分?jǐn)?shù)據(jù)進(jìn)行標(biāo)注, 利用訓(xùn)練好的模型抽取未標(biāo)注數(shù)據(jù)中的實(shí)體及關(guān)系。本研究在識(shí)別出2 500篇高價(jià)值專利之后, 對其摘要進(jìn)行分句, 清洗重復(fù)句后共獲得28 900多條句子。從中選?。?000條數(shù)據(jù)進(jìn)行人工標(biāo)注, 標(biāo)注工作由1 名情報(bào)學(xué)博士生和1 名醫(yī)學(xué)信息學(xué)博士生完成, 之后邀請領(lǐng)域?qū)<液藢?。需要特殊說明的是, 實(shí)體關(guān)系類型“專利本身—申請于—申請年” 不需要預(yù)先標(biāo)注和抽取, 因?yàn)樯暾埬曜侄慰蓮膶@麛?shù)據(jù)庫中直接導(dǎo)出。最后, 人工標(biāo)注的數(shù)據(jù)以Json 格式存儲(chǔ), 具體如表4 所示。
模型訓(xùn)練的實(shí)驗(yàn)環(huán)境配置為: 在Google Colab平臺(tái)上配置Torch2 0 1+cu118、Tensorflow4 18 0、fastNLP0 7、Python3 10 環(huán)境。訓(xùn)練時(shí), 將標(biāo)注好的數(shù)據(jù)以6 ∶2 ∶2 的比例劃分為訓(xùn)練集、驗(yàn)證集和測試集, 實(shí)驗(yàn)參數(shù)設(shè)置為: max_epoch = 50、batch_size=4、learning_rate= 1e-5、max_len = 200。模型訓(xùn)練的最優(yōu)結(jié)果為F1 值達(dá)到0 81、準(zhǔn)確率為0 81、召回率為0 80。最后, 用訓(xùn)練好的模型抽取未標(biāo)注的句子中的三元組, 并進(jìn)行人工校對。
3.3.3 知識(shí)融合與存儲(chǔ)
利用CasRel 深度學(xué)習(xí)模型抽取完三元組之后,需要對實(shí)體進(jìn)行對齊, 參考專業(yè)詞典將同一實(shí)體的多種表述(如“EEG 信號(hào)” 與“腦電信號(hào)”)進(jìn)行統(tǒng)一?;诒恚?定義的實(shí)體關(guān)系類型, 共獲得10 358個(gè)三元組。之后, 將融合后的三元組存儲(chǔ)到Neo4j圖數(shù)據(jù)庫中。需要特殊說明的是, “專利本身” 這個(gè)類型的實(shí)體指代的是整個(gè)專利, 從句子中抽取三元組時(shí), 該實(shí)體一般為“本發(fā)明” “本申請” “本實(shí)用新型” 等。如果直接導(dǎo)入圖數(shù)據(jù)庫會(huì)導(dǎo)致無法區(qū)分每個(gè)專利, 如果用標(biāo)題和摘要作為節(jié)點(diǎn)內(nèi)容過長, 因此這里采用序號(hào)指代不同的專利。圖3 是所構(gòu)建的高價(jià)值專利知識(shí)圖譜的局部示意圖。
3.4 “腦機(jī)接口”領(lǐng)域高價(jià)值專利的技術(shù)創(chuàng)新演化
本研究識(shí)別出的“腦機(jī)接口” 領(lǐng)域高價(jià)值專利的申請年分布在2003—2023 年。腦機(jī)接口技術(shù)形成于20 世紀(jì)70 年代, 1999 年和2002 年兩次BCI 國際會(huì)議為腦機(jī)接口技術(shù)的發(fā)展指明了方向。2000 年以后腦機(jī)接口進(jìn)入技術(shù)爆發(fā)階段, 21 世紀(jì)前十年發(fā)展成為一個(gè)研究領(lǐng)域, 涌現(xiàn)出多種新型的腦機(jī)接口實(shí)驗(yàn)范式。2010 年以后腦機(jī)接口研究的規(guī)模急劇擴(kuò)大并滲透至其他領(lǐng)域[45] 。2016 年該領(lǐng)域又取得了幾項(xiàng)重大突破, 出現(xiàn)了第一個(gè)有觸覺的可靈活控制機(jī)械手臂的人腦控機(jī)器人[46] , 癱瘓患者用BCI+VR 實(shí)現(xiàn)行走[47] , 腦機(jī)接口技術(shù)迎來新的發(fā)展高潮。根據(jù)其發(fā)展歷程及關(guān)鍵轉(zhuǎn)折點(diǎn), 在技術(shù)創(chuàng)新演化分析時(shí)劃分為3 個(gè)階段, 分別是2003—2009年、2010—2016 年、2017—2023 年。技術(shù)創(chuàng)新演化分析的維度從粗粒度到細(xì)粒度, 包括主題維度、專利本質(zhì)維度、應(yīng)用領(lǐng)域維度、方法/ 技術(shù)維度、解決問題維度以及其他維度(性能優(yōu)勢、硬件(組件)維度等)。
3.4.1 “腦機(jī)接口” 領(lǐng)域高價(jià)值專利的“技術(shù)主題” 創(chuàng)新演化
在構(gòu)建的“腦機(jī)接口” 領(lǐng)域高價(jià)值專利知識(shí)圖譜中, 序號(hào)指代的是專利本身。針對專利本身可以先從粗粒度的技術(shù)主題角度分析演化趨勢。本研究利用Bertopic 主題模型, 基于高價(jià)值專利的標(biāo)題和摘要對3 個(gè)時(shí)間段的專利主題進(jìn)行識(shí)別, 并利用余弦相似度計(jì)算相鄰時(shí)間段的主題間的相似度, 繪制技術(shù)主題演化的?;鶊D, 如圖4 所示。該圖中,相鄰主題間連線越粗, 主題相似度越高。從圖中可以看出, 隨著時(shí)間的推移“腦機(jī)接口” 領(lǐng)域的技術(shù)主題越來越多樣化。而關(guān)于“腦機(jī)接口改進(jìn)與優(yōu)化” “腦電信號(hào)處理方法” “腦機(jī)接口在輔助運(yùn)動(dòng)與康復(fù)中的應(yīng)用” “用戶神經(jīng)狀態(tài)監(jiān)測” 等的研發(fā)始終是領(lǐng)域關(guān)注的重點(diǎn)。在2010 年以前腦機(jī)接口領(lǐng)域重點(diǎn)關(guān)注基礎(chǔ)原理以及技術(shù)框架研究, 集中于腦機(jī)接口裝置和腦波信號(hào)基本處理技術(shù)等主題。2010—2016 年間, 技術(shù)研究更加深入并逐漸開始涉及臨床應(yīng)用, 腦機(jī)接口系統(tǒng)優(yōu)化、腦機(jī)接口技術(shù)在診療與康復(fù)干預(yù)中的應(yīng)用, 以及對多類腦電信號(hào)的深度處理等主題成為重點(diǎn)。2017 年以來, 人工智能、虛擬現(xiàn)實(shí)、增強(qiáng)現(xiàn)實(shí)等技術(shù)的發(fā)展為腦機(jī)接口技術(shù)的進(jìn)步注入了新的動(dòng)能, 基于機(jī)器學(xué)習(xí)、智能算法、無人機(jī)、VR 等的腦機(jī)接口技術(shù)研發(fā)、實(shí)際應(yīng)用與產(chǎn)業(yè)化等相關(guān)主題的研究激增, 主題更加多樣化并呈現(xiàn)跨領(lǐng)域特性, 如腦機(jī)接口與無人機(jī)設(shè)備的結(jié)合、腦信號(hào)用于認(rèn)知任務(wù)等。
3.4.2 “腦機(jī)接口” 領(lǐng)域高價(jià)值專利的“專利本質(zhì)” 創(chuàng)新演化
本研究中的“專利本質(zhì)” 是指專利的實(shí)質(zhì),具體體現(xiàn)為系統(tǒng)、方法或裝置。該維度的技術(shù)創(chuàng)新演化分析主要是為了了解在不同階段“腦機(jī)接口”領(lǐng)域研發(fā)的重點(diǎn)對象是什么, 隨著時(shí)間推移呈現(xiàn)何種發(fā)展態(tài)勢。分析過程中, 利用neo4j 的查詢語言進(jìn)行條件查詢。比如, 構(gòu)建查詢語句: match(n:‘專利序號(hào)) -[r:‘申請于] ->(p:‘申請年),(n)-[s:‘是] ->(m:‘系統(tǒng)/ 方法/ 裝置) wherep.name = ‘2010 or p.name = ‘2011 or p.name =‘2012 or p.name=‘2013 or p.name=‘2014 or p.name=‘2015 or p.name=‘2016 return n,s,m, 可獲取第二個(gè)階段專利本質(zhì)的實(shí)體及關(guān)系, 圖5 為局部示意圖。
在知識(shí)圖譜中檢索3 個(gè)階段的“系統(tǒng)/ 方法/裝置” 類型的實(shí)體之后, 分別進(jìn)行人工歸納, 總結(jié)出每個(gè)時(shí)間段主要的“專利本質(zhì)”, 演化路線如圖6 所示。從圖6 可以看出, 2010 年以前“腦機(jī)接口” 領(lǐng)域的研發(fā)重點(diǎn)是腦機(jī)接口的裝置、控制系統(tǒng)與方法、腦波信號(hào)檢測和處理的系統(tǒng)與方法;隨著各項(xiàng)技術(shù)的發(fā)展, 研發(fā)對象趨向多樣化和細(xì)分化, 腦機(jī)接口系統(tǒng)的類型逐漸增多, 且不僅局限于腦機(jī)接口系統(tǒng)本身的開發(fā), 還涉及應(yīng)用腦機(jī)接口技術(shù)的各領(lǐng)域系統(tǒng)的研發(fā), 如智能家居的控制系統(tǒng)。近年來, “腦機(jī)接口” 領(lǐng)域的研發(fā)對象更是拓展至無人機(jī)模擬訓(xùn)練系統(tǒng)、車輛控制方法和系統(tǒng)等。從方法研究來看, 早期注重對腦機(jī)接口控制和實(shí)現(xiàn)方法的探索, 之后越來越側(cè)重于腦機(jī)接口的應(yīng)用與優(yōu)化方法。
3.4.3 “腦機(jī)接口” 領(lǐng)域高價(jià)值專利的“應(yīng)用領(lǐng)域” 創(chuàng)新演化
基于所構(gòu)建的知識(shí)圖譜, 可通過條件查詢分別獲?。?個(gè)階段的“專利本身—應(yīng)用于—應(yīng)用領(lǐng)域”三元組。比如, 構(gòu)建查詢: match(n:‘專利序號(hào))-[r:‘申請于] ->(p:‘申請年),(n) -[s:‘應(yīng)用于]->(m:‘應(yīng)用領(lǐng)域) where p.name=‘2017 orp.name = ‘2018 or p.name = ‘2019 or p.name =‘2020 or p.name=‘2021 or p.name=‘2022 or p.name=‘2023 return n,s,m, 返回結(jié)果(局部)如圖7所示。
在獲?。?個(gè)階段“應(yīng)用領(lǐng)域” 類型的實(shí)體之后, 分別進(jìn)行分類、歸納, 總結(jié)出每個(gè)時(shí)間段腦機(jī)接口技術(shù)的主要應(yīng)用領(lǐng)域, 結(jié)果如表5 所示。
從表5 可以看出, “腦機(jī)接口” 技術(shù)的應(yīng)用范圍不斷擴(kuò)大, 從前期主要用于醫(yī)療領(lǐng)域的患者狀態(tài)檢測、康復(fù)訓(xùn)練、輔助交流, 到中期用于外部設(shè)備控制、娛樂和輔助睡眠、交通領(lǐng)域等生活場景中,再到近年來延伸至航空航天模擬訓(xùn)練、教育、科研、AR/ VR 設(shè)備應(yīng)用等更廣泛的領(lǐng)域中。說明“腦機(jī)接口” 作為前沿科技交叉融合領(lǐng)域, 應(yīng)用前景非常廣闊。
3.4.4 “腦機(jī)接口” 領(lǐng)域高價(jià)值專利其他維度的創(chuàng)新演化
將“腦機(jī)接口” 領(lǐng)域高價(jià)值專利在“方法/技術(shù)” “解決問題” “性能/優(yōu)勢” “組件” 等維度的技術(shù)創(chuàng)新演化總結(jié)為圖8。從“方法/技術(shù)” 維度來看, 主要呈現(xiàn)“傳統(tǒng)生物信號(hào)處理方法—機(jī)器學(xué)習(xí)方法與虛擬現(xiàn)實(shí)技術(shù)—深度學(xué)習(xí)方法與增強(qiáng)現(xiàn)實(shí)及混合現(xiàn)實(shí)技術(shù)” 的發(fā)展趨勢; 從“方法/ 技術(shù)—處理—生物信號(hào)” 關(guān)系類型來看, 隨著技術(shù)方法種類的增多和智能化, 所處理的生物信號(hào)更加精細(xì)和多樣, 如瞬態(tài)EEG 信號(hào)、多通道運(yùn)動(dòng)想象腦電信號(hào)、腦電肌電雙模態(tài)信號(hào)等; 從“解決問題” 維度來看, 前期較為關(guān)注功能性問題, 到后來重視技術(shù)問題、效果和效率問題, 而近年來“人機(jī)交互體驗(yàn)” 問題逐漸成為重點(diǎn); 從“性能/ 優(yōu)勢” 維度來看, 簡單、可靠、方便使用一直是專利研發(fā)追求的目標(biāo), 中期開始從使用者角度改進(jìn)腦機(jī)接口的性能(比如減少受試者疲勞), 近年來又逐漸兼顧醫(yī)護(hù)人員的體驗(yàn), 以及除了功能和操作性能以外的趣味性, 逐漸體現(xiàn)人文關(guān)懷的特點(diǎn); 從組件構(gòu)成來看,設(shè)備更加多樣化、便攜化, 除了腦電采集設(shè)備以外,越來越多地涉及一些外控外聯(lián)設(shè)備。
4 研究結(jié)論
本研究以“腦機(jī)接口” 領(lǐng)域的專利文獻(xiàn)為例,構(gòu)建了反映專利價(jià)值的多維指標(biāo)體系以識(shí)別高價(jià)值專利, 進(jìn)而構(gòu)建“腦機(jī)接口” 領(lǐng)域的高價(jià)值專利知識(shí)圖譜, 在此基礎(chǔ)上從技術(shù)主題、本質(zhì)、應(yīng)用領(lǐng)域、方法、解決問題、性能優(yōu)勢、組件等維度分析了技術(shù)創(chuàng)新演化態(tài)勢。研究主要得出以下結(jié)論:
設(shè)計(jì)的高價(jià)值專利篩選指標(biāo)具有側(cè)重性與合理性, 通過實(shí)證檢驗(yàn)與專家評價(jià)驗(yàn)證了技術(shù)新穎性指標(biāo)計(jì)算方法的優(yōu)越性以及整套評價(jià)指標(biāo)體系的可用性, 使后續(xù)的高價(jià)值專利技術(shù)創(chuàng)新演化分析具有可靠性。
知識(shí)圖譜能夠深度、直觀、細(xì)粒度地揭示專利文獻(xiàn)中的技術(shù)特征, 從而為技術(shù)創(chuàng)新演化分析提供了更多維的視角, 使得分析的層次更加深入, 有助于為研發(fā)者、政策制定者、科技戰(zhàn)略制定者提供更具體的參考。
基于研究結(jié)論, 本文提出以下建議: 在現(xiàn)有的專利數(shù)據(jù)庫中, 參考本研究設(shè)計(jì)的高價(jià)值專利評估體系及知識(shí)圖譜構(gòu)建方法, 嵌入高價(jià)值專利自動(dòng)識(shí)別、知識(shí)問答和創(chuàng)新情報(bào)推送的功能模塊。一方面,提供基于知識(shí)圖譜的智能檢索或問答服務(wù), 根據(jù)用戶需求為其返回各個(gè)時(shí)期特定領(lǐng)域的高價(jià)值專利;另一方面, 基于知識(shí)圖譜為用戶提供多維度的技術(shù)創(chuàng)新演化、專利技術(shù)的對比分析、創(chuàng)新情報(bào)咨詢等各項(xiàng)服務(wù)。
本文的創(chuàng)新之處與研究貢獻(xiàn)主要體現(xiàn)如下: 首先在高價(jià)值專利識(shí)別的指標(biāo)設(shè)計(jì)中, 提出了一種測度專利技術(shù)主題新穎性的新方法, 并與反映專利市場價(jià)值和法律價(jià)值的其他指標(biāo)進(jìn)行組合, 形成了多維度的評估指標(biāo)體系; 其次, 利用知識(shí)圖譜提供了更加精細(xì)的、多點(diǎn)的、具體的專利技術(shù)創(chuàng)新演化分析視角, 而非局限于粗粒度的主題分析, 能夠?yàn)檠芯空咛峁└迂S富的參考。本研究存在的不足主要體現(xiàn)在: 用于識(shí)別高價(jià)值專利的指標(biāo)仍有補(bǔ)充的空間, 并且僅采用了一個(gè)領(lǐng)域的專利文獻(xiàn)進(jìn)行實(shí)驗(yàn),數(shù)據(jù)的范圍和規(guī)模都有待擴(kuò)展。未來將進(jìn)一步豐富高價(jià)值專利篩選的指標(biāo)體系, 選取更多領(lǐng)域、更大規(guī)模的數(shù)據(jù)進(jìn)行分析, 使該方法具有更廣泛的適用性。
(責(zé)任編輯: 郭沫含)