周 磊,王婧怡,黃彩云,余玲瓏
基于機(jī)器學(xué)習(xí)的高質(zhì)量專利特征組合挖掘
周 磊a,王婧怡a,黃彩云b,余玲瓏a
(武漢紡織大學(xué) a. 會(huì)計(jì)學(xué)院,b. 管理學(xué)院,湖北 武漢 430200)
挖掘高質(zhì)量專利的特征組合有助于揭示專利價(jià)值形成機(jī)制,進(jìn)而引導(dǎo)專利質(zhì)量整體提升。以中國(guó)專利獎(jiǎng)獲獎(jiǎng)發(fā)明專利為樣本集,從技術(shù)質(zhì)量、法律質(zhì)量和經(jīng)濟(jì)質(zhì)量等指標(biāo)建立高質(zhì)量專利評(píng)價(jià)指標(biāo)體系,進(jìn)而利用決策樹模型抽取出9條區(qū)分金獎(jiǎng)發(fā)明和優(yōu)秀發(fā)明的知識(shí)規(guī)則。發(fā)現(xiàn)法律質(zhì)量是高質(zhì)量專利的第一要素,高權(quán)利項(xiàng)可作為識(shí)別金獎(jiǎng)發(fā)明的唯一特征;較高的權(quán)利項(xiàng)與專利族、被引頻次的組合可以識(shí)別金獎(jiǎng)發(fā)明;權(quán)利項(xiàng)偏低時(shí),專利需滿足多個(gè)技術(shù)質(zhì)量指標(biāo)閾值才能認(rèn)定為金獎(jiǎng)發(fā)明。
專利質(zhì)量;機(jī)器學(xué)習(xí);決策樹;專利權(quán)利項(xiàng);中國(guó)專利獎(jiǎng)
當(dāng)前,中國(guó)國(guó)家知識(shí)產(chǎn)權(quán)局年均受理專利申請(qǐng)量位于全球首位,但專利“大而不強(qiáng),多而不優(yōu)”的整體態(tài)勢(shì)并未完全扭轉(zhuǎn)。本文將以中國(guó)專利獎(jiǎng)授予的金獎(jiǎng)發(fā)明為目標(biāo)集,利用機(jī)器學(xué)習(xí)模型挖掘其指標(biāo)特征以揭示高質(zhì)量專利的價(jià)值形成機(jī)制,為監(jiān)督式學(xué)習(xí)分類器提供多元化的高質(zhì)量專利篩選標(biāo)準(zhǔn),為提升我國(guó)專利知識(shí)產(chǎn)權(quán)總體質(zhì)量提供參考建議。
主流觀點(diǎn)將專利質(zhì)量分為三個(gè)構(gòu)面:技術(shù)質(zhì)量、法律質(zhì)量和經(jīng)濟(jì)質(zhì)量。技術(shù)質(zhì)量重點(diǎn)反映專利的技術(shù)新穎性和創(chuàng)造性,主要指標(biāo)包括:基于專利引用關(guān)系的專利被引頻次、技術(shù)循環(huán)周期(TCT)、專利權(quán)人的H指數(shù)、技術(shù)原創(chuàng)性與多樣性[1, 2];基于NPC分析的科學(xué)關(guān)聯(lián)度、專利科學(xué)強(qiáng)度;基于技術(shù)保護(hù)范圍的專利技術(shù)寬度、技術(shù)融合程度[3, 4];基于專利申請(qǐng)人的合作申請(qǐng)模式、發(fā)明人規(guī)模;基于專利申請(qǐng)策略的專利族規(guī)模、PCT申請(qǐng)、三方專利申請(qǐng)等[5, 6]。法律質(zhì)量重點(diǎn)反映專利經(jīng)受審查、無效和訴訟程序的綜合能力,只有確保專利有效才能借助專利實(shí)現(xiàn)壟斷性經(jīng)濟(jì)價(jià)值[7]。主要指標(biāo)包括:專利權(quán)利項(xiàng)、專利合同備案、異議、糾紛、訴訟、專利說明書和附圖平均頁數(shù)[8]。經(jīng)濟(jì)質(zhì)量反映專利商業(yè)化和經(jīng)營(yíng)創(chuàng)效前景,主要指標(biāo)包括:專利技術(shù)市場(chǎng)需求度、專利市場(chǎng)技術(shù)壟斷程度、專利壽命、專利技術(shù)利潤(rùn)率;專利實(shí)施、許可、質(zhì)押等轉(zhuǎn)化能力指標(biāo)[9,10]。
情報(bào)學(xué)早期研究利用文獻(xiàn)計(jì)量、層次分析法等定性研究法對(duì)專利質(zhì)量進(jìn)行綜合評(píng)價(jià)。技術(shù)創(chuàng)新管理研究利用計(jì)量經(jīng)濟(jì)學(xué)方法,發(fā)現(xiàn)對(duì)創(chuàng)業(yè)板上市公司專利質(zhì)量綜合指數(shù)影響較大的是有效發(fā)明專利量、專利近 3 年被引次數(shù)[11];而專利被引次數(shù)和權(quán)利要求數(shù)量對(duì)企業(yè)盈利能力具有顯著正向效應(yīng)[12]。目前,新興研究引入邏輯回歸、決策樹、神經(jīng)網(wǎng)絡(luò)等機(jī)器學(xué)習(xí)方法,以期提升專利質(zhì)量評(píng)價(jià)的客觀性、便利性和科學(xué)性。張杰等(2018)以訴訟專利為目標(biāo)集,利用AdaBoost算法提升專利質(zhì)量評(píng)價(jià)弱分類器的準(zhǔn)確性[13]。劉夏等(2019)針對(duì)專利大數(shù)據(jù),提出基于隨機(jī)森林算法的專利質(zhì)量預(yù)測(cè)模型[4]。Mariani MS et al (2019)提出了一個(gè)年限標(biāo)準(zhǔn)化的專利中心性指標(biāo)rescaled PageRank,證明該指標(biāo)比引用次數(shù)計(jì)量法更能準(zhǔn)確發(fā)現(xiàn)引用網(wǎng)絡(luò)中重要專利[14]。Lee et al (2019)對(duì)18個(gè)專利質(zhì)量指標(biāo)進(jìn)行前饋多層神經(jīng)網(wǎng)絡(luò)建模,預(yù)測(cè)具有高被引次數(shù)的高質(zhì)量專利[15]。
綜上所述,專利質(zhì)量評(píng)價(jià)主題的國(guó)內(nèi)外研究成果頗豐,針對(duì)中國(guó)高質(zhì)量專利的探索性研究也已展開。然而,如何將豐富的專利評(píng)價(jià)指標(biāo)充分嫁接于中國(guó)專利系統(tǒng),推動(dòng)中國(guó)高質(zhì)量專利研究從評(píng)價(jià)指標(biāo)的描述性統(tǒng)計(jì)向綜合性、關(guān)聯(lián)性分析升級(jí),仍是一個(gè)值得深入探討的問題。基于此,本文將以中國(guó)專利獎(jiǎng)金獎(jiǎng)專利、優(yōu)秀獎(jiǎng)專利作為對(duì)立樣本,通過決策樹建模挖掘金獎(jiǎng)專利的綜合質(zhì)量特征,從而揭示高質(zhì)量專利的形成機(jī)制,并為專利質(zhì)量指標(biāo)體系研究提供多樣化的評(píng)價(jià)準(zhǔn)則。
本文首先構(gòu)建專利質(zhì)量區(qū)分指標(biāo)體系并進(jìn)行單特征統(tǒng)計(jì)、進(jìn)而增加若干輔助指標(biāo)進(jìn)行決策樹建模、最后抽取出高質(zhì)量專利特征組合的知識(shí)規(guī)則,研究思路如圖1所示:
圖1 研究思路
中國(guó)專利獎(jiǎng)由國(guó)家知識(shí)產(chǎn)權(quán)局和世界知識(shí)產(chǎn)權(quán)組織共同主辦,是我國(guó)唯一專門對(duì)專利給予獎(jiǎng)勵(lì)的政府部門獎(jiǎng)。鑒于發(fā)明專利、外觀設(shè)計(jì)專利在專利“三性”要求上存在顯著差異,本文選擇發(fā)明專利作為樣本集。其中,金獎(jiǎng)發(fā)明作為高質(zhì)量專利集,優(yōu)秀獎(jiǎng)專利作為對(duì)照組。為了獲得足夠的樣本集并統(tǒng)一時(shí)間窗口,筆者在incoPat數(shù)據(jù)庫中下載了第13屆(2011年)至第21屆(2018年)金獎(jiǎng)發(fā)明153件、優(yōu)秀獎(jiǎng)專利3575件。
2.2.1 專利質(zhì)量區(qū)分指標(biāo)集構(gòu)建
綜合國(guó)內(nèi)外研究結(jié)論及樣本數(shù)據(jù)源特征,從技術(shù)價(jià)值、法律價(jià)值和經(jīng)濟(jì)價(jià)值三方面建立專利質(zhì)量區(qū)分指標(biāo)體系,如表1所示。
表1 專利質(zhì)量區(qū)分指標(biāo)體系
需要特別說明的有三點(diǎn):一是考慮到專利引用的“時(shí)間截面”問題,以年均被引頻次替代被引總次數(shù);二是技術(shù)融合程度是新興的專利質(zhì)量評(píng)價(jià)指標(biāo),本文以專利中不同IPC小類的共現(xiàn)來表示;三是由于有效數(shù)據(jù)稀疏,技術(shù)標(biāo)準(zhǔn)、PCT專利、自引、他引評(píng)價(jià)指標(biāo)未納入本研究。樣本中的絕大部分專利尚處于有效期內(nèi),故未將法律狀態(tài)、專利壽命指標(biāo)納入本研究設(shè)計(jì)。
2.2.2 專利質(zhì)量輔助判斷指標(biāo)
還有部分指標(biāo)不能獨(dú)立評(píng)價(jià)專利質(zhì)量但常用于專利分類,可以輔助上述指標(biāo)判斷專利質(zhì)量。特此增加申請(qǐng)人類型、國(guó)民經(jīng)濟(jì)分類2個(gè)輔助指標(biāo):
(1)申請(qǐng)人類型:以取值0-6分別表示申請(qǐng)人為企業(yè)、機(jī)關(guān)團(tuán)體、科研單位、其他、個(gè)人、大專院校、合作申請(qǐng)。
(2)國(guó)民經(jīng)濟(jì)分類:以專利所屬的國(guó)民經(jīng)濟(jì)分類為表示專利技術(shù)類別,取值0-5分別表示分類為農(nóng)林牧漁業(yè)、采礦業(yè)、制造業(yè)、電力熱力燃?xì)饧八a(chǎn)和供應(yīng)業(yè)、建筑業(yè)、信息傳輸軟件和信息技術(shù)服務(wù)業(yè)。
2.2.3 機(jī)器學(xué)習(xí)模型選擇
常用的二分類監(jiān)督學(xué)習(xí)模型包括決策樹、SVM、邏輯回歸模型。決策樹、SVM能夠表示復(fù)雜的、非線性關(guān)系,分類準(zhǔn)確性通常高于邏輯回歸模型;而決策樹能夠直觀展示分類規(guī)則?;诜诸惼鳒?zhǔn)確性及本文的研究目的,故而選擇決策樹模型。
決策樹模型以二叉樹的形式表示分類過程,每一個(gè)父節(jié)點(diǎn)表示一個(gè)屬性分裂規(guī)則,左分支表示滿足該判斷條件的樣本集,右分支表示不滿足該判斷條件的樣本集;每一個(gè)葉節(jié)點(diǎn)表示一種分類結(jié)果。一般通過計(jì)算各節(jié)點(diǎn)的信息熵(entropy)、基尼指數(shù)(Gini)、信息增益值確定每一屬性的分裂規(guī)則。從根節(jié)點(diǎn)出發(fā),歷經(jīng)各級(jí)父節(jié)點(diǎn),到達(dá)葉節(jié)點(diǎn)的一條路徑表示一條完整的分類規(guī)則。決策樹的層次越深,分類越精細(xì),但也可能帶來分類規(guī)則過于復(fù)雜及覆蓋性有限的問題。
將金獎(jiǎng)發(fā)明記為第1組,優(yōu)秀獎(jiǎng)發(fā)明記為第2組,依次檢驗(yàn)表1中各指標(biāo)的顯著性。由于被引頻次、專利族規(guī)模、技術(shù)寬度、發(fā)明人規(guī)模、權(quán)利項(xiàng)規(guī)模、審查時(shí)程的取值為定量數(shù)據(jù),故采用T檢驗(yàn)。T檢驗(yàn)要求樣本符合正態(tài)分布;均值比較時(shí),根據(jù)樣本是否具有方差齊性,選則不同的計(jì)算規(guī)則進(jìn)行檢驗(yàn)。統(tǒng)計(jì)發(fā)現(xiàn)被引頻次、專利族規(guī)模、保護(hù)寬度、發(fā)明人規(guī)模、權(quán)利項(xiàng)規(guī)模5個(gè)指標(biāo)的樣本不符合正態(tài)分布,故首先利用公示(1)進(jìn)行正態(tài)化:
對(duì)5個(gè)指標(biāo)進(jìn)行正態(tài)化后,對(duì)上述6項(xiàng)指標(biāo)進(jìn)行T檢驗(yàn),如表2所示。
表2 金獎(jiǎng)專利與優(yōu)秀獎(jiǎng)專利的指標(biāo)對(duì)比(T檢驗(yàn))
注:***表示。
非專利引用、三方專利、技術(shù)融合、專利運(yùn)用的取值為分類數(shù)據(jù),故采用卡方檢驗(yàn),統(tǒng)計(jì)結(jié)果如表3所示。
表3 金獎(jiǎng)專利與優(yōu)秀獎(jiǎng)專利的指標(biāo)對(duì)比(卡方檢驗(yàn))
注:*表示。
由表2、表3可知,金獎(jiǎng)專利、優(yōu)秀獎(jiǎng)發(fā)明在技術(shù)質(zhì)量上的差別不顯著,而法律質(zhì)量存在顯著差異、經(jīng)濟(jì)質(zhì)量存在一定差異。具體來看,專利權(quán)利項(xiàng)是金獎(jiǎng)發(fā)明的重要標(biāo)志,正態(tài)化處理前,金獎(jiǎng)發(fā)明平均擁有6.3條權(quán)利要求而優(yōu)秀獎(jiǎng)發(fā)明平均僅有1.7條權(quán)利要求。專利運(yùn)用也可用于區(qū)分金獎(jiǎng)發(fā)明、優(yōu)秀獎(jiǎng)發(fā)明,說明二者的經(jīng)濟(jì)價(jià)值亦存在較大不同。
近年來,金獎(jiǎng)發(fā)明與優(yōu)秀獎(jiǎng)發(fā)明比重持續(xù)走低,如2018年授予發(fā)明和實(shí)用新型金獎(jiǎng)20件,優(yōu)秀獎(jiǎng)802件。針對(duì)樣本中兩類數(shù)據(jù)不均衡性問題,分別利用過采樣、欠采樣、綜合采樣三種算法協(xié)調(diào)兩類數(shù)據(jù)的采用比例,將其與原始樣本的訓(xùn)練、測(cè)試準(zhǔn)確率進(jìn)行對(duì)比,結(jié)果如表4所示。
表4 各采樣策略下決策樹建模結(jié)果比較
由表4可知,基于原始采樣的決策樹建模準(zhǔn)確率高于其他采樣策略,前者在訓(xùn)練集上的分類準(zhǔn)確率為96.14%、在測(cè)試集上的分類準(zhǔn)確率為94.37%。筆者認(rèn)為,這可能與原始采樣在最大程度上保證樣本真實(shí)性、十折交叉驗(yàn)證策略賦予分類器足夠的、多樣的學(xué)習(xí)樣本有關(guān)。利用原始數(shù)據(jù)建立決策樹模型,最終發(fā)現(xiàn)9條表征金獎(jiǎng)發(fā)明的if-then知識(shí)規(guī)則:
Rule-1: if 權(quán)利項(xiàng)≤10, 高校或合作申請(qǐng), 技術(shù)寬度>5 then 金獎(jiǎng)發(fā)明
Rule-2: if 權(quán)利項(xiàng)≤10, 高?;蚝献魃暾?qǐng),年均被引>9.78, 審查時(shí)程≤11個(gè)月 then 金獎(jiǎng)發(fā)明
Rule-3: if 權(quán)利項(xiàng)≤10, 企業(yè)、研究所、機(jī)關(guān)團(tuán)體、個(gè)人或其他方獨(dú)立申請(qǐng), 審查時(shí)程≤30個(gè)月, 技術(shù)寬度≤2, 專利轉(zhuǎn)讓、許可或質(zhì)押, 年均被引>13.53 then 金獎(jiǎng)發(fā)明
Rule-4: if 權(quán)利項(xiàng)≤10, 企業(yè)、研究所、機(jī)關(guān)團(tuán)體、個(gè)人或其他方獨(dú)立申請(qǐng), 審查時(shí)程≤9個(gè)月, 技術(shù)寬度>2, 發(fā)明人=1 then 金獎(jiǎng)發(fā)明
Rule-5: if 11≤權(quán)利項(xiàng)≤12, 專利族≤18,企業(yè)申請(qǐng), 年均被引>3.665, 發(fā)明人≤6 then 金獎(jiǎng)發(fā)明
Rule-6: if 權(quán)利項(xiàng)>26, 專利族≤18, 非企業(yè)申請(qǐng), 年均被引≤0.525 then 金獎(jiǎng)發(fā)明
Rule-7: if 11<權(quán)利項(xiàng)≤22, 專利族≤18, 非企業(yè)申請(qǐng), 1.34<年均被引≤1.715 then 金獎(jiǎng)發(fā)明
Rule-8: if 權(quán)利項(xiàng)>18, 專利族>18, 年均被引>1.3 then 金獎(jiǎng)發(fā)明
Rule-9: if 10<權(quán)利項(xiàng)≤18, 專利族>18, 年均被引>1.4 審查時(shí)程≤11個(gè)月 then 金獎(jiǎng)發(fā)明
由上述9條知識(shí)規(guī)則可知:
(1)Rule-6表明,權(quán)利項(xiàng)足夠大時(shí)(>26),即可判斷該專利為金獎(jiǎng)發(fā)明。由此說明專利法律質(zhì)量,特別是專利權(quán)利項(xiàng)是評(píng)價(jià)專利質(zhì)量的第一標(biāo)準(zhǔn)。
(2)Rule-5、Rule-7、Rule-8、Rule-9表明,當(dāng)專利權(quán)利項(xiàng)較大時(shí)(10<權(quán)利項(xiàng)≤22),專利族、年均被引頻次、審查時(shí)程分別大于閾值時(shí),該專利為金獎(jiǎng)發(fā)明。由此說明,專利法律保護(hù)范圍較大時(shí),若目標(biāo)市場(chǎng)范圍廣(>18),則對(duì)后續(xù)技術(shù)影響較大的發(fā)明即為高質(zhì)量專利;若目標(biāo)市場(chǎng)范圍較廣(≤18),還需考察申請(qǐng)人類型、被引頻次、發(fā)明人規(guī)模等指標(biāo)。
(3)Rule-1至Rule-4表明,權(quán)利項(xiàng)偏小時(shí)(≤10),需要分別考察技術(shù)寬度、申請(qǐng)人類型、專利運(yùn)用、審查時(shí)程、年均被引等多個(gè)指標(biāo)的取值情況,才能認(rèn)定該專利是否為金獎(jiǎng)發(fā)明。由此說明,法律保護(hù)范圍較有限時(shí),高校申請(qǐng)或合作申請(qǐng)的專利更容易滿足高質(zhì)量專利條件;其他主體申請(qǐng)的專利,還需要考核審查時(shí)程、技術(shù)保護(hù)范圍、專利運(yùn)用、技術(shù)影響力、發(fā)明人等多個(gè)指標(biāo)。
綜上所述,通過對(duì)比單特征統(tǒng)計(jì)結(jié)果與上述9條知識(shí)規(guī)則,發(fā)現(xiàn)專利權(quán)利項(xiàng)在單因素分析和決策樹建模中均發(fā)揮了關(guān)鍵作用;單因素分析中非顯著的技術(shù)質(zhì)量因素通過與專利權(quán)利項(xiàng)的組合,在決策樹建模中表現(xiàn)出足夠的判別能力。這一發(fā)現(xiàn)與劉夏等(2019)提出的基于隨機(jī)森林的專利質(zhì)量預(yù)測(cè)模型[7]一致,亦可作為專利質(zhì)量評(píng)價(jià)向多指標(biāo)評(píng)價(jià)、綜合化方法升級(jí)的有力證據(jù)。
中國(guó)經(jīng)濟(jì)“雙循環(huán)”發(fā)展模式離不開高質(zhì)量科技創(chuàng)新的支撐。本文以中國(guó)專利獎(jiǎng)獲獎(jiǎng)發(fā)明專利集合為樣本,探索以金獎(jiǎng)專利為代表的高質(zhì)量專利的特征組合,形成了三點(diǎn)主要貢獻(xiàn):一是就單一專利質(zhì)量評(píng)價(jià)指標(biāo)而言,金獎(jiǎng)發(fā)明、優(yōu)秀獎(jiǎng)發(fā)明在技術(shù)質(zhì)量指標(biāo)上的表現(xiàn)無顯著差異,金獎(jiǎng)發(fā)明在權(quán)利項(xiàng)規(guī)模、專利運(yùn)用兩個(gè)指標(biāo)上的表現(xiàn)優(yōu)于優(yōu)秀獎(jiǎng)發(fā)明;二是就專利質(zhì)量評(píng)價(jià)指標(biāo)組合而言,專利權(quán)利項(xiàng)的判別性強(qiáng)于其他指標(biāo),專利權(quán)利項(xiàng)與多項(xiàng)技術(shù)質(zhì)量指標(biāo)、經(jīng)濟(jì)指標(biāo)、輔助指標(biāo)的組合可用于識(shí)別金獎(jiǎng)發(fā)明;三是就研究結(jié)論的拓展應(yīng)用而言,筆者將專利被引、專利運(yùn)用等事后指標(biāo)的統(tǒng)計(jì)時(shí)間限定為《中國(guó)專利獎(jiǎng)評(píng)獎(jiǎng)辦法》規(guī)定專利授權(quán)日前,使得研究方法與結(jié)論具備一定的事前預(yù)測(cè)能力。
此外,本研究亦可對(duì)優(yōu)化專利質(zhì)量評(píng)價(jià)研究及提升專利質(zhì)量提供參考建議。一是研究人員應(yīng)客觀認(rèn)識(shí)專利質(zhì)量外延的豐富性和綜合性。當(dāng)前專利定量研究中多以被引頻次作為專利質(zhì)量指標(biāo),而本文發(fā)現(xiàn)法律質(zhì)量是區(qū)分專利質(zhì)量的單因素指標(biāo),技術(shù)質(zhì)量指標(biāo)主要充當(dāng)專利質(zhì)量判斷的組合指標(biāo);二是專利申請(qǐng)人應(yīng)重視權(quán)利項(xiàng)范圍的撰寫。專利權(quán)利項(xiàng)是金獎(jiǎng)發(fā)明的決定性指標(biāo),申請(qǐng)人應(yīng)通過對(duì)權(quán)利項(xiàng)范圍的全面布局來增強(qiáng)專利保護(hù)能力,引導(dǎo)專利質(zhì)量的提升;三是專利權(quán)利人應(yīng)重視授權(quán)專利的運(yùn)用。專利運(yùn)用是高質(zhì)量專利的重要特征,權(quán)利人應(yīng)通過專利許可、轉(zhuǎn)移、抵押等手段實(shí)現(xiàn)高質(zhì)量專利的經(jīng)濟(jì)價(jià)值。
[1] 朱容輝, 劉樹林, 林軍. 產(chǎn)學(xué)協(xié)同創(chuàng)新主體的發(fā)明專利質(zhì)量研究[J]. 情報(bào)雜志, 2020, 39(2):78-84.
[2] 魏駿巍, 王晰巍, 李雪靈. 信息生態(tài)視角下專利質(zhì)量評(píng)價(jià)指標(biāo)構(gòu)建研究——以汽車無人駕駛專利為例[J]. 情報(bào)理論與實(shí)踐, 2016, 39(11):106-110.
[3] 卞雅莉. 科學(xué)引文對(duì)企業(yè)專利質(zhì)量的影響——以納米材料產(chǎn)業(yè)為例[J]. 情報(bào)雜志, 2013, 32(1):50-54.
[4] 劉夏, 黃燦, 余驍鋒. 基于機(jī)器學(xué)習(xí)模型的專利質(zhì)量預(yù)測(cè)初探[J]. 情報(bào)學(xué)報(bào), 2019, 38(4):72-80.
[5] 蔣仁愛, 張路路, 石皓月. 專利發(fā)明人合作對(duì)中國(guó)專利質(zhì)量的影響研究[J]. 科學(xué)學(xué)研究, 2020, 38(7): 1215-1226.
[6] 宋河發(fā), 穆榮平, 陳芳, 等. 基于中國(guó)發(fā)明專利數(shù)據(jù)的專利質(zhì)量測(cè)度研究[J]. 科研管理, 2014, 35(11):68-76.
[7] 劉立春. 二元專利質(zhì)量研究[J]. 情報(bào)雜志, 2017, 36(11):168-174.
[8] 茍尤釗, 呂琳媛, 陳永偉. 專利質(zhì)量分析的研究進(jìn)展與述評(píng)[J]. 電子知識(shí)產(chǎn)權(quán), 2019, 30(2):59-65.
[9] 劉運(yùn)華. 專利質(zhì)量闡釋及提升策略探討[J]. 知識(shí)產(chǎn)權(quán), 2015, 29(9):79-83.
[10] 劉云, 王小黎, 閆哲. 專利質(zhì)量測(cè)度及區(qū)域比較研究——以我國(guó)石墨烯產(chǎn)業(yè)為例[J]. 科學(xué)學(xué)與科學(xué)技術(shù)管理, 2019, 40 (9): 20-36.
[11] 胡諜, 王元地. 企業(yè)專利質(zhì)量綜合指數(shù)研究——以創(chuàng)業(yè)板上市公司為例[J]. 情報(bào)雜志, 2015, 34(1):77-82.
[12] 宋艷,常菊,陳琳.專利質(zhì)量對(duì)企業(yè)績(jī)效的影響研究——技術(shù)創(chuàng)新類型的調(diào)節(jié)作用 [J/OL]. 科學(xué)學(xué)研究(網(wǎng)絡(luò)首發(fā)),https://kns.cnki.net/KCMS/detail/11.1805.G3.20200915.1651.014.html,[2020-09-15].
[13] 張杰, 孫超, 翟東升, 等. 基于訴訟專利的專利質(zhì)量評(píng)價(jià)方法研究[J]. 科研管理, 2018, 39(5):138-146.
[14] Mariani M S , Medo M, Lafond F. Early identification of important patents: Design and validation of citation network metrics[J]. Technological Forecasting and Social Change, 2019, 146: 644-654.
[15] Lee C, Kwon O, Kim M, et al. Early identification of emerging technologies: A machine learning approach using multiple patent indicators[J]. Technological Forecasting and Social Change, 2018, 127: 291-303.
Mining Features Combination of High-quality Patents by Machine Learning
ZHOU Leia, WANG Jing-yia, HUANG Cai-yunb, YU Ling-longa
(a. Accounting College, b.School of Management, Wuhan Textile University, Wuhan Hubei 430200, China)
Mining features combination of high-quality patents is helpful to revealing the mechanism forming patent value and improving the overall quality of patents. Treating award-winning inventions of China Patent Award as the sample, a high-quality patent evaluation index system is established including technical quality, legal quality, and economic quality. And then, 9 knowledge rules are extracted to differ gold award inventions from excellent award inventions by a decision tree model. Several findings are drawn from such 9 rules. Firstly, legal quality is the fundamental element for high-quality patent with the evidence that patent claim is regard as the individual feature of gold award invention. Secondly, the combination of larger patent claims, patent family and yearly citations refers to gold award invention. Thirdly, a gold award invention with smaller patent claims must reach the thresholds of multiple technical quality index simultaneously.
patent quality; machine learning; decision tree; patent claim; China Patent Award
周磊(1986-),女,副教授,博士,研究方向:技術(shù)創(chuàng)新管理、數(shù)據(jù)挖掘.
國(guó)家社會(huì)科學(xué)基金青年項(xiàng)目(19CTQ030).
F204
A
2095-414X(2021)03-0067-05