亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        未確知聚類在專利質(zhì)量評(píng)價(jià)中的應(yīng)用

        2020-08-03 07:58:33張妮妮孫勝娟張永健
        現(xiàn)代電子技術(shù) 2020年8期

        張妮妮 孫勝娟 張永健

        摘? 要: 隨著人們對(duì)知識(shí)產(chǎn)權(quán)的重視,作為其重要表征的專利的數(shù)量呈現(xiàn)爆發(fā)式增長(zhǎng),然而專利的質(zhì)量卻沒有隨之增長(zhǎng)。大量的低質(zhì)量專利不但作用有限,反而會(huì)造成社會(huì)資源浪費(fèi)和遏制創(chuàng)新。對(duì)于專利質(zhì)量的評(píng)價(jià),目前還沒有統(tǒng)一的標(biāo)準(zhǔn)。文中首先對(duì)國(guó)內(nèi)外的專利質(zhì)量指標(biāo)進(jìn)行分析,選取出對(duì)專利質(zhì)量影響較大的指標(biāo),構(gòu)建專利質(zhì)量評(píng)價(jià)指標(biāo)模型。同時(shí),以鋼鐵行業(yè)相關(guān)專利為目標(biāo)數(shù)據(jù)集,分別采用未確知聚類和模糊均值聚類算法對(duì)目標(biāo)專利質(zhì)量進(jìn)行分析評(píng)價(jià)。最終,將目標(biāo)專利數(shù)據(jù)聚類出不同的級(jí)別,得出高質(zhì)量專利。在聚類過程中,發(fā)現(xiàn)未確知聚類算法在效率和準(zhǔn)確率上都有良好的表現(xiàn)。

        關(guān)鍵詞: 專利質(zhì)量評(píng)價(jià); 未確知聚類; 專利數(shù)據(jù)分析; 評(píng)價(jià)模型構(gòu)建; 數(shù)據(jù)集聚類; 對(duì)比實(shí)驗(yàn)

        中圖分類號(hào): TN911?34; TP311.52? ? ? ? ? ? ? ? 文獻(xiàn)標(biāo)識(shí)碼: A? ? ? ? ? ? ? ? ? ? ?文章編號(hào): 1004?373X(2020)08?0143?04

        Application of unascertained clustering in patent quality evaluation

        ZHANG Nini, SUN Shengjuan, ZHANG Yongjian

        (School of Information and Electrical Engineering, Hebei University of Engineering, Handan 056001, China)

        Abstract: With people′s attention to intellectual property, the quantity of patents, as an important symbol of intellectual property, has increased explosively, but the quality of patents has not increased with it. A large number of low?quality patents not only play a limited role, but also lead to the waste of social resources and inhibit innovation. Nowadays, there is no unified standard for the evaluation of patent quality. The domestic and foreign patent quality indicators are analyzed, from which the indicators that have a greater impact on the quality of patents are selected to build the patent quality evaluation index model. With the related patents in steel industry as the target data set, the analysis and evaluation of the target patent quality are performed by means of the unascertained clustering algorithm and fuzzy mean clustering algorithm, respectively. The target patent data is clustered into different levels to obtain high?quality patents. During the clustering process, it is found that the unascertained clustering algorithm has good performance in efficiency and accuracy.

        Keywords: patent quality evaluation; unascertained clustering; patent data analysis; evaluation model building; dataset clustering; contrast experiment

        0? 引? 言

        隨著科學(xué)技術(shù)的進(jìn)步與發(fā)展,人們對(duì)知識(shí)產(chǎn)權(quán)的重視程度越來越高[1]。根據(jù)2018年12月3日世界知識(shí)產(chǎn)權(quán)組織發(fā)布的《2018年世界知識(shí)產(chǎn)權(quán)指標(biāo)》顯示,我國(guó)在全球?qū)@⑸虡?biāo)和工業(yè)品外觀設(shè)計(jì)等專利申請(qǐng)量上均位居第一。專利總數(shù)越多,質(zhì)量就會(huì)參差不齊,大量的低質(zhì)量專利反而會(huì)為社會(huì)帶來許多弊端。

        國(guó)內(nèi)目前對(duì)專利質(zhì)量評(píng)價(jià)的研究中,有學(xué)者研究顯示專利引證指標(biāo)和專利權(quán)利范圍指標(biāo)所占權(quán)重最高,其次是專利地域范圍指標(biāo)、技術(shù)應(yīng)用范圍和科學(xué)關(guān)聯(lián)度指標(biāo)[2]。在對(duì)具體領(lǐng)域的專利質(zhì)量進(jìn)行分析的時(shí)候,包英群等學(xué)者遵循普適性、簡(jiǎn)潔性和可行性的原則選擇出針對(duì)液晶顯示產(chǎn)業(yè)的質(zhì)量評(píng)價(jià)指標(biāo)為專利引證指標(biāo)和同族專利數(shù)指標(biāo)[3]。

        本文通過對(duì)專利的各個(gè)指標(biāo)分別進(jìn)行討論分析,從理論上評(píng)選出與專利質(zhì)量相關(guān)性較大的指標(biāo),建立專利質(zhì)量評(píng)價(jià)指標(biāo)體系。選取Derwent數(shù)據(jù)庫(kù)的鋼鐵行業(yè)相關(guān)專利為目標(biāo)數(shù)據(jù)集,用未確知聚類算法對(duì)目標(biāo)專利進(jìn)行評(píng)價(jià),得出核心專利。

        1? 專利質(zhì)量評(píng)價(jià)指標(biāo)

        對(duì)于專利質(zhì)量的評(píng)價(jià),國(guó)內(nèi)外目前還沒有一套相對(duì)科學(xué)合理的專利質(zhì)量指標(biāo)評(píng)價(jià)體系[4]。

        1.1? 專利引證指標(biāo)

        專利引證信息是專利發(fā)展的“脈絡(luò)”,從中能看出被引用專利和引用專利,國(guó)外論文通常稱前引(Forward Citation)和后引(Backward Citation),以當(dāng)前專利為標(biāo)準(zhǔn)點(diǎn),當(dāng)前專利被其他專利引用稱為前引,當(dāng)前專利引用其他專利稱為后引。國(guó)內(nèi)外把專利引文分析當(dāng)作專利價(jià)值和技術(shù)地位的重要指標(biāo),對(duì)專利引文的研究層出不窮[5]。其中包括對(duì)專利引文地圖的研究和引文次數(shù)的探討[6?7]。所以,本文選取前引用專利指數(shù)和后引用專利指數(shù)作為專利質(zhì)量評(píng)價(jià)的兩個(gè)指標(biāo)。它們與專利質(zhì)量正相關(guān),即前引用指數(shù)或后引用指數(shù)越大,說明專利質(zhì)量越高。

        1.2? 專利權(quán)利范圍指標(biāo)

        專利的權(quán)利范圍指標(biāo)通常是指權(quán)利要求的數(shù)量。學(xué)者在對(duì)專利價(jià)值和質(zhì)量的研究中用到了專利權(quán)利要求數(shù)這一指標(biāo),喬永忠等選取部分專利文獻(xiàn)信息并構(gòu)建回歸模型進(jìn)行分析,證明專利權(quán)利要求數(shù)量對(duì)專利價(jià)值有正向影響,與專利的價(jià)值正相關(guān)[8]。所以,專利權(quán)利要求數(shù)量與專利質(zhì)量正相關(guān),即越重要的專利其權(quán)利要求數(shù)量越多。

        1.3? 專利地域范圍指標(biāo)

        專利地域范圍指標(biāo)是指專利族的大小,同一個(gè)專利在不同國(guó)家申請(qǐng)的專利保護(hù)稱為一個(gè)專利族。在企業(yè)全球化和地球村的影響下,專利擁有人或企業(yè)為了提升自己的競(jìng)爭(zhēng)力,會(huì)將核心專利技術(shù)在多國(guó)申請(qǐng)專利法的保護(hù)。基于經(jīng)濟(jì)價(jià)值角度來看,只有在專利的價(jià)值和質(zhì)量相對(duì)較高的時(shí)候,申請(qǐng)人才會(huì)考慮在不同的國(guó)家申請(qǐng)?jiān)搶@姆杀Wo(hù),這樣成本和價(jià)值才匹配。可見,專利族的大小同時(shí)反映了專利的質(zhì)量和價(jià)值的高低[9]。

        所以,結(jié)合科學(xué)性、可行性和可比性的原則,評(píng)選出有效的專利價(jià)值評(píng)價(jià)指標(biāo)為:專利引文數(shù)、同族的專利數(shù)和專利的權(quán)利要求數(shù)。

        2? 專利質(zhì)量評(píng)價(jià)算法

        在對(duì)專利質(zhì)量指標(biāo)權(quán)重的確定中,通常是以統(tǒng)計(jì)方法去計(jì)算每個(gè)指標(biāo)對(duì)專利質(zhì)量的影響程度或采取專家打分的方法。這兩種方法為專利質(zhì)量評(píng)價(jià)做出了很大的貢獻(xiàn),可也有其局限的地方。前者的權(quán)重可能與所選取的樣本專利直接相關(guān),后者的結(jié)果會(huì)與專家的主觀意識(shí)相關(guān),得到的權(quán)值數(shù)據(jù)也會(huì)有差距。在核心專利之間,應(yīng)該存在著某些共同特征。由于數(shù)據(jù)量的巨大,沒辦法用人工的方式來對(duì)專利等級(jí)進(jìn)行區(qū)分,所以采用聚類來研究。

        在聚類算法中,選擇了對(duì)數(shù)據(jù)離群點(diǎn)有較好處理能力并不需要人為干預(yù)的未確知聚類算法,同時(shí),用經(jīng)典的模糊均值聚類算法與其進(jìn)行分析對(duì)比實(shí)驗(yàn)。未確知聚類是一種無監(jiān)督的聚類算法,該算法基于未確知理論而提出[10]。

        3? 對(duì)比實(shí)驗(yàn)

        實(shí)驗(yàn)的計(jì)算機(jī)環(huán)境為:處理器Intel 酷睿(TM)i7 2.6 GHz,運(yùn)行內(nèi)存為 16 GB,硬盤為160 GB,操作系統(tǒng)為 Windows 10,編程語言為 Python 3.6,數(shù)據(jù)庫(kù)為MySQL 5.0。

        3.1? 數(shù)據(jù)集

        本文實(shí)驗(yàn)數(shù)據(jù)來源于Derwent數(shù)據(jù)庫(kù)中的鋼鐵行業(yè)相關(guān)專利共45 146條,專利時(shí)間從1967年到2013年,檢索出與本文相關(guān)的字段。

        3.2? 實(shí)驗(yàn)步驟

        該實(shí)驗(yàn)步驟如下:

        1) 首先,輸入目標(biāo)專利數(shù)據(jù)集,隨機(jī)打亂該數(shù)據(jù)集的順序;

        2) 分別用UMC算法和FCM算法對(duì)該數(shù)據(jù)集進(jìn)行聚類,通過對(duì)數(shù)據(jù)中的被引用次數(shù)、引用次數(shù)、同族專利數(shù)和權(quán)利要求數(shù)4個(gè)指標(biāo)判斷目標(biāo)專利屬于哪一個(gè)等級(jí),將所有數(shù)據(jù)分為5類;

        3) 輸出聚類結(jié)果;

        4) 計(jì)算并輸出程序運(yùn)行時(shí)間。

        未確知聚類的計(jì)算過程如下:

        1) 數(shù)據(jù)標(biāo)準(zhǔn)化。將專利數(shù)據(jù)的4個(gè)質(zhì)量指標(biāo)用以下公式取值界定在0與1之間,具體如下:

        式中:[xij]為專利i的第j個(gè)特征指標(biāo)的原始值;運(yùn)算結(jié)果[yij]為專利i的第j個(gè)特征指標(biāo)的標(biāo)準(zhǔn)化值。

        2) 給出專利數(shù)據(jù)的一種初始分類并計(jì)算出類中心。

        式中:

        sum(i)為專利i的所有特征指標(biāo)的標(biāo)準(zhǔn)值之和。

        計(jì)算出和J+1距離最近的正數(shù)k,且將專利[yi]分配到第k類,最終,將N個(gè)專利樣本分為C類,即給出一種初始分類方式,并根據(jù)該初始分類方式計(jì)算出各類的類中心[m(0)k(1≤k≤C)]。

        3) 根據(jù)這C個(gè)專利數(shù)據(jù)初始類的類中心[m(0)1,m(0)2,…,m(0)C],計(jì)算得到專利數(shù)據(jù)集初始分類的均值類。在該步驟中,根據(jù)已經(jīng)給定的初始分類方式,計(jì)算出j專利特征屬性對(duì)專利分類所做的分類貢獻(xiàn)度:

        由式(3)得到的專利分類貢獻(xiàn)度計(jì)算每個(gè)專利屬性的分類權(quán)重:

        通過得到的專利屬性的分類權(quán)重,根據(jù)式(5)計(jì)算出每個(gè)專利屬性特征的加權(quán)距離:

        由式(5)計(jì)算得到各個(gè)專利屬性的加權(quán)距離大小后,需要計(jì)算出其相應(yīng)的基本隸屬度:

        式中,取[ε=0.01]。

        4) 根據(jù)計(jì)算的N個(gè)專利樣本的未確知隸屬度之后,可以算出這N個(gè)專利樣本對(duì)應(yīng)每個(gè)特征指標(biāo)所度量的確定分類。將[u(0)Γk(yi)]作為樣本點(diǎn)[yi]關(guān)于[Γk]類的點(diǎn)質(zhì)量賦予點(diǎn)[yi],最終,N個(gè)質(zhì)點(diǎn)構(gòu)成的質(zhì)點(diǎn)組[{(y1,uΓk(y1)),(y2,uΓk(y2)),…,(yN,uΓk(yN))}]的質(zhì)心可按物理方法確定,即每個(gè)質(zhì)點(diǎn)對(duì)應(yīng)的隸屬度向量為:

        根據(jù)這一步驟得到第一次迭代后的類中心[m(1)1,m(1)2,…,m(1)C]。以[m(1)k(1≤k≤C)]替代[m(0)k],再次返回步驟2),繼續(xù)迭代。

        當(dāng)計(jì)算得到[maxm(t)k-m(t-1)k<δ]的情況下,停止上述的迭代,共迭代t次,輸出結(jié)果為C個(gè)類的類中心[m(t)1,m(t)2,…,m(t)C,m(t)k]是[Γk]的類中心。至此,對(duì)N個(gè)專利的d維特征指標(biāo)空間中的樣本點(diǎn),在沒有其他分類信息條件下,完成了聚類,得出了C個(gè)類中心的中心向量。

        3.3? 實(shí)驗(yàn)結(jié)果

        使用UMC和FCM兩種聚類算法對(duì)目標(biāo)專利數(shù)據(jù)集進(jìn)行聚類的結(jié)果如表1所示。

        在表1中列出了兩種聚類算法的聚類類別編號(hào)及該編號(hào)下聚類的專利數(shù)量。其中UMC算法的平均執(zhí)行時(shí)間為:4.5 s,F(xiàn)CM算法的平均執(zhí)行時(shí)間為:570.9 s??梢钥闯觯琔MC算法執(zhí)行時(shí)間比FCM算法執(zhí)行時(shí)間快了超過100倍,其主要原因是采用UMC算法收斂速度快,相應(yīng)其迭代次數(shù)就少,所以運(yùn)行速度比FCM算法快了兩個(gè)數(shù)量級(jí)。同時(shí),根據(jù)聚類輸出的結(jié)果,用3D圖的方式展示如圖1、圖2所示。

        圖中,分別選取Cited(被引用次數(shù))、Cite(引用次數(shù))和同族專利數(shù)為z,x,y軸,圖中球體的顏色代表不同的類別。根據(jù)兩種聚類算法的結(jié)果對(duì)比可以看出,由于被引用次數(shù)在目標(biāo)專利的指標(biāo)中的數(shù)字相對(duì)于其他三個(gè)指標(biāo)(引用次數(shù)、同族專利數(shù)和權(quán)利要求數(shù))較大,所以兩種算法中被引用次數(shù)對(duì)分類所做的貢獻(xiàn)都比較大,所占權(quán)值也較高。同時(shí),除了被引用數(shù)在聚類中所占權(quán)值最大外,其次是專利引用數(shù)、同族專利數(shù)和各個(gè)專利的權(quán)利要求數(shù)。根據(jù)聚類結(jié)果的顯示結(jié)果,編號(hào)為“1 000”的共11個(gè)專利為UMC算法聚類出來的核心專利,核心專利組的前引用數(shù)平均達(dá)到262.82次,專利的時(shí)間從1995—2009年都有分布,符合預(yù)期的質(zhì)量指數(shù)標(biāo)準(zhǔn)。

        4? 結(jié)? 論

        本文通過對(duì)專利各指標(biāo)的分析討論及結(jié)合科學(xué)性、可行性和可比性的原則,建立專利綜合評(píng)價(jià)指標(biāo)模型。在對(duì)專利的綜合評(píng)價(jià)中,通過對(duì)數(shù)據(jù)的分析得出結(jié)果,去除了人為的干擾,能較為客觀地反應(yīng)專利質(zhì)量信息。在對(duì)核心專利進(jìn)行評(píng)價(jià)的過程中,未確知聚類算法在運(yùn)行效率和聚類結(jié)果方面都有良好的表現(xiàn),是基于未確知理論應(yīng)用的新探索,在專利分析與評(píng)價(jià)方面取得了有意義的創(chuàng)新成果。該課題研究所存在的問題是由于要符合計(jì)算機(jī)大量計(jì)算的前提,在評(píng)價(jià)指標(biāo)方面對(duì)比人工處理有一定的局限性。

        注:本文通訊作者為張永健。

        參考文獻(xiàn)

        [1] 田立新,文尚勝.中國(guó)OLED應(yīng)用專利態(tài)勢(shì)分析與研究[J].現(xiàn)代電子技術(shù),2014,37(19):153?156.

        [2] 呂曉蓉.專利價(jià)值評(píng)估指標(biāo)體系與專利技術(shù)質(zhì)量評(píng)價(jià)實(shí)證研究[J].科技進(jìn)步與對(duì)策,2014(20):113?116.

        [3] 包英群,魯若愚,熊麟.全球液晶顯示產(chǎn)業(yè)專利質(zhì)量評(píng)價(jià)[J].技術(shù)經(jīng)濟(jì),2015,34(4):3?8.

        [4] 谷麗,郝濤,任立強(qiáng),等.專利質(zhì)量評(píng)價(jià)指標(biāo)相關(guān)研究綜述[J].科研管理,2017(z1):35?41.

        [5] 吳紅,冀方燕.基于專利申請(qǐng)及審查制度的專利引文評(píng)價(jià)效能實(shí)證研究[J].圖書情報(bào)工作,2017(19):89?95.

        [6] NARIN F, CARPENTER M P, WOOLF P. Technological performance assessments based on patents and patent citations [J]. IEEE transactions on engineering management, 2017(4): 172?183.

        [7] YOO S H, KIM B, JEONG M K. Modeling of technology lifetime based on patent citation data and segmentation [J]. Journal of the operational research society, 2015, 66(3): 450?462.

        [8] 喬永忠,肖冰.基于權(quán)利要求數(shù)的專利維持時(shí)間影響因素研究[J].科學(xué)學(xué)研究,2016,34(5):678?683.

        [9] 邱洪華,陸潘冰.基于專利價(jià)值影響因素評(píng)價(jià)的企業(yè)專利技術(shù)管理策略研究[J].圖書情報(bào)工作,2016(6):77?83.

        [10] 龐彥軍,劉立民,劉開第.未確知均值聚類[J].河北工程大學(xué)學(xué)報(bào),2010,27(4):98?100.

        [11] 靳顏寧,李夕兵,劉彭金,等基于改進(jìn)的未確知聚類模型的巖爆傾向性預(yù)測(cè)[J].安全與環(huán)境學(xué)報(bào),2017(1):12?16.

        [12] 茍尤釗,呂琳媛,陳永偉.專利質(zhì)量分析的研究進(jìn)展與述評(píng)[J].電子知識(shí)產(chǎn)權(quán),2019(2):59?65.

        人妻少妇av中文字幕乱码| 狂插美女流出白浆视频在线观看| av大全亚洲一区二区三区| 亚洲午夜福利在线视频| 正在播放国产多p交换视频| 国内精品九九久久精品小草| 网站在线观看视频一区二区| 一个人的视频免费播放在线观看| 国产免费午夜a无码v视频| 亚洲妇熟xxxx妇色黄| 丰满少妇a级毛片野外| 国产主播福利一区二区| 熟女人妻中文字幕一区| 蜜桃av人妻精品一区二区三区| 又粗又硬又大又爽免费视频播放 | 国产精品一区二区午夜久久| 亚洲不卡av一区二区三区四区 | 极品美女调教喷水网站| 精品久久久久香蕉网| 亚洲产国偷v产偷v自拍色戒| 亚洲成人av一区二区麻豆蜜桃| 国产亚洲精品90在线视频| 国产网红主播无码精品| 国产精品三级在线观看| 日本久久精品在线播放| 日韩免费一区二区三区在线| 中字幕人妻一区二区三区| 欧美怡红院免费全部视频| 乱子伦av无码中文字幕| 精品国产精品久久一区免费| 在线无码中文字幕一区| 中文字幕一区二区三区精华液| 久久香蕉国产线看观看精品yw| 欧美尺寸又黑又粗又长| 日本久久精品免费播放| 中文字幕av素人专区| 国产精品妇女一二三区| 国产视频导航| 国产精品亚洲av无人区二区| 色又黄又爽18禁免费网站现观看| 在线观看国产成人av片|