李瑞璇 王學(xué)思
〔摘 要〕對廣東省21個城市進行地區(qū)專利綜合評價,為達到數(shù)據(jù)簡化、客觀賦權(quán)、區(qū)域間比較的功能,采用文獻調(diào)查法選取地區(qū)專利綜合評價指標24個,并結(jié)合廣東省知識產(chǎn)權(quán)局的專利統(tǒng)計信息的基本數(shù)據(jù),再在此基礎(chǔ)上進行因子分析,將多項指標聚合為新的因子,并用提取、計算出的6個主因子得分進行系統(tǒng)聚類分析,得出廣東省各市專利綜合實力的分類。該研究幫助相關(guān)人員了解地區(qū)專利的優(yōu)勢和不足,從而為地區(qū)專利發(fā)展提供決策支持。
〔關(guān)鍵詞〕因子分析;聚類分析;數(shù)據(jù)挖掘;專利評價
〔中圖分類號〕G250.252 〔文獻標識碼〕A 〔文章編號〕1008-0821(2012)09-0172-06
工業(yè)革命之后,世界上的創(chuàng)新發(fā)明越來越多,而專利的誕生,是為了保證發(fā)明人的創(chuàng)造活動得到一定量的回報,以激勵更多的發(fā)明研究工作。1624年英國頒布了《壟斷法》,這是早期專利制度的雛形,我國也于1985年頒布了《專利法》[1]。我國經(jīng)濟經(jīng)過30多年的發(fā)展,目前正經(jīng)歷著從勞動密集型向高科產(chǎn)業(yè)型的方向發(fā)展,而判斷是否轉(zhuǎn)型成功的標尺之一就在于專利的發(fā)展狀況,專利是企業(yè)或國家在各種競爭中取得優(yōu)勢的關(guān)鍵因素。廣東省一直處于全國經(jīng)濟發(fā)展的前沿,但各地之間的專利發(fā)展情況不均,為了能找出地區(qū)間的差距并有針對性地采取措施,對廣東省各地區(qū)的專利綜合評價應(yīng)客觀、全面、科學(xué),為此,本文選用目前較為權(quán)威、科學(xué)的專利評價指標體系,在此基礎(chǔ)上對廣東省2010年的專利統(tǒng)計數(shù)據(jù)進行因子分析和聚類分析,以期有效促進廣東省各地區(qū)專利水平的提高和發(fā)展。
1 專利評價指標體系
對專利評價指標體系的選用也是對專利綜合實力進行評價的一個關(guān)鍵步驟,專利評價指標是相對于原始數(shù)據(jù)的二次數(shù)據(jù),用來進行分析的二次數(shù)據(jù)是否準確、客觀、全面,影響著分析結(jié)果的好壞。
我國專利制度實施得比較晚,對專利指標的研究還處于初期階段,目前的研究熱點不僅僅只注重專利數(shù)量,同時也重視專利質(zhì)量以及專利綜合評價,如黃慶[2](2004)等的《專利評價指標體系——專利評價指標體系的設(shè)計和構(gòu)建》,肖國華等[3](2008)《專利分析評價指標體系的設(shè)計與構(gòu)建》,張冬梅[4]等(2006)《專利情報分析指標體系——分析方法與技術(shù)》,阮梅花[5]等(2011)《企業(yè)自主創(chuàng)新能力評價的專利指標體系構(gòu)建初探》等等,結(jié)合國外Huang Z[6]的研究來總結(jié)以上所有文獻,本文在選取專利評價體系遵循以下幾個方面:
(1)較客觀、科學(xué)、全面、準確地表現(xiàn)我國在世界上、我國不同地區(qū)或者各個行業(yè)乃至企業(yè)的專利綜合實力;
(2)“量”和“率”結(jié)合的平衡。“量”指的是總量,用來評價總體實力情況;“率”用來評價相對強度情況。
(3)實用并具有指導(dǎo)性。
最終,本文選取的地區(qū)專利綜合評價指標由表1所示:
2 專利綜合評價的方法
在進行數(shù)據(jù)分析之前,首先對本文運用的因子分析、聚類分析進行介紹和說明。
2.1 因子分析法
因子分析法是指從研究指標相關(guān)矩陣內(nèi)部的依賴關(guān)系出發(fā),把一些信息重疊、具有錯綜復(fù)雜關(guān)系的變量歸結(jié)為少數(shù)幾個不相關(guān)的綜合因子的一種多元統(tǒng)計分析方法,基本思想是:根據(jù)相關(guān)性大小把變量分組,使得同組內(nèi)的變量之間相關(guān)性較高,但不同組的變量不相關(guān)或相關(guān)性較低,每組變量代表一個基本結(jié)構(gòu)——即公共因子[7]。即用較少的綜合指標分別綜合存在于各變量中的各類信息,而綜合指標之間彼此不相關(guān),各指標代表的信息不重疊。根據(jù)因子分析的目的得知,綜合指標應(yīng)該比原始變量少,但包含的信息量應(yīng)該相對損失較少[8]。
因子分析的基本原理[9]是:選擇i個主分量Z1,Z2,……,Zi,其中Zi=ai1*F1+ai2*F2+……+aim*Fi+ε,F(xiàn)1、F2 、…、Fi稱為公共因子,ε稱為以Zi的特殊因子,aim是第i個變量在第m個因子上的負荷,它一方面表示Zi對Fi的依賴程度,絕對值越大,密切程度越高;另一方面也反映了變量Zi對公共因子Fi的相對重要性,把aim稱為因子荷載。該模型中的因子載荷矩陣需要用適當(dāng)?shù)姆椒ㄟM行估計,使得各個公共因子之間相互獨立;然后,分別計算出公共因子Fi的得分:F=f1*Z1+f2*Z2+……+fi*Zi,fi作為每個主分量Zi的方差貢獻率的權(quán)數(shù)(即因子得分系數(shù))。最后利用此綜合評價函數(shù)進行綜合評價,即以每個因子的方差貢獻率占因子總方差貢獻率的比重作為權(quán)數(shù)進行加權(quán)計算綜合得分。
本文使用因子分析的主要目的是可以通過因子分析對各因子進行客觀賦權(quán),以便確定綜合評價的重要因素——權(quán)重,權(quán)重反映不同評價指標對地區(qū)專利的影響程度大小,引入權(quán)重的綜合評價可以更科學(xué)合理地評價地區(qū)專利發(fā)展狀況。
2.2 聚類分析法
聚類(Clustering)就是將數(shù)據(jù)分組成為多個類(Cluster),在同一個類內(nèi)對象之間具有較高的相似度,不同類之間的對象差別較大,聚類分析師一種無監(jiān)督數(shù)據(jù)挖掘方法,它基于觀測之間的相似度或距離將觀測(數(shù)據(jù))分組[10]。一個好的聚類方法會產(chǎn)生高質(zhì)量的聚類結(jié)果,使同一類別內(nèi)的觀測相似度高,而不同類的觀測差異大。
3 專利綜合評價的實證分析
本文選取了廣東省21個市作為樣本,并對樣本進行因子分析與聚類分析。樣本數(shù)據(jù)根據(jù)廣東省知識產(chǎn)權(quán)局網(wǎng)站2006-2010年的專利統(tǒng)計報表計算得出,其中主要數(shù)據(jù)來源于2010年,個別數(shù)據(jù)根據(jù)2006-2010年統(tǒng)計計算得出,計算與統(tǒng)計過程使用EXCEL與SPSS統(tǒng)計分析工具完成。
3.1 基于因子分析的實證研究
(1)采用SPSS因子分析統(tǒng)計得出公因子特征值與貢獻率表以及公因子得分系數(shù)矩陣如表1、表2所示:
按特征值大于1的原則提取公因子,最終提取了6個公因子,第一個公因子的特征根為11.108,解釋了總變異的46.285%,以此類推,6個公因子的累積貢獻率達91.425%,信息損失為8.575%,能較為全面地反映信息。
(2)此時,用回歸法計算出得分,并按系數(shù)大小加權(quán)進行排序,從而得出公因子得分系數(shù)矩陣,如表3所示:
由表2可知,第一公因子Z1的特征值最高,貢獻率也最高,并且由表3可知,第一公因子Z1得分大都為正,且數(shù)值都很高,因此可以認為Z1代表地區(qū)專利發(fā)展水平,Z1越高表明地區(qū)綜合專利發(fā)展水平實力越強。實用新型授權(quán)量X6,實用新型申請量X2,工礦企業(yè)授權(quán)量X18,工礦企業(yè)申請量X13,發(fā)明專利申請量X1,機關(guān)單位授權(quán)量X19在Z1上有高荷載;大專院校申請量X11,大專院校授權(quán)量X16,科研機構(gòu)授權(quán)量X17,科研機構(gòu)申請量X12在Z2上有高荷載;外觀設(shè)計授權(quán)率X9,實用新型授權(quán)率X7,發(fā)明專利授權(quán)率X5在Z3上有高荷載;技術(shù)衰老系數(shù)γ在Z4上有高荷載;年專利申請增長率X20,年專利授權(quán)增長率X21在Z5上有高荷載。
因此,可以認為公共因子Z1包括以下幾個方面的指標:一是反映專利質(zhì)量情況的指標;二是反映專利數(shù)量情況的指標;三是專利來源的指標,這三者被聚合為一個因子的原因之一,是所選擇的數(shù)量類指標、質(zhì)量類指標與專利來源指標之間有密切的相關(guān)關(guān)系,三者之間相互影響,并代表著地區(qū)專利發(fā)展的關(guān)鍵因素。因子Z2包括專利來源的授權(quán)量和申請量指標,這說明專利來源的各種情況也反映著地區(qū)專利發(fā)展的情況。因子Z3包括專利質(zhì)量類指標,原因是該類指標是靠比例計算得出,因此聚合在一個因子中,該因子的貢獻率在10%以上,專利質(zhì)量對地區(qū)專利的發(fā)展情況起著至關(guān)重要的作用。因子Z4包括技術(shù)發(fā)展程度指標,該類指標都是反映專利的發(fā)展趨勢,其貢獻率為9.6%。因子Z5包括專利發(fā)展情況指標。根據(jù)各因子包含的反映地區(qū)專利發(fā)展情況的各個維度的指標類型對各個因子進行命名,命名原則是貢獻率因子,以載荷大的因子來命名。
(3)得出公因子得分系數(shù)矩陣后,以各公因子的方差貢獻率fi占其總方差貢獻率的比重作為權(quán)重進行加權(quán)匯總[11],得出專利綜合得分F,專利綜合評價函數(shù)為:F=(f1*Z1+…+fi*Zi)/∑fi。在該案例中的公式為:F=(0.46285*Z1+0.14518*Z2+…+0.04386*Z6)/0.91425,按此公式,根據(jù)表1與表2的數(shù)據(jù),計算出每個城市在每個公因子下的得分并計算出綜合得分,得出表5。
根據(jù)表5的得分,按綜合評價得分F可將廣東省專利綜合實力分為6個階梯:第一階為深圳和廣州,兩者為廣東省專利綜合實力最突出的地區(qū),由于深圳和廣州是廣東省重點發(fā)展的地區(qū),并且人才更集中,其地理環(huán)境優(yōu)越、交通便捷、人才資源豐富、經(jīng)濟基礎(chǔ)雄厚,這是深圳與廣州專利綜合實力處于領(lǐng)先地位的重要因素。第二階梯為佛山、東莞、中山,這些地區(qū)專利綜合實力也很雄厚,源于地處深圳與廣州附近,并且工業(yè)發(fā)達。第三階梯的惠州、清遠、珠海等,其專利綜合實力較好。第四階梯的韶關(guān)、肇慶等專利綜合實力一般。第五階梯為云浮、茂名等,專利綜合實力較差。第六階梯為陽江、潮州,專利綜合實力很差。
進一步分析,廣州市與深圳市遙遙領(lǐng)先于其他各市,其主要原因在于兩者的綜合因子得分都很高,并且廣州市與深圳市之間也有區(qū)別,廣州市的專利來源因子得分很高,說明廣州市的專利來源分布均勻并且在數(shù)量與質(zhì)量上都占據(jù)絕對優(yōu)勢,相對來說,深圳市的專利質(zhì)量因子、專利發(fā)展情況因子以及技術(shù)發(fā)展程度因子都要優(yōu)于廣州市,這情況說明廣州市聚集了各大高校以及研究所等,科研人才相較于深圳市來說有絕對的優(yōu)勢,而由于深圳市的政治經(jīng)濟因素,使其專利質(zhì)量以及發(fā)展情況更優(yōu)于廣州市。東莞市、佛山市與中山市的專利綜合因子得分相近,并且實用新型與外觀設(shè)計因子得分都較高,三者之中只有中山市的專利來源因子以及專利發(fā)展情況因子較優(yōu),說明這3個城市主要注重于加工制造業(yè),真正的發(fā)明創(chuàng)新較少,其中中山市的專利發(fā)展結(jié)構(gòu)較為合理并長久發(fā)展的可能。清遠市、惠州市、珠海市等專利綜合因子得分較低,但專利來源因子、專利質(zhì)量因子等得分都較高,說明其專利各項發(fā)展水平都良好,但是無法成為一個系統(tǒng)發(fā)揮促進專利綜合發(fā)展的作用,為此,這些城市需協(xié)調(diào)各項專利因素之間的聯(lián)系與影響。其他的分析也同上文相似,比如各個市之間排名的比較與該市專利開發(fā)的分布情況等,都可以依據(jù)上述描述,根據(jù)表4的數(shù)據(jù)分析出來,并可以據(jù)此看出各市的不足與優(yōu)勢,分析各市的發(fā)展重點以及需要進行的改進等。在此不再探討。
3.2 基于聚類分析的實證研究
為看出各市專利發(fā)展水平的相似程度,本文在因子分析的基礎(chǔ)上再運用聚類分析方法對各市進行分類。
根據(jù)因子分析中得到的6個因子對21個城市進行分層聚類,分別用4類、6類、8類進行聚類,發(fā)現(xiàn)分為8類較為合理,最后得到各市在8類中的屬類,即表4最后一列。圖2是反映聚類過程的樹狀圖,該圖各市右邊的序號為該市的綜合實力排名。
圖1的樹狀圖給出了每一步中被合并類的過程,因此可以進一步分析類之間的關(guān)系和同一類的差別,以下將進一步探討。第一類為廣州,是因為廣州專利綜合因子、專利來源因子得分最高,專利綜合總得分也遙遙領(lǐng)先于其他城市;第二類是深圳,深圳專利綜合因子、專利質(zhì)量因子、技術(shù)發(fā)展情況以及專利發(fā)展情況得分很高,專利綜合評價總分也很高;第三類為佛山和東莞,兩個城市的專利發(fā)展水平相似,故聚為一類;第四類為中山、汕頭、江門,這3個城市專利總綜合得分雖然在排名上差距較大,但絕對值差較小,在利綜合因子、專利來源因子、專利質(zhì)量因子、技術(shù)發(fā)展情況因子的得分上結(jié)構(gòu)相似,因此聚在了一類;以此類推,第五類為清遠與韶關(guān),專利綜合因子得分相似,專利來源因子與專利發(fā)展情況因子得分較高;第六類為湛江、珠海等;第七類是陽江,專利綜合評價很差,但技術(shù)發(fā)展情況因子得分很高;第八類是潮州,專利綜合評價以及各方面因子都很差。
參考文獻
[1]邵勇.專利指標及其經(jīng)濟效益研究[D].暨南大學(xué),2003:1-2.
[2]黃慶,曹津燕,瞿衛(wèi)軍,等.專利評價指標體系——專利評價指標體系的設(shè)計和構(gòu)建[J].知識產(chǎn)權(quán),2004,(5):25-28.
[3]肖國華,王春,姜禾,等.專利分析評價指標體系的設(shè)計與構(gòu)建[J].圖書情報工作,2008,(3):96-99.
[4]張冬梅,曾忠祿.專利情報分析指標體系——分析方法與技術(shù)[J].情報雜志,2006,(3):55-57.
[5]阮梅花,肖滬衛(wèi).企業(yè)自主創(chuàng)新能力評價的專利指標體系構(gòu)建初探[J].大學(xué)圖書館情報學(xué)刊,2011,(2):85-89.
[6]Huang Z,Chen H,Yi PA,et al.Longitudinal patent analysis for nanoscale science and engineering:Country,institution and technology field[J].Journal of Nanoparticle Research.2003,5(3):333-363.
[7]白思俊,等.系統(tǒng)工程[M].北京:電子工業(yè)出版社,2006:25-50.
[8]宇傳華.SPSS與統(tǒng)計分析[M].北京:電子工業(yè)出版社,2007:459-513.
[9]龔光明,張柳亮.基于因子分析的湖南省上市公司績效評價[J].會計之友,2012,(1):36-39.
[10]張俊妮.數(shù)據(jù)挖掘與應(yīng)用[M].北京:北京大學(xué)出版社,2009:70-79.
[11]戴維 F.格羅布納.商務(wù)統(tǒng)計(第六版)[M].北京:機械工業(yè)出版社,2008:355-367.
(本文責(zé)任編輯:王 涓)