蘇 敏 阮 卓 張 玲 王曉春 孫 玉 遲玉琢
(哈爾濱工程大學(xué)圖書館,黑龍江 哈爾濱 150001)
隨著圖書館學(xué)科服務(wù)工作在高校中影響力的提升,由圖書館提供的各種類型的學(xué)科報告也越來越受到高校科研部門、發(fā)展規(guī)劃部門以及院系自身的重視,學(xué)科的評估、科研成果的評價、院系的發(fā)展建設(shè)等對學(xué)科報告數(shù)據(jù)的依賴度與日俱增。學(xué)科報告作為圖書館技術(shù)含量較高的工作,如何更準(zhǔn)確、更科學(xué)地提供相關(guān)數(shù)據(jù)以及客觀合理地分析進而提出相應(yīng)的對策建議,仍是圖書館相關(guān)部門人員需要思考的課題。同樣,專利信息作為集技術(shù)信息、法律信息、經(jīng)濟信息為一體的重要信息源,并因其包含最新科技信息、可進行成果轉(zhuǎn)化等特點愈來愈受到各部門的重視,目前很多高校已明確把教師的專利申請情況列入可考察的業(yè)績成果,因此在學(xué)科報告中列入專利數(shù)據(jù)已與學(xué)科報告中經(jīng)常要體現(xiàn)的三大檢索工具收錄(EI、SCI、CPCI-S)數(shù)量、ESI的機構(gòu)排名等指標(biāo)一起成為了必不可少的數(shù)據(jù)。
筆者從實踐探索出發(fā),以中國專利檢索為重點,平臺選擇主要為上海知識產(chǎn)權(quán)(專利信息)公共服務(wù)平臺檢索系統(tǒng),從與學(xué)科報告結(jié)合的專利檢索方法、學(xué)科報告中的專利分析、對策建議的撰寫原則等角度進行闡述,以期對該領(lǐng)域的實際工作提供一定參考。
選擇上海知識產(chǎn)權(quán)(專利信息)公共服務(wù)平臺檢索系統(tǒng)是因為它是免費的檢索平臺,同時具有中國專利覆蓋全面、檢索類型較豐富、檢索結(jié)果易于導(dǎo)出且數(shù)據(jù)項全面、有自主統(tǒng)計功能等特點,筆者使用的主要分析工具也以通用軟件Excel為主,適于為中小型規(guī)?;驎簳r無購買商業(yè)專利分析軟件計劃的高校和機構(gòu)提供自主專利分析思路[1]。
學(xué)科報告的檢索對象通常分為兩種:一是高校某學(xué)院全部教師專利收錄情況;二是高校某學(xué)院的某具體學(xué)科方向的專利情況,比如哈爾濱工程大學(xué)自動化學(xué)院的“控制”學(xué)科或“導(dǎo)航”方向近3年專利情況等。
無論是在上海知識產(chǎn)權(quán)(專利信息)公共服務(wù)平臺還是在國家知識產(chǎn)權(quán)局的專利檢索平臺中的“申請人”字段,針對機構(gòu)如“哈爾濱工業(yè)大學(xué)”或“北京理工大學(xué)”等的檢索結(jié)果都是相對完整的,但上述兩個平臺都未直接提供基于高校具體院系的檢索途徑,只有部分發(fā)明人在“地址”字段體現(xiàn)出所在院系的情況,但數(shù)量與實際總數(shù)量相比差距較大[2]。
因此,目前在上海知識產(chǎn)權(quán)(專利信息)公共服務(wù)平臺上檢索院系全部教師的專利建議使用編寫檢索表達(dá)式,從“發(fā)明人”途徑進行檢索。
例如:檢索上海交通大學(xué)船舶海洋與建筑工程學(xué)院的專利情況,就可以通過如下步驟進行:
①通過學(xué)校院系的官方網(wǎng)站了解該學(xué)院全部教師名單。
②部分人員變動或歸屬不確定的教師可以通過CNKI數(shù)據(jù)庫的“作者單位”字段輸入“上海交通大學(xué)船舶海洋與建筑工程學(xué)院”及“作者”字段的組合檢索進行驗證,詳細(xì)信息還可以通過具體文章全文信息中的作者簡介查看作者出生年、作者單位等內(nèi)容,防止漏檢與誤檢,通常發(fā)文活躍的作者也是專利申請活躍的人員。
③在上海知識產(chǎn)權(quán)(專利信息)公共服務(wù)平臺上的高級搜索中選擇高級檢索,輸入檢索表達(dá)式,同時檢索3種類型的專利,檢索策略如下:(docType=invention_view OR doc-Type=utiltymodel_view OR docType=face_view)AND AU=(顧某某or楊某某or譚某某or張某某or金某某or繆某某)AND PA=(上海交通大學(xué)),經(jīng)實際測試,該平臺一個檢索表達(dá)式最多可以同時檢索20位發(fā)明人,因此多數(shù)情況下需分批次進行全部發(fā)明人的檢索。
④每次檢索后將選中全部檢索結(jié)果進行導(dǎo)出,方便下一步數(shù)據(jù)的清理與分析。該平臺提供的導(dǎo)出字段包括申請人、申請日、主分類號、分類號、發(fā)明人、發(fā)明名稱、公開/公告日、申請國家、法律狀態(tài)、文摘、代理機構(gòu)等共32個(多于國家知識產(chǎn)權(quán)局專利平臺),通常選擇全部字段,以有助于全面分析。一次導(dǎo)出數(shù)量以低于100條為宜,否則會出現(xiàn)死機狀況。
在本步驟需要進一步說明的是一項專利通常擁有多位發(fā)明人,同一院系的合作情況又會較頻繁,因此上述每次20名發(fā)明人的檢索會出現(xiàn)重復(fù)檢出同一專利的情況,在后續(xù)的分析中一定要注意進行查重工作。
另外,該方法的檢索過程中還應(yīng)注意在“地址”字段同時對本院系進行檢索,雖然數(shù)量較少,但從專業(yè)檢索的查全率角度,依然應(yīng)該補充完整。
在針對院系具體學(xué)科方向進行專利檢索時,如果仍舊采用上述1.1的檢索方法,由于人員構(gòu)成不易把握,會出現(xiàn)大量漏檢的情況,專利文獻(xiàn)在撰寫時有具體的規(guī)范,字段也相對完整,因此在檢索時采用關(guān)鍵詞與主分類號相結(jié)合的方法會取得較好的效果,舉例如下:
檢索哈爾濱工程大學(xué)“船舶與海洋工程”學(xué)科2009~2014年的專利情況,可在上海知識產(chǎn)權(quán)(專利信息)公共服務(wù)平臺上輸入檢索表達(dá)式如下。
PD=[2009-2014]AND(((PA=(哈爾濱工程大學(xué))AND(AB=(船 OR海洋 OR艦)OR TI=(船 OR海洋 OR艦)))OR(IC1=(B63)AND PA=(哈爾濱工程大學(xué))))
其中IPC分類號B63(船舶或其他水上船只;與船有關(guān)的設(shè)備)的確定是檢索人員通過維普數(shù)據(jù)庫的科學(xué)指標(biāo)分析中所提供的“船舶與海洋工程”學(xué)科該校部分專家的名單,在專利平臺上進行試檢,并以人工經(jīng)驗分析主分類號所確定的,通過該檢索方法檢出的專利,在閱讀專利摘要后與單純通過維普數(shù)據(jù)庫提供的本專業(yè)學(xué)者名單而進行的“發(fā)明人”檢索對比,前者與學(xué)科的關(guān)聯(lián)度更緊密,更符合學(xué)科報告的要求。
此外,不論是針對院系的上述哪一類學(xué)科報告,如果院系有具體的其他高?;驒C構(gòu)的對比目標(biāo),或是圖書館學(xué)科服務(wù)的老師通過檢索經(jīng)驗自行確定的定標(biāo)比超的對象,應(yīng)在檢索時同時導(dǎo)出其相關(guān)數(shù)據(jù),以為在后面的分析與對策建議中提供相關(guān)信息,使得報告的內(nèi)容更為豐富。
在專利信息分析中,無論是定量分析還是定性分析,專利量始終是一個最基本的數(shù)據(jù)。應(yīng)用在學(xué)科報告中的專利數(shù)據(jù)分析也不例外,其他主要涉及的分析指標(biāo)有專利類型、發(fā)明人、發(fā)明時間、技術(shù)分類、機構(gòu)或人的合作情況、專利被引次數(shù)、同族專利數(shù)量等,進行專利分析,一般多為技術(shù)、人、時間和專利量之間進行二維和多維的組配分析。
對于未購買商業(yè)專利分析軟件的高校或機構(gòu),學(xué)科報告中的專利數(shù)據(jù)分析的方法主要可通過專利檢索平臺直接提供的統(tǒng)計數(shù)據(jù)或圖表,或是通過通用辦公軟件Excel對檢索平臺所導(dǎo)出的數(shù)據(jù)進行相關(guān)分析,另外,有時也可借助于網(wǎng)絡(luò)上的免費專利分析軟件進行分析與專利地圖的應(yīng)用。
在上海知識產(chǎn)權(quán)(專利信息)公共服務(wù)平臺的檢索結(jié)果界面中,直接有可對檢索結(jié)果進行簡單統(tǒng)計與分析的“統(tǒng)計”按鈕,同時可以自動生成圖、表。數(shù)據(jù)的可視化是目前圖書情報領(lǐng)域的主流和熱點,在學(xué)科報告中提供表達(dá)直觀的圖表等更有助于提升報告的吸引力。該平臺可進行的統(tǒng)計項目主要有專利類型、趨勢分析(申請日、公開日)、申請人、技術(shù)領(lǐng)域、區(qū)域等,并可進行數(shù)據(jù)之間的二維矩陣分析,見圖1。
圖12011 ~2013年西北工業(yè)大學(xué)專利檢索之申請人與發(fā)明人矩陣關(guān)聯(lián)
直接通過該平臺導(dǎo)出的數(shù)據(jù)也有一定局限性,比如熱點技術(shù)領(lǐng)域IPC分類號的統(tǒng)計只顯示到大類號,不利于技術(shù)領(lǐng)域的深度挖掘,此外提供分析的字段較少,像專利的法律狀態(tài)等信息未予以統(tǒng)計。因此,更詳細(xì)深入的專利分析可以通過該平臺全字段的數(shù)據(jù)導(dǎo)出利用其他軟件或統(tǒng)計方法進行。
Excel軟件是目前最通用的辦公軟件Microsoft office中的固定產(chǎn)品,深入挖掘其統(tǒng)計分析功能對學(xué)科報告中的數(shù)據(jù)提供是非常有益的。
上海知識產(chǎn)權(quán)(專利信息)公共服務(wù)平臺中的檢索結(jié)果通過選擇Access文件保存格式可直接導(dǎo)入到Excel中,Excel在數(shù)據(jù)統(tǒng)計與分析中有很多實用且未被廣泛應(yīng)用的功能,現(xiàn)根據(jù)實際經(jīng)驗總結(jié)如下。
2.2.1 數(shù)據(jù)清理
在統(tǒng)計數(shù)據(jù)清理中最常用的有分列和排序功能,比如針對公開日字段,系統(tǒng)提供的數(shù)據(jù)為20110112的八位數(shù)形式,如果想添加公開年字段就可以對該數(shù)據(jù)列直接進行分列操作,方便快捷。數(shù)據(jù)的排序功能可以用在很多方面,比如發(fā)明人字段的整理,使用排序功能后,就可以把同一發(fā)明人的發(fā)明進行匯聚,有助于下一步的統(tǒng)計。同時排序的方法也可以用在非大量數(shù)據(jù)的查重工作。
2.2.2 函數(shù)的使用
在Excel軟件使用統(tǒng)計的時候,被經(jīng)常使用到的多是求和、算數(shù)平均數(shù)等指標(biāo),其實在描述數(shù)據(jù)集中和離散趨勢時,還有其他一些重要的指標(biāo),可以通過Excel“公式”功能中的“插入函數(shù)”得以實現(xiàn)。
①中位數(shù)(MEAN)。中位數(shù)是指將數(shù)據(jù)按大小順序排列,形成一個數(shù)列,居于數(shù)列中間位置的那個數(shù)據(jù)即為中位數(shù)。中位數(shù)不受分布數(shù)列的極大值或極小值影響,因此在數(shù)列中出現(xiàn)極端值的情況下,用中位數(shù)作為代表值比用算數(shù)平均值更有說服力。在具體的專利分析中,比如針對某機構(gòu)近10年的專利數(shù)量,除了提供其算數(shù)平均值之外,再提供中位數(shù)一方面可以進行比較,另一方面能夠避免極端值的出現(xiàn)[3]。
②方差(VAR)。方差是描述數(shù)據(jù)離散程度最常用的測量值,反映了各變量值與均值的平均差異,方差采用了平方形式,比采用絕對值形式的標(biāo)準(zhǔn)差更易于在數(shù)學(xué)上予以實現(xiàn),因此成為測度數(shù)據(jù)離散型最主要的方法。在學(xué)科報告的專利分析數(shù)據(jù)中,添加該數(shù)據(jù)可以使得分析更客觀與理性。
③頻數(shù)統(tǒng)計(COUNTIF)。在Excel2007以上的版本中增加了頻數(shù)統(tǒng)計函數(shù)COUNTIF,其在數(shù)據(jù)統(tǒng)計中非常重要,使用也較方便,比如在導(dǎo)出的“IC1”字段中就可以通過人工設(shè)置直接統(tǒng)計相關(guān)分類號的總數(shù)量,具體函數(shù)使用指令為COUNTIF(V2:V75,“G01*”),即可以統(tǒng)計V數(shù)列中第2~75行中IPC分類為G01(測量或測試分類)及其細(xì)分分類下的所有專利數(shù)量,其中“*”為截詞符,代表0~n個字符,上述指令可統(tǒng)計的分類可以包括G01B11/16、G01N21/41、G01D5/26等多種次級分類。
另一方面,該函數(shù)同樣可以通過使用引號進行字符形式變量的統(tǒng)計,比如針對發(fā)明人為劉少剛的統(tǒng)計,可以使用的函數(shù)指令即為COUNTIF(S2:S75,“*劉少剛*”),其中在發(fā)明人劉少剛前后都加了“*”,是考慮同一字段常有多個發(fā)明人,發(fā)明人之間多用分號分隔,通過該方法經(jīng)實際測試可避免漏檢的情況出現(xiàn)。
2.2.3 圖形的可視化展示
Excel提供的圖形形式豐富是眾所周知的,在學(xué)科報告中的圖形選擇要根據(jù)具體的數(shù)據(jù)指標(biāo),比如隨時間變化的專利數(shù)量,選擇曲線圖比較直觀且連續(xù);不同機構(gòu)的數(shù)量對比可以用二維或三維柱狀圖來體現(xiàn);專利中發(fā)明、實用新型、外觀設(shè)計的占比關(guān)系用餅狀圖更一目了然。另外,如果在只有圖沒有表的情況下,應(yīng)注意在圖形中添加數(shù)據(jù)標(biāo)簽,以確保圖形數(shù)據(jù)來源的可靠性與真實性。
專利信息分析是有歷史傳承的領(lǐng)域,除常規(guī)的數(shù)據(jù)分析方法之外,還有其獨有的分析方法,在學(xué)科報告中引入適合的專利自主分析方法可以為報告增加新穎性和獨特性。
比如定量分析中的專利三角圖分析法,不僅可以直觀地看出3種專利類型的數(shù)值,并且通過多時間點的選取,可以揭示發(fā)明專利、實用新型、外觀設(shè)計專利的比率所發(fā)生的連續(xù)動態(tài)變化,進而判斷相關(guān)機構(gòu)或技術(shù)領(lǐng)域的專利活躍度。
此外時間序列法、回歸分析法等也是專利分析中的常用方法,通過基礎(chǔ)數(shù)據(jù)形成的散點圖,并通過使用趨勢線或回歸函數(shù)等方法進行最小二乘法的擬合,不僅能進行專利數(shù)據(jù)的分析,同時也可以進行數(shù)量的預(yù)測。上述方法的實現(xiàn),完全可以通過Excel軟件進行,在需要的學(xué)科報告中是可以進行內(nèi)容添加和展示的。
目前,在專利分析領(lǐng)域,網(wǎng)絡(luò)上還有一些免費的專利分析軟件,比如Soopat軟件,可進行國內(nèi)外專利的聚類分析,同時還可以進行專利的引證分析,并形成專利地圖,這是中文專利檢索平臺所不具備的功能。
國家知識產(chǎn)權(quán)局、世界知識產(chǎn)權(quán)局WIPO的免費檢索平臺都提供了專利檢索結(jié)果的圖形可視化展示,在學(xué)科報告的應(yīng)用中可與上海知識產(chǎn)權(quán)(專利信息)公共服務(wù)平臺的圖表統(tǒng)計功能交叉使用,豐富學(xué)科報告的展示形式[4]。
學(xué)科報告中除了相關(guān)的檢索與數(shù)據(jù)分析之外,給出有的放矢、言之有物的建設(shè)性對策建議也是非常重要的一環(huán),針對專利信息方面的建議也不例外,應(yīng)遵循以下幾點原則。
①體現(xiàn)客觀性。對策建議的給出應(yīng)以報告中的數(shù)據(jù)作為基礎(chǔ),實事求是地指出優(yōu)勢、不足及努力方向。
②突出建設(shè)性。對策建議應(yīng)具有積極意義與可操作性,有通過努力能夠?qū)崿F(xiàn)的目標(biāo)。
③對象的針對性。學(xué)科報告的使用對象會存在不同的機構(gòu),可能是院系也可能是高校中的科研院、發(fā)展計劃處或者是學(xué)校的領(lǐng)導(dǎo)機構(gòu),針對不同的對象側(cè)重點也應(yīng)有所不同,比如科研院更關(guān)注科研成果的質(zhì)量與數(shù)量,院系更希望了解與競爭機構(gòu)的差距等。
④語言的簡潔性。對策建議通常比較精煉,不易過長過多,以結(jié)論性的闡述為主。
在學(xué)科報告中提供專利信息的數(shù)據(jù)及分析建議是有意義且必要的工作,立足于免費專利檢索平臺與常規(guī)統(tǒng)計軟件也是可以有所為的,當(dāng)然在專利統(tǒng)計分析的項目中還應(yīng)進一步深入挖掘,比如專利的法律狀態(tài)、專利的成果轉(zhuǎn)化情況與具體機構(gòu)、技術(shù)生命周期的關(guān)系等,以進一步為高校學(xué)科的良性發(fā)展提供思路。
[1] 上海知識產(chǎn)權(quán)(專利信息)公共服務(wù)平臺[EB/OL].[2014-07-28].http://www.shanghaiip.cn/wasWeb/index.jsp.
[2] 中國國家知識產(chǎn)權(quán)局專利檢索平臺[EB/OL].[2014-07-28].http://www.sipo.gov.cn/zljsfl/.
[3] 莊君,蔣敏杰,李秀霞.Excel統(tǒng)計分析與應(yīng)用[M].北京:電子工業(yè)出版社,2013:52-56.
[4] 羅立國,余翔,鄭婉婷.專利檢索網(wǎng)站比較研究[J].情報雜志,2012(3):163-167.