劉 澄 雷秋原 張 楠 鮑新中
(1.北京科技大學經(jīng)濟管理學院 北京 100083; 2.北京聯(lián)合大學管理學院 北京 100101)
伴隨著經(jīng)濟全球化進程的加快,科學技術(shù)水平已經(jīng)成為各國核心競爭力的重要體現(xiàn),人類社會已經(jīng)步入了知識時代。作為知識時代最重要的知識產(chǎn)權(quán),專利的重要性受到了越來越多的認可。對于專利權(quán)人而言,專利是其智力成果的凝聚;對于企業(yè)而言,專利成為其挖掘發(fā)展?jié)摿?、快速占領(lǐng)市場、獲得經(jīng)濟利益的載體;而對于國家而言,專利可以增強其科技實力,無懼競爭者的抗衡。在專利的運營和實施過程中,價值評估是一個十分重要的環(huán)節(jié),因此引起了學者們和業(yè)界相關(guān)人士的關(guān)注。
相較于有形資產(chǎn)在市場上具有明確的市場價格,專利由于其唯一性特征,并且缺少可供參考的公開交易,其評估難度明顯更大。同時,專利的價值評估還面臨更多的技術(shù)因素、市場因素和法律因素等不確定性影響,也給專利價值評估實踐帶來了更多的復雜性,這也是學者們長期以來進行相關(guān)研究所要解決的問題。早期的專利價值評估實踐借鑒了有形資產(chǎn)價值評估的經(jīng)驗,采用了現(xiàn)行市價法、重置成本法和收益現(xiàn)值法等市場基準的價值評估方法。按照我國《資產(chǎn)評估執(zhí)業(yè)準則——無形資產(chǎn)》第二十一條規(guī)定:“確定無形價值的評估方法包括市場法、收益法和成本法三種基本方法及其衍生方法”。由于三種基本方法在應用中對風險因素的考慮不夠,學者們提出了基于實物期權(quán)模型的專利價值評估方法[1-4]。
以市場為基準的專利價值評估方法通過獲取較為完善的市場信息來進行價值確定,但是由于市場信息的不完備,造成這些方法耗時耗力,且主觀性較強。近些年來,非市場基準的專利價值評估方法也被廣泛的應用在理論和實踐當中。非市場基準的專利價值評估方法的基本思路是,基于公共專利數(shù)據(jù)庫中相關(guān)信息,應用實證研究方法來分析不同信息與專利價值之間的關(guān)系,在此基礎(chǔ)上,以專利價值影響因素為變量來構(gòu)建專利價值評估模型[5]。在運用非市場基準的專利價值評估方法時,首先要解決的是尋找影響專利價值的因素,在確定專利價值影響因素的前提下,建立價值評估模型。根據(jù)建立專利價值評估模型的不同方法,非市場基準的專利價值評估方法分為模糊綜合評價法、計量經(jīng)濟學模型法、機器學習與仿真模擬法三類。在應用模糊綜合評價法進行專利價值評估時,學者們從不同視角建立專利價值評估綜合指標體系,再應用各種方法給被評價專利的每一個因素賦值,最后得到專利價值的綜合評價結(jié)果[6-10]。2002 年,德國慕尼黑大學的Harhoff教授提出了一種基于計量經(jīng)濟模型的專利價值評估方法并進行了實證研究[11]。該方法以專利價值估計值作為因變量,以選取的專利價值影響因素作為自變量,選取與待評估專利同質(zhì)的樣本,運用歷史數(shù)據(jù)進行多元回歸分析,在此基礎(chǔ)上建立專利價值的評估模型。國內(nèi)學者也運用該類方法進行了一些探索性研究[12-13]。
近年來隨著人工智能技術(shù)的發(fā)展,有學者提出了運用一些基于機器學習的專利價值評估方法。這種方法的基本思路是:首先同樣是分析和選擇專利價值的評估指標,然后利用機器學習的方法對樣本進行訓練并測試,從而得到專利價值評估結(jié)果。學者們嘗試運用分類回歸樹算法[14]、支持向量機[15]、系統(tǒng)動力學模擬[16]等算法進行了一些實證研究。當前專利價值評估領(lǐng)域,主要應用機器學習解決分類問題。 通過一些表現(xiàn)專利價值的指標標注專利價值,使用相關(guān)分類算法構(gòu)建分類模型, 經(jīng)過訓練和學習, 獲取專利價值評估模型。這種基于機器學習與模擬仿真的專利價值評估方法在理論上存在一定的可行性,但是實際應用中還需要對相關(guān)指標、算法等進行進一步的完善。因此, 如何科學合理地選擇價值指標, 如何選取合適的算法對于構(gòu)建專利價值評估模型有重要影響。因此,本文以探究更加可行、準確度更高的專利價值評估模型為目標,應用BP神經(jīng)網(wǎng)絡構(gòu)建專利價值評估模型。
BP神經(jīng)網(wǎng)絡作為人工智能領(lǐng)域中的重要組成部分,在各項經(jīng)濟社會生活中得到較為廣泛的應用[17-19]。 本文將BP神經(jīng)網(wǎng)絡原理應用到專利價值評估中,同時考慮到專利價值影響因素的多元性,在確定輸入層神經(jīng)元時采用粗糙集理論對專利價值影響因素進行指標約簡,建立一個粗糙集和BP神經(jīng)網(wǎng)絡相結(jié)合的專利價值評估模型,并運用336條專利轉(zhuǎn)讓數(shù)據(jù)對模型進行訓練和測試。本文可能的創(chuàng)新點為:(1)指標體系創(chuàng)新。在對現(xiàn)有專利價值評估指標體系分析基礎(chǔ)上,新增發(fā)明人相關(guān)指標,構(gòu)建了包含專利文本特征、專利法律度特征、專利市場關(guān)注度特征、發(fā)明人特征的指標體系。(2)研究方法創(chuàng)新。將BP神經(jīng)網(wǎng)絡引入專利價值評估領(lǐng)域,構(gòu)建新的專利價值評估模型??紤]到專利價值影響因素的多元性,在確定輸入層神經(jīng)元時采用粗糙集理論對專利價值指標體系進行知識約簡。
運用BP神經(jīng)網(wǎng)絡對專利價值進行評估,首先需要確定影響專利價值的主要因素,建立合理科學適用的專利價值評估指標體系。在初期構(gòu)建指標體系可以盡可能全面考慮影響因素,進一步對全部影響因素進行分析,將冗余重復類因素進行初選后再細致優(yōu)選,盡量得到既精簡又全面的影響因素?,F(xiàn)行指標初選方法多為文獻法、理論挖掘法、專家打分法等。此三類指標篩選方法均有其優(yōu)缺點,因而采用單一方法進行此初選指標存在一定局限,而多種方法結(jié)合可以規(guī)避單方法的缺點,進而建立更為科學完善的指標體系。對此,本文通過使用文獻法和理論分析方法進行初選指標。
國內(nèi)外眾多學者對專利價值評估模型指標體系建立有不同做法。在專利價值成為研究重點以來,學者們對影響專利價值的因素已經(jīng)有一定研究成果,多數(shù)學者將與專利相關(guān)的要素分成三類,分別是:法律因素、技術(shù)因素和經(jīng)濟因素[20-22]。在單個影響因素基礎(chǔ)上,眾多學者也突破單個因素的分析,結(jié)合多種因素對專利價值進行研究[23]。20世紀80年代,美國CHI-Resarch公司構(gòu)建CHI評估指標體系,美國聯(lián)邦法院確立佐治亞太平洋指標體系。張黎等將影響因素劃分成專利技術(shù)水平、市場價值、權(quán)利保護三個方面建立指標體系[24];楊思思等參考《專利價值分析指標體系》并結(jié)合行業(yè)特點選取指標,構(gòu)建適用性高的專利價值通用指標體系[25]。
眾多國內(nèi)外學者、機構(gòu)對專利價值影響因素的研究也逐漸完善,結(jié)合眾多專門專利相關(guān)數(shù)據(jù)庫的成立與投入使用,現(xiàn)在國內(nèi)外已經(jīng)存在一些現(xiàn)有的針對專利價值評估的指標體系,包括CHI評估指標體系、佐治亞太平洋指標體系、OECD專利指標體系及國家知識產(chǎn)權(quán)局專利指標體系等。基于這些文獻資料,延續(xù)已有的專利文本特征、專利法律度特征、專利市場關(guān)注度特征,并在此基礎(chǔ)上,考慮到當前我國進入交易或運營環(huán)節(jié)、需要進行價值評估的專利大都來源于高?;蚩蒲性核奶卣鳎冶疚牡难芯繕颖疽簿莵碓从诟咝:涂蒲性核膶@?,從而第一發(fā)明人的職稱、職務以及其他相關(guān)特征可能會影響到專利的價值,因此,本文在初選專利價值評估指標時增加了發(fā)明人特征的相關(guān)指標,從而構(gòu)成了由發(fā)明人特征、專利文本特征、專利法律度特征和市場關(guān)注度組成的專利價值評估初選指標體系,如表1所示。
表1 專利價值評估指標體系
發(fā)明人是專利的直接關(guān)聯(lián)者,發(fā)明人能力越強則其創(chuàng)造的專利在顯示市場中可能更具有價值。如果第一發(fā)明人職務、職稱高,參與申請的專利數(shù)量可能表明第一發(fā)明人能力強,其所研究的專利更具有價值[26];專利權(quán)發(fā)明人人數(shù)多,可能表明此項專利復雜程度高、更具創(chuàng)新[23,26];第一發(fā)明人所在單位作為外界環(huán)境也可能對發(fā)明人創(chuàng)造專利有一定影響,如可以提供的材料、場地等支持;發(fā)明人并不是孤軍奮戰(zhàn),除了會與其他發(fā)明人合作,可能與其他機構(gòu)或組織合作[27],除具體實物專利等合作產(chǎn)物的體現(xiàn),還有論文等形式。
專利文本特征中專利度表示主權(quán)項數(shù)量,即界定此項專利受法律保護的邊界。由此可見,專利度對專利而言是極其重要的核心。在現(xiàn)實市場中,專利價值在一定程度上會受到專利度數(shù)量的影響。專利通過國際專利分類號(IPC)分類,因而不同專利都會有相應的專利分類號,分類號數(shù)量越多則表明該項專利涉及領(lǐng)域?qū)?,本文稱之為技術(shù)寬度,亦稱專利保護范圍[12,28]。
專利法律度特征中專利的法律狀態(tài)一般有公開、授權(quán)、實質(zhì)審查,還可能存在終止現(xiàn)象。一般情況下,專利價值可能伴隨專利的法律狀態(tài)的公開度變化,公開越多,價值越小。專利在僅部分授權(quán)情形下,會有一定稀缺獲得其他關(guān)注,并產(chǎn)生增值[12]。專利在專利申請時按照不同類型有不同壽命期限,自申請日起,發(fā)明專利權(quán)壽命為20年,實用新型和外觀設計專利權(quán)壽命為10年。專利權(quán)需要后續(xù)繳納費用維護,否則可能因未繳納年費提前終止專利權(quán)。一般而言專利的法律壽命與經(jīng)濟壽命不能劃等號,一項專利可能因為技術(shù)等的更新?lián)Q代而提前失去意義。在法律專利壽命期限內(nèi),專利存在時間或剩余壽命可能對專利價值也有一定影響,畢竟當法律壽命結(jié)束后,專利權(quán)所擁有的法律保護就消失,如:越接近法律壽命最后期限,專利價值可能并不會太高[12,28]。專利存在即可能會出現(xiàn)法律訴訟等問題,因而在實際交易過程中被交易方可能會對該項專利是否訴訟有一定考量[28]。
專利市場關(guān)注度中指標包含有專利對其他專利的引用數(shù)量和專利申請成功后被其他專利引用的數(shù)量,通過引用數(shù)量表明對引用專利的認可,通過被引次數(shù)表明本項專利的重要度和影響力,這些會對專利價值產(chǎn)生一定影響[12,29]。專利在市場內(nèi)的轉(zhuǎn)移,包含有申請權(quán)轉(zhuǎn)移、專利權(quán)轉(zhuǎn)移,有過轉(zhuǎn)移經(jīng)歷的專利可能更為市場所接受與需要,受讓單位、轉(zhuǎn)讓方式、轉(zhuǎn)讓時間可能都對專利價值有影響。專利權(quán)同族數(shù)是專利權(quán)持有者在不同國家申請專利,以達到保護專利權(quán)的目的[28]。專利價值越高,則其持有者才會付出更多成本以尋求更多國家的保護。
考慮到專利價值評估初選指標可能存在一定的信息冗余,所以這里采用粗糙集理論對指標體系進行約簡。粗糙集(Rough Set)理論是波蘭學者Pawlak于1982年提出的一種可以定量分析解決含有不確定、不一致、不完整數(shù)據(jù)的數(shù)據(jù)挖掘工具。通過對數(shù)據(jù)進行深度挖掘,發(fā)現(xiàn)內(nèi)在隱含信息,找出數(shù)據(jù)間潛在聯(lián)系,在屬性約簡方面得到了廣泛的應用[30-31]。Rosetta軟件是由挪威科技大學計算機與信息科學系與波蘭華沙大學數(shù)學研究所合作共同開發(fā)的一款致力于采用粗糙集進行數(shù)據(jù)分析的專用數(shù)學分析工具。本文采用Rosetta軟件對專利價值評估初選指標進行約簡。
2.1原始數(shù)據(jù)的來源本文數(shù)據(jù)主要涉及兩部分:是在現(xiàn)行專利市場中已經(jīng)成功轉(zhuǎn)讓并能準確獲取轉(zhuǎn)讓價格的專利申請?zhí)柤皩@D(zhuǎn)讓價值;依據(jù)指標體系搜集專利指標數(shù)據(jù)。本文通過專利交易市場獲取專利的最后一次轉(zhuǎn)讓價格信息,這里以最后一次轉(zhuǎn)讓價格代替專利價值作為粗糙集專利價值評估模型分析的決策屬性。一共收集到336條專利轉(zhuǎn)讓價值的數(shù)據(jù),通過文獻總結(jié)及專家意見,這里將專利轉(zhuǎn)讓價值進行價值分級,具體分級對應見表2。
表2 專利轉(zhuǎn)讓價格分級對應表
在搜集到336條專利轉(zhuǎn)讓價值基礎(chǔ)上,通過現(xiàn)有專利數(shù)據(jù)庫:國家知識產(chǎn)權(quán)局官網(wǎng)(http://www.cnipa.gov.cn)及合享新創(chuàng)官網(wǎng)(https://www.incopat.com)逐個對具體數(shù)據(jù)指標信息進行檢索收集,官網(wǎng)內(nèi)收錄專利信息全面且詳細獲得專利指標數(shù)據(jù)集合。由于指標中含有一些文本指標數(shù)據(jù),在提煉規(guī)律并對其進行分層,以達到對獲取的眾多非數(shù)值數(shù)據(jù)進行數(shù)值轉(zhuǎn)化,如發(fā)明人職稱按照1-在讀學生、2-初級職稱、3-中級職稱、4-副高級職稱、5-高級職稱進行數(shù)值轉(zhuǎn)化。
本文所使用的專利價值評估指標體系一共23個指標,其中需要進行數(shù)值轉(zhuǎn)化的指標一共7個,分別是:第一發(fā)明人職稱、第一發(fā)明人職務、第一發(fā)明人所在單位、技術(shù)寬度、專利法律狀態(tài)、專利權(quán)受讓單位、專利轉(zhuǎn)讓方式。其中發(fā)明人職稱按照在讀學生、初級職稱、中級職稱、副高級職稱、高級職稱進行數(shù)值轉(zhuǎn)化;第一發(fā)明人職務按照有無職務數(shù)值轉(zhuǎn)化;技術(shù)寬度數(shù)值轉(zhuǎn)化是指專利的IPC分類號前4位的個數(shù);專利法律狀態(tài)是對未繳年費專利權(quán)終止、實質(zhì)審查、授權(quán)三種狀態(tài)的數(shù)值轉(zhuǎn)化;專利轉(zhuǎn)讓方式有兩種分別是專利權(quán)轉(zhuǎn)讓與專利申請權(quán)轉(zhuǎn)讓。
本文選取數(shù)據(jù)共336條,將全部樣本數(shù)據(jù)分為訓練集和測試集,將全部336條數(shù)據(jù)進行隨機采樣,分為272+64,本文選用272條樣本數(shù)據(jù)作為訓練集,剩余64條數(shù)據(jù)作為測試集。訓練集論域為Utrain={X1,X2,…,X272},其中X1,X2,…,X272分別表示272條專利數(shù)據(jù),測試集Utest={X273,X332,…,X336},X273,X332,…,X336表示64條訓練集數(shù)據(jù)。所在行所有數(shù)值為各指標數(shù)據(jù)。C={C1,C2,…,C23}是條件屬性集,D={D}是決策屬性集,則初始決策表為A={C,D}。
2.2原始數(shù)據(jù)的補齊及離散化將272條訓練集數(shù)據(jù)放置在同一Excel工作表中,通過Rosetta軟件機器數(shù)據(jù)源讀入訓練集,構(gòu)建決策表。因為本文數(shù)據(jù)缺失項在進行軟件訓練前已經(jīng)做了剔除,則并不含有缺失值,因而無需通過軟件進行數(shù)據(jù)預處理,也就是數(shù)據(jù)補齊,對此通過現(xiàn)有訓練決策表進行離散化。通過Rosetta中Boolean、MDL、Equal Frequency、Na?ve、Semi-na?ve算法分別進行離散化,得出斷點數(shù),并選取斷點數(shù)最少算法作為本文離散化算法。將訓練決策表采用五種算法計算分別離散化斷點數(shù),結(jié)果見表3。
表3 五種算法離散化斷點結(jié)果
由表3中五種離散化算法得出的斷點數(shù)明顯Boolean算法斷點數(shù)少,斷點以簡便為佳,對此本文選擇Boolean算法進行離散化,得到離散化條件屬性量化參數(shù)見表4。
表4 條件屬性量化參數(shù)表
2.3決策表屬性約簡依據(jù)上述采用Boolean算法進行離散化后的決策表進行下一步屬性約簡。屬性約簡是粗糙集算法核心內(nèi)容,本文采用遺傳算法進行屬性約簡,主要約簡方法有:Genetic algorithm、Johnson's algorithm及Holte's 1R三種約簡算法。將通過離散化后的決策表進行Rosetta軟件三種算法約簡,具體約簡個數(shù)及包含屬性個數(shù)結(jié)果見表5。
表5 三種算法屬性約簡結(jié)果
通過表5可以看出Holte's 1R算法并沒有約簡,條件屬性保持仍在23個,因而排除Holte's 1R算法。比對三種算法對指標約簡,支持度均為100條件下,Johnson's算法約簡個數(shù)最少。本文選擇Johnson's算法約簡后的專利價值評估指標體系,見表6。
表6 基于Johnson's算法生成的約簡指標對照
3.1 BP神經(jīng)網(wǎng)絡的基本原理BP神經(jīng)網(wǎng)絡,又稱誤差反向傳播神經(jīng)網(wǎng)絡,是神經(jīng)網(wǎng)絡中學者研究最多、使用范圍最大的一種。BP神經(jīng)網(wǎng)絡是通過輸入后所得出的輸出值與實際值差額平方和,不斷調(diào)解隱含層數(shù)值使其最小的學習型算法[18-19]。BP神經(jīng)基本結(jié)構(gòu)與神經(jīng)網(wǎng)絡基本結(jié)構(gòu)一致,均包含有輸入層、隱含層與輸出層,其中隱含層并不一定唯一,可能存在一個或多個隱含層。各層與相鄰層各個神經(jīng)元均連接,但同一層神經(jīng)元間不連接[18]。
BP神經(jīng)網(wǎng)絡的操作步驟較為固定,主要有兩種操作,其一:為正向傳播,主要是通過輸入層進入隱含層計算,在經(jīng)過輸出層進行數(shù)值輸出;其二:為反向調(diào)節(jié),在經(jīng)過正向操作后最后的輸出值沒有達到預判,差額數(shù)值過大,可以通過反向操作,依據(jù)實際輸出值與預判值間的差額以調(diào)節(jié)指標屬性的權(quán)重與閾值,再次傳到輸入值,直至差額減小至誤差范圍內(nèi)以結(jié)束最終學習[18-19]。正向傳播過程中各層神經(jīng)元只會受到上一層神經(jīng)元影響。經(jīng)過已有數(shù)據(jù)進行不斷學習訓練,以找到輸入值與輸出值間聯(lián)系,使得實際中眾多問題得到解決。
3.2數(shù)據(jù)預處理BP神經(jīng)網(wǎng)絡可以做非線性輸入輸出,因而可以直接對現(xiàn)有數(shù)據(jù)進行訓練學習,但通過適當?shù)臄?shù)據(jù)處理能夠提升運行效率及精確度。因而對現(xiàn)有數(shù)據(jù)進行預處理——歸一化,顧名思義歸一化就是通過標準化將數(shù)據(jù)呈現(xiàn)0-1正態(tài)分布,以達到避免數(shù)據(jù)大的變動范圍對結(jié)果影響。
本文使用Z-Score標準化方法對訓練集與測試集數(shù)據(jù)進行歸一化。Z-Score標準化方法的計算公式為:
z=(x-μ)/σ
(1)
公式中z表示歸一化的最終結(jié)果,x表示數(shù)據(jù)值,μ是均值,σ是標準差。z的具體量表示原數(shù)值與均值間差值,可能為負值。
對數(shù)據(jù)進行預處理有以下優(yōu)點:能夠減弱或消除量綱對結(jié)果的影響,使運行速度增加,避免過于擬合。
3.3模型構(gòu)建與訓練本文采用Python軟件進行神經(jīng)網(wǎng)絡專利價值評估模型構(gòu)建。對參數(shù)設定:
總之,德國雙元制高等職業(yè)教育模式內(nèi)涵豐富、特點突出,其中有許多值得我們借鑒的經(jīng)驗,我們應該有針對性的學習,以便能夠提高我國高等職業(yè)教育的水平,為“中國制造2025”培養(yǎng)更多的高素質(zhì)應用技術(shù)人才,助力中國從制造業(yè)大國向制造業(yè)強國的轉(zhuǎn)變。
(1)神經(jīng)網(wǎng)絡層數(shù)確定。BP神經(jīng)網(wǎng)絡結(jié)構(gòu)包含有輸入層、隱含層與輸出層,隱含層數(shù)量可能不唯一。在通過Python進行多次測試,隱含層數(shù)量在3個,模型準確率高。因而本文采用五層神經(jīng)網(wǎng)絡結(jié)構(gòu)進行訓練學習,即包含有三個隱含層。
(2)輸入層神經(jīng)元個數(shù)確定。在上文對指標篩選選擇中粗糙集的指標篩選具有一定優(yōu)勢,因而本文在基于BP神經(jīng)網(wǎng)絡構(gòu)建專利價值評估模型操作過程中,使用經(jīng)過粗糙集采用Johnson's算法知識約簡后的12個指標進行操作,因而BP神經(jīng)網(wǎng)絡結(jié)構(gòu)中輸入層神經(jīng)元個數(shù)有12個。
(3)輸出層神經(jīng)元個數(shù)確定。本文是對專利價值進行評估,因而輸出層神經(jīng)元僅有一個輸出值就是專利價值。故輸出層神經(jīng)元個數(shù)有且僅有一個。
(4)隱含層神經(jīng)元個數(shù)確定。通過不斷修改各隱含層神經(jīng)元個數(shù)進行測試,對比不同個數(shù)條件下模型的準確率,保留相對較好且較為穩(wěn)定的參數(shù),最終得到3個隱含層的神經(jīng)元個數(shù)分別為16、32、16。
(5)選擇誤差目標值。在實際利用神經(jīng)網(wǎng)絡進行模型構(gòu)建過程中,實際值與輸出值可能是存在一定差額的,而且利用神經(jīng)網(wǎng)絡也是允許誤差存在的。一般在實際操作過程中的誤差目標值要根據(jù)問題是否有較高的規(guī)律性,如果規(guī)律性較強則誤差目標值精度較高,一般在10-4到10-6間;如果規(guī)律性較低,誤差目標值精度就會有所降低,一般在10-2。仔細考慮多方因素,為保證精度較高、運算效率在同準確度條件下達到最高,這里選用10-4作為模型誤差目標值。
(6)選擇激活函數(shù)。目前神經(jīng)網(wǎng)絡選用激活函數(shù)多為Sigmoid函數(shù),Sigmoid函數(shù)又具體分為Log-Sigmoid函數(shù)與Tan-Sigmoid函數(shù)。本文選擇Tan-Sigmoid函數(shù)作為輸入層與隱含層的激活函數(shù)。
(7)最大訓練次數(shù)確定。通過軟件對訓練集訓練可能訓練時間過長,才達到設定的誤差目標值,也可能存在達不到設定值,因而需要提前設定最大訓練次數(shù)以避免時間過長或達不到情況出現(xiàn),本文設定最大訓練次數(shù)為2 000。
本次通過BP神經(jīng)網(wǎng)絡構(gòu)建的專利價值評估模型,依據(jù)上述參數(shù)設定具體為:神經(jīng)網(wǎng)絡層數(shù)5層、輸入層神經(jīng)元23個、輸出神經(jīng)元1個、隱含層神經(jīng)元分別為16、32、16個;誤差目標值10-4、激活函數(shù)Tan-Sigmoid函數(shù)、最大訓練次數(shù)2 000。
在上述參數(shù)設定下,通過Python軟件進行訓練,神經(jīng)網(wǎng)絡系統(tǒng)在內(nèi)部進行訓練學習,調(diào)整權(quán)重或閾值,構(gòu)建評估模型及價值輸出。本文所用BP神經(jīng)網(wǎng)絡模型如圖1所示。
圖1 基于BP神經(jīng)網(wǎng)絡專利價值評估模型
輸入層神經(jīng)元特征重要度列示情況見圖2,圖中柱形長度代表特征重要度。特征重要度從大到小列示見表7。
圖2 輸入層神經(jīng)元特征重要度列示情況
表7 特征重要度從大到小列示
針對訓練集通過訓練學習所得到的模型,在對訓練集本身進行預測,所得準確率為81.39%。
3.4模型測試利用以上所得出的專利價值評估模型對64條測試集數(shù)據(jù)進行測試,預測結(jié)果與實際值比對情況如表8所示。
通過表8的測試集檢驗,表明通過BP神經(jīng)網(wǎng)絡構(gòu)建的專利價值評估模型對專利價值預測有較高的可信度,預測專利價值等級在64條測試集中有12條實際與預測不符,預測準確52例,準確率為81.25%。
表8 專利預測值與實際值對照表
BP神經(jīng)網(wǎng)絡的應用較為成熟,且具有自適應性、非線性、容錯性及計算并行性特點。通過對同樣336條數(shù)據(jù)進行訓練集與測試集劃分后,對數(shù)據(jù)預處理歸一化消除量綱對結(jié)果的影響。接著通過Python軟件設置參數(shù)結(jié)果為:神經(jīng)網(wǎng)絡層數(shù)5層、輸入層神經(jīng)元23個、輸出神經(jīng)元1個、隱含層神經(jīng)元分別為16、32、16個;誤差目標值10-4、激活函數(shù)Tan-Sigmoid函數(shù)、最大訓練次數(shù)2000。再對訓練集進行學習訓練,輸入層神經(jīng)元特征重要度從大到小排列為:第一發(fā)明人合作機構(gòu)數(shù)、專利發(fā)明人人數(shù)、專利權(quán)轉(zhuǎn)讓時間、第一發(fā)明人合作論文次數(shù)、技術(shù)寬度、專利轉(zhuǎn)讓方式、專利度、第一發(fā)明人職稱、引用次數(shù)、專利存在時間、第一發(fā)明人職務、第一發(fā)明人參與申請的專利數(shù)量。針對訓練集搜尋訓練所得的模型,對訓練集本身預測準確率為81.39%。用訓練所得模型對測試集數(shù)據(jù)進行檢驗,預測準確率81.25%。
不論是傳統(tǒng)方法下的市場法、成本法、收益法以及實物期權(quán)法,還是非市場基準評估方法中的模糊綜合評價法、計量經(jīng)濟模型方法,在專利價值評估中都存在一定的缺陷,而人工智能技術(shù)的運用尚需要不斷對指標選擇和算法進行完善。本文依據(jù)現(xiàn)有336條專利轉(zhuǎn)讓數(shù)據(jù)樣本,結(jié)合眾多影響因素構(gòu)建指標體系,采用粗糙集理論進行屬性約簡,并采用BP神經(jīng)網(wǎng)絡理論,構(gòu)建基于粗糙集和BP神經(jīng)網(wǎng)絡專利價值評估模型,并對專利樣本數(shù)據(jù)進行了訓練集與測試集劃分,進行實證研究。研究結(jié)果表明:
(1)專利文本特征、法律度特征、市場關(guān)注度特征是專利價值的重要影響因素。對于高校、科研院所的專利成果來說,其專利的價值與發(fā)明人的特征也有一定的相關(guān)性,包括第一發(fā)明人的職稱、職務、參與申請的專利數(shù)量、合作機構(gòu)數(shù)、合作論文次數(shù)以及專利發(fā)明人的數(shù)量等。
(2)粗糙集理論相對于其他評估方法具有不需要先驗知識來定量分析解決含有不確定、不一致、不完整數(shù)據(jù)的數(shù)據(jù)挖掘問題,因而可以很好地適應專利價值不確定性因素多的特點,運用粗糙集理論可以對專利價值評估指標體系進行約簡。在實際應用過程中,Boolean算法與Johnson's算法可以較好解決決策表中離散化與屬性約簡問題。
(3)基于約簡后的專利價值評估指標體系,運用BP神經(jīng)網(wǎng)絡原理構(gòu)建專利價值評估模型,通過自我學習訓練和檢驗測試,發(fā)現(xiàn)模型運用相對簡單,對測試集進行檢驗測試所得的預測準確率81.25%,表明通過BP神經(jīng)網(wǎng)絡構(gòu)建的專利價值評估模型在實際市場條件中較為適用可靠。
本文主要是粗糙集與BP神經(jīng)網(wǎng)絡兩種方法結(jié)合,由于多方面的制約,還存在有不足之處,在各方面研究深度和廣度比較有限,有待于在以后的學習中不斷改進完善:①樣本問題:由于專利轉(zhuǎn)讓價值的數(shù)據(jù)獲取較難,搜集到的336條數(shù)據(jù)涉及領(lǐng)域太廣,可能影響專利價值評估模型實際操作;②指標問題:受限于我國專利信息公開市場有限,有一些相關(guān)影響因素不能直觀找到具體數(shù)據(jù),還有些指標不能量化,因而在指標選取方面有一定制約。