高道斌 吳 紅 張 彪 崔 哲 李劍飛
(山東理工大學(xué)信息管理研究院 淄博 255049)
伴隨人工智能等新興技術(shù)領(lǐng)域的出現(xiàn),技術(shù)更迭周期顯著縮短,領(lǐng)域競爭日益激烈,企業(yè)經(jīng)營環(huán)境愈發(fā)復(fù)雜和難以預(yù)料。在日新月異的市場競爭中,每個企業(yè)都不具備絕對優(yōu)勢,都有著不同的競爭對手和競爭方式。企業(yè)要想在激烈的市場競爭中占有一席之地,就必須對市場競爭態(tài)勢進(jìn)行分析,辨別競爭對手,采取差異性戰(zhàn)略,做到知己知彼,方可百戰(zhàn)不殆。否則即便領(lǐng)軍企業(yè),若不能準(zhǔn)確前瞻、研判局面,不有效關(guān)注、辨別競爭對手并采取有力措施,也會被競爭對手趕超甚至淘汰出局,如博客網(wǎng)—從引領(lǐng)Web2.0的先驅(qū)成為無人問津的棄兒。競爭對手有多種分類,馬天旗將競爭對手依據(jù)所提供產(chǎn)品與服務(wù)的相似性依次劃分為核心、中間、外圍及潛在競爭對手,并明確指出,針對不同類型的競爭對手,目標(biāo)企業(yè)應(yīng)制定不同的競爭策略以鞏固競爭優(yōu)勢,如進(jìn)攻、回避、聯(lián)合、兼并等[1]。因此,辨別競爭對手并對其進(jìn)行精準(zhǔn)分類,就成為目標(biāo)企業(yè)制定差異化競爭策略、在競爭中立于不敗之地的現(xiàn)實所求。
企業(yè)間競爭表面上表現(xiàn)為市場中所流通產(chǎn)品或服務(wù)的替代關(guān)系,內(nèi)在因素卻是技術(shù)競爭[2]。為鞏固競爭優(yōu)勢,企業(yè)通常會將其視為命脈的核心技術(shù)進(jìn)行科學(xué)、縝密的專利保護(hù),所以專利文獻(xiàn)是展示企業(yè)核心技術(shù)最為清楚、完整的數(shù)據(jù)源。目前已有眾多學(xué)者以企業(yè)專利為數(shù)據(jù)源、以技術(shù)相似度為依據(jù),從IPC相似性、文本內(nèi)容相似性以及兩者結(jié)合角度對競爭對手的分析、辨別進(jìn)行了深入研究。
Lee等以企業(yè)間專利IPC分類號的共現(xiàn)強(qiáng)度表示技術(shù)相似性,實現(xiàn)了對具有相似創(chuàng)新模式競爭對手的辨別[3];劉高勇等通過IPC分類號對產(chǎn)業(yè)技術(shù)結(jié)構(gòu)進(jìn)行分析,并以IPC相似性度量專利關(guān)聯(lián)性與企業(yè)間技術(shù)相似性,實現(xiàn)了對產(chǎn)業(yè)內(nèi)競爭格局的分析,為競爭對手辨別提供參考[4];溫芳芳等以IPC分類號為媒介,構(gòu)建專利耦合網(wǎng)絡(luò),實現(xiàn)了對潛在競爭對手/合作伙伴的有效識別[5];Mun等以IPC分類號表示專利技術(shù)層次,在對其進(jìn)行技術(shù)分解與層次聚類的基礎(chǔ)上,對太陽能光伏技術(shù)領(lǐng)域的子領(lǐng)域進(jìn)行詳細(xì)劃分,實現(xiàn)企業(yè)競爭對手辨別[6]。
考慮到專利文獻(xiàn)內(nèi)部特征所蘊含技術(shù)信息的重要性,部分學(xué)者通過專利文本內(nèi)容反映技術(shù)相似性。Geum提出技術(shù)關(guān)聯(lián)值概念,其核心觀點為技術(shù)關(guān)聯(lián)值越大的企業(yè),成為競爭對手的可能性越高,并通過企業(yè)專利文本相似性進(jìn)行了實證[7];Kim、Wang等通過對專利文本中SAO結(jié)構(gòu)的分析,為企業(yè)辨別技術(shù)競爭趨勢提供了參考[8-9];張杰等通過計算獨立權(quán)利要求文本的SAO結(jié)構(gòu)相似度對企業(yè)間相似專利進(jìn)行識別,以此為企業(yè)競爭對手辨別提供依據(jù)[10];史敏等基于語義將說明書文本進(jìn)一步劃分為技術(shù)背景與解決方案,通過比對兩者間的相似性實現(xiàn)了競爭對手的辨別[11]。
為提升競爭對手辨別效果,少數(shù)研究結(jié)合IPC分類號與文本內(nèi)容對企業(yè)間技術(shù)相似度進(jìn)行測算。吳菲菲等綜合考慮競爭對手技術(shù)應(yīng)用領(lǐng)域相似度與技術(shù)內(nèi)容相似度,實現(xiàn)了對OLED領(lǐng)域競爭對手的辨別[2];向姝璇等基于改進(jìn)Jaccard 算法所得的IPC組合相似度及獨立權(quán)利要求文本相似度,對企業(yè)所擁有的專利文獻(xiàn)整體相似度進(jìn)行計算,實現(xiàn)了競爭對手的辨別[12];Park等基于專利地圖對企業(yè)專利文本進(jìn)行挖掘,同時結(jié)合IPC等信息實現(xiàn)了對企業(yè)間技術(shù)相似性的度量,為企業(yè)辨別競爭對手提供依據(jù)[13]。
綜上,以技術(shù)相似度為依據(jù)辨別競爭對手已成為業(yè)界共識,但還存在以下不足:僅通過IPC辨別會遺漏專利文獻(xiàn)中的技術(shù)信息,導(dǎo)致辨別粒度較粗;在融入文本內(nèi)容的研究中,基于權(quán)利要求書的對比視角較為單一,基于說明書的對比忽略了說明書中不同標(biāo)題內(nèi)容(技術(shù)領(lǐng)域、背景技術(shù)、發(fā)明內(nèi)容等)重要性的主次,降低了辨別結(jié)果的準(zhǔn)確性;另,企業(yè)間技術(shù)相似度對比除考慮技術(shù)內(nèi)容本身,專利質(zhì)量和市場領(lǐng)域也發(fā)揮了重要作用,但現(xiàn)有研究均未顧及,對比過于理想。基于此,本文在技術(shù)相似度計算中融入了專利說明書中標(biāo)題內(nèi)容權(quán)重、市場相似性和專利質(zhì)量情境,以期更為細(xì)膩、準(zhǔn)確的對競爭對手進(jìn)行辨別和分類,為企業(yè)制定發(fā)展戰(zhàn)略提供決策支持。
從企業(yè)視角出發(fā),競爭對手是指競爭環(huán)境中具有相似產(chǎn)品或技術(shù)的經(jīng)營者,技術(shù)相似度作為度量企業(yè)間技術(shù)相似性的量化方法,能夠有效辨別企業(yè)間的競爭關(guān)系。在專利文獻(xiàn)中,說明書包括技術(shù)領(lǐng)域、背景技術(shù)、發(fā)明內(nèi)容、有益效果等內(nèi)容,相比于權(quán)利要求書、說明書摘要等,對技術(shù)內(nèi)容的描述更為清楚、完整。為更加細(xì)膩、準(zhǔn)確的辨別競爭對手,本文對技術(shù)相似度辨別模型進(jìn)行了優(yōu)化:首先從說明書中提取技術(shù)背景(背景技術(shù))、技術(shù)方案(發(fā)明內(nèi)容)、技術(shù)功效(有益效果)文本,采用AHP-熵權(quán)法[14]按照其對技術(shù)內(nèi)容描述的地位主次賦予不同權(quán)重,計算目標(biāo)-對手企業(yè)單件專利間的個體技術(shù)相似度;然后將各企業(yè)的專利依質(zhì)量進(jìn)行分類,分別依據(jù)目標(biāo)-對手企業(yè)相同類別專利集合間不同維度的技術(shù)相似度計算整體技術(shù)相似度;最后從整體技術(shù)相似度、專利平均質(zhì)量兩個維度構(gòu)建戰(zhàn)略坐標(biāo),通過設(shè)置閾值將目標(biāo)企業(yè)競爭對手進(jìn)行細(xì)粒度分類。
單件專利是計算企業(yè)間技術(shù)相似度的基本單位,每件專利的技術(shù)內(nèi)容由技術(shù)背景、技術(shù)方案、技術(shù)功效組成:技術(shù)背景闡述了與本發(fā)明具有關(guān)聯(lián)的現(xiàn)有技術(shù)及該技術(shù)領(lǐng)域尚未解決的技術(shù)問題,以突出本發(fā)明的技術(shù)必要性;技術(shù)方案包含解決該技術(shù)問題、實現(xiàn)技術(shù)目的的具體技術(shù),是本發(fā)明的實現(xiàn)途徑;另,技術(shù)方案還涵蓋了對本發(fā)明有益效果的闡述,表明了該發(fā)明的技術(shù)功效。技術(shù)背景、技術(shù)方案、技術(shù)功效在表達(dá)順序上前后相承,在語義上形成“技術(shù)研發(fā)必要性—技術(shù)研發(fā)內(nèi)容—技術(shù)有益效果”的表述閉環(huán)。在專利技術(shù)內(nèi)容的表達(dá)上,雖然兩件或多件發(fā)明的技術(shù)背景與技術(shù)功效可以高度重合甚至完全一致,但專利法對創(chuàng)造性與新穎性的要求,使得每項發(fā)明的技術(shù)方案必須具有唯一性,所以技術(shù)方案對展示技術(shù)內(nèi)容的重要性要大于技術(shù)背景與技術(shù)功效,在計算個體技術(shù)相似度時應(yīng)設(shè)置不同權(quán)重?;诖?,個體技術(shù)相似度計算模型如圖1所示。
圖1 個體技術(shù)相似度計算模型
圖中,專利A與專利B分別表示目標(biāo)企業(yè)與對手企業(yè)的單件專利,sim1-3分別表示技術(shù)背景、技術(shù)方案、技術(shù)功效文本兩兩之間的余弦相似度。本文通過AHP-熵權(quán)法對個體技術(shù)相似度、整體技術(shù)相似度、專利質(zhì)量評價指標(biāo)體系中各指標(biāo)(構(gòu)成部分)進(jìn)行組合賦權(quán),這樣既可以取兩者之長,又可以克服AHP法主觀隨意性強(qiáng)和熵權(quán)法僅憑數(shù)據(jù)判斷具有機(jī)械性的缺點,使賦權(quán)結(jié)果更加符合實際。組合賦權(quán)方式具體為:
ωi=αωi1+βωi2(α+β=1)
(1)
ɑ、β為AHP法、熵權(quán)法占組合權(quán)重的比重。本研究認(rèn)為主觀經(jīng)驗判斷與客觀數(shù)據(jù)分析對評價對象權(quán)重賦予同樣重要,所以將兩者比重均設(shè)置為0.5。ωi1、ωi2表示AHP法、熵權(quán)法所得權(quán)重,其中,AHP法權(quán)重賦予步驟為:首先確定指標(biāo)集合,構(gòu)建重要性毗鄰判斷矩陣,之后通過公式(2)對各指標(biāo)進(jìn)行歸一化,然后通過公式(3)獲得指標(biāo)權(quán)重:
(2)
(3)
熵權(quán)法權(quán)重賦予步驟為:首先構(gòu)建對象評價矩陣,對指標(biāo)數(shù)值通過min-max法進(jìn)行標(biāo)準(zhǔn)化,之后通過信息熵公式得到如公式(4)所示指標(biāo)熵值,最后基于熵值通過公式(5)得到指標(biāo)熵權(quán):
(4)
(5)
結(jié)合文本余弦相似度與組合權(quán)重最終得到個體技術(shù)相似度:
V1=ω1sim1(TBA,TBB)+ω2sim2(TSA,TSB)+ω3sim3(TEA,TEB)
(6)
ω1、ω2、ω3分別表示技術(shù)背景相似度、技術(shù)方案相似度與技術(shù)功效相似度在個體技術(shù)相似度中的組合權(quán)重。
個體技術(shù)相似度雖能表示目標(biāo)-對手企業(yè)單件專利間技術(shù)內(nèi)容的相似性,卻難以反映企業(yè)間整體的技術(shù)相似性及映射競爭關(guān)系,另,在企業(yè)間整體技術(shù)相似性的比較中,技術(shù)領(lǐng)域、技術(shù)市場和專利質(zhì)量都發(fā)揮了不同的作用?;诖耍疚奶岢隽苏w技術(shù)相似度計算模型,該模型將企業(yè)所有專利視作一個集合,計算目標(biāo)-對手企業(yè)整體技術(shù)相似性。具體為:將專利集合分為核心、重點、一般三類,整體技術(shù)相似度為目標(biāo)-對手企業(yè)三類專利集合技術(shù)相似度的加權(quán)總和,每類專利集合的技術(shù)相似度又由技術(shù)內(nèi)容相似度、技術(shù)領(lǐng)域相似度、技術(shù)市場相似度的加權(quán)總和構(gòu)成,技術(shù)內(nèi)容相似度由目標(biāo)-對手企業(yè)相同類別專利集合中個體技術(shù)相似度總和的均值表示,由此將個體技術(shù)相似度融入到整體相似度的計算過程中。整體技術(shù)相似度計算模型如圖2所示。
圖2 整體技術(shù)相似度計算模型
眾多研究以專利質(zhì)量作為企業(yè)專利分類劃分的依據(jù),總體觀點為高質(zhì)量專利對企業(yè)保持競爭優(yōu)勢、進(jìn)行專利布局產(chǎn)生更重要的作用[15-16]?;诖?,本文通過專利質(zhì)量對專利進(jìn)行類別劃分:依據(jù)“二八法則”,將排名前20%專利視為核心專利,將排名20%~50%專利視為重點專利,其余為一般專利。為確保三類專利在整體技術(shù)相似度中所占權(quán)重的普適性和反映在計算過程中的易理解性,研究采用專家9分制評分法(權(quán)重總值為9)賦予不同類別專利在計算整體技術(shù)相似度中的權(quán)重,具體如表1所示。
表1 專利劃分方式與含義
從表1可知,由于核心、重點、一般專利對企業(yè)間競爭態(tài)勢影響情況依次遞減且競爭強(qiáng)度依次降低,同時結(jié)合“高質(zhì)量專利對企業(yè)保持競爭優(yōu)勢、進(jìn)行專利布局產(chǎn)生更重要作用”的觀點,因此,將三者在整體技術(shù)相似度中的權(quán)重分別設(shè)置為5/9、3/9、1/9,由此鮮明反映三類專利在辨別企業(yè)間競爭關(guān)系的不同重要性。經(jīng)過加權(quán)的整體技術(shù)相似度為:
V2=αSIM1+βSIM2+λSIM3
(7)
ɑ、β、λ分別為目標(biāo)-對手企業(yè)三類專利集合在整體技術(shù)相似度中的權(quán)重(與表1對應(yīng))。SIM1、SIM2、SIM3為目標(biāo)-對手企業(yè)三類專利集合的技術(shù)相似度:
V3=aTCS+bTMS+cTFS
(8)
a、b、c分別表示TCS、TMS、TFS在同類別專利集合技術(shù)相似度中的權(quán)重,其賦予方式與個體技術(shù)相似度相同。TCS為技術(shù)內(nèi)容相似度(Technical Content Similarity),具體計算方式為:
(9)
V1表示目標(biāo)-對手企業(yè)同類別專利集合中單件專利間的個體技術(shù)相似度,n表示目標(biāo)-對手企業(yè)相同專利集合中單件專利間構(gòu)成的專利對數(shù)量。
TMS為技術(shù)市場相似度(Technical Market Similarity)。占據(jù)市場是企業(yè)申請專利的目的之一,企業(yè)在獲得發(fā)明授權(quán)后,需要將其轉(zhuǎn)化為現(xiàn)實生產(chǎn)力以實現(xiàn)收益,因此對專利間市場競爭關(guān)系的分析十分重要?!秶窠?jīng)濟(jì)行業(yè)分類號》規(guī)定了全社會經(jīng)濟(jì)活動的分類及代碼,據(jù)此可對企業(yè)的經(jīng)濟(jì)活動進(jìn)行分類。每件專利都與國民經(jīng)濟(jì)行業(yè)分類號(簡稱行業(yè)分類號)相關(guān)聯(lián),可以視作專利的經(jīng)濟(jì)活動領(lǐng)域與市場取向?;诖?,本文使用基于Jaccard系數(shù)的行業(yè)分類號共現(xiàn)強(qiáng)度表示TMS:
(10)
(ICN)Am為目標(biāo)企業(yè)第m件專利國民經(jīng)濟(jì)行業(yè)分類號,(ICN)Bk為對手企業(yè)第k件專利國民經(jīng)濟(jì)行業(yè)分類號,h表示目標(biāo)-對手企業(yè)存在技術(shù)市場相似度的專利對數(shù),屬于h的專利對表示為:
coupleAm,Bk≠0∈(quantity_h)∪coupleAm,Bk=0?(quantity_h)
TFS為技術(shù)領(lǐng)域相似度(Technical Field Similarity)。每件專利包含若干IPC號,由本技術(shù)領(lǐng)域?qū)彶閱T依據(jù)發(fā)明內(nèi)容劃分,代表專利應(yīng)用領(lǐng)域,兩件專利相同IPC號越多,表明應(yīng)用領(lǐng)域競爭強(qiáng)度越大,分別擁有該專利的企業(yè)間競爭關(guān)系越強(qiáng)烈。本文借鑒吳菲菲等[2]的研究,將技術(shù)領(lǐng)域相似度表示為:
(11)
(IPC)Am為目標(biāo)企業(yè)第m件專利IPC號,(IPC)Bk為對手企業(yè)第k件專利IPC號,l表示目標(biāo)-對手企業(yè)存在技術(shù)領(lǐng)域相似度的專利對數(shù),屬于l的專利對表示為:
coupleAm,Bk≠0∈(quantity_l)∪coupleAm,Bk=0?(quantity_l)
通過目標(biāo)-對手企業(yè)整體技術(shù)相似度計算,可識別出存在高度技術(shù)相似性的競爭對手,但技術(shù)相似度只是表征競爭關(guān)系的一個維度,需要更加立體的評判標(biāo)準(zhǔn)對競爭對手進(jìn)行更加細(xì)化的辨別。專利質(zhì)量是企業(yè)技術(shù)競爭強(qiáng)度的體現(xiàn),專利平均質(zhì)量高的企業(yè),代表著技術(shù)基礎(chǔ)、研發(fā)實力更加雄厚,在市場競爭中更有可能取得競爭優(yōu)勢,對目標(biāo)企業(yè)產(chǎn)生威脅[15]?;诖?,通過整體技術(shù)相似度-專利平均質(zhì)量二維戰(zhàn)略坐標(biāo)將競爭對手劃分為核心、潛在、外圍、候選四類,如圖3所示。
圖3 整體技術(shù)相似度-專利平均質(zhì)量戰(zhàn)略坐標(biāo)
在該戰(zhàn)略坐標(biāo)圖中,縱軸代表目標(biāo)-對手企業(yè)整體技術(shù)相似度,由公式(7)計算而得,該值越大表明兩企業(yè)技術(shù)越相似,競爭關(guān)系越強(qiáng)烈;橫軸代表企業(yè)專利平均質(zhì)量,由下文中公式(13)計算而得,該值越大表示企業(yè)技術(shù)競爭力越強(qiáng),對目標(biāo)企業(yè)產(chǎn)生更大威脅。關(guān)于專利質(zhì)量的評價,本文借鑒劉云、馮仁濤等[17-18]的觀點,從技術(shù)性(技術(shù)質(zhì)量)、法律性(法律質(zhì)量)、市場性(經(jīng)濟(jì)質(zhì)量)三方面進(jìn)行。考慮到指標(biāo)的權(quán)威性與易計算性,指標(biāo)選取以國家知識產(chǎn)權(quán)局《專利價值
表2 專利質(zhì)量評價指標(biāo)體系
分析指標(biāo)體系操作手冊》為基礎(chǔ),同時結(jié)合文獻(xiàn)調(diào)研與專家智慧,選取結(jié)果如表2所示。
為消除量綱影響,使用min-max法獲得單件專利各項指標(biāo)標(biāo)準(zhǔn)化數(shù)值xi,結(jié)合指標(biāo)組合權(quán)重wi后,單件專利質(zhì)量P_Q的評價方式為:
P_Q=w1x1+w2x2+w3x3+w4x4+w5x5+w6x6+w7x7+w8x8
(12)
各企業(yè)專利平均質(zhì)量A_P_Q評價方式為(m代表企業(yè)專利數(shù)量):
(13)
依據(jù)整體技術(shù)相似度-專利平均質(zhì)量二維戰(zhàn)略坐標(biāo),各類型競爭對手辨別的方式與具體含義如表3所示。
表3 各類競爭對手含義及辨別依據(jù)
人工智能是引領(lǐng)未來的戰(zhàn)略性技術(shù),是國際競爭的新焦點。我國為搶抓人工智能發(fā)展重大戰(zhàn)略機(jī)遇,于2017年制定了《新一代人工智能發(fā)展規(guī)劃》,提出了面向2030年我國新一代人工智能發(fā)展的指導(dǎo)思想、戰(zhàn)略目標(biāo)、重點任務(wù)和保障措施。基于此,研究以我國人工智能為行業(yè)領(lǐng)域、以領(lǐng)頭羊百度公司為目標(biāo)企業(yè),對其競爭對手進(jìn)行辨別。
人工智能涉及領(lǐng)域非常廣泛,考慮到百度公司的業(yè)務(wù)范圍,本文更認(rèn)同《人工智能技術(shù)專利深度分析報告》(以下簡稱報告,由我國專利保護(hù)協(xié)會聯(lián)合人工智能領(lǐng)域業(yè)內(nèi)技術(shù)專家和專利分析專家合作完成)對人工智能的解析:應(yīng)著重強(qiáng)調(diào)核心算法及相關(guān)的應(yīng)用場景,人工智能的核心問題為建構(gòu)能夠跟人類相似甚至超越的推理、知識、規(guī)劃、學(xué)習(xí)、交流、感知、移動和操作物體的能力等,尤其以軟件、算法相關(guān)的技術(shù)為代表。
專利數(shù)據(jù)以智慧芽數(shù)據(jù)庫為數(shù)據(jù)源,該數(shù)據(jù)庫具有更新及時、收錄全面、格式規(guī)范的特點,能保證數(shù)據(jù)的權(quán)威性。檢索詞以《報告》劃定的人工智能領(lǐng)域分支為主,同時結(jié)合文獻(xiàn)調(diào)研與專家智慧,最終確定關(guān)鍵詞為:人工智能、機(jī)器學(xué)習(xí)、基礎(chǔ)算法、智能搜索、智能推薦、語音識別、自然語言處理、自動駕駛、計算機(jī)視覺、圖像識別、深度學(xué)習(xí)、手勢控制、智能機(jī)器人、視頻識別。由于上述關(guān)鍵詞有相當(dāng)部分體現(xiàn)的是技術(shù)功能,說明書摘要結(jié)構(gòu)為發(fā)明名稱+技術(shù)方案+技術(shù)功效,包含了最能體現(xiàn)技術(shù)功能的上述關(guān)鍵詞,所以檢索字段設(shè)定為發(fā)明名稱與摘要,這樣既克服了眾多IPC分類號帶來的不確定性,又確保了檢索結(jié)果的全面性和準(zhǔn)確性。專利類型設(shè)置為授權(quán)發(fā)明,法律狀態(tài)設(shè)置為有效,受理局設(shè)置為中國,專利權(quán)人類型設(shè)置為公司,檢索日期為2021年6月20日,共獲取專利10 374件,專利權(quán)人4 573個。通過瀏覽專利權(quán)人,發(fā)現(xiàn)數(shù)量排名20以后的公司專利數(shù)據(jù)較少,比較零散,難以對百度構(gòu)成競爭威脅,故選擇數(shù)量排名前20的企業(yè)(包含百度)為辨別對象,刪除重復(fù)與噪音數(shù)據(jù)后共獲得有效專利2 438件,進(jìn)一步剔除數(shù)據(jù)缺失專利后,剩余2 422件。
3.2.1指標(biāo)權(quán)重賦予
邀請5位高校領(lǐng)域教師、3位企業(yè)技術(shù)骨干組成評審小組,將專利質(zhì)量評價指標(biāo)作為目標(biāo)因素,構(gòu)建兩兩重要性比較矩陣,通過公式(2)-(3)獲得各指標(biāo)AHP法權(quán)重;對專利指標(biāo)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理后,通過公式(4)-(5)獲得熵權(quán)法權(quán)重;通過公式(1)獲得組合權(quán)重,如表4所示。
表4 專利質(zhì)量評價指標(biāo)權(quán)重賦予結(jié)果
3.2.2前20位公司專利平均質(zhì)量計算
首先通過公式(12)計算各企業(yè)的單件專利質(zhì)量;其次通過公式(13)計算各企業(yè)專利平均質(zhì)量,具體結(jié)果如表5所示。
表5 企業(yè)專利平均質(zhì)量(降序)
其中,微軟公司專利平均質(zhì)量最高,為0.1478,平安國際最低,為0.0385,究其原因:微軟作為互聯(lián)網(wǎng)行業(yè)巨頭擁有著豐富的技術(shù)積累,在人工智能領(lǐng)域技術(shù)研發(fā)中具有巨大優(yōu)勢,且其產(chǎn)品面向國際市場,因此更加注重專利質(zhì)量;平安國際成立年限較短,企業(yè)仍處于發(fā)展期,自身技術(shù)資源積累量較少,涉獵人工智能領(lǐng)域時間較短,因此其專利質(zhì)量較低。
3.3.1專利文本內(nèi)容提取
通過3.2部分得到單件專利質(zhì)量后,首先,依據(jù)表1專利類別劃分方式,將所有專利劃分為核心、重點、一般專利,由此得到每個企業(yè)上述三類專利集合;然后在人工閱讀說明書的基礎(chǔ)上,基于線索句/詞與段落表述規(guī)律,利用python的re模塊編寫正則表達(dá)式,通過內(nèi)置的findall函數(shù)提取說明書中技術(shù)背景、技術(shù)方案與技術(shù)功效內(nèi)容,結(jié)合Excel菜單欄功能進(jìn)行輔助提取,步驟詳情見表6;最后以專利權(quán)人為單位,通過Excel表格進(jìn)行分列存儲,并對其進(jìn)行編號,每個企業(yè)分別有核心、重點、一般專利集合所對應(yīng)的上述數(shù)據(jù),如表7所示。
表6 單件專利技術(shù)背景、方案、功效提取步驟詳情
表7 技術(shù)背景、技術(shù)方案、技術(shù)功效文本提取結(jié)果(百度公司部分核心專利)
3.3.2專利文本內(nèi)容清洗
使用Excel“替換”功能將原始語料中標(biāo)點剔除。由于說明書中有多個無意義詞匯,如“本發(fā)明”“提供”“實現(xiàn)”“實施例”等,會影響文本相似度計算結(jié)果的準(zhǔn)確性,因此,通過建立停用詞表將其剔除。另,由于人工智能領(lǐng)域?qū)@膶S忻~較多,通過建立專有名詞詞表以提升分詞效果,部分停用詞與專有名詞如表8所示。
表8 停用詞與人工智能領(lǐng)域?qū)S忻~(部分)
3.3.3百度-對手企業(yè)個體技術(shù)相似度計算
通過停用詞與自建人工智能領(lǐng)域?qū)S忻~表對語料進(jìn)行清洗后,使用Python中jieba庫進(jìn)行分詞,使用gensim庫中Word2vec模型對語料進(jìn)行訓(xùn)練,之后通過余弦相似度計算目標(biāo)-對手企業(yè)單件專利對經(jīng)向量表示后的技術(shù)背景、技術(shù)方案、技術(shù)功效文本相似度,將其作為公式(1)中三者熵權(quán)權(quán)重分析數(shù)據(jù)源;將技術(shù)背景、技術(shù)方案、技術(shù)功效作為AHP法目標(biāo)因素,通過公式(2)-(5)結(jié)合公式(1),確定三者在計算個體技術(shù)相似度中的權(quán)重分別為:0.2454、0.4351、0.3196,該結(jié)果與前文中所提出“技術(shù)方案重要性大于技術(shù)背景與技術(shù)功效”的觀點保持一致。在對百度與對手企業(yè)的單件專利進(jìn)行編碼后,通過公式(6)對個體技術(shù)相似度進(jìn)行計算并構(gòu)建相似度矩陣,如表9所示。
表9 百度-華為核心專利集合個體技術(shù)相似度矩陣(部分)
3.3.4百度-對手企業(yè)整體技術(shù)相似度計算
通過公式(9)-(11)分別計算百度-對手企業(yè)的技術(shù)內(nèi)容、技術(shù)市場、技術(shù)領(lǐng)域相似度,將其作為公式(1)中三者熵權(quán)權(quán)重分析數(shù)據(jù)源;將技術(shù)內(nèi)容、技術(shù)市場、技術(shù)領(lǐng)域作為AHP法目標(biāo)因素,通過公式(2)-(5)結(jié)合公式(1),確定三者在計算整體技術(shù)相似度中的權(quán)重分別為:0.3491、0.2858、0.3201。最后,通過公式(7)-(8)得到百度與所有對手企業(yè)的整體技術(shù)相似度,如表10所示。
表10 整體技術(shù)相似度計算結(jié)果—以百度為目標(biāo)企業(yè)(降序)
表10中,聯(lián)想、阿里巴巴的整體技術(shù)相似度顯著高于其他對手企業(yè),為0.6273、0.6029,說明兩企業(yè)與百度的核心、重點專利技術(shù)相似性高,展露了與百度的直接競爭關(guān)系。進(jìn)一步的,專利質(zhì)量整體較高的企業(yè)競爭力更強(qiáng),作為競爭對手對目標(biāo)企業(yè)威脅程度更高,因此需結(jié)合專利質(zhì)量分析競爭對手的威脅程度,細(xì)化競爭對手所處競爭地位。
依據(jù)表3將所有對手企業(yè)劃分為核心、潛在、外圍、候選競爭對手4類,各類型競爭對手對目標(biāo)企業(yè)的競爭威脅程度依次遞減,如圖4所示。
3.4.1核心競爭對手
阿里巴巴、聯(lián)想、華為、微軟、通用、三星、訊飛、三菱、奇虎為核心競爭對手。天眼查數(shù)據(jù)顯示,除訊飛、三菱外,其余企業(yè)均與百度經(jīng)營范圍存在多處重合,包括計算機(jī)軟硬件、通信設(shè)備、電子產(chǎn)品、信息系統(tǒng)集成服務(wù)等,與百度存在直接競爭關(guān)系。訊飛主營范圍是以自然語言處理、機(jī)器學(xué)習(xí)為主的人工智能產(chǎn)品,技術(shù)關(guān)注度高,擁有多件核心專利;百度近幾年申請了多件自然語言處理、機(jī)器學(xué)習(xí)領(lǐng)域的核心專利,如公開號為CN108062246B的“用于深度學(xué)習(xí)框架的資源調(diào)度方法和裝置”、公開號為CN107241260B的“基于人工智能的新聞推送的方法和裝置”等,均與訊飛核心專利的技術(shù)領(lǐng)域與技術(shù)內(nèi)容保持高度相似;訊飛“AIUI開放平臺”與百度“AI開放平臺”的服務(wù)內(nèi)容與服務(wù)目標(biāo)高度一致,都是對人工智能服務(wù)的延伸,兩者在技術(shù)、產(chǎn)品、服務(wù)策略方面的高度相似展露了高強(qiáng)度競爭關(guān)系。三菱近幾年注重對自動駕駛領(lǐng)域的技術(shù)研發(fā),申請了多件核心專利,如公開號為CN106200631B的“自動駕駛控制裝置及自動駕駛控制方法”、公開號為CN108137059B的“駕駛輔助裝置”等,以及多件關(guān)于語音識別的核心專利,百度近幾年同樣開始關(guān)注自動駕駛領(lǐng)域,不僅申請了多件核心專利且推出了“阿波羅自動駕駛平臺”,旨在向開發(fā)者提供開放、完整的自動駕駛策略,上述產(chǎn)品與專利申請態(tài)勢展露了百度正在不斷拓寬自動駕駛領(lǐng)域的技術(shù)市場與技術(shù)研發(fā)范圍,與三菱在市場主營范圍、專利申請技術(shù)領(lǐng)域方面存在直接沖突。上述企業(yè)整體技術(shù)實力雄厚,專利質(zhì)量高,技術(shù)內(nèi)容與百度高度相似,與百度相比,處于競爭優(yōu)勢,因此為核心競爭對手。
圖4 競爭對手辨別結(jié)果—以百度為目標(biāo)企業(yè)
3.4.2潛在競爭對手
本田、豐田、吉利、發(fā)那科、OPPO、國網(wǎng)為潛在競爭對手。上述企業(yè)雖與百度在經(jīng)營范圍方面未呈現(xiàn)直接沖突,整體技術(shù)相似性較低,但本田、豐田、吉利近幾年均在申請百度目前正在拓展的自動駕駛領(lǐng)域相關(guān)專利,且整體專利質(zhì)量較高。國網(wǎng)、OPPO在圖像識別領(lǐng)域保持著專利申請質(zhì)量與數(shù)量的領(lǐng)先。發(fā)那科專注智能機(jī)器人領(lǐng)域并有多件機(jī)器學(xué)習(xí)、智能機(jī)器人領(lǐng)域的核心專利,技術(shù)基礎(chǔ)雄厚;百度近幾年不斷增加圖像識別、機(jī)器學(xué)習(xí)、智能機(jī)器人領(lǐng)域的專利申請量,且在提升產(chǎn)品市場轉(zhuǎn)化效率。上述企業(yè)擁有著高質(zhì)量專利,在未來,若轉(zhuǎn)變專利市場布局取向,有可能成為百度核心競爭對手。
3.4.3外圍競爭對手
騰訊、平安國際為外圍競爭對手。騰訊雖整體專利擁有量顯著高于其他企業(yè),且與百度經(jīng)營范圍、專利技術(shù)領(lǐng)域保持高度相似,但核心專利占比與專利平均質(zhì)量均較低,整體專利競爭實力較弱。平安國際為新興企業(yè),專注智慧城市、人工智能技術(shù)、信息技術(shù)的產(chǎn)品與服務(wù),并在上述領(lǐng)域不斷增加專利申請量,其專利技術(shù)領(lǐng)域、產(chǎn)品及服務(wù)與百度保持高度相似,但由于缺乏技術(shù)積累導(dǎo)致整體專利質(zhì)量較低,與百度相比處在競爭劣勢地位。上述企業(yè)雖經(jīng)營范圍、產(chǎn)品、服務(wù)、專利技術(shù)領(lǐng)域與百度高度相似,但由于整體專利質(zhì)量較低,與百度相比,處于競爭劣勢,因此為外圍競爭對手。
3.4.4候選競爭對手
格力、光年無限為候選競爭對手。格力的主營范圍為家電,包括冰箱、電視、熱水器等,近幾年開始拓展智能機(jī)器人市場,專利申請量不斷增加,但由于與主營業(yè)務(wù)研發(fā)方向不匹配,導(dǎo)致研發(fā)投入較低,整體以智能機(jī)器人為主的人工智能領(lǐng)域?qū)@|(zhì)量較低且研發(fā)方向分散。光年無限雖與百度經(jīng)營范圍保持多方相似,但技術(shù)研發(fā)重點為智能機(jī)器人,核心專利較少且整體上與百度在該技術(shù)領(lǐng)域的專利相似度較低。上述企業(yè)與百度的經(jīng)營范圍或?qū)@夹g(shù)內(nèi)容相似度低,且人工智能領(lǐng)域?qū)@|(zhì)量低、研發(fā)方向分散,因此為候選競爭對手。
辨別競爭對手類型、知彼知己,是企業(yè)制定差異化競爭策略的前提與鞏固自身競爭優(yōu)勢的保障。本文針對現(xiàn)有研究存在的辨別粒度較粗、準(zhǔn)確性低的問題,對技術(shù)相似度辨別模型進(jìn)行了優(yōu)化。首先,以專利說明書為研究樣本,提取其中的技術(shù)背景、技術(shù)方案和技術(shù)功效,并按照其對技術(shù)內(nèi)容描述的地位主次分別賦予不同權(quán)重,細(xì)粒度計算目標(biāo)-對手企業(yè)單件專利間的個體技術(shù)相似度;其次,結(jié)合文獻(xiàn)調(diào)研與專家智慧,將各企業(yè)專利依質(zhì)量劃分為核心、重點、一般3個類別,并從技術(shù)內(nèi)容、技術(shù)市場(行業(yè)分類號)、技術(shù)領(lǐng)域(IPC分類號)3個維度,分別計算目標(biāo)-對手企業(yè)相同類別專利集合間的技術(shù)相似度,然后按照專利質(zhì)量對每類專利集合的技術(shù)相似度賦予權(quán)重,獲得每個競爭對手的整體技術(shù)相似度;再次,依據(jù)整體技術(shù)相似度和專利平均質(zhì)量兩個維度構(gòu)建戰(zhàn)略坐標(biāo),通過設(shè)置閾值將競爭對手細(xì)粒度劃分為核心、潛在、外圍、候選4類;最后以人工智能領(lǐng)域為例,以中國有效專利數(shù)量排名前20企業(yè)為研究對象,以百度為目標(biāo)企業(yè),對本方法進(jìn)行了實證,結(jié)合企業(yè)專利、產(chǎn)品、商業(yè)等多維信息驗證了本方法的準(zhǔn)確性與有效性。
本文創(chuàng)新之處在于:在個體技術(shù)相似度和整體技術(shù)相似度計算中,融入說明書中不同標(biāo)題內(nèi)容權(quán)重、市場相似性和專利質(zhì)量等情境,更加細(xì)膩、準(zhǔn)確的對競爭對手進(jìn)行辨別和分類,為企業(yè)科學(xué)制定差異化競爭策略提供有力的決策支持;不足之處在于:對專利質(zhì)量進(jìn)行評價時沒有考慮技術(shù)領(lǐng)域、市場大小等因素,辨別準(zhǔn)確性有待進(jìn)一步提高。