亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于技術(shù)關(guān)聯(lián)關(guān)系的企業(yè)研發(fā)潛在合作伙伴識別方法研究綜述

        2023-10-07 12:09:58趙展一鐘永恒
        現(xiàn)代情報 2023年10期
        關(guān)鍵詞:關(guān)聯(lián)語義文本

        趙展一 鐘永恒 王 輝 劉 佳

        (1.中國科學(xué)院武漢文獻情報中心,湖北 武漢 430071;2.中國科學(xué)院大學(xué)經(jīng)濟管理學(xué)院信息資源管理系,北京 100190;3.科技大數(shù)據(jù)湖北省重點實驗室,湖北 武漢 430071)

        研發(fā)合作(R&D Cooperation),是指多個創(chuàng)新主體通過共享獨有技術(shù)來加速創(chuàng)新過程所采取的聯(lián)合行動,常用于產(chǎn)業(yè)界[1]。企業(yè)研發(fā)合作則是指企業(yè)作為需求主體,與同行、上下游供應(yīng)商、科研院校、客戶等主體共同研究與開發(fā)新技術(shù)、新產(chǎn)品的行動,其本質(zhì)是一種共同的知識創(chuàng)造過程。目前,技術(shù)創(chuàng)新過程越來越復(fù)雜,研發(fā)難度大,學(xué)科交叉性強,產(chǎn)品更新快,風(fēng)險和不確定性高,為降低研發(fā)風(fēng)險,增強競爭優(yōu)勢,企業(yè)已將研發(fā)合作視為生存發(fā)展與技術(shù)創(chuàng)新的重要手段之一。

        現(xiàn)有研究對研發(fā)合作的影響因素及其之間的關(guān)系進行了探索,發(fā)現(xiàn)創(chuàng)新主體之間的戰(zhàn)略契合程度、需求匹配程度、合作偏好程度、信任水平程度以及政府支持力度、中介代理水平等[2-5]外部因素均會對研發(fā)合作產(chǎn)生影響,為了解研發(fā)合作行為的機理奠定了基礎(chǔ)。關(guān)于研發(fā)合作伙伴的評價指標(biāo)體系也不斷完善,在候選合作伙伴已知的情況下,通常從研發(fā)能力、市場能力、合作能力等維度考慮選擇最佳合作伙伴[6]。但如何在候選合作伙伴未知的情況下,從眾多創(chuàng)新主體中識別具有合作潛力的伙伴,預(yù)先掌握合作伙伴情況,降低研發(fā)合作風(fēng)險,仍是研究難點。

        梳理文獻發(fā)現(xiàn),潛在研發(fā)合作識別方法主要包括兩類:基于實體鏈接關(guān)系的方法和基于技術(shù)關(guān)聯(lián)關(guān)系的方法?;趯嶓w鏈接關(guān)系的方法,是指以實體之間已經(jīng)真實存在的鏈接為依據(jù),如專利合作申請關(guān)系、專利轉(zhuǎn)讓許可關(guān)系等,利用復(fù)雜網(wǎng)絡(luò)、鏈路預(yù)測、深度學(xué)習(xí)等方法推斷實體之間未來進行研發(fā)合作的概率。這類方法考慮了實體之間的合作偏好程度,但受限于現(xiàn)有網(wǎng)絡(luò),無法擴展到新增節(jié)點去發(fā)現(xiàn)新的合作關(guān)系,也未深入到技術(shù)內(nèi)容層面去分析實體之間合作的合理性,不夠有說服力?;诩夹g(shù)關(guān)聯(lián)關(guān)系的方法,是指實體擁有的技術(shù)存在某種關(guān)聯(lián)關(guān)系,如共同關(guān)注某一個技術(shù)領(lǐng)域、擁有同一技術(shù)問題的不同解決方案等,依據(jù)這種內(nèi)在的技術(shù)關(guān)聯(lián)關(guān)系去識別潛在合作伙伴。這類方法考慮了研發(fā)合作的本質(zhì)動因,即創(chuàng)新主體希望獲取異質(zhì)技術(shù)知識來提高自身競爭力,只有在分析技術(shù)知識的基礎(chǔ)上去識別研發(fā)合作伙伴,得出的結(jié)果才是科學(xué)可靠的。因此,有必要系統(tǒng)梳理基于技術(shù)關(guān)聯(lián)關(guān)系的企業(yè)研發(fā)潛在合作伙伴識別方法,了解現(xiàn)有方法和識別效果,揭示其中存在的問題,總結(jié)未來的發(fā)展方向,為完善面向企業(yè)研發(fā)潛在合作伙伴識別的情報分析方法體系提供借鑒,助力企業(yè)尋找對口伙伴,制定合作戰(zhàn)略,提升研發(fā)效率。

        1 技術(shù)關(guān)聯(lián)關(guān)系

        技術(shù)是為實現(xiàn)某一特定目標(biāo)所采用的特定方法,是制造某種產(chǎn)品所需要的系統(tǒng)知識、工藝或服務(wù)[7],因具有系統(tǒng)性和隱含性的特征,技術(shù)以縱向或橫向的方式不斷擴散、交融,并重新組合為新的技術(shù),形成龐大的技術(shù)關(guān)聯(lián)網(wǎng)絡(luò)。通常,某一項技術(shù)發(fā)生變化時,也會引起與之關(guān)聯(lián)的多項技術(shù)的變化,如智能手機技術(shù)直接影響了通信、傳媒、教育等技術(shù),還催生了電子商務(wù)等新技術(shù)。由此可見,技術(shù)不是孤立的,而是存在著復(fù)雜的關(guān)聯(lián)關(guān)系,深入分析創(chuàng)新主體之間的技術(shù)關(guān)聯(lián)關(guān)系有利于細(xì)粒度地、準(zhǔn)確地分析其合作潛力與合作方向。

        技術(shù)關(guān)聯(lián)關(guān)系的定義與類型尚未統(tǒng)一。黃斌等[8]依據(jù)專利是否共類將技術(shù)關(guān)聯(lián)劃分為直接關(guān)聯(lián)和間接關(guān)聯(lián)。馮秀珍等[9]依據(jù)技術(shù)是否具有共同用途將技術(shù)關(guān)聯(lián)劃分為直接關(guān)聯(lián)、間接關(guān)聯(lián)、關(guān)鍵關(guān)聯(lián),并提出技術(shù)關(guān)聯(lián)鏈、環(huán)、網(wǎng)、群、子群等概念。Vaez-Alaeim M等[10]將企業(yè)間的技術(shù)關(guān)聯(lián)關(guān)系劃分為相似性技術(shù)、互補性技術(shù)、無關(guān)性技術(shù)。徐珍珍等[11]依據(jù)研究問題與技術(shù)方案的對應(yīng)關(guān)系將技術(shù)關(guān)聯(lián)劃分為直接競爭關(guān)系、間接競爭關(guān)系、合作關(guān)系、包含關(guān)系,并提出了基于問題—技術(shù)矩陣的技術(shù)關(guān)聯(lián)自動發(fā)現(xiàn)方法。王莎莎等[12]將技術(shù)關(guān)聯(lián)關(guān)系劃分為基于技術(shù)知識結(jié)構(gòu)與內(nèi)容的等價性關(guān)聯(lián)關(guān)系和基于技術(shù)知識溢出與流動情況的非等價性技術(shù)關(guān)聯(lián)關(guān)系?,F(xiàn)有研究對技術(shù)關(guān)聯(lián)關(guān)系的分類大多較為粗糙,僅劃分為強、弱或直接、間接,少有研究關(guān)注技術(shù)關(guān)聯(lián)關(guān)系的具體類型。

        楊冬敏[13]比較全面地考慮了時間、空間等因素的影響,從技術(shù)沿革、技術(shù)應(yīng)用、技術(shù)體系結(jié)構(gòu)、技術(shù)知識單元4個維度將技術(shù)關(guān)聯(lián)關(guān)系細(xì)分為取代、發(fā)展、完善、補充、競爭、互補、包含、平行、交叉、繼承、兄弟、交融關(guān)系。借鑒該分類方式,并結(jié)合技術(shù)關(guān)聯(lián)關(guān)系在企業(yè)研發(fā)潛在合作伙伴識別領(lǐng)域的應(yīng)用,本文將技術(shù)關(guān)聯(lián)關(guān)系劃分為技術(shù)承繼、共現(xiàn)、結(jié)構(gòu)、應(yīng)用關(guān)系以及復(fù)合技術(shù)關(guān)系。

        如圖1所示,技術(shù)承繼關(guān)系,是指隨著時間推移技術(shù)之間相互借鑒、創(chuàng)新、完善、融合的關(guān)系,T1、T2、T3、T4、T5、T6為典型的承繼關(guān)系;技術(shù)共現(xiàn)關(guān)系,是指技術(shù)之間共同出現(xiàn)或通過第三方共現(xiàn)的關(guān)系,T1與T9、T10為直接共現(xiàn)關(guān)系,T1與T11通過T10形成間接共現(xiàn)關(guān)系;技術(shù)結(jié)構(gòu)關(guān)系,是指從技術(shù)體系結(jié)構(gòu)和知識單元的角度理解技術(shù)關(guān)聯(lián)關(guān)系,技術(shù)體系結(jié)構(gòu)是指根技術(shù)與其分支技術(shù)構(gòu)成的技術(shù)系統(tǒng),具有層次性、整體性,t1、t2為T6的分支技術(shù),屬于同一技術(shù)體系結(jié)構(gòu)。技術(shù)知識單元是指某一技術(shù)及其同級技術(shù)構(gòu)建的技術(shù)模塊,具有并行性、協(xié)同性,T6、T7、T8為并列技術(shù),t1、t2也為并列技術(shù),屬于同一技術(shù)知識單元,技術(shù)知識單元是技術(shù)體系結(jié)構(gòu)的一部分;技術(shù)應(yīng)用關(guān)系,是指依據(jù)是否用于解決同一問題將技術(shù)關(guān)聯(lián)關(guān)系劃分為直接競爭關(guān)系、合作關(guān)系、間接競爭關(guān)系,T2、T3可用于解決Q1,形成直接競爭關(guān)系,T3、T4可分別用于解決Q2、Q3,也可通過組合用于解決Q4,形成合作關(guān)系,相互補充,還可與T5組合用于解決Q4,此時T3、T4與T5形成間接競爭關(guān)系。現(xiàn)實中的技術(shù)關(guān)聯(lián)關(guān)系往往是多維且復(fù)雜的,本文將涉及兩種及兩種以上類型的技術(shù)關(guān)聯(lián)關(guān)系定義為復(fù)合技術(shù)關(guān)系。

        圖1 技術(shù)關(guān)聯(lián)關(guān)系的類型

        2 基于技術(shù)關(guān)聯(lián)關(guān)系的企業(yè)研發(fā)潛在合作伙伴識別方法

        為全面把握基于技術(shù)關(guān)聯(lián)關(guān)系的企業(yè)研發(fā)潛在競合目標(biāo)識別方法及其效果,檢索并梳理國際國內(nèi)相關(guān)研究進展。國內(nèi)研究以“CNKI”為數(shù)據(jù)源,以“R&D合作”“研發(fā)合作”“產(chǎn)學(xué)研合作”“合作識別”“伙伴選擇”“技術(shù)關(guān)系”“技術(shù)關(guān)聯(lián)”為主題詞進行檢索,國際研究以“Google Scholar”為數(shù)據(jù)源,以“R&D Cooperation”“R&D Partner”“Technology Cooperation”“University and Industrial Cooperation”“Cooperation Identification”“Cooperation Selection”“Technology Relation”“Technology Association”為主題詞進行檢索,篩選出136篇重點文獻?;诖耍瑢⑵髽I(yè)研發(fā)潛在合作伙伴識別方法按照基于技術(shù)承繼、共現(xiàn)、結(jié)構(gòu)、應(yīng)用關(guān)系以及復(fù)合技術(shù)關(guān)系5個維度來梳理,如圖2所示,歸納各類方法的優(yōu)缺點,總結(jié)當(dāng)前研究存在的問題和未來研究方向。

        圖2 基于技術(shù)關(guān)聯(lián)關(guān)系的企業(yè)研發(fā)潛在合作伙伴識別方法分類

        2.1 基于技術(shù)承繼關(guān)系的識別方法

        作為技術(shù)成果的重要載體,專利文獻已成為技術(shù)情報的關(guān)鍵來源,專利引用本身就體現(xiàn)了技術(shù)流動和演進的過程,現(xiàn)有研究基于技術(shù)承繼關(guān)系的識別方法主要通過專利引用分析實現(xiàn)。

        專利引用是申請人和審查員共同的行為,包括直引、共引和共被引。直引是指多件專利直接相互引用的關(guān)系,通常與分類號、關(guān)鍵詞等信息結(jié)合使用,如表1所示。例如,李睿等[14]建立兩國專利權(quán)人的直引關(guān)系,通過關(guān)聯(lián)強度篩選候選合作組對,再通過引用跨越度分析競合技術(shù)。共引和共被引分析應(yīng)用較多,分別指多件專利引用同一件專利或被同一件專利引用,通常認(rèn)為共引或共被引次數(shù)越多,技術(shù)關(guān)聯(lián)越強,研發(fā)合作概率越大。例如,李睿等[15]基于專利共引關(guān)系建立兩國專利權(quán)人—技術(shù)領(lǐng)域二模網(wǎng)絡(luò),通過不同技術(shù)領(lǐng)域之間的專利共引強度定位兩國共同關(guān)注的技術(shù)領(lǐng)域,揭示國家(地區(qū))間的研發(fā)合作機會。許海云等[16]以論文—專利的共引與共被引關(guān)系表示科學(xué)—技術(shù)的關(guān)聯(lián)關(guān)系,根據(jù)被專利引用的論文比例、被論文引用的專利比例確定科學(xué)—技術(shù)關(guān)聯(lián)特征,提出了不同關(guān)聯(lián)特征下的新興主題產(chǎn)學(xué)研合作模式,完善了產(chǎn)學(xué)研合作識別的方法體系。

        表1 引用分析方法對比

        引用關(guān)系可以反映雙方是否具有共同關(guān)注的技術(shù)領(lǐng)域,并且具有成熟的理論、方法和工具支持,但其局限性在于:①動機不明,無法區(qū)分積極引用和消極引用;②具有時滯性,無法反映最新文獻的引用關(guān)系;③未深入技術(shù)文本層面,無法進一步揭示合作潛力。

        2.2 基于技術(shù)共現(xiàn)關(guān)系的識別方法

        基于技術(shù)共現(xiàn)關(guān)系的方法是指通過分析技術(shù)特征項共同出現(xiàn)的現(xiàn)象揭示創(chuàng)新主體之間的關(guān)聯(lián),包括共類分析、共詞分析等,如表2所示。專利分類號能夠體現(xiàn)技術(shù)的應(yīng)用領(lǐng)域和主要功能,易獲取和量化,應(yīng)用最多,例如,溫芳芳[17]通過專利權(quán)人的共類數(shù)量、共類頻次分析企業(yè)潛在合作關(guān)系,認(rèn)為共類數(shù)量越多,共類頻次越高,專利權(quán)人技術(shù)相似性越強,合作潛力越大。專利文獻沒有關(guān)鍵詞,現(xiàn)有研究通過TF-IDF等方法抽取特征詞作為共詞分析的依據(jù),以進一步分析機構(gòu)之間的合作方向。例如,Li S等[18]基于機構(gòu)共同分類、引用耦合、主題共現(xiàn)關(guān)系建立機構(gòu)相似性矩陣,識別核心專利組合和技術(shù)轉(zhuǎn)讓合作伙伴?;诙嘀毓铂F(xiàn)關(guān)系的綜合分析結(jié)果更加可靠,例如,F(xiàn)ritsch M等[19]建立基于合作項目、專利、論文的多模異構(gòu)網(wǎng)絡(luò),發(fā)現(xiàn)結(jié)合3種數(shù)據(jù)捕獲的合作關(guān)系更全面。

        表2 共現(xiàn)分析方法對比

        共現(xiàn)分析通過技術(shù)特征項的共現(xiàn)現(xiàn)象揭示隱含的技術(shù)關(guān)聯(lián),可以為識別潛在合作提供參考。但其局限性在于:①共現(xiàn)分析無法提供潛在合作概率;②共類分析、共詞分析都無法深入地揭示文本語義關(guān)系;③共現(xiàn)分析大多通過共現(xiàn)數(shù)量、共現(xiàn)頻次體現(xiàn)合作潛力,信息量較少。

        2.3 基于技術(shù)結(jié)構(gòu)關(guān)系的識別方法

        基于技術(shù)結(jié)構(gòu)關(guān)系的識別方法是指從技術(shù)文本中抽取符合規(guī)則的語義特征,形成技術(shù)體系結(jié)構(gòu)或知識單元,通常以技術(shù)樹或知識圖譜的方式呈現(xiàn),如表3所示。

        表3 語義特征抽取分析方法對比

        技術(shù)樹是指用于表示某一技術(shù)領(lǐng)域中技術(shù)特征及其關(guān)系的樹形結(jié)構(gòu)圖,包含技術(shù)、功能、產(chǎn)品等要素,可以輔助決策者梳理技術(shù)體系,把握技術(shù)架構(gòu)和創(chuàng)新主體在技術(shù)發(fā)展過程中的位置,選擇相匹配的合作目標(biāo)。例如,翟東升等[20]對專利文獻的標(biāo)題、摘要進行切分和標(biāo)注,抽取功能、功能效果、科學(xué)效應(yīng)等語義特征,通過合并同義概念確定樹的基礎(chǔ)模塊,通過語義特征的共現(xiàn)關(guān)系實現(xiàn)概念之間的聯(lián)接,構(gòu)建技術(shù)樹,與企業(yè)提供的結(jié)構(gòu)化需求文檔進行匹配,篩選能夠滿足企業(yè)需求的專利權(quán)人。伊惠芳等[21]爬取公開信息中的需求文檔,并將技術(shù)需求劃分為廣泛、單一、綜合性3類,采用百度語義工具和Python語言技術(shù)從技術(shù)需求文檔和高校專利文獻中抽取技術(shù)領(lǐng)域、功能、功效和技術(shù)方案,通過LDA模型聚類,實現(xiàn)各項語義特征之間的聯(lián)接,建立高校專利技術(shù)樹,與不同類型的技術(shù)需求進行模糊、特定、多目標(biāo)匹配,再根據(jù)需求的滿足程度、技術(shù)的有用性確定高校專利轉(zhuǎn)移目標(biāo)。

        知識圖譜可以完整規(guī)范地描述實體及其屬性之間的關(guān)系,幫助實現(xiàn)實體關(guān)聯(lián)和語義推理,有利于理解技術(shù)主體之間的關(guān)聯(lián)關(guān)系。例如,李家全等[22]利用新能源汽車領(lǐng)域的術(shù)語層次關(guān)系構(gòu)建了知識圖譜,根據(jù)兩個術(shù)語的類型、出現(xiàn)頻次以及在知識圖譜中的層次深度計算實體概念相似度,根據(jù)兩個術(shù)語的類型、最短距離計算實體距離相似度,利用Word2Vec、Bert模型計算實體語義相似度,利用TextRank提取術(shù)語屬性句子中的關(guān)鍵詞計算實體屬性相似度,對上述指標(biāo)進行綜合賦權(quán)得到實體相似度,可用于識別相似實體。Deng W等[23]繪制專利、企業(yè)、行業(yè)的知識圖譜,將從專利標(biāo)題和摘要中提取的關(guān)鍵詞及其共現(xiàn)關(guān)系作為圖的邊權(quán)重,再通過融合共同節(jié)點、邊權(quán)重、總權(quán)重的圖編輯距離度量不同圖的相似性,為企業(yè)匹配相似策略、互補策略、混合策略下的專利轉(zhuǎn)讓目標(biāo),該方法已成功應(yīng)用于江西省技術(shù)交易平臺。

        抽取語義特征并進行匹配分析的方法可以更精準(zhǔn)地捕獲文本的語義信息,展示技術(shù)結(jié)構(gòu)關(guān)系,匹配合作需求。但其局限性在于:①技術(shù)樹或知識圖譜的構(gòu)建過程復(fù)雜,人工成本較高,不適合應(yīng)用于大規(guī)模數(shù)據(jù)集;②通常需要人工標(biāo)注,標(biāo)注的準(zhǔn)確性與統(tǒng)一性有待考量;③方法不具有通用性,難以重復(fù)。

        2.4 基于技術(shù)應(yīng)用關(guān)系的識別方法

        基于技術(shù)應(yīng)用關(guān)系的識別方法是指從是否用于解決同一問題的角度分析技術(shù)的競合性質(zhì),據(jù)此識別競爭對手或合作伙伴。競爭性技術(shù)是指可用于解決同一問題的技術(shù),具有相似性和取代性,如通信領(lǐng)域的3G與5G技術(shù)、低碳領(lǐng)域的藍氫與綠氫技術(shù);合作性技術(shù)是指可通過組合用于解決同一問題的技術(shù),具有互補性和協(xié)同性,如汽車領(lǐng)域的車窗制造與車門制造技術(shù)、3D打印領(lǐng)域的打印機噴頭與打印材料。目前,相似性技術(shù)的識別方法更加成熟,語義相似性分析可以細(xì)粒度地從文本語義的層面揭示技術(shù)的相似性,在潛在合作識別領(lǐng)域應(yīng)用較為廣泛,主要包括文本聚類分析、依存句法分析、基于預(yù)測的詞嵌入分析等,如表4所示。

        表4 語義相似性分析方法對比

        文本聚類分析是指通過聚類算法從同一類簇中識別潛在合作,主題模型是一種典型的聚類方法,先從技術(shù)文本中識別技術(shù)主題,再根據(jù)相似主題識別合作潛力大的創(chuàng)新主體。例如,Kang J等[24]運用LDA模型識別特定領(lǐng)域的子技術(shù)主題,再通過K-means聚類算法確定子技術(shù)集群,從子技術(shù)集群中根據(jù)相似專利密度確定技術(shù)轉(zhuǎn)移伙伴,考慮了企業(yè)的多元化研發(fā)方向。類似地,崔晶等[25]利用關(guān)聯(lián)規(guī)則分析目標(biāo)企業(yè)的技術(shù)同心多元化領(lǐng)域,再通過LDA模型將創(chuàng)新主體劃分到不同的技術(shù)主題,根據(jù)專業(yè)能力和合作能力為企業(yè)推薦不同技術(shù)主題的研發(fā)合作伙伴。周洪等[26]采用t-SNE主題模型對專利中的新穎性和用途部分聚類,建立基于技術(shù)—應(yīng)用主題的二維分析框架,結(jié)合目標(biāo)企業(yè)的技術(shù)布局,與其他創(chuàng)新主體的技術(shù)相似性、應(yīng)用相似性識別潛在競爭對手。Qi Y等[27]利用LDA模型識別論文與專利的主題,基于論文與專利的主題相似度確定可以合作的技術(shù)主題,根據(jù)創(chuàng)新能力與開放程度對相關(guān)主體進行排序,確定是否有合作的潛力,再建立這些主體基于主題的合作網(wǎng)絡(luò),進行鏈路預(yù)測,識別潛在合作機構(gòu)與合作方向。武川等[28]通過LDA-Gibbs Sampling模型識別專利文本的主題,建立專利權(quán)人合作網(wǎng)絡(luò)和主題相似網(wǎng)絡(luò),認(rèn)為網(wǎng)絡(luò)的平均加權(quán)度越高,專利主題相似性越高,合作潛力越大。

        依存句法分析是指通過提取分析主謂賓等語義要素及其關(guān)聯(lián)關(guān)系識別潛在合作。例如,汪雪鋒等[29]通過SAO方法識別染敏太陽能電池領(lǐng)域的研發(fā)合作組對,通過Stanford Parser軟件提取專利文本的SAO結(jié)構(gòu),篩選、歸類后繪制基于時間序列的“材料—技術(shù)與組件—目標(biāo)”SAO結(jié)構(gòu)圖,挖掘具有相似研發(fā)目標(biāo)的機構(gòu)。Li R等[30]抽取專利標(biāo)題和摘要中的SAO語義結(jié)構(gòu),利用專業(yè)醫(yī)學(xué)術(shù)語系統(tǒng)識別與目標(biāo)技術(shù)相關(guān)的SAO語義結(jié)構(gòu),判斷SAO語義結(jié)構(gòu)之間的相似性,評價專利權(quán)人的技術(shù)相似性,再通過TF-IDF獲取關(guān)鍵詞重要性作為SAO語義結(jié)構(gòu)的特征權(quán)重,構(gòu)建專利權(quán)人向量,評價專利權(quán)人的技術(shù)互補性,為識別R&D合作提供更精準(zhǔn)的參考。Li X等[31]運用SAO語義結(jié)構(gòu)分析抽取論文中的技術(shù)問題和專利中的解決方案,計算相似度,進行聚類,分析每個聚類主題下問題與方案的差異,并將論文中檢測出的離群點納入技術(shù)機會的識別范圍,再結(jié)合專家知識確定合作技術(shù)機會。

        詞嵌入是將詞語映射為向量的自然語言處理技術(shù),基于預(yù)測的嵌入可以較好地解決數(shù)據(jù)稀疏、詞表膨脹等問題,分辨語義細(xì)節(jié),極大地優(yōu)化了文本表示效果,如Word2Vec、Doc2Vec等,在衡量技術(shù)相似性方面得到廣泛應(yīng)用。例如,向姝璇等[32]以Jaccard算法計算IPC組合相似度定義功能相似性、以Doc2Vec計算獨立權(quán)利要求相似度定義技術(shù)相似性,構(gòu)建基于功能—技術(shù)的專利整體相似網(wǎng)絡(luò),分析主題簇下的競爭組合。Lee C等[33]基于美國專利商標(biāo)局?jǐn)?shù)據(jù)庫提取3D打印領(lǐng)域?qū)@c產(chǎn)品的對應(yīng)關(guān)系,運用Word2Vec識別具有相似技術(shù)的產(chǎn)品,識別目標(biāo)產(chǎn)品的技術(shù)機會,再從技術(shù)、企業(yè)維度對其價值進行評價,為識別潛在技術(shù)機會和合作伙伴提供參考。李冰等[34]建立企業(yè)引用專利的二分網(wǎng)絡(luò),采用Sim Rank算法預(yù)測潛在競合對象、Text2Vec算法對其專利進行向量化表示,計算專利相似度,衡量技術(shù)的差異性,確定競合目標(biāo)?;陬A(yù)測的嵌入可以很好地表示詞向量、句子向量,但對整篇文檔向量的表示通常采用加權(quán)平均的方式獲取,比較粗糙。以2018年Google AI研究所提出的BERT模型為標(biāo)志,基于預(yù)訓(xùn)練的嵌入開始受到關(guān)注,一些改進的模型如ALBERT、RoBERTa等也取得了比較好的效果,但這類模型在技術(shù)關(guān)聯(lián)關(guān)系分析和潛在合作識別領(lǐng)域還未得到廣泛應(yīng)用。

        語義相似性分析方法可以對大規(guī)模文本進行處理,深入分析文本語義特征,判斷創(chuàng)新主體之間的技術(shù)關(guān)系,匹配特定需求,提高識別結(jié)果的可靠性。但其局限性在于:①聚類分析易生成高維稀疏向量,需要進行降維處理;②依存句法分析需要高質(zhì)量的人工標(biāo)注,成本較高,不太適用于大規(guī)模數(shù)據(jù);③詞嵌入分析對整篇文檔以及機構(gòu)之間多篇文檔語義特征的處理方式較為粗糙,有待完善;④大多數(shù)研究認(rèn)為,相似即具有合作潛力,但相似性技術(shù)更趨于競爭性質(zhì),忽略了企業(yè)研發(fā)合作的內(nèi)在動因。

        相較來看,互補性技術(shù)的識別難度更大,如表5所示,主要基于分類號[35]、技術(shù)空白點[36]、產(chǎn)業(yè)鏈或創(chuàng)新鏈分析[37-38]以及指標(biāo)評價[39]方法確定,也有研究深入文本語義層面嘗試測算企業(yè)之間的技術(shù)互補性,例如,Wang X等[40]采用HLDA模型識別3D打印領(lǐng)域的技術(shù)主題,建立主題層次樹,發(fā)現(xiàn)主題之間的關(guān)聯(lián)關(guān)系,再通過企業(yè)之間的主題補集數(shù)量衡量技術(shù)互補性。技術(shù)互補性的量化方法亟待完善。

        表5 技術(shù)互補性分析方法對比

        識別互補型合作伙伴可以為企業(yè)填補技術(shù)空白,尋找技術(shù)機會提供參考,往往比相似型合作伙伴更能產(chǎn)生重大創(chuàng)新?,F(xiàn)有研究的局限性在于:①大多數(shù)研究認(rèn)為“空白”即互補,可以進行研發(fā)合作,較少對雙方技術(shù)的用途進行細(xì)致區(qū)分,結(jié)果的可靠性有待考量;②定量方法主要基于專利類別實現(xiàn),未深入技術(shù)文本語義層面;③技術(shù)互補性的判斷仍以定性方法為主,實施過程復(fù)雜且受主觀影響較大。

        2.5 基于復(fù)合技術(shù)關(guān)系的識別方法

        為了彌補基于單一關(guān)系的識別方法的不足,優(yōu)化識別效果,已有研究綜合利用多種技術(shù)關(guān)系分析技術(shù)關(guān)聯(lián)情況,識別潛在研發(fā)合作,如表6所示。例如,傅俊英等[41]構(gòu)建基于專利共引、共被引關(guān)系和文本相似關(guān)系3種元路徑和包括專利權(quán)人、發(fā)明人、IPC分類號、專利所屬國家等信息的異構(gòu)網(wǎng)絡(luò),運用PathSelClus算法進行聚類,認(rèn)為同一聚簇中的機構(gòu)與聚類種子存在技術(shù)相似性,識別中小企業(yè)的潛在合作伙伴。吳菲菲等[42]從網(wǎng)絡(luò)信息獲取領(lǐng)域市場需求,采用LDA模型識別需求主題,再結(jié)合領(lǐng)域?qū)@湍繕?biāo)企業(yè)專利確定目標(biāo)企業(yè)的研發(fā)需求,查閱科技文獻獲取解決方案,進行檢索,得到與目標(biāo)企業(yè)產(chǎn)業(yè)類別不同的候選合作伙伴,從技術(shù)能力、合作能力、市場能力3個方面進行評價,確定最佳合作伙伴。劉小玲等[43]分別構(gòu)建專利共同分類強度向量、共同引文強度向量、專利標(biāo)題和摘要文本向量,各向量首尾相連,進而得到多屬性融合的專利相似度,優(yōu)于僅考慮單個屬性的結(jié)果,可以為判斷技術(shù)相似度提供參考。

        表6 多方法綜合分析對比

        利用復(fù)雜網(wǎng)絡(luò)可以將引用、共現(xiàn)、語義等復(fù)雜關(guān)系刻畫為拓?fù)浣Y(jié)構(gòu),形成異構(gòu)網(wǎng)絡(luò)、加權(quán)網(wǎng)絡(luò)、有向網(wǎng)絡(luò)、多分網(wǎng)絡(luò)、多層網(wǎng)絡(luò),結(jié)合使用鏈路預(yù)測、深度學(xué)習(xí)等技術(shù),利用網(wǎng)絡(luò)性質(zhì)和多類節(jié)點的屬性、關(guān)系識別潛在合作。例如,Wang Q等[44]建立融合專利交易關(guān)系、發(fā)明關(guān)系、引用關(guān)系以及本體、文本信息的異構(gòu)網(wǎng)絡(luò),運用基于元路徑的相似性測量方法AvgSim識別專利轉(zhuǎn)讓目標(biāo)。何喜軍等[45]從專利和組織維度建立影響專利交易的屬性指標(biāo)體系,構(gòu)建屬性異構(gòu)網(wǎng)絡(luò),設(shè)計AHNRL-PTR模型進行表示學(xué)習(xí),可以為節(jié)點推薦具有相似屬性的專利交易目標(biāo)。此類方法在研發(fā)合作領(lǐng)域應(yīng)用較少,可能與技術(shù)創(chuàng)新主體具有很強的競爭性、合作網(wǎng)絡(luò)稀疏、有用信息較少、識別結(jié)果可用性較差有關(guān)。在科研合作領(lǐng)域應(yīng)用較多,包括融合節(jié)點的共同鄰居、研究內(nèi)容、研究興趣、多模體[46-49]等特征,或在超網(wǎng)絡(luò)的基礎(chǔ)上改進傳統(tǒng)的資源分配指標(biāo)[50],識別潛在科研合作關(guān)系。

        復(fù)合型方法能夠集成多種方法的優(yōu)勢,充分挖掘引用關(guān)系、共現(xiàn)關(guān)系、文本語義、復(fù)雜網(wǎng)絡(luò)中蘊含的有用信息,綜合統(tǒng)計特征和語義特征識別潛在合作伙伴,效果更好,但此類方法實施過程較為復(fù)雜,融合多維屬性的難度較大,成熟的實施流程仍有待探索。

        3 當(dāng)前研究存在的主要問題

        通過對現(xiàn)有方法的比較,發(fā)現(xiàn)每種方法各有優(yōu)劣,如表7所示,總結(jié)當(dāng)前研究存在的主要問題如下:

        表7 基于技術(shù)關(guān)聯(lián)關(guān)系的企業(yè)研發(fā)潛在合作識別方法對比

        1)數(shù)據(jù)源和數(shù)據(jù)范圍較為受限。除專利文獻以外,產(chǎn)品、商標(biāo)、標(biāo)準(zhǔn)等文獻以及一些網(wǎng)絡(luò)資源也是技術(shù)信息的重要載體,現(xiàn)有研究大多以專利文獻為數(shù)據(jù)源進行技術(shù)關(guān)聯(lián)分析,缺乏對其他類型文獻的考慮,能夠利用的屬性信息有限。另外,基于合作歷史篩選出的候選合作伙伴,本質(zhì)上沒有從技術(shù)關(guān)聯(lián)視角考慮機構(gòu)之間的合作潛力,已經(jīng)將一些可能的潛在伙伴剔除在外,無法發(fā)現(xiàn)新增主體和已有鏈路之外的潛在合作關(guān)系,影響識別效果。

        2)技術(shù)文本的語義分析方法存在較多缺陷?,F(xiàn)有研究通過文本聚類、依存句法分析、知識圖譜等方法實現(xiàn)了對大規(guī)模技術(shù)文本的語義挖掘,相比基于分類號的方法蘊含了更豐富的語義信息,優(yōu)化了識別效果。但在技術(shù)關(guān)聯(lián)分析領(lǐng)域所用到的語義分析方法仍有很多弊端,例如,基于主題詞的方法易生成高維稀疏向量,無法較好地識別細(xì)分類目;基于語義特征抽取的方法需要統(tǒng)一的、高質(zhì)量的人工標(biāo)注,成本較高;Word2Vec、Doc2Vec等神經(jīng)網(wǎng)絡(luò)方法受不同語境的影響較大,仍未能較好地解決多義性問題。機構(gòu)層多篇技術(shù)文本的語義相似性分析方法仍采用單篇文本相似度加權(quán)平均的方式,較為粗糙,容易模糊機構(gòu)之間的技術(shù)關(guān)聯(lián)特征。技術(shù)互補性的測算方法仍以定性判讀為主,缺乏成熟的量化方法,區(qū)分互補方向也是一大難點。

        3)技術(shù)關(guān)聯(lián)與合作行為的關(guān)系尚未梳理清晰。技術(shù)關(guān)聯(lián)是企業(yè)進行研發(fā)合作的基礎(chǔ),已存在研發(fā)合作關(guān)系的主體必定存在著某種技術(shù)關(guān)聯(lián),現(xiàn)有研究通過獲取技術(shù)相似度、合作偏好等參數(shù)對潛在合作進行定量推斷,取得了較好效果。但缺乏對技術(shù)關(guān)聯(lián)與合作行為關(guān)系的系統(tǒng)分析,例如,共現(xiàn)關(guān)系具體反映何種技術(shù)關(guān)聯(lián),擁有何種共現(xiàn)關(guān)系的機構(gòu)合作潛力大;引用關(guān)系受引用動機影響,何種引用特征可以反映機構(gòu)的合作潛力;技術(shù)相似可能會使雙方傾向于競爭而非合作;同一產(chǎn)業(yè)鏈的機構(gòu)不一定合作,反而會在其他產(chǎn)業(yè)鏈尋求伙伴等。技術(shù)關(guān)聯(lián)與合作行為的關(guān)系不清晰,直接影響到合作潛力測度指標(biāo)的合理性以及識別結(jié)果的準(zhǔn)確性和可用性。

        4 未來研究方向

        針對上述問題,提出基于技術(shù)關(guān)聯(lián)關(guān)系的企業(yè)研發(fā)潛在合作識別方法領(lǐng)域的未來研究方向如下:

        1)納入多源數(shù)據(jù)并保障識別范圍的完整性。利用專利、產(chǎn)品、商標(biāo)、標(biāo)準(zhǔn)等多種文獻蘊含的技術(shù)信息以及企業(yè)等機構(gòu)網(wǎng)站/專業(yè)數(shù)據(jù)庫的市場經(jīng)營信息[51],獲取豐富的屬性參數(shù),有利于全面客觀地判斷技術(shù)關(guān)聯(lián)關(guān)系和研發(fā)合作潛力。以產(chǎn)品為例,產(chǎn)品名稱或功能的高相似性往往被用于識別競爭對手,而低相似性不被重視,不以相似度的高低簡單判定競合關(guān)系,而應(yīng)該對相似性進行分層、分級、分情況的討論,面向不同用途的高相似性和面向同一用途的低相似性是有合作可能的。同時,不應(yīng)該囿于機構(gòu)之間的合作歷史,而是優(yōu)先考慮技術(shù)關(guān)聯(lián)關(guān)系,判斷雙方進行研發(fā)合作的技術(shù)匹配程度,例如對方技術(shù)與企業(yè)現(xiàn)有技術(shù)資源加以組合是否有利于提高企業(yè)技術(shù)創(chuàng)新能力,在此基礎(chǔ)上再考慮合作歷史等因素,判斷合作潛力,提高識別結(jié)果的科學(xué)性。

        2)完善技術(shù)文本語義分析與計算的理論方法體系。技術(shù)文本語義分析直接影響技術(shù)關(guān)聯(lián)判斷結(jié)果的準(zhǔn)確性,現(xiàn)有知識組織方式不斷朝著結(jié)構(gòu)化、標(biāo)準(zhǔn)化的方向發(fā)展,為文本挖掘提供了較好的基礎(chǔ),但仍面臨詞語歧義、情感傾向、復(fù)雜語境等問題,應(yīng)模擬現(xiàn)實世界的語義分析環(huán)境與習(xí)慣,系統(tǒng)性地完善語義分析、計算、推理、應(yīng)用方面的理論與方法體系,利用復(fù)雜網(wǎng)絡(luò)、深度學(xué)習(xí)、知識圖譜、人工智能等技術(shù)從大規(guī)模數(shù)據(jù)中自動化、智能化地學(xué)習(xí)有效特征,優(yōu)化文本特征表示效果;在機構(gòu)技術(shù)文本語義分析方面,可以采用將多個機構(gòu)多篇文檔的相似度進行分類來代替多個機構(gòu)多篇文檔的相似度直接加權(quán)平均的方式,既可以利用現(xiàn)有機器學(xué)習(xí)多分類的成熟方法,也可以更大程度地保留機構(gòu)技術(shù)文本語義的特征,提供有價值的、可解釋的分析結(jié)果。在技術(shù)互補性的測算方面,考慮互補的出發(fā)點是基于雙方技術(shù)結(jié)構(gòu)還是技術(shù)用途,明確判斷標(biāo)準(zhǔn)和測度指標(biāo),借鑒技術(shù)相似性的測算方法,深入文本語義層面加以挖掘,同時可以考慮利用復(fù)雜網(wǎng)絡(luò)等工具展示互補方向。

        3)系統(tǒng)梳理技術(shù)關(guān)聯(lián)與研發(fā)合作行為的關(guān)系,完善測度指標(biāo)。研發(fā)合作是一種復(fù)雜的選擇行為,本質(zhì)上要以研發(fā)技術(shù)的匹配程度作為選擇合作伙伴的出發(fā)點,應(yīng)系統(tǒng)梳理各類技術(shù)關(guān)聯(lián)關(guān)系與研發(fā)合作行為的關(guān)系,完善測度合作潛力的指標(biāo)和方法,提升識別結(jié)果的客觀性和可靠性。以技術(shù)應(yīng)用關(guān)系為例,當(dāng)雙方技術(shù)強相似、弱互補時,表明雙方很可能在研發(fā)相似技術(shù)或產(chǎn)品,競爭激烈,但在細(xì)分領(lǐng)域上也可以嘗試合作;當(dāng)雙方技術(shù)弱相似、強互補時,表明此類機構(gòu)可能正好擁有企業(yè)沒有且需要的技術(shù),未來可能助力企業(yè)形成重大技術(shù)創(chuàng)新或革命性產(chǎn)品;當(dāng)雙方強相似、強互補時,表明此類機構(gòu)可能會幫助企業(yè)解決現(xiàn)有研發(fā)過程遇到的技術(shù)瓶頸,優(yōu)化企業(yè)技術(shù)或產(chǎn)品性能,也對激發(fā)雙方在共同領(lǐng)域的潛能,實現(xiàn)雙贏有促進作用;當(dāng)雙方弱相似、弱互補時,企業(yè)可考慮將此類機構(gòu)作為未來技術(shù)擴張的備選目標(biāo),以提升技術(shù)或產(chǎn)品多樣性。厘清技術(shù)關(guān)聯(lián)關(guān)系與研發(fā)合作之間的組合方式,才能建立起科學(xué)的識別依據(jù)和識別指標(biāo)。

        猜你喜歡
        關(guān)聯(lián)語義文本
        “苦”的關(guān)聯(lián)
        語言與語義
        在808DA上文本顯示的改善
        基于doc2vec和TF-IDF的相似文本識別
        電子制作(2018年18期)2018-11-14 01:48:06
        奇趣搭配
        智趣
        讀者(2017年5期)2017-02-15 18:04:18
        “上”與“下”語義的不對稱性及其認(rèn)知闡釋
        文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學(xué)隱喻
        認(rèn)知范疇模糊與語義模糊
        如何快速走進文本
        語文知識(2014年1期)2014-02-28 21:59:13
        日本一区二区三区视频在线观看| 视频女同久久久一区二区三区 | 亚洲综合无码一区二区三区| 亚洲一区二区av免费观看| 国产综合在线观看| 人妻中文字幕一区二区三区| 国内国外日产一区二区| 人妖av手机在线观看| 国产美女精品视频线免费播放软件 | 国产精品一区二区三区蜜臀| 日韩精品视频中文字幕播放| 久久久99精品免费视频| a级毛片免费观看在线| 老太脱裤让老头玩ⅹxxxx| 国产成人午夜福利在线小电影| 亚洲精品国产熟女久久| 日本高清在线播放一区二区| 国产偷国产偷亚洲综合av| 国产精品亚洲片在线观看不卡| 肥臀熟女一区二区三区| 亚洲 欧美 国产 日韩 精品| 亚洲AV秘 无码一区二区在线| 亚洲无人区乱码中文字幕能看| 色窝窝无码一区二区三区| 免费人成网ww555kkk在线| 亚洲综合无码一区二区三区 | 77777亚洲午夜久久多人| 国产91AV免费播放| 美女被强吻并脱下胸罩内裤视频| 精品亚洲a∨无码一区二区三区| 大地资源在线播放观看mv| 中文人成影院| 日韩精品一区二区av在线| 日韩av水蜜桃一区二区三区 | 日韩一区三区av在线| 亚洲最全av一区二区| 成全高清在线播放电视剧| 国产无码swag专区| 91亚洲最新国语中文字幕| 文字幕精品一区二区三区老狼| 亚洲人成电影在线观看天堂色|