亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于異構(gòu)信息網(wǎng)絡(luò)融合的專(zhuān)利技術(shù)主題識(shí)別研究*

        2021-08-30 00:20:44田鵬偉
        情報(bào)雜志 2021年8期
        關(guān)鍵詞:專(zhuān)利技術(shù)主題詞異構(gòu)

        田鵬偉 張 嫻

        (1. 中國(guó)科學(xué)院成都文獻(xiàn)情報(bào)中心知識(shí)產(chǎn)權(quán)研究咨詢(xún)中心 成都 610041;2. 百度時(shí)代網(wǎng)絡(luò)技術(shù)(北京)有限公司 北京 100085;3. 中國(guó)科學(xué)院大學(xué)經(jīng)濟(jì)與管理學(xué)院圖書(shū)情報(bào)與檔案管理系 北京 100190)

        0 引 言

        專(zhuān)利文獻(xiàn)是記錄技術(shù)創(chuàng)新過(guò)程與成果的重要載體,也是聯(lián)系科技與經(jīng)濟(jì)兩大范疇的重要信息介質(zhì)。專(zhuān)利文本主題識(shí)別是采用文本數(shù)據(jù)挖掘手段發(fā)掘?qū)@墨I(xiàn)中具有可研究性及經(jīng)濟(jì)價(jià)值的主題信息,有助于把握技術(shù)創(chuàng)新前沿、預(yù)測(cè)技術(shù)發(fā)展趨勢(shì)。然而,專(zhuān)利數(shù)據(jù)不同于一般的科學(xué)文獻(xiàn),其語(yǔ)言表述晦澀性、文本組織結(jié)構(gòu)特殊性增加了文本主題識(shí)別的難度,削弱了通用文本挖掘方法直接套用于專(zhuān)利文本主題識(shí)別的應(yīng)用效果。

        目前專(zhuān)利文本主題識(shí)別相關(guān)研究大致可劃分為三個(gè)階段:(1)基于專(zhuān)利技術(shù)主題詞、主題詞關(guān)聯(lián)關(guān)系表征,研究專(zhuān)利文本的主題[1];(2)采用共詞分析方法、多元關(guān)系網(wǎng)絡(luò),對(duì)專(zhuān)利文獻(xiàn)進(jìn)行建模,獲取專(zhuān)利文本的主題[2-4];(3)應(yīng)用文本挖掘技術(shù)(如LDA等主題模型)分析專(zhuān)利文獻(xiàn),挖掘?qū)@闹黝}[5-6]?,F(xiàn)有研究局限主要體現(xiàn)在三方面:a.將專(zhuān)利數(shù)據(jù)視作普通文本數(shù)據(jù)處理[7]。專(zhuān)利文獻(xiàn)用語(yǔ)晦澀,增加了文本處理難度,通用分詞結(jié)果難以達(dá)到理想的技術(shù)主題挖掘效果。b.主題識(shí)別分析維度單一,缺乏多維視角[8]。主題識(shí)別研究多依賴(lài)于主題詞共現(xiàn)網(wǎng)絡(luò),或發(fā)明人、專(zhuān)利權(quán)人、IPC等屬性網(wǎng)絡(luò),少有涉及多維網(wǎng)絡(luò)融合視角研究主題識(shí)別[9-12]。c.逐漸重視將多維、異構(gòu)建模思維應(yīng)用于專(zhuān)利分析,但針對(duì)專(zhuān)利技術(shù)主題識(shí)別方面的研究較少[13-14]。

        異構(gòu)信息網(wǎng)絡(luò)(Heterogeneous Information Network,HIN)于2009年由Sun提出[15],也稱(chēng)元網(wǎng)絡(luò),指的是網(wǎng)絡(luò)中至少存在兩種及以上種類(lèi)的節(jié)點(diǎn)對(duì)象類(lèi)型、關(guān)系類(lèi)型。按網(wǎng)絡(luò)節(jié)點(diǎn)的同質(zhì)、異質(zhì)特性,異構(gòu)信息網(wǎng)絡(luò)可分為同質(zhì)異構(gòu)與異質(zhì)異構(gòu),常見(jiàn)于圖像處理、通信領(lǐng)域等[16]。異構(gòu)信息網(wǎng)絡(luò)融合指對(duì)已存在的若干信息網(wǎng)絡(luò)進(jìn)行融合使其拓?fù)浣Y(jié)構(gòu)合為一體,或?qū)?fù)雜系統(tǒng)中若干組實(shí)體重新構(gòu)建網(wǎng)絡(luò)。異構(gòu)信息網(wǎng)絡(luò)與專(zhuān)利文本主題識(shí)別相結(jié)合,有助于充分利用多維信息優(yōu)勢(shì)提升專(zhuān)利技術(shù)主題識(shí)別的準(zhǔn)確性。

        本文嘗試基于異構(gòu)信息網(wǎng)絡(luò)融合實(shí)現(xiàn)專(zhuān)利文本主題識(shí)別,提高專(zhuān)利技術(shù)主題識(shí)別的準(zhǔn)確性。具體而言,利用專(zhuān)利文獻(xiàn)中的主題詞、發(fā)明人、專(zhuān)利權(quán)人、IPC分類(lèi)號(hào)、引證信息等屬性共同構(gòu)建專(zhuān)利異構(gòu)信息網(wǎng)絡(luò),通過(guò)融合運(yùn)算形成融合網(wǎng)絡(luò),進(jìn)而開(kāi)展主題識(shí)別研究,期望探索一種基于異構(gòu)信息網(wǎng)絡(luò)融合的專(zhuān)利技術(shù)主題識(shí)別方法。

        1 研究方法

        1.1研究思路利用異構(gòu)信息網(wǎng)絡(luò)對(duì)專(zhuān)利文獻(xiàn)數(shù)據(jù)集的多類(lèi)特征屬性建模。專(zhuān)利文獻(xiàn)中特征項(xiàng)之間可抽象為直接或間接的矩陣表示,OVL疊加算法(overlap function)可用于計(jì)算兩個(gè)關(guān)聯(lián)矩陣間各節(jié)點(diǎn)的最小聯(lián)通路徑,且對(duì)術(shù)語(yǔ)權(quán)重大小的文檔間差異測(cè)度敏感[17]。因此,本文采用OVL疊加算法以及線(xiàn)性加權(quán)[18-19]方法融合構(gòu)建異構(gòu)信息網(wǎng)絡(luò),形成專(zhuān)利異構(gòu)信息融合網(wǎng)絡(luò)。

        本文提出的技術(shù)主題識(shí)別方法研究框架(見(jiàn)圖1)包含:提取與技術(shù)主題密切關(guān)聯(lián)的多個(gè)類(lèi)型特征,構(gòu)建專(zhuān)利異構(gòu)信息網(wǎng)絡(luò);采用OVL算法及線(xiàn)性加權(quán)方法,融合所構(gòu)建的異構(gòu)信息網(wǎng)絡(luò),形成專(zhuān)利異構(gòu)信息融合網(wǎng)絡(luò);基于融合后的網(wǎng)絡(luò)進(jìn)行聚類(lèi),識(shí)別專(zhuān)利技術(shù)主題。

        圖1 基于異構(gòu)信息網(wǎng)絡(luò)融合的專(zhuān)利文本主題識(shí)別方法研究框架

        1.2專(zhuān)利異構(gòu)信息網(wǎng)絡(luò)建模

        1.2.1 獲取數(shù)據(jù)特征項(xiàng) 選取下述特征項(xiàng)構(gòu)建網(wǎng)絡(luò):主題詞[20](對(duì)標(biāo)題與摘要經(jīng)自然語(yǔ)言處理提取)、專(zhuān)利號(hào)(唯一標(biāo)識(shí))、發(fā)明人、專(zhuān)利權(quán)人、IPC分類(lèi)號(hào)、專(zhuān)利引文等。

        a.主題詞抽取。對(duì)專(zhuān)利文獻(xiàn)的標(biāo)題、摘要進(jìn)行通用的自然語(yǔ)言處理,提取關(guān)鍵詞信息。然后,在盡可能保全關(guān)鍵詞的前提下,剔除低頻詞匯,形成核心主題詞集合。

        b.其他特征項(xiàng)抽取。在上述主題詞集合之外,抽取專(zhuān)利文獻(xiàn)其它內(nèi)部、外部特征信息,分別形成專(zhuān)利號(hào)集合、發(fā)明人集合、專(zhuān)利權(quán)人集合、IPC集合、專(zhuān)利引文集合、專(zhuān)利申請(qǐng)年集合;進(jìn)行數(shù)據(jù)清洗,如專(zhuān)利權(quán)人、發(fā)明人名稱(chēng)規(guī)范與消歧、低頻專(zhuān)利引文數(shù)據(jù)剔除等[21]。

        1.2.2 構(gòu)建專(zhuān)利異構(gòu)信息網(wǎng)絡(luò) 異構(gòu)信息網(wǎng)絡(luò)的重要特點(diǎn)在于節(jié)點(diǎn)的異質(zhì)性與連邊的復(fù)雜性。共現(xiàn)關(guān)系是海量文本挖掘中一種表征特征屬性間相互關(guān)聯(lián)的有效方法。例如,通過(guò)統(tǒng)計(jì)一組特征項(xiàng)在同一篇文獻(xiàn)中出現(xiàn)的次數(shù),體現(xiàn)特征項(xiàng)之間的關(guān)聯(lián)關(guān)系、強(qiáng)度及結(jié)構(gòu)變化[22-23]。

        將前述主題詞集合、其他特征項(xiàng)集合作為節(jié)點(diǎn),其共現(xiàn)關(guān)系作為連邊,構(gòu)建網(wǎng)絡(luò)。該網(wǎng)絡(luò)中節(jié)點(diǎn)均是異質(zhì)節(jié)點(diǎn),各節(jié)點(diǎn)間存在多種連接關(guān)系,因此屬典型的異構(gòu)信息網(wǎng)絡(luò)模型,如圖2所示。

        圖2 專(zhuān)利異構(gòu)信息網(wǎng)絡(luò)模型示意

        1.3專(zhuān)利異構(gòu)信息網(wǎng)絡(luò)融合當(dāng)前的信息網(wǎng)絡(luò)融合處理方法各具優(yōu)劣[24]。考慮到異質(zhì)節(jié)點(diǎn)屬性特征的融合性、術(shù)語(yǔ)權(quán)重差異測(cè)度的敏感性、聯(lián)通路徑計(jì)算的經(jīng)濟(jì)性,本文采用“矩陣運(yùn)算”+“加權(quán)融合”思路進(jìn)行異構(gòu)信息網(wǎng)絡(luò)融合處理。

        f2=min (Wik[A:B],Wkj[B:C])

        (1)

        式(1)中,Wik表示從節(jié)點(diǎn)i到節(jié)點(diǎn)k的鏈接權(quán)重,[A:B]表示矩陣的行對(duì)象是A,列對(duì)象是B;min ()則表示計(jì)算由節(jié)點(diǎn)i通過(guò)節(jié)點(diǎn)k到達(dá)節(jié)點(diǎn)j的最小值。

        (2)

        式(2)中,f1是在f2的基礎(chǔ)上計(jì)算經(jīng)過(guò)B(bi)從A到C所有最小權(quán)重之和。

        將公式(1)、(2)整合可得:

        (3)

        則OVL計(jì)算公式可定義為:

        Wij[A:C]=OVL (Wik[A:B],Wkj[B:C])

        (4)

        將算法衍生于對(duì)更多數(shù)量矩陣的融合處理,如下所示:

        Wij[A:E]=OVL (Wil[A:B],Wlm[B:C],Wmn[C:D],Wnj[D:E])

        (5)

        采用OVL方法對(duì)異構(gòu)信息網(wǎng)絡(luò)進(jìn)行融合處理,分別采用OVL算法對(duì)圖2中每條路徑進(jìn)行融合,即形成多個(gè)不同的P-T(Patents-Terms)融合矩陣,如圖3所示。

        圖3 OVL矩陣融合示意圖

        1.3.2 加權(quán)計(jì)算融合網(wǎng)絡(luò) 采用加權(quán)融合對(duì)上述得到的多個(gè)Patents-Terms融合矩陣再次融合,最終形成統(tǒng)一、有效的融合矩陣,設(shè)為P-Tfusion(見(jiàn)圖4)。計(jì)算公式如式(6)。

        圖4 矩陣加權(quán)融合示意圖

        (6)

        1.4專(zhuān)利技術(shù)主題識(shí)別基于上述融合矩陣P-Tfusion,進(jìn)行技術(shù)主題識(shí)別研究。聚類(lèi)運(yùn)算前需考慮是否對(duì)已有數(shù)據(jù)進(jìn)一步降維處理,提高識(shí)別的準(zhǔn)確性和有效性。

        1.4.1 矩陣降維 常用數(shù)據(jù)降維手段有主成分分析(Principal component analysis,PCA)、奇異值矩陣分解(Singular value decomposition,SVD)等[25-26]。就降維原理而言[27-28],上述兩種均可作為本文的降維工具,但使用PCA之前需明確知道降維后的維度k,而SVD則不需要提前指定維度,因此本文選用SVD,計(jì)算公式如式(7)。

        (7)

        1.4.2 專(zhuān)利技術(shù)主題聚類(lèi)與可視化 目前已有多種文本聚類(lèi)方法研究,如基于數(shù)據(jù)分類(lèi)的K-means、K-medoids、PAM,基于層次聚類(lèi)的BIRCH、CURE、ROCK,基于聚類(lèi)簇密度的DBSCAN、OPTICS、Mean-shift等[31]。由于聚類(lèi)工具與算法并非本文研究重點(diǎn),因此選用經(jīng)典聚類(lèi)算法K-means,用于驗(yàn)證異構(gòu)信息網(wǎng)絡(luò)融合前后的專(zhuān)利技術(shù)主題識(shí)別效果。聚類(lèi)效果評(píng)價(jià),采用Silhouette Coefficient(輪廓系數(shù))[32]計(jì)算聚類(lèi)的全局最優(yōu)系數(shù),具體如下:

        采用K-means將待分類(lèi)數(shù)據(jù)分為了k個(gè)類(lèi),對(duì)于類(lèi)中每個(gè)向量i,分別計(jì)算它們的輪廓系數(shù),有:a(i)=average(向量i到同類(lèi)中的所有其它點(diǎn)的距離),b(i)=min(向量i到非同類(lèi)中的所有點(diǎn)的平均距離)。

        如圖5所示,對(duì)于向量i,有:

        圖5 聚類(lèi)輪廓示意圖

        (8)

        則,向量i的輪廓系數(shù)為:

        (9)

        其中,a(i)表示向量i到同一簇內(nèi)其他點(diǎn)不相似程度的平均值;b(i)表示向量i到其他類(lèi)的平均不相似程度的最小值??梢?jiàn),輪廓系數(shù)的值介于[-1,1],越趨近于1代表內(nèi)聚度和分離度都相對(duì)較優(yōu)。求取所有節(jié)點(diǎn)的輪廓系數(shù)平均值,就是該聚類(lèi)結(jié)果的總輪廓系數(shù)。

        可視化是直觀(guān)考察主題識(shí)別聚類(lèi)效果優(yōu)劣的重要手段,尤其Origin工具的三維旋轉(zhuǎn)功能有助于清晰展示。本文采用Origin工具對(duì)融合處理前后網(wǎng)絡(luò)的主題聚類(lèi)結(jié)果可視化呈現(xiàn),以對(duì)比技術(shù)主題識(shí)別效果。

        2 實(shí)證分析

        2.1數(shù)據(jù)獲取與預(yù)處理本文選擇工業(yè)機(jī)器人技術(shù)領(lǐng)域開(kāi)展實(shí)證分析。實(shí)證數(shù)據(jù)來(lái)自科睿唯安(Clarivate Analytics)的德溫特創(chuàng)新索引(Derwent Innovation Index,DII),通過(guò)概念及相關(guān)要素組配制定檢索策略。鑒于實(shí)驗(yàn)數(shù)據(jù)處理能力,將檢索年限設(shè)定為2014-2015年,對(duì)檢索結(jié)果人工排雜后共獲得14 331件專(zhuān)利記錄。

        利用DDA(Derwent Data Analyzer)和Python的NLP工具進(jìn)行數(shù)據(jù)預(yù)處理。提取6項(xiàng)屬性特征值:專(zhuān)利號(hào)(Patent Numbers)、專(zhuān)利權(quán)人/申請(qǐng)人(Patent Assignees)、發(fā)明人(Inventors)、IPC分類(lèi)號(hào)(International Patent Classifications)、引證專(zhuān)利號(hào)(Cited Patent Numbers)、主題詞(Keywords)。規(guī)整發(fā)明人、機(jī)構(gòu)申請(qǐng)人項(xiàng)名稱(chēng);對(duì)Title和Abstract項(xiàng)進(jìn)行NLP處理抽取關(guān)鍵詞(詞組),去除停用詞、主題無(wú)關(guān)詞,自定義TF-IDF算法選取高頻詞;去除被引頻次低于2的離散數(shù)據(jù)。最終得到待分析的數(shù)據(jù)集合。數(shù)據(jù)預(yù)處理操作詳見(jiàn)表1。

        表1 實(shí)證數(shù)據(jù)預(yù)處理結(jié)果

        2.2異構(gòu)信息網(wǎng)絡(luò)融合分析

        2.2.1 異構(gòu)信息網(wǎng)絡(luò)構(gòu)建 利用DDA抽取9個(gè)共現(xiàn)矩陣,構(gòu)建9個(gè)異構(gòu)共現(xiàn)網(wǎng)絡(luò):CO-PI(專(zhuān)利-發(fā)明人共現(xiàn))、CO-IT(發(fā)明人-主題詞共現(xiàn))、CO-PA(專(zhuān)利-專(zhuān)利權(quán)人/申請(qǐng)人共現(xiàn))、CO-AT(專(zhuān)利權(quán)人/申請(qǐng)-主題詞共現(xiàn))、CO-PIC(專(zhuān)利-IPC共現(xiàn))、CO-ICT(IPC-主題詞共現(xiàn))、CO-PC(專(zhuān)利-被引專(zhuān)利共現(xiàn))、CO-CT(被引專(zhuān)利-主題詞共現(xiàn))以及CO-PT(專(zhuān)利-主題詞共現(xiàn))。

        2.2.2 異構(gòu)信息網(wǎng)絡(luò)融合 第一步,OVL融合。提取該異構(gòu)信息網(wǎng)絡(luò)中的4條路徑:Patents-Inventors-Terms、Patents-Assignees-Terms、Patents-IPCs-Terms、Patents-Citations-Terms;分別采用OVL算法融合,形成4個(gè)不同的P-T(Patents-Terms)矩陣:P-Tinventors、P-Tassignees、P-Tipcs、P-Tcitations。

        第二步,對(duì)以上4個(gè)P-T矩陣進(jìn)行加權(quán)融合,形成P-Tfusion矩陣。

        第三步,確定加權(quán)系數(shù)。加權(quán)系數(shù)的計(jì)算通過(guò)聚類(lèi)系數(shù)K值進(jìn)行逆向推導(dǎo)。

        a.聚類(lèi)系數(shù)K值確定。K值選擇原則是在保證聚類(lèi)團(tuán)體較為集中的前提下,力求類(lèi)更多,即K值更大??紤]到計(jì)算的時(shí)間與空間復(fù)雜度,采用控制變量法,設(shè)定α=β=γ=θ=0.25,并設(shè)置網(wǎng)絡(luò)聚類(lèi)系數(shù)K(3≤K≤50)進(jìn)行迭代運(yùn)算,鎖定可能的聚類(lèi)范圍,如圖6所示。

        圖6 聚類(lèi)系數(shù)K值確定

        由于網(wǎng)絡(luò)聚類(lèi)輪廓系數(shù)取值范圍為[-1,1],且對(duì)比參照組與實(shí)驗(yàn)組發(fā)現(xiàn),K=4時(shí)對(duì)應(yīng)的聚類(lèi)輪廓系數(shù)最大(不考慮K=2,因不含實(shí)際意義),因而取K=4。

        2.2.3 專(zhuān)利技術(shù)主題識(shí)別 對(duì)融合矩陣P-Tfusion降維處理,k-means算法聚類(lèi),然后在領(lǐng)域?qū)<覅⑴c下解讀聚類(lèi)結(jié)果并予以主題命名。表2列舉了專(zhuān)家參與下的部分聚類(lèi)主題識(shí)別結(jié)果。

        表2 工業(yè)機(jī)器人專(zhuān)利聚類(lèi)主題識(shí)別結(jié)果(異構(gòu)融合網(wǎng)絡(luò)P-Tfusion,部分)

        2.3對(duì)比分析與結(jié)果討論為驗(yàn)證異構(gòu)信息網(wǎng)絡(luò)融合方法在專(zhuān)利主題識(shí)別中的應(yīng)用效果,本文采用關(guān)鍵詞直接共現(xiàn)CO-PT進(jìn)行主題聚類(lèi)識(shí)別作為對(duì)照組P-Treference,與實(shí)驗(yàn)組P-Tfusion主題識(shí)別結(jié)果相對(duì)比,分別采用可視化、專(zhuān)家解讀兩種對(duì)比途徑。

        2.3.1 可視化對(duì)比 利用Origin工具可視化,對(duì)比觀(guān)測(cè)兩組聚類(lèi)結(jié)果的主題向量空間結(jié)構(gòu)分布。結(jié)果表明,實(shí)驗(yàn)組P-Tfusion的聚類(lèi)識(shí)別結(jié)果優(yōu)于對(duì)照組P-Treference,篇幅原因,此處例舉正視、正視左旋45度、正視右旋45度視圖,詳見(jiàn)圖7。

        續(xù)表2 工業(yè)機(jī)器人專(zhuān)利聚類(lèi)主題識(shí)別結(jié)果(異構(gòu)融合網(wǎng)絡(luò)P-Tfusion,部分)

        圖7 專(zhuān)利技術(shù)主題識(shí)別結(jié)果可視化對(duì)比

        如圖7所示,對(duì)照組P-Treference的聚類(lèi)結(jié)果,其正視圖(圖7a)、左視圖(圖7c)、右視圖(圖7e)的空間分布結(jié)構(gòu)性均不具備明顯區(qū)分度,部分重疊交叉狀態(tài)較為嚴(yán)重。實(shí)驗(yàn)組P-Tfusion的聚類(lèi)識(shí)別結(jié)果可視化效果較為清晰,除左視圖(圖7d)顯示出部分重疊,正視圖(圖7b)、右視圖(圖7f)均呈現(xiàn)出較好的區(qū)分度,尤其右視圖表現(xiàn)出聚類(lèi)結(jié)果具有幾近完全清晰的區(qū)分度,三維空間中點(diǎn)對(duì)之間的區(qū)分性更高、簇間間隙更明顯。

        2.3.2 專(zhuān)家解讀 在領(lǐng)域?qū)<覅⑴c下對(duì)與P-Tfusion(表2)同時(shí)段的對(duì)照組P-Treference進(jìn)行主題聚類(lèi)結(jié)果解讀與命名,結(jié)果如表3所示。

        表3 工業(yè)機(jī)器人專(zhuān)利聚類(lèi)主題(關(guān)鍵詞直接共現(xiàn)網(wǎng)絡(luò)P-Treference,部分)

        對(duì)比發(fā)現(xiàn),實(shí)驗(yàn)組P-Tfusion4個(gè)聚類(lèi)內(nèi)部間隙緊密,類(lèi)間間隙較清晰,未出現(xiàn)明顯重疊。對(duì)照組P-Treference4個(gè)聚類(lèi)中,#1與#4在控制系統(tǒng)方面存在部分重疊,#2與#3在描述機(jī)器人機(jī)械手與機(jī)器人機(jī)身時(shí)存在被包含關(guān)系,#3與#4之間在生產(chǎn)線(xiàn)效率問(wèn)題上存在交叉。

        2.3.3 結(jié)果討論 可視化觀(guān)測(cè)顯示,基于異構(gòu)信息網(wǎng)絡(luò)融合(以下簡(jiǎn)稱(chēng)“融合網(wǎng)絡(luò)”)處理得到的技術(shù)主題識(shí)別結(jié)果與未經(jīng)融合網(wǎng)絡(luò)(以下簡(jiǎn)稱(chēng)“非融合網(wǎng)絡(luò)”)得到的技術(shù)主題識(shí)別結(jié)果相比,其主題向量空間分布的結(jié)構(gòu)邊界更清晰、區(qū)分度更明顯。

        同時(shí),聚類(lèi)主題判讀命名對(duì)比顯示,融合網(wǎng)絡(luò)主題識(shí)別結(jié)果具有更強(qiáng)的主題關(guān)聯(lián),非融合網(wǎng)絡(luò)的主題識(shí)別結(jié)果相對(duì)更偏向通識(shí)性、常規(guī)性描述,對(duì)技術(shù)細(xì)節(jié)內(nèi)部揭示深度較弱。如,非融合網(wǎng)絡(luò)主題識(shí)別結(jié)果中描述機(jī)器人的控制系統(tǒng)、機(jī)身描述、生產(chǎn)效率、多視圖,這些技術(shù)主題對(duì)于機(jī)器人領(lǐng)域而言更屬通用技術(shù),不具顯著特殊性,且關(guān)鍵詞描述概括性較高。領(lǐng)域?qū)<覍?duì)比判斷認(rèn)為,融合網(wǎng)絡(luò)的專(zhuān)利技術(shù)主題識(shí)別結(jié)果相對(duì)更全面,既包括了概括性機(jī)身描述,也包括關(guān)鍵性部件詳細(xì)描述,并且還識(shí)別出了前沿性機(jī)器人種類(lèi)挖掘等主題。究其原因,融合網(wǎng)絡(luò)融合了專(zhuān)利信息的多類(lèi)特征屬性,蘊(yùn)涵了更豐富的顯性與隱性信息。

        綜上,基于異構(gòu)信息網(wǎng)絡(luò)融合的專(zhuān)利技術(shù)主題識(shí)別方法,在開(kāi)展既定領(lǐng)域?qū)@夹g(shù)主題識(shí)別中具有可行性。相對(duì)于非融合的網(wǎng)絡(luò)模型,本文提出的方法得到技術(shù)主題結(jié)果在全面性、深入性方面更具優(yōu)勢(shì),各主題的類(lèi)中集中性更好,類(lèi)間區(qū)分度更高、交叉性與重疊度更低,并且有助于發(fā)掘出領(lǐng)域內(nèi)前沿性技術(shù)。

        3 結(jié) 語(yǔ)

        當(dāng)前,專(zhuān)利文本主題識(shí)別大多基于單一關(guān)聯(lián)關(guān)系分析,難以全面挖掘?qū)@麛?shù)據(jù)中更多隱性關(guān)聯(lián)信息。本文采用多維、異構(gòu)建模思維,提出了一種基于異構(gòu)信息網(wǎng)絡(luò)融合的專(zhuān)利技術(shù)主題識(shí)別方法,對(duì)專(zhuān)利信息進(jìn)行異構(gòu)建模,結(jié)合OVL算法對(duì)異構(gòu)信息網(wǎng)絡(luò)融合,在此基礎(chǔ)上識(shí)別專(zhuān)利技術(shù)主題。以工業(yè)機(jī)器人領(lǐng)域?yàn)槔膶?shí)驗(yàn)對(duì)比結(jié)果顯示,異構(gòu)融合的專(zhuān)利信息網(wǎng)絡(luò)可以有效提高技術(shù)主題聚類(lèi)的全面性與準(zhǔn)確性。

        未來(lái),關(guān)于異構(gòu)信息網(wǎng)絡(luò)融合的專(zhuān)利技術(shù)主題識(shí)別研究,需要關(guān)注以下兩方面:一是優(yōu)化多維關(guān)系特征獲取。專(zhuān)利大數(shù)據(jù)環(huán)境下,專(zhuān)利信息間蘊(yùn)涵的直接、間接關(guān)聯(lián)日漸豐富,不同維度的關(guān)聯(lián)關(guān)系對(duì)技術(shù)主題表征的側(cè)重、強(qiáng)度有所差異,要盡可能深挖更多關(guān)聯(lián)類(lèi)型,構(gòu)建更豐富的多維信息關(guān)系體系。二是深入開(kāi)展網(wǎng)絡(luò)融合算法應(yīng)用研究。網(wǎng)絡(luò)融合方法多樣,但目前應(yīng)用于文本主題識(shí)別的研究尚不多見(jiàn),本文應(yīng)用OVL算法開(kāi)展了有限的探索。不同融合算法在概念、方法上有所差異,針對(duì)異質(zhì)文本信息特征,找尋更具有效性、適用性及計(jì)算經(jīng)濟(jì)性的融合算法是未來(lái)該研究方向的重要研究命題。

        猜你喜歡
        專(zhuān)利技術(shù)主題詞異構(gòu)
        試論同課異構(gòu)之“同”與“異”
        全新充電專(zhuān)利技術(shù)實(shí)現(xiàn)車(chē)隊(duì)充電
        鎂冶煉專(zhuān)利技術(shù)研究
        overlay SDN實(shí)現(xiàn)異構(gòu)兼容的關(guān)鍵技術(shù)
        LTE異構(gòu)網(wǎng)技術(shù)與組網(wǎng)研究
        我校學(xué)報(bào)第32卷第5期(2014年10月)平均每篇有3.04個(gè)21世紀(jì)的Ei主題詞
        我校學(xué)報(bào)第32卷第6期(2014年12月)平均每篇有3.00個(gè)21世紀(jì)的Ei主題詞
        2014年第16卷第1~4期主題詞索引
        在新興異構(gòu)SoCs上集成多種系統(tǒng)
        《疑難病雜志》2014年第13卷主題詞索引
        最新日本人妻中文字幕| 欧美精品AⅤ在线视频| 亚洲欧美日韩在线精品2021| 日韩精品视频av在线观看| 久久亚洲av成人无码国产最大| 狼人香蕉香蕉在线28 - 百度| 欧美黑人又粗又大久久久 | 97精品人妻一区二区三区在线| 国产精品vⅰdeoxxxx国产| 国产人妖视频一区二区| 成人国产在线播放自拍| 论理视频二区三区四区在线观看| 男女性杂交内射妇女bbwxz| 无码人妻精品一区二区三区免费 | 伴郎粗大的内捧猛烈进出视频观看| 亚州AV成人无码久久精品| 亚洲国产av高清一区二区三区| 真人抽搐一进一出视频| 亚州少妇无套内射激情视频| 国产精品无码久久久久久蜜臀AV | 亚洲一区在线观看中文字幕| a级特黄的片子| 午夜精品一区二区三区无码不卡| 久久久国产精品三级av| 中国娇小与黑人巨大交| 国产chinese男男gay视频网| 国产精品原创永久在线观看| 色婷婷精品午夜在线播放| 欧美人与禽z0zo牲伦交| 精品免费在线| 丝袜美腿久久亚洲一区| 免费在线观看视频播放| 天天躁狠狠躁狠狠躁夜夜躁| 一区二区在线亚洲av蜜桃| 亚洲高清一区二区精品| 亚洲av无码专区亚洲av网站| 亚洲熟妇av乱码在线观看| 国产精品一区二区久久毛片| 久久精品国产亚洲av麻豆会员| 亚洲av第一页国产精品| 国产丝袜精品丝袜一区二区|