亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于弱信號(hào)的顛覆性技術(shù)早期識(shí)別研究

        2024-01-03 09:10:00劉俊婉龐博徐碩
        情報(bào)學(xué)報(bào) 2023年12期
        關(guān)鍵詞:信號(hào)模型

        劉俊婉,龐博,徐碩

        (北京工業(yè)大學(xué)經(jīng)濟(jì)與管理學(xué)院,北京 100124)

        0 引 言

        顛覆性技術(shù)是指改變原有技術(shù)軌跡的全新技術(shù)或跨學(xué)科、跨領(lǐng)域應(yīng)用的現(xiàn)有技術(shù),可對(duì)已有傳統(tǒng)或主流技術(shù)產(chǎn)生整體或根本性的替代效果和相應(yīng)的市場顛覆效應(yīng)[1]。顛覆性技術(shù)具有跨界性、突變性、破壞性、替代性、前沿性等特征,屬于一種對(duì)現(xiàn)有市場、技術(shù)體系等產(chǎn)生巨大影響的技術(shù)。因顛覆性技術(shù)對(duì)現(xiàn)有市場的顛覆性和破壞性,圍繞該類技術(shù)的研究成為國家和企業(yè)掌握未來技術(shù)發(fā)展動(dòng)向、進(jìn)行市場變革以及提升自身競爭力的重要途徑[2],因此,針對(duì)顛覆性技術(shù)的識(shí)別研究成為當(dāng)前學(xué)界關(guān)注的熱點(diǎn)領(lǐng)域。在以往研究中,常用的顛覆性技術(shù)識(shí)別方法包括以專家評(píng)議為主的定性研究方法和以文獻(xiàn)或?qū)@治龇ā⒓夹g(shù)演化規(guī)律法、理論或數(shù)學(xué)模型法為主的定量方法,識(shí)別結(jié)果主要集中在技術(shù)的快速發(fā)展期或成熟期,針對(duì)顛覆性技術(shù)早期識(shí)別的研究較少。預(yù)先感知?jiǎng)倓偯妊康念嵏残约夹g(shù),可以掌握市場先機(jī)并進(jìn)行針對(duì)性地研發(fā),在技術(shù)競爭過程中占據(jù)先導(dǎo)地位。顛覆性技術(shù)發(fā)展初期,信號(hào)的信噪比較低,對(duì)于有征兆意義的弱信號(hào),需要運(yùn)用系統(tǒng)的方法在龐雜的信號(hào)中進(jìn)行掃描、篩選、甄別,才能輔助科技決策[3]。如何建立顛覆性技術(shù)探測的弱信號(hào)掃描體系,以實(shí)現(xiàn)顛覆性技術(shù)的早期識(shí)別,是提高顛覆性技術(shù)戰(zhàn)略政策感知預(yù)警能力的關(guān)鍵。

        目前,關(guān)于顛覆性技術(shù)的早期識(shí)別通常依賴于專家進(jìn)行人工判斷,隨著大數(shù)據(jù)規(guī)模呈指數(shù)級(jí)增長,專家們從各種信息來源中掃描預(yù)警信息變得越來越具有挑戰(zhàn)性,而弱信號(hào)探測全自動(dòng)化的研究處于起步階段,本文基于專利的弱信號(hào)探測模型與技術(shù)顛覆性潛力測度體系相結(jié)合的方法,進(jìn)行顛覆性技術(shù)早期識(shí)別。具體而言,基于目標(biāo)領(lǐng)域的專利數(shù)據(jù),利用LDA(latent Dirichlet allocation)主題模型抽取專利的研究主題,使用弱函數(shù)對(duì)研究主題進(jìn)行過濾,得到包含弱信號(hào)的主題,進(jìn)一步利用預(yù)兆函數(shù)對(duì)弱信號(hào)主題涉及的術(shù)語進(jìn)行過濾,結(jié)合語義分析得到弱信號(hào)術(shù)語集合,利用技術(shù)顛覆性潛力測度指標(biāo)體系對(duì)包含弱信號(hào)術(shù)語的專利進(jìn)行顛覆性潛力測度,最終識(shí)別出具有顛覆性潛力特征的技術(shù)。本文使用的弱信號(hào)探測模型與技術(shù)顛覆性潛力測度體系相結(jié)合的方法,為顛覆性技術(shù)的早期識(shí)別提供了一種可供參考的思路和方法。

        1 相關(guān)研究

        1.1 弱信號(hào)及探測方法

        與電子通信領(lǐng)域中“信號(hào)”的含義不同,情報(bào)學(xué)領(lǐng)域的“信號(hào)”側(cè)重于信息的語用維度,注重解讀信號(hào)的產(chǎn)生、信號(hào)包含的信息和趨勢等[4-5]。弱信號(hào)通常是指強(qiáng)度較弱、不易被感知和接收、攜帶著預(yù)示未來發(fā)展可能性的有效信息,隨著時(shí)間的推移可以演變?yōu)閺?qiáng)信號(hào),其表現(xiàn)出的變化和預(yù)兆既是一種機(jī)遇,也是一種威脅[4]。弱信號(hào)具有隱匿性和不確定性[6],針對(duì)弱信號(hào)的研究可獲得有關(guān)未來趨勢的關(guān)鍵信息,預(yù)防和控制可能發(fā)生的各類情形,抓住可能帶來的增益機(jī)會(huì),提前規(guī)避可能存在的風(fēng)險(xiǎn),為此各領(lǐng)域?qū)W者開展了關(guān)于弱信號(hào)的研究[7]。顛覆性技術(shù)在萌芽初期往往以主題間的微弱連接關(guān)系存在,而弱信號(hào)是識(shí)別這種弱關(guān)系的切入點(diǎn),通過弱信號(hào)分析可以使顛覆性技術(shù)的早期識(shí)別成為可能[6]。

        與“弱信號(hào)”相關(guān)的研究涉及計(jì)算機(jī)科學(xué)、社會(huì)科學(xué)、商業(yè)和管理等學(xué)科領(lǐng)域[7],其中與技術(shù)弱信號(hào)相關(guān)的研究是目前的熱點(diǎn)和難點(diǎn),眾多學(xué)者針對(duì)不同階段的技術(shù)開展了弱信號(hào)的相關(guān)研究[8],相關(guān)分析方法包括定性和定量兩種方法。弱信號(hào)的定性分析主要包括主觀感知、德爾菲法、環(huán)境掃描法、情景分析法等。該類分析方法以專家為核心進(jìn)行弱信號(hào)探測,常用于企業(yè)戰(zhàn)略規(guī)劃、行業(yè)或國家政策導(dǎo)向等實(shí)際應(yīng)用[4]。弱信號(hào)的定量分析主要包括文獻(xiàn)計(jì)量、專利計(jì)量、文本挖掘、模糊綜合評(píng)價(jià)法、突變理論、監(jiān)測模型、機(jī)器學(xué)習(xí)探測法等。利用機(jī)器學(xué)習(xí)方法進(jìn)行弱信號(hào)探測是當(dāng)前研究的熱點(diǎn)之一,該方法通過建立全自動(dòng)化的弱信號(hào)探測模型,較大程度排除了主觀方面的影響。在諸多方法中,利用文本挖掘技術(shù)進(jìn)行弱信號(hào)探測受到越來越多的學(xué)者關(guān)注。Yoon[9]基于Web新聞中的關(guān)鍵詞,利用文本挖掘方法構(gòu)建了關(guān)鍵詞畫像圖譜,從中識(shí)別出弱信號(hào)主題。主題模型方法是一種無監(jiān)督的機(jī)器學(xué)習(xí)技術(shù),其能夠不受人為干預(yù)獨(dú)立確定文本的研究主題。已有研究中,有學(xué)者使用LDA主題模型進(jìn)行弱信號(hào)檢測。Pépin等[10]基于推特?cái)?shù)據(jù),利用LDA方法動(dòng)態(tài)抽取其中的主題,并通過主題演化的桑基圖對(duì)弱信號(hào)進(jìn)行探測。Gutsche[11]使用LDA模型對(duì)弱信號(hào)的生命周期進(jìn)行跟蹤。

        1.2 顛覆性技術(shù)及識(shí)別方法

        顛覆性技術(shù)早期識(shí)別的主要目的是對(duì)處于潛伏期的技術(shù)進(jìn)行有效預(yù)判,盡早發(fā)現(xiàn)可能存在的顛覆性技術(shù),并針對(duì)該類技術(shù)進(jìn)行相應(yīng)的政策支持、風(fēng)險(xiǎn)防范和市場應(yīng)對(duì)等措施[12]。與顛覆性技術(shù)識(shí)別相關(guān)的概念包括突破性創(chuàng)新、新興主題等,相關(guān)概念如表1所示。

        表1 顛覆性技術(shù)相似概念對(duì)比

        在突破性創(chuàng)新識(shí)別的研究中,早期以專家評(píng)議等定性分析方法為主,后期隨著大規(guī)模數(shù)據(jù)分析工具及算法的出現(xiàn),定量分析方法逐漸成為突破性創(chuàng)新研究的主要方法[13],在實(shí)際研究過程中,圍繞突破性創(chuàng)新的特征、技術(shù)演化規(guī)律、產(chǎn)品效益與市場表現(xiàn)等開展相關(guān)識(shí)別研究。新興主題識(shí)別方法主要以文本挖掘和科學(xué)計(jì)量分析方法為主,前者借助自然語言處理方法挖掘科學(xué)文獻(xiàn)和專利文獻(xiàn)中的話題、關(guān)鍵詞或受控詞等,后者通常借助網(wǎng)絡(luò)分析方法對(duì)科技文獻(xiàn)元數(shù)據(jù)進(jìn)行分析[14]??傮w來看,突破性創(chuàng)新識(shí)別側(cè)重技術(shù)創(chuàng)新中的突破性,新興主題識(shí)別側(cè)重研究的新穎性,而顛覆性技術(shù)早期識(shí)別通常關(guān)注未來技術(shù)對(duì)現(xiàn)有技術(shù)與市場的顛覆性。

        常用的顛覆性技術(shù)識(shí)別方法大體可以分為4類:專家評(píng)議法、文獻(xiàn)或?qū)@治龇ā⒓夹g(shù)演化規(guī)律法和理論或數(shù)學(xué)模型法。其中,第1種偏向于定性研究,后3種偏向于定量研究。在研究的過程中,通常會(huì)結(jié)合不同類型方法,圍繞顛覆性技術(shù)的替代性、破壞性、突變性、跨界性、前沿性等特征[15]進(jìn)行預(yù)判和識(shí)別。

        第1類,專家評(píng)議法。該方法主要包括德爾菲法、問卷調(diào)查法、技術(shù)路線圖、情景分析法、技術(shù)定義法,是國家層面進(jìn)行顛覆性技術(shù)識(shí)別常用的方法。如美國、日本、英國等國家建立了單獨(dú)的研究部門對(duì)顛覆性技術(shù)的識(shí)別進(jìn)行研究,通常以需求為導(dǎo)向、以專家為核心進(jìn)行主觀預(yù)判和識(shí)別。此類方法在研究過程中需要大量的人力、物力,且很大程度上依賴于專家的個(gè)人經(jīng)驗(yàn)和主觀判斷,具有一定的局限性。Weissenberger-Eibl等[16]根據(jù)顛覆性創(chuàng)新過程,將技術(shù)路線圖和指標(biāo)預(yù)測相結(jié)合,構(gòu)建了一種顛覆性創(chuàng)新項(xiàng)目的綜合預(yù)判方法。

        第2類,文獻(xiàn)或?qū)@治龇?。該方法主要包括文獻(xiàn)計(jì)量、專利計(jì)量、文本挖掘等定量分析方法。該類方法主要以文獻(xiàn)或?qū)@麛?shù)據(jù)作為數(shù)據(jù)分析源,通過建立相應(yīng)的指標(biāo)、評(píng)判標(biāo)準(zhǔn),從客觀角度挖掘潛在的顛覆性技術(shù)。劉忠寶等[17]使用LDA-LSTM(latent Dirichlet allocation - long short term memory)文本分類算法,從論文和專利數(shù)據(jù)中抽取技術(shù)主題,構(gòu)建主題共現(xiàn)網(wǎng)絡(luò)并進(jìn)行主題突變探測,以達(dá)到顛覆性技術(shù)識(shí)別的目的。王康等[18]基于專利引用方向的變化,構(gòu)建了顛覆性技術(shù)識(shí)別方法。馬榮康等[19]比較專利之間的相似度,從專利的新穎性、獨(dú)特性和影響力3個(gè)方面進(jìn)行測度,構(gòu)建突破性技術(shù)發(fā)明的綜合識(shí)別方案。本文使用專利計(jì)量和文本挖掘相結(jié)合的方法,對(duì)專利信息進(jìn)行主題抽取、弱信號(hào)探測和技術(shù)顛覆性潛力測度,構(gòu)建一種基于弱信號(hào)的顛覆性技術(shù)早期識(shí)別方案。

        第3類,技術(shù)演化規(guī)律法。該方法包括TRIZ理論、技術(shù)生命周期、技術(shù)軌道、S曲線等方法。該類方法主要利用進(jìn)化法則、生命周期和S曲線等,通過識(shí)別當(dāng)前技術(shù)所處的發(fā)展階段預(yù)判未來可能的發(fā)展趨勢,以實(shí)現(xiàn)對(duì)顛覆性技術(shù)的識(shí)別。劉玉梅等[20]基于技術(shù)軌道躍遷和技術(shù)融合理論,對(duì)技術(shù)軌道中不同技術(shù)交叉融合形成的復(fù)雜關(guān)系網(wǎng)絡(luò)進(jìn)行分析,利用技術(shù)新穎度、差異度和融合度等特征判斷技術(shù)軌道的躍遷及躍遷程度,構(gòu)建了預(yù)測突破性技術(shù)的方法體系。

        第4類,理論或數(shù)學(xué)模型法。該方法主要包括層次分析法、突變理論、技術(shù)顛覆性風(fēng)險(xiǎn)預(yù)測模型等。此類方法主要用于識(shí)別處于成長期的顛覆性技術(shù),通過理論或數(shù)學(xué)模型進(jìn)行顛覆性技術(shù)的未來預(yù)判。相較于其他方法,理論或數(shù)學(xué)模型法更容易操作、預(yù)測周期短,但需要對(duì)模型使用的數(shù)據(jù)進(jìn)行高效獲取和處理。侯廣輝等[21]構(gòu)建了顛覆性技術(shù)突變級(jí)數(shù)模型,并根據(jù)評(píng)估指標(biāo)體系搜集專家評(píng)估數(shù)據(jù)進(jìn)行顛覆性技術(shù)的識(shí)別和評(píng)估工作。Chen等[22]提出了一個(gè)基于機(jī)器學(xué)習(xí)的判別模型用于識(shí)別潛在的顛覆性技術(shù)。

        上述研究為本文顛覆性技術(shù)的弱信號(hào)識(shí)別提供了借鑒和參考,但前期的研究依賴于具有豐富經(jīng)驗(yàn)的專家的直觀判斷,服務(wù)成本較高,不同專家可能提供不同的判斷結(jié)果。同時(shí),包括論文和專利在內(nèi)的科技大數(shù)據(jù)呈現(xiàn)爆炸式增長,幾乎不可能完全依賴專家對(duì)顛覆性技術(shù)進(jìn)行掃描和判斷?,F(xiàn)有針對(duì)顛覆性技術(shù)的弱信號(hào)識(shí)別研究尚比較缺乏,特別是基于技術(shù)信息的內(nèi)在主題特征進(jìn)行弱信號(hào)識(shí)別的研究仍需進(jìn)一步深入。本文采用LDA主題模型方法對(duì)目標(biāo)領(lǐng)域的弱信號(hào)進(jìn)行探測,有助于從技術(shù)本質(zhì)特征出發(fā)對(duì)早期顛覆性技術(shù)進(jìn)行識(shí)別。

        2 研究方法

        本文基于專利的弱信號(hào)探測模型與技術(shù)顛覆性潛力測度體系相結(jié)合的方法,進(jìn)行顛覆性技術(shù)早期識(shí)別。首先,對(duì)目標(biāo)領(lǐng)域的專利信息進(jìn)行弱信號(hào)探測,具體過程如下:利用LDA主題模型對(duì)領(lǐng)域的專利數(shù)據(jù)進(jìn)行主題抽取,再利用弱函數(shù)過濾抽取到的主題,得到包含弱信號(hào)的主題集合,進(jìn)一步利用預(yù)兆函數(shù)過濾弱信號(hào)主題涉及的術(shù)語,得到弱信號(hào)術(shù)語集合。其次,基于技術(shù)顛覆性潛力測度體系,對(duì)包含弱信號(hào)術(shù)語的專利進(jìn)行顛覆性潛力測度,得到具有顛覆性技術(shù)潛力的技術(shù),為目標(biāo)領(lǐng)域的顛覆性技術(shù)早期識(shí)別提供參考。顛覆性技術(shù)早期識(shí)別技術(shù)路線如圖1所示。

        圖1 顛覆性技術(shù)早期識(shí)別技術(shù)路線

        2.1 LDA主題模型

        LDA主題模型主要由數(shù)據(jù)預(yù)處理、模型訓(xùn)練和結(jié)果輸出構(gòu)成[23]。數(shù)據(jù)預(yù)處理部分主要通過去除噪聲和無關(guān)數(shù)據(jù)、去除停用詞等方式,對(duì)專利數(shù)據(jù)進(jìn)行清洗和分詞處理。LDA主題模型訓(xùn)練中的主要問題是主題數(shù)的確定,本文選用關(guān)鵬等[24]提出的PV(perplexity-var)指標(biāo),基于主題相似度和困惑度進(jìn)行模型最優(yōu)主題數(shù)的確定。模型的輸入為經(jīng)過預(yù)處理的專利文本數(shù)據(jù),輸出結(jié)果為專利信息的主題提取結(jié)果,如主題對(duì)應(yīng)的詞匯、專利與主題對(duì)應(yīng)的概率等。下文將對(duì)模型訓(xùn)練中主題數(shù)確定PV指標(biāo)進(jìn)行詳述。

        (1)困惑度。困惑度是評(píng)估一個(gè)語言模型優(yōu)劣的指標(biāo),困惑度越低,表示模型對(duì)文本的解釋效果越好。通常隨著主題數(shù)的增加,困惑度呈先遞減后遞增的趨勢,常用于判斷最優(yōu)主題數(shù)的“手肘法”便是根據(jù)該趨勢進(jìn)行主題數(shù)的判斷。在LDA主題模型中,困惑度的計(jì)算公式為

        其中,D表示專利文獻(xiàn)集,共計(jì)M篇專利文獻(xiàn);wd表示專利文獻(xiàn)d中的詞匯;p(wd)表示專利文獻(xiàn)中wd產(chǎn)生的概率;Nd表示專利文獻(xiàn)d中的單詞數(shù)量。

        (2)主題相似度。主題相似度是指模型得到的主題結(jié)果中,不同主題間的相似程度和辨識(shí)度。主題相似度越低,代表模型對(duì)主題的區(qū)分度越高。本文選取滿足對(duì)稱性和三角不等式的JS(Jensen-Shan‐non)散度作為主題相似度的度量方法[25]。為衡量主題空間的整體差異性,引入隨機(jī)變量方差概念構(gòu)建主題方差指標(biāo)。主題方差越大,表示主題之間的差異性越大,區(qū)分度越高,主題的結(jié)構(gòu)越穩(wěn)定。主題方差以JS散度為基礎(chǔ),計(jì)算每個(gè)主題與其均值間距離平方和的平均數(shù),計(jì)算公式為

        其中,T表示LDA模型中的主題;K表示主題數(shù)量;DJS表示JS散度;表示主題-詞概率分布?的均值。

        (3)PV指標(biāo)。PV指標(biāo)結(jié)合了困惑度和主題方差,當(dāng)困惑度越小、主題方差越大時(shí),PV值達(dá)到最小。此時(shí),對(duì)應(yīng)的主題數(shù)使LDA主題模型效果達(dá)到最優(yōu),計(jì)算公式為

        其中,D表示專利文獻(xiàn)集;Perplexity(D)表示數(shù)據(jù)集D的困惑度;Var(T)表示數(shù)據(jù)集的主題方差。

        在進(jìn)行LDA主題模型訓(xùn)練過程中,通過計(jì)算PV指標(biāo),選取該指標(biāo)最小時(shí)對(duì)應(yīng)的主題數(shù)作為最優(yōu)主題數(shù),以確保主題提取達(dá)到最優(yōu)效果。

        2.2 弱信號(hào)技術(shù)識(shí)別

        弱信號(hào)通常是指強(qiáng)度較弱、不易被感知和接收、攜帶著預(yù)示未來發(fā)展可能性的有效信息,是一種未來趨勢和系統(tǒng)不連續(xù)的跡象,未來可能產(chǎn)生較大變化和影響[9]。基于弱信號(hào)的概念與特征,本文考慮使用一種全自動(dòng)弱信號(hào)探測方法進(jìn)行弱信號(hào)識(shí)別[26]。一般來說,主題(topic)由不同的術(shù)語(term)概括而來。本文通過對(duì)包含弱信號(hào)的主題進(jìn)行過濾,抽取出潛在的弱信號(hào)術(shù)語。弱信號(hào)探測過程如下:首先,通過弱函數(shù)過濾目標(biāo)領(lǐng)域的專利信息主題集合,得到包含弱信號(hào)的主題集合;其次,利用預(yù)兆函數(shù)過濾弱信號(hào)主題下的術(shù)語,提取具有弱信號(hào)特征的術(shù)語集合;最后,利用word2vec模型分析弱信號(hào)術(shù)語的上下文,計(jì)算詞向量間的余弦相似度并排序,得到與弱信號(hào)術(shù)語語義相關(guān)的單詞列表。最終弱信號(hào)術(shù)語和語義相關(guān)詞的集合為弱信號(hào)詞匯集合,與弱信號(hào)詞匯集合相關(guān)的專利為弱信號(hào)技術(shù)集合。

        一方面,與依賴專家提取關(guān)鍵詞進(jìn)行的弱信號(hào)檢測的研究[9]不同,本文采用的方法不需要人工專家干預(yù)即可自動(dòng)探測全文文本中的微弱信號(hào);另一方面,主題模型從文檔中提取主題信息,考慮的不僅僅是單獨(dú)的詞匯或關(guān)鍵詞,還有詞匯與文檔之間的語義信息。El Akrouchi等[26]認(rèn)為,主題分類得到的結(jié)果中,每一主題下的術(shù)語強(qiáng)弱程度均取決于其所屬主題的強(qiáng)弱,即弱信號(hào)主題中的術(shù)語詞匯更可能成為弱信號(hào)。因此,在弱信號(hào)探測過程中,先進(jìn)行弱信號(hào)主題過濾,再對(duì)過濾后主題下的術(shù)語詞匯進(jìn)行過濾,提取潛在的弱信號(hào)。

        (1)主題過濾

        本文使用由Logistic函數(shù)推導(dǎo)的一種弱函數(shù)(weakness,WK)進(jìn)行主題過濾[26]。該函數(shù)由接近中心性、主題權(quán)重和自相關(guān)函數(shù)組成。S形曲線是識(shí)別技術(shù)生命周期階段的一種經(jīng)典模型,其中Lo‐gistic曲線可用于模擬語言的變化,如對(duì)邊緣術(shù)語隨時(shí)間變化的傳播速度、范圍增長或變化趨勢進(jìn)行模擬,經(jīng)研究適用于快速、明顯增長的技術(shù)生命周期預(yù)測[27]。Logistic函數(shù)中的較低值可代表主題以及術(shù)語的稀有性,通過研究這些較低值能夠?qū)崿F(xiàn)技術(shù)生命周期發(fā)展階段前期的微弱信號(hào)檢測,即對(duì)未來可能快速發(fā)展的技術(shù)實(shí)現(xiàn)早期信號(hào)檢測。下文將對(duì)弱函數(shù)WK包含的3項(xiàng)度量指標(biāo)進(jìn)行詳述。

        第1個(gè)度量指標(biāo)是接近中心性,指的是一個(gè)主題與其他主題之間的距離,通過兩個(gè)主題間的距離描述主題之間的相似性?;谝粋€(gè)距離測量必須呈現(xiàn)一個(gè)基于S形的變化這一原理[10],使用海林格距離(Hellinger distance)進(jìn)行主題距離的測量,該指標(biāo)在概率和統(tǒng)計(jì)學(xué)中用于衡量兩個(gè)概率分布之間的相似性,計(jì)算公式為

        其中,d為海林格距離;t為主題。

        第2個(gè)度量指標(biāo)是主題權(quán)重,指基于連貫性表達(dá)的主題t在所有主題中的重要性程度,計(jì)算公式為

        其中,Coh(t)為主題t的連貫性。

        第3個(gè)度量指標(biāo)是“自相關(guān)性”指標(biāo),指同一變量在不同時(shí)間段觀測值之間的關(guān)系,是一種趨勢分析。自相關(guān)指時(shí)間序列和自身滯后的版本線性相關(guān),本文對(duì)主題相關(guān)的專利頻率隨時(shí)間的變化進(jìn)行自相關(guān)分析,目的是評(píng)估一段時(shí)間后該主題在專利頻率方面的變化情況。該指標(biāo)用于過濾掉不包含弱信號(hào)的主題,計(jì)算公式為

        其中,Cov(t)k為主題t在滯后時(shí)間k處的協(xié)方差。

        綜合以上3個(gè)指標(biāo),定義主題t的弱函數(shù)公式為

        在弱信號(hào)的定義中,稀有性、隱匿性和不確定性等是弱信號(hào)的主要特征。因此,主題對(duì)應(yīng)的弱函數(shù)WK數(shù)值越低,表現(xiàn)出的信號(hào)就越弱,此類具有低函數(shù)值的主題可以被認(rèn)為是具有弱信號(hào)特征的主題。為減少噪聲影響,過濾出信號(hào)強(qiáng)度較弱的主題,將WK函數(shù)計(jì)算數(shù)值在區(qū)間[1%,10%]的主題視為包含弱信號(hào)的主題[26]。

        (2)術(shù)語過濾

        通過主題過濾提取包含弱信號(hào)的主題,但每個(gè)主題內(nèi)包含的術(shù)語較多且不一定全部具有弱信號(hào)特征。同時(shí),主題中術(shù)語的概率和出現(xiàn)頻率并不相同,不能保證與主題最相關(guān)的術(shù)語具有相應(yīng)的弱信號(hào)。因此,在進(jìn)行主題過濾后需再進(jìn)行術(shù)語過濾,從中提取包含弱信號(hào)的術(shù)語集合。在術(shù)語過濾部分,仍以Logistic函數(shù)為理論基礎(chǔ),通過術(shù)語及其對(duì)應(yīng)主題的概率和頻率,建立與術(shù)語相關(guān)的預(yù)兆函數(shù)PW[26],計(jì)算公式為

        其中,w為術(shù)語;NF(w)為對(duì)應(yīng)主題中的術(shù)語w的歸一化頻率;?(w)為從LDA模型獲得相應(yīng)主題中的術(shù)語w的概率。基于弱信號(hào)特征,在術(shù)語過濾部分,提取PW函數(shù)值處于區(qū)間[1%,10%]的術(shù)語作為具備弱信號(hào)特征的術(shù)語集合[26]。

        (3)結(jié)果輸出

        在進(jìn)行主題過濾和術(shù)語過濾后,得到弱信號(hào)術(shù)語集合,通過對(duì)弱信號(hào)術(shù)語進(jìn)行上下文分析得到術(shù)語語義相關(guān)詞集合。使用基于神經(jīng)網(wǎng)絡(luò)的word2vec[26]模型分析術(shù)語語義相關(guān)詞,該模型通過將數(shù)據(jù)集中的單詞表示為向量,捕捉單詞的上下文并進(jìn)行重構(gòu),使語料庫中共享相同上下文的詞匯在語義空間中更加接近,最終獲取與弱信號(hào)術(shù)語語義相關(guān)的單詞集合。

        2.3 技術(shù)顛覆性潛力測度體系

        以往研究中,李乾瑞等[28]基于專利視角,從技術(shù)的融合性、新穎性、擴(kuò)張性和影響力4個(gè)維度,運(yùn)用熵權(quán)法和模糊一致性矩陣方法,構(gòu)建了一套系統(tǒng)的顛覆性技術(shù)識(shí)別模型,并通過在5個(gè)技術(shù)領(lǐng)域開展的實(shí)證研究,驗(yàn)證了模型的可行性以及各技術(shù)顛覆性潛力指數(shù)的有效性和適用性。本文參考李乾瑞等[28]提出的四維技術(shù)顛覆性潛力測度指標(biāo)體系,增加技術(shù)突變性特征維度形成五維顛覆性潛力測度指標(biāo)體系,對(duì)包含弱信號(hào)術(shù)語的專利集合進(jìn)行顛覆性潛力測度,探測其中具有顛覆性潛力的技術(shù),以實(shí)現(xiàn)顛覆性技術(shù)的早期識(shí)別。技術(shù)顛覆性潛力測度指標(biāo)體系由5個(gè)維度構(gòu)成,每一個(gè)維度代表一個(gè)顛覆性技術(shù)特征,分別為技術(shù)集成性、技術(shù)創(chuàng)新性、技術(shù)成長性、技術(shù)影響力和技術(shù)突變性。通過綜合分析技術(shù)的顛覆性潛力測度值,評(píng)估某類技術(shù)所具有的顛覆性程度。顛覆性技術(shù)測度模型的指標(biāo)計(jì)算公式具體闡述如下。

        (1)技術(shù)集成性測度[28]。技術(shù)集成性是指數(shù)根據(jù)多樣性、差異性和均勻度3個(gè)維度進(jìn)行加權(quán)擬合,測度技術(shù)領(lǐng)域多樣性和領(lǐng)域內(nèi)知識(shí)信息交叉融合與集成程度。

        不同技術(shù)類別的平均數(shù)目(average number,AN):通過專利中包含的技術(shù)類別數(shù)量,衡量技術(shù)多樣性程度。多樣性程度越高,表明技術(shù)涉及的理論基礎(chǔ)與學(xué)科越豐富,集成性越高。

        其中,n為專利中對(duì)應(yīng)的技術(shù)類別平均數(shù)目;N為領(lǐng)域?qū)@麛?shù)量。

        不同技術(shù)的平均距離(average distance,AD):通過測度不同技術(shù)類別性質(zhì)的差異程度,衡量技術(shù)領(lǐng)域的差異程度。技術(shù)領(lǐng)域內(nèi)不同技術(shù)的差異程度越高,表明該領(lǐng)域涉及的研究方向越豐富,集成性越高。

        其中,n為技術(shù)類別的數(shù)目;Sij為類別i和j的相似度。

        技術(shù)類別分布的均衡度:用“1-基尼系數(shù)(Gini coefficient,GC)”進(jìn)行計(jì)算,對(duì)技術(shù)分布的均勻程度進(jìn)行有效測度。基尼系數(shù)計(jì)算公式為

        其中,xi為屬于第i個(gè)技術(shù)類別的專利數(shù)量;技術(shù)類別的排序依據(jù)xi的數(shù)值從小到大排列;i為此序列的序列號(hào)。

        (2)技術(shù)創(chuàng)新性測度[28]。技術(shù)創(chuàng)新性指數(shù)根據(jù)技術(shù)獨(dú)創(chuàng)性、原創(chuàng)性和科學(xué)關(guān)聯(lián)度3個(gè)維度進(jìn)行綜合加權(quán)擬合,測度技術(shù)的創(chuàng)新性。

        技術(shù)獨(dú)創(chuàng)性(distinctive level,DL):反映專利依賴本領(lǐng)域技術(shù)的程度。DL值越大,表示該技術(shù)依賴本領(lǐng)域技術(shù)進(jìn)行創(chuàng)新的程度越高,越可能擁有相對(duì)獨(dú)立的技術(shù)發(fā)展理論體系。

        其中,N為該領(lǐng)域?qū)@麛?shù)量;CPi(cited patent col‐lection)為專利i后向引用文獻(xiàn)集合;P(patent col‐lection)為該領(lǐng)域的專利集合。

        技術(shù)原創(chuàng)性(originality level,OL):反映專利包含未出現(xiàn)的分類號(hào)數(shù)目。OL值越大,表示在一定時(shí)間內(nèi)出現(xiàn)的該類技術(shù)包含之前未出現(xiàn)過的分類號(hào)數(shù)量越多,即該技術(shù)的原創(chuàng)程度越高,創(chuàng)新性越高。

        其中,N為該領(lǐng)域的專利數(shù)量;IPCAi為專利i的分類號(hào)組合的集合;IPCBi為在專利i申請年份之前出現(xiàn)的分類號(hào)組合的集合。

        科學(xué)關(guān)聯(lián)度(scientific relevance,SR):反映領(lǐng)域內(nèi)專利引用科技文獻(xiàn)的數(shù)量。該指標(biāo)用于衡量專利技術(shù)和基礎(chǔ)科學(xué)研究的關(guān)系強(qiáng)弱和影響強(qiáng)度[29],有研究表明,基礎(chǔ)知識(shí)對(duì)技術(shù)創(chuàng)新具有廣泛影響且是顛覆性技術(shù)的重要來源[30]。SR值越大,表示該專利引用科技文獻(xiàn)的數(shù)量越多,與基礎(chǔ)知識(shí)和基礎(chǔ)研究的關(guān)聯(lián)性越強(qiáng),越有可能成為顛覆性技術(shù)。

        其中,N為該領(lǐng)域?qū)@麛?shù)量;Pi為專利i引用的科學(xué)文獻(xiàn)的數(shù)量。

        (3)技術(shù)成長性測度[28]。技術(shù)成長性指數(shù)根據(jù)技術(shù)生長率、技術(shù)擴(kuò)張性和技術(shù)覆蓋比率3個(gè)維度進(jìn)行加權(quán)擬合。

        技術(shù)生長率(growth rate,GR):反映技術(shù)隨時(shí)間變化的專利申請數(shù)量的增長程度。GR值越大,表示技術(shù)成長性越強(qiáng)。

        其中,Y為測度時(shí)間長度(單位:年);Ni和Nj分別為第i年和第j年的專利申請數(shù)量。

        技術(shù)擴(kuò)張性(expansionary rate,ER):反映技術(shù)隨時(shí)間變化的專利申請對(duì)應(yīng)分類號(hào)的數(shù)量。ER值越大,表示技術(shù)跨領(lǐng)域的擴(kuò)張性越強(qiáng),成長性越強(qiáng)。

        其中,Y為測度時(shí)間長度(單位:年);IPCi和IPCi-1分別為第i年和第i-1年專利申請對(duì)應(yīng)的分類號(hào)數(shù)量,i=(1,2,…,Y)。

        技術(shù)覆蓋比率(coverage ratio,CR):反映專利涉及的技術(shù)類別。CR值越大,表示該專利涉及技術(shù)的類別越多,適應(yīng)性越強(qiáng),成長性越強(qiáng)。

        其中,N為該領(lǐng)域?qū)@麛?shù)量,IPCi為專利i對(duì)應(yīng)的分類號(hào)數(shù)量。

        (4)技術(shù)影響力測度[28]。技術(shù)影響力指數(shù)根據(jù)即時(shí)影響、平均后向引文率和前向引用分布類別3個(gè)維度進(jìn)行加權(quán)擬合。

        即時(shí)影響指數(shù)(current impact index,CII):反映近5年內(nèi)專利對(duì)技術(shù)創(chuàng)新的影響程度。CII值越大,表示該專利對(duì)技術(shù)創(chuàng)新的影響程度越高,當(dāng)前階段的影響力越強(qiáng),表明該專利具有一定的顛覆性。

        其中,Y為測度時(shí)間段(單位:年);Ni和Nj分別為第i年和第j年專利的申請量;NCij為第j年專利引用第i年專利的數(shù)量;NCj為第j年以前的專利被本領(lǐng)域?qū)@玫臄?shù)量;SNj為第j年以前專利的數(shù)量。

        平均前向引文率(average citing rate,ACR):該指標(biāo)表示在相應(yīng)領(lǐng)域內(nèi)專利被后續(xù)專利引用的程度。ACR值越大,表示專利對(duì)技術(shù)的影響力越大。

        其中,N為該領(lǐng)域?qū)@麛?shù)量;NCi為專利i被后續(xù)專利引用的數(shù)量。

        前向引用分布類別(citing distribution category,CDC):也稱前向引用專利類別數(shù),反映一類技術(shù)對(duì)于其他類別技術(shù)的影響程度。CDC值越大,表示該類技術(shù)對(duì)其他類別的技術(shù)影響程度越高,跨領(lǐng)域影響力越大。

        其中,Num(citing)為前向引用專利的類別數(shù)量。

        (5)技術(shù)突變性測度[29-31]。技術(shù)突變性指數(shù)根據(jù)技術(shù)突變可能性、新技術(shù)類別頻次突變率、重復(fù)技術(shù)類別頻次突變率3個(gè)維度進(jìn)行加權(quán)擬合。技術(shù)突變性越大,成為顛覆性技術(shù)的潛力越大。

        技術(shù)突變可能性(mutation possibility,MP)[31]:該指標(biāo)結(jié)合詞突發(fā)檢測算法[32]和基于重復(fù)關(guān)鍵詞的主題突變程度[30],測度弱信號(hào)術(shù)語對(duì)應(yīng)技術(shù)類別的突變可能性。MP值越大,表示該類技術(shù)術(shù)語頻次突變程度越大;技術(shù)突變性越高,越具有成為顛覆性技術(shù)的潛力。

        其中,t為弱信號(hào)術(shù)語;TFt代表弱信號(hào)術(shù)語t在某一時(shí)段內(nèi)出現(xiàn)的頻次;代表弱信號(hào)術(shù)語t在研究區(qū)間內(nèi)出現(xiàn)頻次的平均值;TFSt代表弱信號(hào)術(shù)語t在研究區(qū)間內(nèi)出現(xiàn)頻次的標(biāo)準(zhǔn)差。

        新技術(shù)類別頻次突變率(new frequency muta‐tion rate,NM)[30]:反映測度時(shí)間段內(nèi),一類技術(shù)中新出現(xiàn)的技術(shù)類別突變程度。新技術(shù)類別頻次突變率越高,表明技術(shù)涉及的新學(xué)科和新分類越多,技術(shù)突變性越高。

        其中,Y為測度時(shí)間段(單位:年);IPCi和IPCi-1分別為第i年和第i-1年專利申請對(duì)應(yīng)的分類號(hào)種類,i=(1,2,…,Y);IF代表相應(yīng)分類號(hào)出現(xiàn)的頻次。

        重復(fù)技術(shù)類別頻次突變率(repeat frequency mu‐tation Rate,RM)[30]:反映測度時(shí)間段內(nèi),一類技術(shù)中重復(fù)出現(xiàn)的技術(shù)類別突變程度。重復(fù)技術(shù)類別頻次突變率越高,表明該類技術(shù)在相同學(xué)科與分類的研究中變化程度越大,技術(shù)突變性越高。

        其中,Y為測度時(shí)間段(單位:年);IPCi和IPCi-1分別為第i年和第i-1年專利申請對(duì)應(yīng)的分類號(hào)種類,i=(1,2,…,Y);IF代表相應(yīng)分類號(hào)出現(xiàn)的頻次。

        3 實(shí)證研究

        3.1 數(shù)據(jù)獲取與清洗

        本文以基因編輯領(lǐng)域的專利作為研究樣本,專利檢索數(shù)據(jù)庫為incoPat專利數(shù)據(jù)庫?;蚓庉嫾夹g(shù)已成為生命科學(xué)領(lǐng)域重要的顛覆性技術(shù)之一,為生物學(xué)研究、醫(yī)學(xué)治療領(lǐng)域帶來了革命性的變化。該技術(shù)通過定點(diǎn)修飾或修改基因組及其轉(zhuǎn)錄產(chǎn)物實(shí)現(xiàn)高效、精確的基因工程,在基因治療、核酸診斷和建立細(xì)胞、動(dòng)物疾病模型方面具有極其重要的價(jià)值。CRISPR/Cas9技術(shù)的出現(xiàn)更是引起了廣泛關(guān)注,甚至曾兩次榮登Science“年度十大科學(xué)突破”[33]。為了獲得基因編輯領(lǐng)域技術(shù)的專利文獻(xiàn),通過查閱文獻(xiàn)、閱讀相關(guān)研究報(bào)告、時(shí)事新聞等對(duì)基因編輯領(lǐng)域進(jìn)行技術(shù)分解,構(gòu)建基因編輯領(lǐng)域的專利檢索式。具體而言,根據(jù)基因編輯領(lǐng)域技術(shù)所涉及的代表性技術(shù)及其特征詞匯,以及基因編輯領(lǐng)域技術(shù)所涉及的其他相關(guān)詞匯,構(gòu)建專利數(shù)據(jù)庫檢索表達(dá)式:

        (TIABC=(“gene edit*” OR “genome edit*” OR“ZFN” OR “zinc finger nucleases” OR “TALEN” OR“transcription activator like effector nucleases” OR “CRIS‐PR” OR “clustered regularly interspaced short palindromic repeats” OR “Cas9”) OR DES=(“gene edit*” OR “ge‐nome edit*” OR “ZFN” OR “zinc finger nucleases” OR“TALEN” OR “transcription activator like effector nucleas‐es” OR “CRISPR” OR “clustered regularly interspaced short palindromic repeats” OR “Cas9”)OR TIABC=(“gene targeting” OR “gene knock in” OR “gene re‐pair” OR “targeted gene repair” OR“gene therapy” OR“Synthetic genomics” OR “human genome project”) OR(TIABC=(“gene” OR “genome”) AND TIABC=(“Syn‐thia” OR “CAGE” OR “CAR-T” OR “YOGE” OR“Yeast oligo-mediated genome engineering”O(jiān)R “Chimeric Antigen Receptor T-Cell Immunotherapy” OR “CERES”O(jiān)R “CROP-seq")))

        在構(gòu)建檢索表達(dá)式的過程中,使用了專利TIA‐BC(標(biāo)題title、摘要abstract、權(quán)利要求claims)及專利DES(說明書description)兩種方式進(jìn)行了檢索。其中,對(duì)于“gene edit”“ZFN”“CRISPR”等基因編輯領(lǐng)域的核心詞匯,為了提高專利查全率,同時(shí)采用TIABC及DES兩種方式對(duì)專利進(jìn)行了檢索。此外,為了提高專利查準(zhǔn)率,對(duì)于“gene tar‐geting”“CAGE”等頻繁出現(xiàn)在其他領(lǐng)域的關(guān)鍵詞或非基因編輯領(lǐng)域?qū)S械脑~匯,僅通過TIABC對(duì)專利進(jìn)行數(shù)據(jù)檢索。檢索時(shí)間為2020年1月23日,初步的數(shù)據(jù)檢索結(jié)果為,1988—2019年共獲得基因編輯領(lǐng)域?qū)@?8338件。檢索到的專利數(shù)據(jù)內(nèi)容包括標(biāo)題、摘要、說明書、申請時(shí)間、專利引文和非專利引文等。為了使各年專利數(shù)據(jù)的數(shù)量滿足主題抽取、主題過濾的效果以及技術(shù)顛覆性潛力指標(biāo)計(jì)算的要求,本文選取2008—2019年的專利數(shù)據(jù)作為研究數(shù)據(jù)樣本集合,專利的年代分布情況如圖2所示。專利數(shù)據(jù)的預(yù)處理主要分為數(shù)據(jù)清洗和文本處理兩個(gè)部分:刪除重復(fù)、摘要缺失和非英文語言的專利信息后,獲得共計(jì)35687件專利的信息;通過分詞(tokenization)、大寫字母轉(zhuǎn)換為小寫、去除停用詞等處理,將上述專利信息中的題目和摘要處理為由單詞組成的文本信息,便于后續(xù)研究使用。

        圖2 專利數(shù)據(jù)的年份分布

        3.2 專利數(shù)據(jù)的弱信號(hào)分析

        3.2.1 LDA主題抽取

        對(duì)LDA主題模型進(jìn)行訓(xùn)練,尋找最優(yōu)主題數(shù)用于專利數(shù)據(jù)的主題抽取。從經(jīng)過預(yù)處理的專利數(shù)據(jù)中隨機(jī)抽取25000條文本信息作為訓(xùn)練集,獲取54385個(gè)單詞建立詞典并計(jì)算文本向量。主題數(shù)的取值范圍設(shè)置為[1,50],以步長為1進(jìn)行LDA主題抽取,分別計(jì)算不同主題數(shù)下的困惑度、主題方差和PV值。綜合考慮3種指標(biāo)結(jié)果以及后續(xù)的主題過濾,確定30作為LDA主題模型中的主題數(shù)量。在該數(shù)量的主題下,最重要的PV指標(biāo)處于較低值,困惑度趨于最低,主題方差處于較大值。根據(jù)確定的主題數(shù),對(duì)專利數(shù)據(jù)進(jìn)行逐年主題抽取。以2019年專利數(shù)據(jù)主題抽取為例,選擇該年份對(duì)應(yīng)的專利數(shù)據(jù)作為模型的輸入信息,2019年預(yù)處理后的專利信息共計(jì)11983條?;谠撃甑膶@畔⒂?jì)算文本向量,再通過開源Python庫gensim中的LDA模型方法進(jìn)行主題建模。其中,主題數(shù)設(shè)置為30個(gè),每個(gè)主題下獲取100個(gè)術(shù)語(term)。

        3.2.2 專利數(shù)據(jù)的主題過濾

        通過專利所屬主題的概率和主題詞頻率進(jìn)行相關(guān)指標(biāo)計(jì)算,以年為單位使用弱函數(shù)WK進(jìn)行主題過濾。第1個(gè)指標(biāo)貼近中心性CC主要通過海林格距離計(jì)算主題t與其他主題間的距離,基于LDA主題模型中獲得的主題-詞概率分布,分別計(jì)算一個(gè)主題和其他主題間的距離,得到每一個(gè)主題對(duì)應(yīng)的接近中心性。第2個(gè)指標(biāo)主題權(quán)重W基于LDA主題模型中得到主題所具有的連貫性進(jìn)行計(jì)算,該指標(biāo)使用gensim中計(jì)算連貫性的方法。根據(jù)得到的每個(gè)主題的連貫性和總體主題的連貫性確定所計(jì)算主題的權(quán)重,得到每個(gè)主題對(duì)應(yīng)的主題權(quán)重。第3個(gè)指標(biāo)是自相關(guān)函數(shù)AC,該函數(shù)描述了一個(gè)變量在不同時(shí)間段觀測值的變化。在本文中,每個(gè)主題對(duì)應(yīng)的文檔頻率,即主題對(duì)應(yīng)的專利頻率隨著時(shí)間不斷變化,選用每個(gè)主題在不同月份的專利頻率進(jìn)行自相關(guān)函數(shù)的計(jì)算。將每一年的專利數(shù)據(jù)按月進(jìn)行自相關(guān)計(jì)算,滯后時(shí)間選擇6個(gè)月。

        在對(duì)以上3個(gè)指標(biāo)進(jìn)行計(jì)算后,結(jié)合3個(gè)指標(biāo)的結(jié)果進(jìn)行弱函數(shù)WK(t)的計(jì)算。在El Akrouchi等[26]提出的弱信號(hào)識(shí)別模型中,閾值為區(qū)間[1%,10%]的信號(hào)構(gòu)成弱信號(hào)函數(shù)值范圍。以1%作為下限的原因是在該函數(shù)值以下的信號(hào)未來可能成為弱信號(hào),但是包含了較多噪聲,出現(xiàn)有意義的詞匯的概率較小。以10%作為上限的原因是該閾值內(nèi)獲得的函數(shù)值較低,且能夠獲取到有意義的弱信號(hào)集合。本文結(jié)合專利主題計(jì)算得到的弱函數(shù)結(jié)果以及對(duì)比不同閾值主題過濾結(jié)果,最后選擇弱函數(shù)結(jié)果在閾值區(qū)間[5%,10%]的主題作為該年包含弱信號(hào)的主題。由于噪聲通常在0%~5%變化[26],提高上限至5%是為了過濾掉更多噪聲。

        通過弱信號(hào)閾值對(duì)每年的主題函數(shù)值進(jìn)行篩選,得到逐年的弱信號(hào)主題。以2008年專利數(shù)據(jù)的主題過濾結(jié)果為例,展示弱信號(hào)主題的篩選結(jié)果。由圖3可以看出,在2008年的30個(gè)主題中,有1個(gè)主題在弱信號(hào)的閾值內(nèi),即T21,該主題的弱函數(shù)WK值高于5%且低于10%。

        圖3 2008年專利數(shù)據(jù)的主題過濾結(jié)果

        通過弱信號(hào)探測模型對(duì)2008—2018年的專利信息進(jìn)行弱信號(hào)探測,得到每一年的弱信號(hào)主題分別為T21(2008年)、T21(2009年)、T8(2010年)、T11(2011年)、T18(2012年)、T25(2013年)、T7(2014年)、T29(2015年)、T26(2016年)、T18(2017年)、T1(2018年),共計(jì)11個(gè)弱信號(hào)主題。

        3.2.3 專利數(shù)據(jù)的術(shù)語過濾

        針對(duì)從2008—2018年共計(jì)330個(gè)主題過濾得到的11個(gè)包含弱信號(hào)的主題,對(duì)每一個(gè)主題下的100個(gè)術(shù)語進(jìn)行弱信號(hào)篩選,得到每年的弱信號(hào)術(shù)語。該部分的輸入為術(shù)語、術(shù)語頻率,分別對(duì)每一個(gè)主題下的每一個(gè)術(shù)語進(jìn)行預(yù)兆函數(shù)PW的計(jì)算,根據(jù)LDA模型得到的術(shù)語概率,計(jì)算術(shù)語在對(duì)應(yīng)主題中的歸一化頻率,得到該術(shù)語的預(yù)兆函數(shù)值。其中,對(duì)于術(shù)語在主題中的歸一化頻率的計(jì)算,需要統(tǒng)計(jì)該主題下的專利數(shù)據(jù)總量和主題中術(shù)語的文檔頻率。參考3.2.2節(jié)中的主題過濾方法,本節(jié)的術(shù)語過濾同樣需要進(jìn)行弱信號(hào)閾值調(diào)整。由于潛在警告函數(shù)PW值均較小,[1%,10%]這一閾值無法過濾出弱信號(hào)術(shù)語,直至將上限提升至30%時(shí),2008—2018年每一年均可獲得弱信號(hào)術(shù)語。

        通過開源Python庫gensim中的word2vec模型對(duì)術(shù)語過濾結(jié)果進(jìn)行處理,針對(duì)弱信號(hào)術(shù)語對(duì)應(yīng)的主題內(nèi)相關(guān)專利進(jìn)行語義分析,最后輸出與該弱信號(hào)術(shù)語語義相關(guān)的30個(gè)單詞形成語義相關(guān)詞集。通過該詞集對(duì)弱信號(hào)術(shù)語及弱信號(hào)主題進(jìn)行解釋,在后續(xù)研究中用于形成弱信號(hào)術(shù)語對(duì)應(yīng)的專利集。實(shí)踐證明,使用word2vec模型獲取語義相關(guān)詞可以豐富探測到的弱信號(hào)含義,并能探測到隨時(shí)間變強(qiáng)的新的弱信號(hào)[26]。

        3.3 基于弱信號(hào)的技術(shù)顛覆性潛力測度

        3.3.1 專利數(shù)據(jù)弱信號(hào)選取

        由于弱信號(hào)術(shù)語結(jié)果中存在干擾詞匯,即術(shù)語對(duì)應(yīng)的語義相關(guān)詞集中存在無意義詞匯或術(shù)語含義過于寬泛,無法對(duì)術(shù)語進(jìn)行合理解釋。因此,本文結(jié)合每一個(gè)弱信號(hào)術(shù)語對(duì)應(yīng)的語義相關(guān)詞集,人工剔除無意義或無關(guān)詞匯,選擇符合基因編輯領(lǐng)域技術(shù)特征的弱信號(hào)術(shù)語。最后,選擇出2008—2018年的35個(gè)弱信號(hào)術(shù)語,如表2所示,測度結(jié)果中若出現(xiàn)相同術(shù)語,則優(yōu)先考慮該術(shù)語最先出現(xiàn)的年份用以后續(xù)的相關(guān)測度。

        表2 2008—2018年術(shù)語過濾結(jié)果(5%~30%的百分位數(shù))

        3.3.2 技術(shù)顛覆性潛力測度

        以篩選出的弱信號(hào)術(shù)語為基礎(chǔ),將每個(gè)術(shù)語及其對(duì)應(yīng)的30個(gè)語義相關(guān)的詞匯看作該弱信號(hào)術(shù)語集合,針對(duì)每一個(gè)術(shù)語及語義相關(guān)詞建立起來的詞匯集合,檢索該詞匯集合對(duì)應(yīng)的專利,構(gòu)建每個(gè)弱信號(hào)術(shù)語對(duì)應(yīng)的專利集合。本節(jié)基于該專利數(shù)據(jù)集合,進(jìn)行技術(shù)顛覆性潛力測度指標(biāo)體系計(jì)算,評(píng)估包含弱信號(hào)的技術(shù)所具備的顛覆性潛力。

        以2017年的4個(gè)弱信號(hào)術(shù)語及語義相關(guān)詞所構(gòu)成的詞匯集為例,如表3所示。從專利數(shù)據(jù)庫中檢索所有包含這些詞匯的專利信息,并根據(jù)4個(gè)弱信號(hào)術(shù)語分別建立4個(gè)技術(shù)類別專利集?;趯@畔?,分別計(jì)算這4個(gè)弱信號(hào)技術(shù)類別在3年中的技術(shù)集成性、創(chuàng)新性、成長性、影響力和突變性指標(biāo)數(shù)值,計(jì)算結(jié)果如表4所示。

        表3 弱信號(hào)術(shù)語與語義相關(guān)詞(2017年)

        表4 4項(xiàng)弱信號(hào)技術(shù)顛覆性潛力指數(shù)(2017年)

        基于以上指標(biāo)結(jié)果,利用熵權(quán)法計(jì)算顛覆性潛力測度指標(biāo)。首先,通過極差標(biāo)準(zhǔn)化方法對(duì)獲得的指標(biāo)結(jié)果進(jìn)行標(biāo)準(zhǔn)化處理,消除變量量綱和變異范圍影響。其次,計(jì)算每個(gè)維度每個(gè)指標(biāo)的比重、信息熵和權(quán)重。最后,通過加權(quán)求和得到顛覆性潛力測度綜合結(jié)果,即顛覆性潛力測度指標(biāo)值,測度結(jié)果按照從高到低排序,如表5所示。

        按照技術(shù)顛覆性潛力測度值對(duì)識(shí)別出的弱信號(hào)術(shù)語進(jìn)行排序,為顛覆性技術(shù)的早期識(shí)別提供參考。2008—2018年的35個(gè)弱信號(hào)術(shù)語及對(duì)應(yīng)的技術(shù)顛覆性潛力測度值如表6所示。

        3.3.3 弱信號(hào)技術(shù)潛力測度結(jié)果

        本文基于顛覆性潛力測度值對(duì)所識(shí)別的弱信號(hào)進(jìn)行排序。對(duì)技術(shù)弱信號(hào)進(jìn)行全時(shí)段的顛覆性潛力測度,得到每項(xiàng)技術(shù)弱信號(hào)在2008—2019年的不同時(shí)期、不同維度的顛覆性潛力測度值。為進(jìn)一步獲得有效的顛覆性測度指標(biāo)數(shù)值和潛力測度值,保證每個(gè)時(shí)段每個(gè)指標(biāo)均可得到有效且連續(xù)的結(jié)果,進(jìn)一步采用3年為一個(gè)周期進(jìn)行分時(shí)段的指標(biāo)測度,分析弱信號(hào)顛覆性潛力數(shù)值在12年內(nèi)4個(gè)階段的變化。

        以2017年測度結(jié)果為例,該年弱信號(hào)術(shù)語對(duì)應(yīng)的顛覆性潛力測度結(jié)果如圖4所示。其中展現(xiàn)了包含技術(shù)弱信號(hào)在5個(gè)維度的測度結(jié)果,以及加權(quán)后的整體顛覆性潛力測度值。從整體來看,methyla‐tion和polynucleotide/cas潛力測度值較高,methyla‐tion的5個(gè)維度的表現(xiàn)為集成性和突變性突出、創(chuàng)新性和成長性較差,polynucleotide/cas在5個(gè)維度特征上均表現(xiàn)較好;locus潛力測度值最低,但其成長性遠(yuǎn)遠(yuǎn)大于其他弱信號(hào)技術(shù)。從分析結(jié)果來看,各方面表現(xiàn)均衡的polynucleotide/cas具有較高的顛覆性潛力,locus的高成長性則表示該技術(shù)在專利申請數(shù)量、對(duì)應(yīng)分類號(hào)數(shù)量和涉及技術(shù)類別3個(gè)方面均處于較高水平,未來具有一定顛覆性潛力。

        圖4 2017年弱信號(hào)技術(shù)顛覆性潛力測度

        3.4 弱信號(hào)結(jié)果對(duì)比

        基于文本挖掘的弱信號(hào)識(shí)別方法還包括三維模型方法,該方法是Yoon[9]基于信號(hào)的三維模型理論[34]提出的一種弱信號(hào)主題掃描方法。該方法利用關(guān)鍵詞的出現(xiàn)信息(occurrence information)與時(shí)間加權(quán)分析,生成關(guān)鍵字涌現(xiàn)圖和關(guān)鍵字分配圖兩種關(guān)鍵詞畫像圖譜,在此基礎(chǔ)上識(shí)別和分析弱信號(hào)主題。該過程由4個(gè)步驟組成:①數(shù)據(jù)采集;②定義領(lǐng)域相關(guān)關(guān)鍵詞;③利用關(guān)鍵詞信息構(gòu)建時(shí)間加權(quán)的關(guān)鍵詞畫像圖譜;④通過統(tǒng)計(jì)分析以及相關(guān)信息搜索識(shí)別出弱信號(hào)主題。

        為進(jìn)一步驗(yàn)證本文弱信號(hào)識(shí)別方法的有效性,本文參照Yoon[9]的弱信號(hào)識(shí)別框架進(jìn)行了基于專利挖掘的弱信號(hào)識(shí)別工作,并將識(shí)別結(jié)果與本文弱信號(hào)識(shí)別結(jié)果進(jìn)行對(duì)比,用于驗(yàn)證弱信號(hào)探測結(jié)果的有效性。具體過程如下:

        (1)獲取關(guān)鍵詞。基于3.2.1節(jié)中LDA主題抽取結(jié)果,將歷年獲取的主題詞集合進(jìn)行匯總和去重,將該主題詞集合作為下一步分析的數(shù)據(jù)集。

        (2)構(gòu)建關(guān)鍵詞涌現(xiàn)圖。利用關(guān)鍵詞的出現(xiàn)頻率衡量弱信號(hào)主題的可見程度,關(guān)鍵詞的出現(xiàn)頻率越高,表示相關(guān)弱信號(hào)主題的可見度越高。關(guān)鍵詞i在周期j中的可見程度(degree of visibility,DOV)計(jì)算公式為

        其中,TFij是關(guān)鍵詞i在周期j中出現(xiàn)的總頻率;Nj是周期j中專利的總數(shù)量;n是周期數(shù);tw是時(shí)間權(quán)重,設(shè)定為0.05[9]。

        逐年計(jì)算關(guān)鍵詞的DOV指標(biāo)和時(shí)間加權(quán)增長率(幾何平均值),部分計(jì)算結(jié)果如表7所示。

        表7 關(guān)鍵詞DOV指標(biāo)及增長率

        (3)構(gòu)建關(guān)鍵詞分配圖。利用關(guān)鍵詞的文檔頻率衡量弱信號(hào)主題的擴(kuò)散程度,關(guān)鍵詞的文檔頻率越高,表明該詞在文本信息集合中的一般性程度越高,即相關(guān)弱信號(hào)主題擴(kuò)散程度越高。關(guān)鍵詞i在周期j中的擴(kuò)散程度(degree of diffusion,DOD)計(jì)算公式為

        其中,DFij是關(guān)鍵詞i在周期j中的文檔頻率;Nj是周期j中專利總數(shù)量;n是周期數(shù);tw是時(shí)間權(quán)重,設(shè)定為0.05。

        逐年計(jì)算關(guān)鍵詞的DOD指標(biāo)和時(shí)間加權(quán)增長率(幾何平均值),部分計(jì)算結(jié)果如表8所示。

        表8 關(guān)鍵詞DOD指標(biāo)及增長率

        (4)弱信號(hào)關(guān)鍵詞識(shí)別。未來信號(hào)的主題通常擴(kuò)散程度低且伴隨異常模式[34]。從定量分析角度看,弱信號(hào)關(guān)鍵詞具有出現(xiàn)頻率較低但波動(dòng)幅度較大的特點(diǎn),因此,可通過相關(guān)關(guān)鍵詞指標(biāo)的時(shí)間加權(quán)增長率和關(guān)鍵詞平均詞條(文檔)頻率進(jìn)行弱信號(hào)的識(shí)別[9]。對(duì)關(guān)鍵詞涌現(xiàn)和分配的測度結(jié)果進(jìn)行分析,分別取符合弱信號(hào)關(guān)鍵詞特征的詞匯集合,即DOV和DOD指標(biāo)結(jié)果時(shí)間加權(quán)增長率的前30%且低于平均絕對(duì)詞條(文檔)頻率的關(guān)鍵詞為弱信號(hào)關(guān)鍵詞[9],兩個(gè)集合的交集詞匯是最終的弱信號(hào)關(guān)鍵詞識(shí)別結(jié)果,共計(jì)有1182個(gè)詞匯。

        (5)結(jié)果對(duì)比。將上述得到的弱信號(hào)關(guān)鍵詞集合與本文弱信號(hào)術(shù)語及語義相關(guān)詞集進(jìn)行對(duì)比。去除噪聲后對(duì)比發(fā)現(xiàn),兩個(gè)弱信號(hào)詞匯集合的語義重復(fù)詞匯為311個(gè),本文弱信號(hào)術(shù)語集合包含545個(gè)詞匯,與弱信號(hào)關(guān)鍵詞集合重復(fù)率為57.06%。對(duì)比結(jié)果可分為形同詞匯、意同形異詞匯以及形異意異詞匯3類,部分詞匯如表9所示。

        兩種弱信號(hào)識(shí)別方法得到的詞匯大致可分屬“疾病類型”“應(yīng)用領(lǐng)域”“技術(shù)要點(diǎn)”3個(gè)領(lǐng)域。共同弱信號(hào)詞匯代表了現(xiàn)在具有一定發(fā)展?jié)摿桶l(fā)展前景的技術(shù),其中包括已驗(yàn)證為顛覆性技術(shù)的CRISPR/Cas9。非重復(fù)詞匯部分是兩種方法得到的弱信號(hào)識(shí)別結(jié)果中具有差異的詞匯,該部分分為兩種情況:一是詞形相近或語義相關(guān)詞匯,如adeno‐virus(腺病毒)和adenosine(腺苷,腺甘酸),兩個(gè)詞匯具有相似的語義;二是詞形和詞意完全不相同的詞匯。兩種弱信號(hào)探測結(jié)果重復(fù)率達(dá)到了一半以上,證明本文的弱信號(hào)探測方法具有一定的合理性和有效性。探測結(jié)果的差異部分,是由于兩種方法原理不同而造成的識(shí)別結(jié)果的差異。

        3.5 識(shí)別結(jié)果驗(yàn)證

        經(jīng)過對(duì)基因編輯領(lǐng)域的科學(xué)文獻(xiàn)、新聞報(bào)道等內(nèi)容的研讀,最終選擇規(guī)律成簇間隔的短回文重復(fù)相關(guān)蛋白技術(shù)(CRISPR/Cas9)作為顛覆性技術(shù),用于驗(yàn)證基于弱信號(hào)的顛覆性技術(shù)早期識(shí)別方法和結(jié)果的有效性。CRISPR/Cas9技術(shù)是一種基因編輯技術(shù),源于細(xì)菌和古細(xì)菌的適應(yīng)性免疫系統(tǒng),2012年首次成功應(yīng)用于大腸桿菌的基因組編輯,2017年左右已經(jīng)出現(xiàn)了針對(duì)遺傳病、感染病的臨床試驗(yàn)[35]。該系統(tǒng)從被發(fā)現(xiàn)到發(fā)展成為目前精準(zhǔn)、多功能的基因編輯工具僅10年左右時(shí)間,雖未完成臨床應(yīng)用,但該技術(shù)為新一代基因療法奠定了基礎(chǔ)[36]。結(jié)合搜集到的相關(guān)新聞報(bào)道以及CRISPR/Cas9技術(shù)相關(guān)研究文獻(xiàn),認(rèn)為以CRISPR技術(shù)為代表的基因組編輯技術(shù)已經(jīng)成為生命科學(xué)研究領(lǐng)域的顛覆性技術(shù)之一。

        (1)弱信號(hào)探測模型結(jié)果

        在弱信號(hào)探測模型的主題抽取結(jié)果中,存在與CRISPR/Cas9技術(shù)相關(guān)的單詞crispr和cas,兩個(gè)相關(guān)單詞分別在2010年和2014年出現(xiàn),而CRISPR/Cas9技術(shù)的全稱則直至2016年才出現(xiàn)。在弱信號(hào)主題結(jié)果中還發(fā)現(xiàn),2017年的弱信號(hào)主題T18中出現(xiàn)與CRISPR/Cas9技術(shù)相關(guān)的單詞rna/cas,且該單詞僅在這一個(gè)主題中出現(xiàn),表明該年弱信號(hào)主題識(shí)別結(jié)果具有一定實(shí)際意義。2017年的主題抽取可視化結(jié)果如圖5所示。

        2016年和2017年,在弱信號(hào)術(shù)語的語義相關(guān)詞集中出現(xiàn)了與CRISPR/Cas9技術(shù)相關(guān)的單詞,具體的弱信號(hào)術(shù)語及語義相關(guān)詞如表10所示。由表10可知,弱信號(hào)探測模型得到的弱信號(hào)術(shù)語結(jié)果和語義相關(guān)詞集中,存在與CRISPR/Cas9技術(shù)相關(guān)的弱信號(hào)術(shù)語,弱信號(hào)識(shí)別結(jié)果具有一定實(shí)際意義。

        表10 弱信號(hào)術(shù)語與語義相關(guān)單詞(含CRISPR/Cas9技術(shù))

        通過對(duì)比弱信號(hào)探測模型各階段的篩選結(jié)果,發(fā)現(xiàn)與CRISPR/Cas9技術(shù)相關(guān)的術(shù)語在各個(gè)階段均有不同程度的體現(xiàn),弱信號(hào)術(shù)語及語義相關(guān)詞集作為本文的一項(xiàng)重要研究結(jié)果包含了與該技術(shù)相關(guān)的明確信息。弱信號(hào)探測模型得到的弱信號(hào)術(shù)語中,在2010年、2014年和2016年探測到CRISPR/Cas9技術(shù)存在的弱信號(hào),2017年探測到CRISPR/Cas9技術(shù)全稱的出現(xiàn)。

        (2)技術(shù)顛覆性潛力測度

        根據(jù)弱信號(hào)探測模型的驗(yàn)證結(jié)果,本文選擇2017年弱信號(hào)術(shù)語polynucleotide/cas和gene的技術(shù)顛覆性潛力測度結(jié)果進(jìn)行顛覆性潛力驗(yàn)證。2017年弱信號(hào)的顛覆性潛力測度結(jié)果見圖4,兩個(gè)弱信號(hào)術(shù)語各時(shí)段測度結(jié)果分別如圖6和圖7所示。

        圖6 gene各時(shí)段的顛覆性潛力測度

        圖7 polynucleotide/cas各時(shí)段的顛覆性潛力測度

        從圖4可以看出,2017年弱信號(hào)技術(shù)顛覆性潛力測度對(duì)比中,polynucleotide/cas相關(guān)技術(shù)在該年識(shí)別的弱信號(hào)術(shù)語中呈現(xiàn)了較高的顛覆性潛力值,在5個(gè)特征維度中均有較好表現(xiàn)。從圖6和圖7的分析結(jié)果可以看出,弱信號(hào)術(shù)語polynucleotide/cas和gene的顛覆性潛力測度值在2017年之前相對(duì)較高且均在2017達(dá)到最低值,因此,2017年識(shí)別得到的CRISPR/Cas9技術(shù)相關(guān)弱信號(hào)在該年之前體現(xiàn)出相對(duì)較高的顛覆性潛力,并于2017—2019年逐漸成為該領(lǐng)域中較為成熟的技術(shù)。

        CRISPR/Cas9技術(shù)于2012年宣布正式成功實(shí)現(xiàn),2017年基本進(jìn)入臨床試驗(yàn)階段,主要被用于遺傳病、傳染性病毒等研究。案例分析證明,通過弱信號(hào)探測模型和顛覆性潛力測度體系相結(jié)合,可以實(shí)現(xiàn)對(duì)顛覆性技術(shù)CRISPR/Cas9的早期識(shí)別。因此,弱信號(hào)探測模型和顛覆性潛力測度體系相結(jié)合的顛覆性技術(shù)早期識(shí)別方法,通過弱信號(hào)探測模型篩選弱信號(hào)術(shù)語,為顛覆性技術(shù)的早期識(shí)別提供了豐富的信號(hào)基礎(chǔ)。顛覆性潛力測度指標(biāo)體系實(shí)現(xiàn)了對(duì)同一時(shí)期不同弱信號(hào)的顛覆性潛力測度對(duì)比,以及對(duì)同一技術(shù)不同時(shí)段的顛覆性潛力的對(duì)比,從多維視角對(duì)弱信號(hào)探測結(jié)果的顛覆性進(jìn)行驗(yàn)證和修正。經(jīng)實(shí)例驗(yàn)證,本文所使用的基于弱信號(hào)的顛覆性技術(shù)早期識(shí)別方法具有可行性和有效性。

        4 總 結(jié)

        本文基于領(lǐng)域?qū)@畔ⅲ岢隽艘环N基于弱信號(hào)探測模型和技術(shù)顛覆性潛力測度指標(biāo)體系相結(jié)合的方法,用于實(shí)現(xiàn)對(duì)領(lǐng)域顛覆性技術(shù)進(jìn)行早期識(shí)別。首先,使用弱信號(hào)探測模型對(duì)專利數(shù)據(jù)依次進(jìn)行LDA主題建模、弱信號(hào)主題過濾以及弱信號(hào)術(shù)語過濾,得到弱信號(hào)術(shù)語及包含弱信號(hào)術(shù)語的專利集合。其次,根據(jù)技術(shù)顛覆性潛力測度指標(biāo)體系,計(jì)算得到弱信號(hào)的顛覆性潛力測度值,并對(duì)5個(gè)維度和不同時(shí)段弱信號(hào)的顛覆性潛力進(jìn)行相關(guān)測度和分析。最后,結(jié)合不同方法結(jié)果對(duì)比和文獻(xiàn)調(diào)研進(jìn)行實(shí)證研究,以驗(yàn)證該顛覆性技術(shù)早期識(shí)別方法的可行性和有效性,研究結(jié)果為顛覆性技術(shù)的早期識(shí)別提供了一種新的思路和方案。

        本文針對(duì)顛覆性技術(shù)早期識(shí)別方法的研究存在一定不足。首先,該方法未涉及技術(shù)的應(yīng)用情況,在后續(xù)研究中應(yīng)考慮加入市場中的相關(guān)信息,為技術(shù)的應(yīng)用測度提供支撐。其次,由于不同國家針對(duì)專利引用的要求不同,部分專利引用的參考專利或參考文獻(xiàn)并未標(biāo)明,因此,造成與引用相關(guān)的專利信息出現(xiàn)殘缺、無法補(bǔ)全,會(huì)對(duì)相關(guān)指標(biāo)的計(jì)算產(chǎn)生影響。最后,在研究結(jié)果驗(yàn)證部分,目前僅確認(rèn)一個(gè)顛覆性技術(shù),后續(xù)應(yīng)擴(kuò)大驗(yàn)證范圍以提升方法的適用性和準(zhǔn)確度。本文的顛覆性技術(shù)早期識(shí)別僅分析了基因編輯領(lǐng)域,未來還將繼續(xù)對(duì)其他領(lǐng)域如工程技術(shù)領(lǐng)域等進(jìn)行更廣泛的研究和分析。

        猜你喜歡
        信號(hào)模型
        一半模型
        信號(hào)
        鴨綠江(2021年35期)2021-04-19 12:24:18
        重要模型『一線三等角』
        完形填空二則
        重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
        孩子停止長個(gè)的信號(hào)
        3D打印中的模型分割與打包
        基于LabVIEW的力加載信號(hào)采集與PID控制
        一種基于極大似然估計(jì)的信號(hào)盲抽取算法
        FLUKA幾何模型到CAD幾何模型轉(zhuǎn)換方法初步研究
        日本一区二区三区看片| 国产乱人视频在线观看播放器| 成人无码视频在线观看网站| 太大太粗太爽免费视频| 国产内射视频免费观看| 一区视频免费观看播放| 综合图区亚洲偷自拍熟女| 激情五月开心五月啪啪| 日本动漫瀑乳h动漫啪啪免费| 午夜福利啪啪片| 最近中文字幕视频高清| 久久久久中文字幕精品无码免费 | 久久99精品这里精品动漫6| 日本精品久久中文字幕| 美女视频黄a视频全免费网站色 | 少妇人妻偷人精品免费视频| 亚洲国产欧美在线成人| аⅴ天堂一区视频在线观看| 精品女同一区二区三区在线播放器| 成人爽a毛片在线播放| 日本少妇浓毛bbwbbwbbw| 熟妇人妻无乱码中文字幕| 99热成人精品国产免| 国产黄色一级大片一区二区| 婷婷久久国产综合精品| 亚洲av无码一区二区三区天堂古代 | 中文字幕亚洲欧美日韩2019| 久久狠狠第一麻豆婷婷天天| 国产精品亚洲A∨无码遮挡| 日本免费一区二区精品| 麻豆资源在线观看视频| 国产边摸边吃奶叫床视频| 女人夜夜春高潮爽a∨片传媒| 久久国产免费观看精品| av免费观看在线网站| 久久久久久夜精品精品免费啦 | 狠狠色狠狠色综合网老熟女| 成人自拍三级在线观看| 国产亚洲美女精品久久久2020| 国产免费av片在线观看播放| 欧美久久中文字幕|