亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        產(chǎn)業(yè)鏈核心技術(shù)堵點識別與分析研究
        ——以芯片產(chǎn)業(yè)為例

        2024-01-23 06:40:36張桐赫何海燕孫磊華張亞東
        中國科技論壇 2024年1期
        關(guān)鍵詞:數(shù)據(jù)庫文本分析

        張桐赫,何海燕,孫磊華,張亞東

        (北京理工大學管理與經(jīng)濟學院,北京 100081)

        0 引言

        在 “技術(shù)封鎖”與 “技術(shù)脫鉤”的復(fù)雜國際競爭格局下,全球原本緊密合作的產(chǎn)業(yè)鏈和供應(yīng)鏈遭到嚴重沖擊,芯片領(lǐng)域作為核心制造業(yè)高地之一,日益成為世界各國競爭與攻關(guān)的關(guān)鍵領(lǐng)域。在芯片產(chǎn)業(yè)鏈的上中下游包含許多關(guān)鍵核心技術(shù),是技術(shù)領(lǐng)先國進行技術(shù)設(shè)限的最重要領(lǐng)域之一,中國的關(guān)鍵核心技術(shù)自主可控有利于維護全球產(chǎn)業(yè)鏈供應(yīng)鏈安全穩(wěn)定,避免技術(shù)碎片化,推動全球技術(shù)創(chuàng)新版圖重塑。在技術(shù)競爭視角下分析中國關(guān)鍵核心技術(shù)堵點并進行精確識別,對有效防范重大科技風險、打贏關(guān)鍵核心技術(shù)攻堅戰(zhàn)、保障產(chǎn)業(yè)鏈自主可控具有重要作用,為中國牢牢把握核心技術(shù)發(fā)展的主動權(quán)提供分析框架和數(shù)據(jù)支撐。

        當前技術(shù)優(yōu)勢國意圖壟斷先進科技,維護自身科技霸權(quán),主要以申請專利為手段,運用自身的先發(fā)科技優(yōu)勢和自主創(chuàng)新能力持續(xù)地擴大其技術(shù)優(yōu)勢[1]。專利作為最新技術(shù)情報是技術(shù)信息最有效的載體之一,包括了九成以上的技術(shù)特性,相比其他平臺信息更新具有很強的規(guī)范性與時間優(yōu)勢[2],被普遍認為是衡量技術(shù)合理、適當和可靠的指標[3],對專利的挖掘、對比和研究能夠為技術(shù)管理決策提供支撐[4],本文以專利表征技術(shù)探討相關(guān)問題,研究中美之間的技術(shù)競爭格局,進行核心技術(shù)產(chǎn)業(yè)鏈定位,最終識別核心技術(shù)堵點,對打贏關(guān)鍵核心技術(shù)攻堅戰(zhàn)有重要指導(dǎo)意義。因此本文構(gòu)建系統(tǒng)分析框架,結(jié)合文本分析和LDA主題建模對中外技術(shù)布局與產(chǎn)業(yè)鏈關(guān)系進行對照分析,對中國關(guān)鍵核心技術(shù)堵點進行深度識別與產(chǎn)業(yè)鏈定位。

        1 國內(nèi)外研究現(xiàn)狀

        1.1 基于專利數(shù)據(jù)的關(guān)鍵核心技術(shù)識別方法研究

        專利承載了技術(shù)的主要數(shù)據(jù),70%的發(fā)明首先出現(xiàn)在專利申請上[5],專利數(shù)據(jù)因其規(guī)范性,已經(jīng)成為分析技術(shù)發(fā)展態(tài)勢的重要、可靠的數(shù)據(jù)來源,關(guān)鍵核心技術(shù)識別離不開對專利的甄別與分析?;趯@暯堑年P(guān)鍵核心技術(shù)識別,主要可以分為兩個方向。

        第一個方向是專利外部特征指標評價法,通過直接引用及同被引、耦合和共類等特征進行核心技術(shù)識別。主流的指標評價有3類:①依托專利引用頻次、專利族數(shù)、專利權(quán)數(shù)量等直接指標進行核心技術(shù)識別[6-7]。②進一步構(gòu)建專利指標體系綜合識別核心技術(shù);楊大飛等[8]構(gòu)建核心技術(shù) “三力”模型,包括發(fā)展力、控制力和創(chuàng)新力指標;鄭思佳等[9]從技術(shù)性、經(jīng)濟性和法律性3個維度篩選核心專利。羅天宇[10]構(gòu)建多個專利指標,使用AHP法構(gòu)建判別體系識別核心技術(shù)。③使用社會網(wǎng)絡(luò)分析法識別核心技術(shù),即通過網(wǎng)絡(luò)節(jié)點特征判斷其重要性,將專利代碼作為網(wǎng)絡(luò)節(jié)點,構(gòu)建共現(xiàn)或引文網(wǎng)絡(luò)識別核心技術(shù)。主要有IPC共現(xiàn)分析法[11-12]以及考慮技術(shù)交叉影響的改進分析法等[13-15]。

        第二個方向是通過自然語言數(shù)據(jù)分析算法進行文本挖掘,主要基于專利中的文本信息,題名、摘要等識別核心技術(shù)主題,隨著機器學習算法的不斷發(fā)展,該方法也逐漸受到越來越多學者的重視。主要通過聚焦專利關(guān)鍵詞,如應(yīng)用SAO 網(wǎng)絡(luò)結(jié)構(gòu)[16-18]、TF-IDF 算法[9,19]、經(jīng)驗?zāi)B(tài)分解EMD[20]等方法對海量專利數(shù)據(jù)進行關(guān)鍵抽取和識別;LDA主題模型作為一種主流的文本主題建模方法應(yīng)用廣泛且關(guān)鍵詞識別較為準確,成為核心技術(shù)文本識別的主要方法之一,任佳妮等[21]基于論文專利摘要特征提取,采用LDA主題建模和專家咨詢法對醫(yī)療機器人領(lǐng)域的新興技術(shù)進行識別。一些學者提出方法構(gòu)建指標進一步判別,周云澤等[22]使用LDA主題模型識別技術(shù)主題,構(gòu)建包含專利信息的主題強度、主題新穎度指標綜合判別。席笑文等[23]基于LDA主題模型構(gòu)建專利權(quán)人-專利-技術(shù)主題三層概率分布,識別關(guān)鍵核心技術(shù)。一些學者也對LDA的優(yōu)化模型在核心技術(shù)識別中的應(yīng)用進行研究,王秀紅等[24]提出BERT-LDA主題模型,增加上下文語義信息結(jié)合專利數(shù)據(jù)對農(nóng)業(yè)機器人領(lǐng)域的關(guān)鍵共性技術(shù)進行識別。裘惠麟等[25]使用LDA2vec模型,優(yōu)化上下文語義向量,結(jié)合專利等多元數(shù)據(jù)識別技術(shù)熱點。

        1.2 技術(shù)競爭態(tài)勢研究現(xiàn)狀

        國際競爭格局下,技術(shù)競爭態(tài)勢分析對于把握技術(shù)發(fā)展方向、發(fā)掘國內(nèi)外研究熱點,確定自身技術(shù)研發(fā)戰(zhàn)略等具有重要作用,當前已有不少研究以專利數(shù)據(jù)為基礎(chǔ)評估技術(shù)競爭態(tài)勢。主要是通過專利總體申請情況、時間分布、IPC分類領(lǐng)域、專利信息共現(xiàn)與專利引證等角度直接進行競爭分析[26-27]。也有通過構(gòu)建模型,以組合指標維度分析競爭情報,張子巖等[28]結(jié)合技術(shù)活躍度、技術(shù)影響力和市場布局三重指標對儲能領(lǐng)域的關(guān)鍵技術(shù)國際競爭態(tài)勢進行分析。楊曦等[29]使用基于專利的ECIRM模型,從專利權(quán)人、資本、產(chǎn)業(yè)、資源和技術(shù)管理維度以石墨烯產(chǎn)業(yè)為例進行產(chǎn)業(yè)競爭態(tài)勢分析,魏娟霞等[30]使用IPC (專利分類號)-MC (手工代碼)-Term (元組)三元模型,構(gòu)建高維向量空間,計算相似度,分析技術(shù)競爭格局。

        在技術(shù)競爭中設(shè)置國別技術(shù)壁壘已成為技術(shù)優(yōu)勢國阻礙技術(shù)國際流動,限制他國技術(shù)發(fā)展的最主要手段之一。研究多集中于技術(shù)性貿(mào)易壁壘 (TBT),即以維護本國經(jīng)濟利益為目的,設(shè)置一定的技術(shù)門檻以阻止外來商品和投資自由進入[31]。蔡靜靜等[32]基于演化博弈視角研究技術(shù)壁壘對出口企業(yè)技術(shù)創(chuàng)新決策的影響。張秀妮等[19]結(jié)合美國出口管制清單與專利數(shù)據(jù)研究了技術(shù)壁壘環(huán)境下航空航天產(chǎn)業(yè)核心技術(shù)預(yù)見問題。

        綜上,梳理現(xiàn)有研究可以發(fā)現(xiàn),專利視角下針對關(guān)鍵核心技術(shù)的識別已有較為成熟的方法和體系,技術(shù)競爭態(tài)勢分析的研究也有較為主流的切入角度,但在國際競爭格局下對兩者的聯(lián)合分析模型研究較少,需要在識別關(guān)鍵核心技術(shù)的基礎(chǔ)上進行競爭態(tài)勢分析并加入外部政策影響。技術(shù)壁壘的研究多集中于技術(shù)性貿(mào)易壁壘 (TBT),缺乏對技術(shù)管控格局下技術(shù)堵點的發(fā)現(xiàn)方法。尤其在美國設(shè)立嚴格的出口管制清單下如何精確發(fā)現(xiàn)本國核心技術(shù)堵點并進行產(chǎn)業(yè)鏈定位挖掘其與政策文本的關(guān)聯(lián)分析尚待深度研究。因此本文建立產(chǎn)業(yè)鏈堵點技術(shù)綜合識別模型,在美國出口管制清單背景下,基于專利數(shù)據(jù)庫,使用IPC分類號明確技術(shù)類別,進行產(chǎn)業(yè)鏈定位,分析技術(shù)競爭態(tài)勢,使用LDA關(guān)鍵詞主題建模,充分利用專利文本,進行技術(shù)壁壘點識別與核心技術(shù)風險預(yù)見,最終實現(xiàn)關(guān)鍵核心技術(shù)堵點的精確定位,通過深度剖析管制政策與專利卡位的內(nèi)在聯(lián)系,分析模型對競爭格局下識別核心技術(shù)堵點提供新的研究框架并為尋找技術(shù)自主可控路徑提供借鑒。

        2 研究流程與方法

        在前期文獻研究的基礎(chǔ)之上,本文構(gòu)建核心技術(shù)堵點識別模型,結(jié)合美國商務(wù)部工業(yè)安全局設(shè)置的出口管制清單,在復(fù)雜國際競爭格局下,對核心技術(shù)堵點進行識別與產(chǎn)業(yè)鏈定位,建立 “三橫三縱”的立體分析框架,橫向分為數(shù)據(jù)層、方法層和結(jié)論層3個主要層次,關(guān)鍵核心技術(shù)堵點集成識別框架如圖1所示。

        圖1 關(guān)鍵核心技術(shù)堵點識別框架

        研究3條主要縱向分析路徑,以專利數(shù)據(jù)庫為基礎(chǔ),IPC專利分類號類別分析為中軸線,左側(cè)結(jié)合美國商務(wù)部出口管制清單內(nèi)容將受控技術(shù)分類劃歸,對照分析專利IPC分類受限技術(shù)并進行產(chǎn)業(yè)鏈定位,最終識別受限技術(shù)壁壘點。右側(cè)采用LDA主題建模方法挖掘核心技術(shù)主題關(guān)鍵詞,結(jié)合產(chǎn)業(yè)鏈特點對照分析核心專利主題國別競爭態(tài)勢,預(yù)見核心技術(shù)風險。受限技術(shù)壁壘點與核心技術(shù)風險點交集部分技術(shù)主題有3個特點:①受出口管制清單嚴格限制;②該IPC專利類別存在技術(shù)短板;③專利在數(shù)據(jù)庫中地位重要。結(jié)合產(chǎn)業(yè)鏈特點進行技術(shù)定位,集成多元數(shù)據(jù)開展關(guān)聯(lián)分析,構(gòu)建綜合分析框架識別亟待突破的關(guān)鍵核心技術(shù)堵點并深度分析其與出口管制清單的聯(lián)系。

        2.1 本地數(shù)據(jù)庫建立

        本研究專利數(shù)據(jù)來源于德溫特專利數(shù)據(jù)庫 (Derwent Innovation Index),在確定研究主題后建立檢索式TI搜索相關(guān)專利,將搜索聚焦于受限制的技術(shù)與終端產(chǎn)品,數(shù)據(jù)檢索使用布爾邏輯關(guān)系,對研究領(lǐng)域涉及的專利進行檢索,下載完整的專利信息。對文本進行分詞去停用詞預(yù)處理,清洗殘缺數(shù)據(jù),建立本地專利數(shù)據(jù)庫。

        美國商務(wù)部工業(yè)安全局 (BIS)限制出口清單內(nèi)容 (Commerce Control List)[33]共10類,并附帶受控國別列表信息及檢索方法,對研究主題范圍內(nèi)的大類進行文本梳理,分類劃歸受限制技術(shù),標注及解釋文本清洗,保留大類限制目錄并進行子目錄精確提取,去除殘缺文本,人工檢查分類目錄,統(tǒng)計類別,形成管制清單文本數(shù)據(jù)庫。

        2.2 對照分析受限制技術(shù)主題

        對美國出口管制清單文本數(shù)據(jù)庫進行受控技術(shù)分類劃歸,得到技術(shù)主題分級目錄,對分級目錄中的內(nèi)容進行文本分析,獲取研究領(lǐng)域當前主要的技術(shù)限制,完善各個技術(shù)分類內(nèi)的目錄及主題內(nèi)容,結(jié)合專家意見對受限制的技術(shù)主題大類進行產(chǎn)業(yè)鏈定位,建立起技術(shù)壁壘點與產(chǎn)業(yè)鏈的關(guān)聯(lián)關(guān)系。通過已經(jīng)建立的專利數(shù)據(jù)庫讀取IPC分類號,查詢分類號對應(yīng)的技術(shù)主題,對比國內(nèi)外優(yōu)勢技術(shù)IPC方向,進行專利國別競爭態(tài)勢比較分析,在產(chǎn)業(yè)鏈中定位各個技術(shù)主題,對照管制清單數(shù)據(jù)精確尋找受限技術(shù)壁壘點。

        2.3 LDA主題建模

        LDA主題建模是機器學習算法中一種非監(jiān)督學習模型,使用狄利克雷函數(shù)對 “潛在主題信息”進行提取,通過算法抽取詞匯與文檔間的關(guān)系,可以有效提取大規(guī)模文檔集和語料庫中的隱含主題,目前已成為文本情感分類、關(guān)鍵信息抽取的主流方法之一[25]。

        本研究基于構(gòu)建的本地專利數(shù)據(jù)庫,使用LDA主題建模對核心專利主題進行篩選,DWPI專利數(shù)據(jù)庫摘要包含了大量的專利重要信息,文本數(shù)據(jù)主要體現(xiàn)在專利標題與摘要中,因此提取Derwent專利數(shù)據(jù)標題 (TI)結(jié)合摘要 (AB)作為數(shù)據(jù)源。專利文本是一種非結(jié)構(gòu)化數(shù)據(jù),為了將非結(jié)構(gòu)化文本數(shù)據(jù)轉(zhuǎn)化為結(jié)構(gòu)化向量集,建立好語料庫后,使用Gibbs采樣方法估算出的文檔主題分布作為文檔向量的權(quán)重,通過提取特征詞匯,借助關(guān)鍵詞向量將每個專利文檔轉(zhuǎn)換為結(jié)構(gòu)化向量,構(gòu)建的關(guān)鍵詞向量包含在文本中多次出現(xiàn)體現(xiàn)專利技術(shù)特征的關(guān)鍵詞及其在文本中出現(xiàn)的頻率。

        LDA模型可以對訓練集與非訓練集文檔進行主題概率預(yù)測,盡管其在文本識別的主要假設(shè)為一篇文檔是由一組詞構(gòu)成,主要局限性為沒有考慮詞與詞之間先后順序的關(guān)系,是一種無監(jiān)督模型。本研究聚焦受限技術(shù)壁壘點識別與核心技術(shù)風險預(yù)見最終定位中國關(guān)鍵核心技術(shù)堵點,關(guān)鍵詞的讀取更有利于對照分析適用于解決本研究中專利數(shù)據(jù)庫核心主題的發(fā)現(xiàn)。

        3 實證研究

        集成電路產(chǎn)業(yè)鏈可整體劃分為芯片設(shè)計、分立器件制造和封裝測試3個環(huán)節(jié),即對應(yīng)產(chǎn)業(yè)鏈的上、中、下游。當前全球半導(dǎo)體行業(yè)處于新一輪景氣周期上行階段,而中國的半導(dǎo)體產(chǎn)業(yè),不僅受到全球性大周期的影響,更有關(guān)鍵核心技術(shù)受限和疫情沖擊的國產(chǎn)替代需求。工信部2021年數(shù)據(jù)顯示,中國集成電路銷售額突破萬億元人民幣,2018—2021這3年的增速超全球同期3倍以上,復(fù)合增長率為17%[34]。中國雖目前已經(jīng)成為全球最大的半導(dǎo)體消費國,但芯片自給率低,2020年中國集成電路自給率僅15.9%,國產(chǎn)替代仍有極大市場空間。本研究選取集成電路領(lǐng)域作為研究對象,深度挖掘中國核心技術(shù)堵點。

        3.1 集成電路本地數(shù)據(jù)庫構(gòu)建

        3.1.1 集成電路領(lǐng)域?qū)@麛?shù)據(jù)庫

        專利數(shù)據(jù)包含技術(shù)的有效數(shù)據(jù),使用德溫特 (Derwent Innovation Index)數(shù)據(jù)庫在數(shù)據(jù)檢索時,使用檢索式TI的布爾邏輯關(guān)系,芯片的應(yīng)用場景極其豐富,因此涉及芯片領(lǐng)域的專利數(shù)量眾多,本文主要研究在芯片上游設(shè)計、中游生產(chǎn)、下游封測的關(guān)鍵核心技術(shù)堵點進行識別。

        本文采用檢索式TS= ( ( ( (chip?or microchip?or integratedcircuit?or Semiconductor or Microelectronics or FINFET or MOSFET)near/5 (Equip* or System* or material?Or Rig?or facilitate?or Inst*))near/5 ( (Design* or Plan* or Program* or Devis* or Formation or Production or Manufactur* or Test or Package*)))not (appli* or apply or utliz*))

        檢索式同時設(shè)置專利時間為2002—2022年,檢索時間為2022年2月16日,共檢索到35112條專利 (包含專利族)數(shù)據(jù)。本文研究集成電路產(chǎn)業(yè)鏈相關(guān)學科類別專利,選取工程,儀器儀表,化學等13個專業(yè)類別進行技術(shù)壁壘甄別,集成電路學科類別專利數(shù)量統(tǒng)計如圖2所示。

        圖2 集成電路學科類別專利數(shù)量

        集成電路學科涉及的最主要類別為工程類,德溫特專利學科類別存在交叉無法判斷主要的專利類別領(lǐng)域,主要涉及的13個專利類別范圍廣泛,進一步研究挖掘?qū)@畔?,使用Python對檢索到35112條專利進行國別信息提取,對提取專利的國別信息進行統(tǒng)計。在檢索到的數(shù)據(jù)庫中,美國有相關(guān)專利9113件 (占比26.99%),中國有相關(guān)專利8726件 (占比25.56%),日本9118件 (占比27.02%),韓國5006件 (占比14.18%),歐洲專利組織803件 (占比2.09%)。

        日本、美國、中國和韓國是最主要的芯片專利授權(quán)大國,考慮到美國技術(shù)優(yōu)勢國的地位受到?jīng)_擊,其在芯片、計算機、通信領(lǐng)域設(shè)置了嚴密的出口管制清單,限制別國使用先進的芯片產(chǎn)品,限制制造設(shè)備的出口與國際研究合作,違背了WTO貿(mào)易合作規(guī)則,破壞了全球緊密合作的產(chǎn)業(yè)鏈和供應(yīng)鏈,嚴重阻礙全球科技進步,打破了人類命運共同體建設(shè)。在其嚴密的出口管制下,中國芯片的設(shè)計、制造和應(yīng)用均受到嚴重限制。

        3.1.2 出口管制清單文本數(shù)據(jù)庫

        美國商務(wù)部工業(yè)安全局 (BIS)發(fā)布的《商業(yè)管制清單》中針對芯片、電子電路、通信領(lǐng)域進行了嚴密的管制,限制了技術(shù)在國際間的流動和跨國技術(shù)合作,其設(shè)置的出口管制清單 (Export Administration Regulations,EAR)對主要的十大類技術(shù)進行出口管制,其中針對電子設(shè)計開發(fā)與生產(chǎn)設(shè)置了獨立的一個大類目進行管制,主要涉及芯片與集成電路領(lǐng)域終端產(chǎn)品和產(chǎn)業(yè)鏈的不同環(huán)節(jié)。商業(yè)管制清單的大類4 (計算機類目)、類目5.1 (通信)與類目5.2 (信息安全)更多涉及到軟件系統(tǒng),并且類目間存在引用關(guān)系,CCL避免了不同大類下重復(fù)設(shè)限相似技術(shù)條目,本研究聚焦CCL大類3 (電子設(shè)計開發(fā)與生產(chǎn))進行文本數(shù)據(jù)提取。

        出口管制清單 (EAR)對集成電路領(lǐng)域進行了嚴密的限制。在電子設(shè)備設(shè)計開發(fā)與生產(chǎn)領(lǐng)域共設(shè)置5項一級技術(shù)分類,涵蓋55個二級技術(shù)分類和149個三級技術(shù)分類,三級技術(shù)分類下仍設(shè)置3個次級目錄對技術(shù)類別進行注釋和細分領(lǐng)域的界定。本文針對受限制技術(shù)對技術(shù)分類進行數(shù)據(jù)清洗整理,去除殘缺保留項,去除注釋界定等進行類別縮減。技術(shù)分類匯總見表1。

        表1 出口管制清單技術(shù)分類匯總

        美國出口管制清單分為5類,涵蓋芯片產(chǎn)業(yè)鏈的上中下游,上游終端產(chǎn)品與設(shè)計環(huán)節(jié)對應(yīng)第1個一級分類與軟件一級分類中的設(shè)備運行類軟件;中游制造環(huán)節(jié)對應(yīng)第2個一級分類中制造部分、材料一級分類與軟件一級分類中生產(chǎn)設(shè)備軟件;下游封測對應(yīng)第2個一級分類中的測試設(shè)備;軟件部分主要為設(shè)計軟件和制造開發(fā)軟件;材料部分管制清單側(cè)重于制備材料的限制。技術(shù)類目同樣作為一級分類,在限制上述分類的一般性技術(shù)出口的同時對軍用電子設(shè)備技術(shù)與其他前沿技術(shù)模塊提前進行封鎖。在芯片領(lǐng)域?qū)@麛?shù)據(jù)庫中出口管制清單進行產(chǎn)業(yè)鏈上中下游的定位后發(fā)現(xiàn)不僅是產(chǎn)業(yè)鏈相關(guān)技術(shù),幾乎是全產(chǎn)業(yè)鏈的封鎖與限制,疊加超前技術(shù)卡位布局?;诩呻娐奉I(lǐng)域的專利的數(shù)量變化與主題對比分析,中國在專利數(shù)量上與美國接近,增長趨勢高于美國,但在產(chǎn)業(yè)鏈主要環(huán)節(jié)技術(shù)不足,需要結(jié)合專利分類進行產(chǎn)業(yè)鏈定位。

        3.2 專利分類號產(chǎn)業(yè)鏈環(huán)節(jié)競爭態(tài)勢分析

        集成電路領(lǐng)域主要涉及的專利IPC四位一級分類號有H01L、G01R、G05B、G06F、G01R等,需對更細分的二級IPC七位專利號進行對比,世界各個專利技術(shù)大國在集成電路領(lǐng)域研究方向不盡相同,使用整體專利數(shù)據(jù)庫進行主要專利IPC統(tǒng)計無法有效考慮各專利大國優(yōu)勢專利,在二級分類號下數(shù)量排序前20項IPC號占整體數(shù)量均超過75%,代表了各國的主要專利研究方向,故本文選取九國兩組織主要細分領(lǐng)域?qū)@鸌PC分類號授權(quán)量前20作為主要專利分類,進行去重處理,共計27個主要專利分類號。本研究聚焦中美芯片專利將九國兩組織其他國家相同二級專利分類號專利數(shù)量進行匯總,統(tǒng)一計算其占比。在本地德溫特專利數(shù)據(jù)庫中按不同二級專利分類下中美占比繪制散點圖。進行技術(shù)特征提取,結(jié)合芯片產(chǎn)業(yè)鏈特點與專家意見將27項IPC二級專利分類號定位至產(chǎn)業(yè)鏈不同環(huán)節(jié),綜合進行國別態(tài)勢分析,對技術(shù)風險進行預(yù)見。專利IPC分類產(chǎn)業(yè)鏈定位占比如圖3所示。

        圖3 專利IPC分類產(chǎn)業(yè)鏈定位占比

        根據(jù)專利IPC分類進行芯片專利產(chǎn)業(yè)鏈定位分析,集成電路產(chǎn)業(yè)鏈整體可以分為上游設(shè)計、中游制造、下游封測3個主要流程,最終形成終端產(chǎn)品。中國在數(shù)字計算設(shè)備、數(shù)據(jù)庫結(jié)構(gòu)設(shè)計中存在明顯的短板,是主要的技術(shù)弱項之一。在分立器件模塊與美國相比同樣存在一定技術(shù)差距。中游制造模塊是中國最重要的技術(shù)短板,主要涉及的11個IPC二級分類號專利全球占比均未超過10%,其中G03B-027 (光學印片設(shè)備)是中國存在的嚴重技術(shù)空缺,相比美國接近全球一半的專利數(shù)量,中國僅有0.32%的專利占比,實現(xiàn)自主可控光學印片設(shè)備還有較大差距。芯片產(chǎn)業(yè)鏈因其獨特性需要多個環(huán)節(jié)匹配,某個環(huán)節(jié)技術(shù)有缺陷時就可能存在整體產(chǎn)業(yè)依賴進口,終端產(chǎn)品受制于人的問題。對照分析出口管制清單中均可找到多個三級技術(shù)分類限制這11項IPC技術(shù)主題。在制造設(shè)備、材料與輔料部分限制的尤為明顯,不僅將基片制造器件進行限制,基片異質(zhì)外延抗蝕材料如碳化硅 (SiC)、氧化鎵 (Ga2O3)、高電阻率材料晶錠和多晶陶瓷襯底等也面臨管制封鎖,在專利卡位的同時不斷封鎖基材的出口, “被卡”國家甚至無材料開展相關(guān)領(lǐng)域技術(shù)攻關(guān)。

        3.3 LDA自然語言處理算法對照分析核心技術(shù)主題

        本部分使用自然語言處理算法進行關(guān)鍵詞分析,使用LDA主題模型對專利數(shù)據(jù)庫的題目和摘要進行分析,對核心專利主題進行篩選,對照分析國內(nèi)外優(yōu)勢技術(shù)及核心技術(shù)主題國別競爭態(tài)勢在產(chǎn)業(yè)鏈中的位置。使用Python進行LDA主題建模,版本3.7.1首先對德溫特 (DII)專利數(shù)據(jù)庫的文本文檔進行提取題目 (TI)和摘要 (AB),對殘缺的數(shù)據(jù)進行清洗和預(yù)處理,構(gòu)建非結(jié)構(gòu)化文本集共35112個同族專利,調(diào)用Nltk庫Stopwords數(shù)據(jù)包對文檔進行去停用詞處理。

        首先對主要參數(shù)主題數(shù)K進行設(shè)定,針對數(shù)據(jù)庫中的文檔進行主題數(shù)估計,本文專利數(shù)目較多,借助指標進行主題數(shù)確定。目前研究中,學者主要利用困惑度 (Perplexity)的變化進行估計,其指標隨著主題數(shù)量的增加而遞減。主題一致性是另一種主要的最優(yōu)主題數(shù)目選擇的模型,也是衡量主題質(zhì)量最有效的方法之一。針對最優(yōu)主題數(shù)的確定一般需要對數(shù)據(jù)集中包含的主題數(shù)目有一定的先驗估計[35]。根據(jù)構(gòu)建專利數(shù)據(jù)庫IPC分類特點、專利類別數(shù)量及同族專利情況,本研究估計所下載的專利數(shù)據(jù)集中的主題數(shù)目為100個以內(nèi),結(jié)合主題關(guān)鍵詞易讀性與專家意見,進行迭代實驗以確定最優(yōu)主題數(shù),K為5~105,步進為5,每個主題數(shù)運行1000次迭代,得到每個K對應(yīng)的困惑度值和主題一致性,如圖4所示。

        圖4 主題數(shù) (K)對應(yīng)困惑度-主題一致性曲線

        在LDA主題模型下,當主題數(shù)取30時困惑度開始趨于穩(wěn)定,達到最小值-8.96,結(jié)合主題一致性進行檢驗,主題一致性在主題數(shù)大于15后趨于穩(wěn)定,隨著主題數(shù)數(shù)目的增加,主題一致性并未有顯著提升。最終選取芯片領(lǐng)域前30項關(guān)鍵技術(shù)主題,進行LDA建模,將每一個主題Topic視為一個專利熱點,對集成電路領(lǐng)域中每個主題Topic下特征詞及其概率進行統(tǒng)計,通過主題詞識別結(jié)果及主題下專利題目,明確各主題對應(yīng)的關(guān)鍵技術(shù)。主題Topic 1中權(quán)重前10項的主題詞包括:組件、存儲器、可編程、主控、芯片、接觸、陣列,結(jié)合該主題下的專利名稱,確定該技術(shù)主題為芯片存儲器主控陣列技術(shù)。同理讀取出LDA主題識別topic1-30技術(shù)主題,并進行產(chǎn)業(yè)鏈定位,結(jié)果如圖5所示。

        圖5 LDA主題特征詞概率及其讀取結(jié)果

        結(jié)合LDA主題建模挖掘?qū)@麛?shù)據(jù)庫技術(shù)主題關(guān)鍵詞,對核心技術(shù)進行識別,共記30項核心技術(shù)主題,300個關(guān)鍵詞及其主題概率。其中,涉及集成電路設(shè)計的有4項,涉及制造材料的有8項,涉及制造設(shè)備的有8項。自然語言算法處理結(jié)果與IPC分類號專利方向有部分重合,但關(guān)鍵詞讀取結(jié)果更側(cè)重于制造材料與設(shè)備,占核心技術(shù)主題的有16項,占比超一半,其中 “draw;印制”關(guān)鍵詞在不同的主題下多次被識別,是貫穿制造類別主題的最重要關(guān)鍵詞之一。對比分析IPC分類專利國別競爭態(tài)勢,中國主要的核心技術(shù)風險點在數(shù)字電路邏輯芯片、存儲器、數(shù)據(jù)庫訪問端口、底層基材、微型環(huán)氧樹脂復(fù)合材料、管體表面結(jié)構(gòu)材料 (苯酚、錫)、金屬表面氧化成薄膜材料、電化學材料 (氟化物,烴類,聚乙烯)、微型晶元印制設(shè)備及制造、刻蝕設(shè)備與晶體熔爐、晶片表面密封印制設(shè)備、離子注入設(shè)備、電化學氣體 (化學氣象沉積)共13項LDA主題建模核心技術(shù)。

        4 結(jié)論與建議

        本文構(gòu)建了集成多元數(shù)據(jù)的綜合分析框架,建立專利數(shù)據(jù)庫分析中外技術(shù)競爭態(tài)勢,結(jié)合美國商務(wù)部出口管制清單對我國的受限技術(shù)壁壘點進行識別,對專利IPC分類號進行產(chǎn)業(yè)鏈定位,使用LDA主題建模篩選核心技術(shù)主題,結(jié)合產(chǎn)業(yè)鏈特點挖掘亟待解決的核心技術(shù)堵點,通過深度解析出口管制清單5個一級技術(shù)類目的布局得出以下結(jié)論與建議。

        美國相關(guān)管制清單文件中包含的技術(shù)產(chǎn)品范圍很大,技術(shù)性參數(shù)限制面寬,在部分細分產(chǎn)業(yè)鏈領(lǐng)域中國已經(jīng)掌握相關(guān)技術(shù),并不存在 “卡脖子”的技術(shù)堵點,而在特定應(yīng)用數(shù)字計算設(shè)備;信息檢索、數(shù)據(jù)庫結(jié)構(gòu)、文件系統(tǒng)結(jié)構(gòu);印制電元件、電設(shè)備結(jié)構(gòu)零部件、基片材料應(yīng)用;PN結(jié)電容器或電阻器、半導(dǎo)體本體或其電極的零部件;光學印片設(shè)備;通過氣態(tài)化合物分解化學鍍覆 (化學氣相沉積);物質(zhì)或材料引入放電作用結(jié)構(gòu)的電子管;圖紋面,印刷表面的照相制版 (光刻工藝);在一個共用襯底內(nèi)或上形成多個半導(dǎo)體或其他固態(tài)組件;用于制造印刷電路的設(shè)備或方法 (穿孔,光刻,沉積等)共10項專利領(lǐng)域中國存在缺口,為主要受限技術(shù)點,其中4項受限點集中在產(chǎn)業(yè)鏈制造設(shè)備中,3項受限點集中在制造材料中。管制清單將材料部分獨立為一個一級分類,意圖使得技術(shù)受限國家無芯可用、無料生產(chǎn)。中國面對缺少基材的問題,應(yīng)在芯片材料研發(fā)中充分發(fā)揮引進吸收再創(chuàng)新的路徑,將當前主流芯片基材碳化硅 (SiC)、PN結(jié)電容器、多晶陶瓷等制備工藝充分吸收,在既有專利方向拓展應(yīng)用的同時引領(lǐng)性的布局新材料。

        LDA建模中最主要的專利短板為光學印片設(shè)備,其重要性貫穿整個中游制造過程。在材料制備、主要制造工藝流程中均有體現(xiàn),是芯片制造過程中最重要的技術(shù)之一,也是面臨的關(guān)鍵核心技術(shù)堵點,打贏關(guān)鍵核心技術(shù)攻堅戰(zhàn)的首要關(guān)卡。其次,中國在數(shù)字計算與數(shù)據(jù)庫技術(shù)中存在專利短板,該技術(shù)也是LDA建模的核心技術(shù)主題,是中國集成電路設(shè)計環(huán)節(jié)中亟待解決的技術(shù)堵點,中國在傳感器、光電器件、封裝測試材料與設(shè)備技術(shù)方向通過經(jīng)驗積累與技術(shù)攻關(guān)已經(jīng)在專利數(shù)量上取得了一定突破并掌握了一定的核心技術(shù)。但通過LDA主題關(guān)鍵詞識別,此類技術(shù)方向在整體芯片產(chǎn)業(yè)鏈中并不占據(jù)核心地位,其專利作用相對獨立,持續(xù)地擴大研發(fā)與增進專利優(yōu)勢并不能解決所面臨的關(guān)鍵核心技術(shù)堵點,需精確定位堵點,以點帶面打通全產(chǎn)業(yè)鏈,實現(xiàn)芯片自主可控。中國面對光刻工藝與設(shè)備的嚴密封鎖,尖端EUV光刻、離子注入、蝕刻設(shè)備、化學氣相沉積CVD設(shè)備無法獲取的現(xiàn)狀,應(yīng)充分結(jié)合上游分立器件、光電器件等獨立模塊的成功路徑,通過原創(chuàng)性攻關(guān)能力的積累,逐漸縮小技術(shù)代差。

        技術(shù)類目同樣作為一級分類,在限制上述分類的一般性技術(shù)出口的同時對軍用電子設(shè)備技術(shù)部分限制進行全方位的用途限制,不僅意圖使受限國無法生產(chǎn)特種設(shè)備,并且安裝、使用、維護、維修均需高度依賴領(lǐng)先國壟斷技術(shù)。在補充的其他技術(shù)模塊,屬于前沿技術(shù)領(lǐng)域卡位布局政策,部分領(lǐng)域如 “量子阱” “超晶閣器件” “超導(dǎo)材料”等技術(shù)仍處在開發(fā)階段,提前進行了出口管制卡位布局,意圖壟斷此類技術(shù)。中國面對超前技術(shù)布局,結(jié)合前沿技術(shù)特點,應(yīng)充分發(fā)揮舉國體制優(yōu)勢,全面推動顛覆式創(chuàng)新的出現(xiàn),提前布局前沿技術(shù)領(lǐng)域,形成專利后主動占位,穩(wěn)步構(gòu)建在芯片顛覆式技術(shù)中的優(yōu)勢,引領(lǐng)技術(shù)革命的出現(xiàn),實現(xiàn)未來核心技術(shù)的突破式發(fā)展。

        5 展望

        本研究整合多元數(shù)據(jù)進行處理與分析工作,結(jié)合專利、管制政策和產(chǎn)業(yè)鏈特點構(gòu)建可移植的集成分析框架,但仍存在一些可以改進的部分,未來可針對以下方向進一步研究。第一,IPC分類技術(shù)主題與產(chǎn)業(yè)的定位關(guān)系可以進一步細化,將產(chǎn)業(yè)鏈特點進行更深入的挖掘細分,再進一步對更精確的IPC分類號進行定位與國別態(tài)勢分析。第二,LDA主題建模的結(jié)果可以通過調(diào)參不斷優(yōu)化結(jié)果輸出,多次迭代人工剔除過于籠統(tǒng)的主題詞并過濾無關(guān)的關(guān)鍵詞,優(yōu)化概率分布,根據(jù)主題數(shù)判別指標,輸出更多的最優(yōu)主題數(shù),進行更精確的核心技術(shù)主題識別與分析。第三,本研究集中于分析框架構(gòu)建、數(shù)據(jù)庫建立、產(chǎn)業(yè)鏈定位與算法分析,聚焦出口管制清單文本第三類電子設(shè)計開發(fā)和生產(chǎn)進行實證研究,未來可以進一步針對美國出口管制清單中核材料設(shè)施和設(shè)備、材料化學品微生物和毒素、導(dǎo)航和航空電子設(shè)備等剩余9個其他不同類目領(lǐng)域技術(shù)使用本文集成方法進行堵點識別與分析并提出針對性的建議。此外,研究不局限于美國商務(wù)部BIS的管制清單,結(jié)合自然語言處理算法可以為不同關(guān)鍵核心產(chǎn)業(yè)結(jié)合政策文本對照分析提供整體分析框架,為打贏關(guān)鍵核心技術(shù)攻堅戰(zhàn)提供數(shù)據(jù)分析框架與決策支持。

        猜你喜歡
        數(shù)據(jù)庫文本分析
        隱蔽失效適航要求符合性驗證分析
        在808DA上文本顯示的改善
        電力系統(tǒng)不平衡分析
        電子制作(2018年18期)2018-11-14 01:48:24
        基于doc2vec和TF-IDF的相似文本識別
        電子制作(2018年18期)2018-11-14 01:48:06
        數(shù)據(jù)庫
        財經(jīng)(2017年2期)2017-03-10 14:35:35
        電力系統(tǒng)及其自動化發(fā)展趨勢分析
        數(shù)據(jù)庫
        財經(jīng)(2016年15期)2016-06-03 07:38:02
        數(shù)據(jù)庫
        財經(jīng)(2016年3期)2016-03-07 07:44:46
        數(shù)據(jù)庫
        財經(jīng)(2016年6期)2016-02-24 07:41:51
        文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學隱喻
        草草地址线路①屁屁影院成人| 女优av福利在线观看| 免费国产不卡在线观看| 久久高潮少妇视频免费| 日本中文字幕乱码中文乱码| 午夜一区二区视频在线观看| 精品亚洲国产成人| 亚洲av成人无码网天堂| 毛片网站视频| 91最新免费观看在线| 内射中出后入内射极品女神视频| 97精品一区二区三区| 亚洲av无码电影在线播放| 欧美人与动人物牲交免费观看| 日本理论片一区二区三区| 偷窥偷拍一区二区三区| 亚洲小说区图片区色综合网| 国产av旡码专区亚洲av苍井空| 日本道精品一区二区三区| 麻豆AV免费网站| 一区二区三区日本在线| 国产成人亚洲精品91专区高清| 日韩精品第一区二区三区| 最新亚洲人成网站在线观看| 国产在线91观看免费观看| 黄色录像成人播放免费99网| 一区二区视频资源在线观看| 亚洲国产区中文在线观看| av免费网址在线观看| 日日噜狠狠噜天天噜av| 亚洲中文无码成人影院在线播放 | 亚洲av综合色区| 日韩a毛片免费观看| 国产欧美久久久精品影院| 国产激情综合五月久久| 亚洲综合色婷婷七月丁香| 东北寡妇特级毛片免费| 亚洲AV无码未成人网站久久精品 | 国产夫妻精品自拍视频| av影片在线免费观看| 性色av浪潮av色欲av|