趙公民, 呂京芹, 武勇杰
(中北大學 經濟與管理學院, 太原 030051)
隨著環(huán)境污染與資源消耗問題日益嚴重,作為環(huán)保產業(yè)的新能源汽車受到廣泛關注。國家十分重視新能源汽車的發(fā)展與規(guī)劃,自2001年“十五”時期的電動汽車專項課題開始關注新能源汽車[1]。2010年開始大力召開相關會議開展新能源汽車推廣工作,并頒布具體行業(yè)政策?!吨袊圃?025》報告中,新能源汽車的發(fā)展已經上升為國家戰(zhàn)略[2]。2011年新能源汽車銷量僅為8 259輛,2019達到120.6萬輛,可見新能源汽車產業(yè)的快速發(fā)展與國家產業(yè)支持政策密不可分。因此,政策文本的量化研究對于新能源汽車的發(fā)展以及未來政策制定具有重要意義。
國內外專家學者們對政策文本的研究涵蓋眾多領域。國外學者Kitson等[3]收集1990-2010年近20年間的衛(wèi)生政策進行研究,確定以患者為中心的護理核心要素;Talamini與Dewes[4]研究巴西有關政策文本與學術文獻,分析液體生物燃料政策效果與科研成果之間的差異;Jansa等[5]收集了1984-2014年間美國50個州12項政策的法案文本,研究時間推移政策文本的全面性變化。國內學者曾婧婧[6]以2004-2014年間泛珠三角區(qū)域合作政策文本為研究對象,發(fā)現(xiàn)區(qū)域發(fā)展的差異性以及政府政策制定具有傾向性;黃萃等[7]以1978-2013年出臺的1 298份科技文獻政策為研究對象,發(fā)現(xiàn)政府間合作關系的發(fā)展趨勢;蘇飛與劉紅[8]以省級政府數(shù)據開放政策為研究對象,發(fā)現(xiàn)開放工作中的不足并提出建議;譚玉等[9]對1998-2018年間出臺的59篇大學生創(chuàng)新創(chuàng)業(yè)政策文本進行分析,總結出創(chuàng)新政策的特征;魏萍等[10]從實踐、空間等維度研究湖北省294份“一帶一路”建設政策,發(fā)現(xiàn)主體的擴散與聚焦點。
楊慧與楊建林[11]將政策文本量化分析方法分為文獻計量、社會網絡分析、內容分析以及文本挖掘等類型。在政策文本的研究過程中,文獻計量方法應用領域十分廣泛,劉穎琦等[12]運用文獻計量的方法分析中國新能源汽車產業(yè)聯(lián)盟在知識轉移與技術創(chuàng)新等方面與國外的差距;鄭征等[13]運用文獻計量方法從年代分布、研究主題等角度分析離子液體領域的發(fā)展態(tài)勢;潘丹等[14]綜合運用內容分析法和文獻計量法研究農村環(huán)境管理政策演變特征。社會網絡分析方法一般與文獻計量方法結合使用,李英等[15]結合文獻計量方法與社會網絡分析方法,以2005-2015年間的360篇文獻為研究對象,探討國際綠色車輛路徑的發(fā)展態(tài)勢;趙佳麗等[16]綜合運用文獻計量與社會網絡分析法研究晉商活動的地理特征及山西的地理優(yōu)勢。關于內容分析法的應用,王薇與劉云[17]運用內容分析法對國家出臺的47項新能源汽車政策從基本政策工具與價值鏈進行分析;謝倩等[18]運用內容分析法研究鄉(xiāng)村教師支持政策。文本挖掘則可以深度分析文本的潛在含義,張永安與周怡園[19]采用文本挖掘的方法和PMC指數(shù)模型法對新能源汽車政策進行量化評價;朱青等[20]運用文本挖掘和分類方法,以醫(yī)療訴訟文本為研究對象,設計出輔助判決的決策支持系統(tǒng)。
通過閱讀政策文本量化分析相關文獻,發(fā)現(xiàn)文本挖掘方法能夠憑借技術理性和機器效率對政策文本的潛在信息進行挖掘,并為其他政策文本量化分析方法提供支撐。但政策文本挖掘類的文獻數(shù)量較少,而且主要聚焦于聚類、分類的研究視角。語義視角的政策研究補充是未來文本挖掘技術的焦點,而主題挖掘在語義研究視角方面具有特殊功能。因此,本文以2010-2019年國家、中部六省兩個層級的新能源汽車相關政策作為研究對象,運用主題挖掘技術對政策的高頻詞、主題強度及年度變化進行量化分析,深入挖掘政策文本的潛在信息。
新能源汽車政策文本包括國家、中部六省兩個層級,國家層級政策文本主要從中國政府網、國家發(fā)展和改革委員會、國家能源局等門戶網站進行搜集,中部六省的政策文本主要從相應的省市級的能源局、經信委、發(fā)展和改革委員會等相關門戶網站進行搜集,并結合“北大法寶”(url:http://www.pkulaw.cn/)的搜索結果對政策文本進行整理。整理得到國家層級的政策文本45個,中部六省層級的政策文本共99個。
20世紀90年代政策文本挖掘相關研究逐漸得到發(fā)展,研究對象從原始的非結構化文本發(fā)展至網頁類的半結構化文本再至文獻、報告等非結構化文本。信息技術的飛速發(fā)展對我們搜集信息數(shù)據的方式產生了影響,R語言的機器學習算法對于文本挖掘研究具有重要意義。主題挖掘能夠深入文本內部,文檔的主題研究以及分類、聚類研究都需要語義視角的補充,因此大規(guī)模語料庫的多文檔主題挖掘成為熱點研究對象。主題挖掘的常用手段為主題模型,主要有潛在語義索引(Latent Semantic Index ,LSI)、概率性潛在語義索引(Probabilistic Latent Semantic Index ,PLSI)和潛在狄利克雷分配模型(Latent Dirichlet Allocation ,LDA)等[21], 由于LDA模型的主題分布具有預測訓練集與非訓練集文檔和詞,漸漸得到學者們的認可并給予完善, 使其成為研究非結構化多文本的有效工具。
政策文本的特點是文本較長、語義完整且術語較多,與京東、淘寶等購物網站的評價類文本不同,政策文本不包含情感態(tài)度和個性差別。而且,政策文本與文獻也有區(qū)別,其不具有文獻中的總分結構,且語言表達內容與領域和類別的不同有關。由于政策文本的特性,要對政策文本進行全文挖掘,并將詞層面和語義層面結合起來對文本內容進行主題分析。本文在學者們的研究基礎之上,結合新能源汽車政策的相關特點,構建了主題挖掘模型,模型流程圖如圖1所示。模型分為文本獲取、文本預處理、N-gram模型、高頻詞匯可視化及LDA主題模型幾個部分。
圖1 新能源汽車政策主題挖掘模型示意圖
整理新能源汽車政策文本,得到有效政策文本為國家的政策文本45個,中部六省的政策文本共99個分別為安徽省25個、河南省24個、湖北省11個、湖南省9個、江西省12個、山西省18個。運用R語言中文分詞包結巴分詞(jiebaR),結合哈工大停用詞表、與政策特征停用詞進行停用詞處理。
Suen[22]提出N-gram模型處理文本問題,該模型在許多機器翻譯和文本挖掘等問題的處理中得到應用。N-gram模型的中心觀點是假定在標記流中僅有限定個連續(xù)標記會影響之后的標記。簡單地說,若句子W由K個詞組成,某個詞的出現(xiàn)概率只與前K-1項有關:
(1)
并根據公式(1)進行核心詞匯和詞組的計算。
Blie[23]在2004年提出LDA模型,LDA模型是基于PLSI模型對文檔、主題、詞三層結構對應分布做出改進,給文檔-主題分布與主題-詞分布參數(shù)分別加上狄利克雷先驗分布,構成貝葉斯框架結構。從文檔的文檔-主題分布中得到相應主題,隨后依據主題-詞分布得到相應詞,忽略文檔、詞語的順序,一次性得到與詞相對應的主題,之后逐次生成相應的詞語并組織成文。文檔中詞的概率公式:
p(x|d)=Σtp(x|t)*p(t|d)
(2)
p(x|d)為主題-詞分布,p(t|d)為文檔主題分布,與相乘則為詞-主題-文檔模型。本文采用Gibbs抽樣方法進行參數(shù)估計,將兩個超參數(shù)α、β設置為0.10和0.02,迭代次數(shù)為5 000,得到國家層級的主題數(shù)為20,中部六省的主題數(shù)為20。
為更進一步了解新能源汽車政策文本的特征,對政策文本進行分析并以詞匯頻率作為指標進行排序,篩選出前20的關鍵詞匯,如表1所示。由表1可知,除去新能源、汽車等詞匯,國家、中部六省兩個層級上充電、補助等詞匯頻率都較高,表明基礎設施建設及財政補貼都是關注的焦點。
表1 高頻詞匯
為了更直觀地觀察兩個層次的高頻詞匯,將詞匯進行降序排列,選取前100個詞匯制作詞匯云圖,如圖2所示。云圖中詞匯的大小是由詞匯的頻率決定的,頻率越高詞匯字體越大。觀察兩個層級的云圖可知,新能源汽車均為核心詞匯,國家、中部六省層面中充電設施相較于其它高頻詞匯字體稍大,說明對充電樁等基礎設施建設的重視程度較高。
圖2 詞匯云圖
中部六省高頻詞匯的頻率比國家高出兩倍多說明各省市的出臺政策的關注點較為集中。國家出臺的新能源汽車政策,從高頻詞匯的頻率方面來看動力蓄電池產業(yè)發(fā)展、節(jié)能發(fā)展和基礎設施建設是國家著重強調的方面。中部六省是在國家政策的基礎上根據地方特點制定的相關政策,更加注重充電設施建設、補貼補助等方面。
主題強度是用來衡量國家和中部六省的每個主題相對分量,利用LDA模型中的文檔-主題矩陣和主題-詞矩陣,得到每篇文檔與每個主題和每個主題與每個詞的后驗概率。主題強度公式如下:
(3)
其中,N代表文檔的數(shù)量;θki代表第k個主題在第i個文檔中的概率;pk代表第k個主題的強度。排名前20的主題強度如表2所示。由表2數(shù)據可知,經過軟件運算所得到的主體強度分布情況與人工計算結果基本一致。選取強度數(shù)值最大的三個作為熱門主題,最后確定國家主題(3,13,18),中部六省主題(5,10,20)。表3和表5分別為國家和中部六省兩個層級主題相關度較高的特征詞,與人工判斷與語料查詢相結合得出主題標題。表4、6則為兩個層級的熱門主題年度變化。
表2 主題強度分布
2014年Carson和Kenneth[24]提出了一種主題可視化方法:LDAvis。LDAvis以特征詞和主題的關聯(lián)程度選擇表示主題的特征詞,而且LDAvis可視化圖可以幫助人們從整體的視角觀察各個主題之間的關系。如圖3、圖4分別是國家、中部六省的LDAvis可視化圖,其中每個圓代表一個主題,主題的文檔數(shù)目以圓的大小表示,圓越大表示主題的文檔越多,各個主題的關聯(lián)程度以圓的距離表示,距離越近代表關聯(lián)程度越大。
圖3 國家層級LDAvis可視圖
圖4 中部六省層級LDAvis可視圖
3.2.1 國家主題強度分析
由表3可知,3節(jié)能發(fā)展、13動力蓄電池回收、18基礎設施建設是國家熱門主題。伴隨著環(huán)保問題越來越受到公眾關注,集低污染、高智能于一體化的新能源汽車成為汽車產業(yè)發(fā)展的重點方向。在國家大力發(fā)展新能源汽車的基礎之上,動力蓄電池作為其關鍵部件也呈現(xiàn)快速增長狀態(tài),由于電池充電與放電數(shù)量的增加呈現(xiàn)的衰減性,電池的壽命要遠遠小于汽車的壽命,因此電池的回收再利用是需要引起關注的重點問題。主題18基礎設施建設,Sierzchula等[25]對30多個國家的新能源汽車數(shù)據進行實證分析,發(fā)現(xiàn)充電基礎設施的建設是新能源汽車銷售的關鍵因素。
表3 國家熱門主題詞及相關度
表4 國家熱門主題年份變化表
隨著能源匱乏以及氣候問題越來越嚴重,新能源汽車等綠色產業(yè)的發(fā)展成為有效解決問題的方式之一,受到廣泛關注。2010年國家開始系統(tǒng)性的出臺相關政策推動新能源汽車的發(fā)展。蓄電池作為新能源汽車的核心部件,其使用壽命是5~8年。隨著新能源汽車銷量增加,蓄電池的回收利用成了需要關注的對象,2016—2018年主題強度顯著上升是由于國家出臺了6項蓄電池回收利用相關政策。主題18在2015年主題強度最高,是因為國家于2014年首次在政策中系統(tǒng)地提出基礎設施規(guī)劃。
3.2.2 中部六省主題強度分析
由表5可知,5新能源汽車發(fā)展、10公共設施建設、20財政補貼是中部六省熱門主題。中部六省主要是從推進公共設施建設和財政補貼兩方面推進新能源汽車的發(fā)展。例如:建設充電設施智能服務平臺,在高速公路服務區(qū)、住宅小區(qū)等地安裝充電設施,在合規(guī)的基礎之上優(yōu)先公共充電設施建設用地審批,為新能源汽車建立專門的停車位并在停車費用方面給予一定的優(yōu)惠。對企業(yè)進行補貼,促進其進行技術創(chuàng)新;頒布銷售補貼、免稅等利好政策,引導消費者購買新能源汽車;并結合省情首先從政府等公共機構做起,對傳統(tǒng)燃油公交車的價格補助做出了調整。
表5 中部六省熱門主題詞及相關度
由表6可知,2010年至2014年熱門主題強度變化可以分析出中部六省新能源汽車政策的滯后性。主題5和主題20 在2016年強度都達到最大,主題10在2016年和2017年增加幅度也較大,是因為新能源汽車在政策引導下迅速發(fā)展的同時也受騙補和政策補貼落地問題的影響,國家在2016年出臺十余項政策進行宏觀調控,各省市也積極出臺政策推動新能源汽車穩(wěn)健發(fā)展。然而2019年3月新能源汽車補貼標準大幅調整,地方補貼退出,主題20的強度在2019年降低到0.033 272。毋庸置疑,財政補貼的退坡會導致購置成本增加,然而國家政策的引導是為了促進技術的發(fā)展。
表6 中部六省熱門主題年份變化表
本文基于LDA主題挖掘模型,對新能源汽車政策文本進行量化分析,得到高頻詞匯、主題強度以及年度變化趨勢。主要得到以下結論:
1)國家層級和中部六省層級的政策中公共基礎設施建設主體強度都較高,說明兩個層級都認為基礎設施的建設與完善是新能源汽車發(fā)展的必要條件。只有基礎設施的建設與新能源汽車發(fā)展“兩條腿走路”才會走得更穩(wěn)健、長遠。
2)國家層級與中部六省層級相比而言,國家層級在政策制定時不僅注重新能源汽車的發(fā)展,同時積極落實綠色發(fā)展理念,而中部六省層級更重視基礎保障等具體措施對于新能源汽車發(fā)展的推動作用,大力建設充電樁、停車場的基礎設施;生產過程的企業(yè)技術補貼到銷售過程的客戶購買補貼;從基礎設施建設和財政補貼方面推動新能源汽車發(fā)展。
3)總體而言,政策特點與新能源汽車產業(yè)政策的要求基本一致,政策體系較為完善,但是層級間政策存在互動性不足、忽視傳導滲透作用等問題。如中部六省的蓄電池回收強度較低,與國家主體之間存在差異,可能導致執(zhí)行效果不理想。
通過對國家和中部六省兩個層面的政策文本進行量化分析,總結本次主題挖掘的成果,對新能源汽車的未來發(fā)展提出以下幾點啟示:
1)重視新能源汽車產業(yè)政策的系統(tǒng)性,加強層級間的溝通能力。一是政策制定時充分研究產業(yè)價值鏈的系統(tǒng)發(fā)展,要統(tǒng)籌新能源汽車的研發(fā)、生產、購置、使用及回收等環(huán)節(jié)的系統(tǒng)性政策,而不是針對某一環(huán)節(jié)的政策。二是要根據地區(qū)發(fā)展的實際情況,因地制宜地制定產業(yè)政策,層級間積極溝通,根據政策實施效果不斷進行反饋調整,保證政策有效執(zhí)行。
2)尊重市場規(guī)律,實現(xiàn)“市場+政策”雙輪驅動。一是加強政策意見收集,在制定、出臺政策前要廣泛調研,征求各部門、企業(yè)、用戶的意見,確保政策執(zhí)行實施過程的有效性。例如補貼退坡和免征購置稅等政策漸變式退出,可以促進技術進步和創(chuàng)新發(fā)展,釋放市場的競爭力。二是發(fā)揮市場的主體地位,鼓勵企業(yè)創(chuàng)新商業(yè)模式,拓寬營銷渠道,如發(fā)展“融資租賃”、“分時租賃”、“汽車+”等新業(yè)態(tài)。
3)協(xié)調地方政策實施,夯實層級間協(xié)同基礎。一是各地方要有合作共贏的心態(tài),發(fā)揮區(qū)位優(yōu)勢,攜手推動中部地區(qū)新能源汽車產業(yè)的發(fā)展。中部六省的位置鄰近,技術具有外溢性,所以各省可以在蓄電池回收技術、充電設施地址規(guī)劃等領域加強合作。二是地方產業(yè)政策在實施過程加強互動,能夠減少上下層級間的協(xié)同難度,國家和各省市之間協(xié)同推進新能源汽車的發(fā)展,能更快提升新能源汽車的競爭力,實現(xiàn)從“汽車大國”到“汽車強國”的飛躍。