李慧慧
(1.北方民族大學 管理學院,銀川 750021;2.合肥工業(yè)大學 管理學院,合肥 230009)
基于共詞分析法的我國產業(yè)結構研究熱點解析
李慧慧1,2
(1.北方民族大學 管理學院,銀川 750021;2.合肥工業(yè)大學 管理學院,合肥 230009)
基于共詞分析法,分析了27495篇產業(yè)結構相關論文中出現的26467個關鍵詞,統(tǒng)計出63個高頻關鍵詞。從詞頻分析可以看出,“就業(yè)結構”“就業(yè)”“第三產業(yè)”“產業(yè)結構升級”“工業(yè)化”等關鍵詞出現頻率很高,是產業(yè)結構領域研究中的熱點內容。同時,通過構建高頻關鍵詞的共詞矩陣、相似矩陣、相異矩陣并運用多元統(tǒng)計分析發(fā)現,我國產業(yè)結構研究主要集中在第三產業(yè)、就業(yè)結構、城鎮(zhèn)化進程這三個領域。
產業(yè)結構;共詞分析;產業(yè)發(fā)展
目前,我國產業(yè)結構處于重要的調整轉型期,一方面,國際金融危機導致外需急劇波動,對外依存度過高的風險日益凸顯;另一方面,內需也在不斷萎縮,同時產能過剩、人口紅利消失、生產要素成本上升等問題不斷凸顯。要保持經濟可持續(xù)發(fā)展,就必須調整產業(yè)結構,推進產業(yè)轉型升級。為此,我國學者在產業(yè)結構調整方面進行了大量研究,涌現了大批研究成果。本文擬利用共詞分析法探究2012—2016年間我國產業(yè)結構研究熱點,以期更加直觀和科學地反映我國產業(yè)結構研究的熱點領域。
共詞分析來源于文獻計量學的引文耦合與共被引概念[1]。1986年,法國國家科學研究中心CNRS(Centre National de la Recherche Scientifique)的M.Callon、J.Law和A.Rip出版了第一部關于共詞分析的專著——《Mapping the Dynamics of Science and Technology》[2]。經過幾十年的發(fā)展,該方法逐步在醫(yī)學、人工智能等不同領域得到了廣泛應用,相關領域的學者利用該方法概述了各領域的研究熱點、發(fā)展趨勢等。
共詞分析法主要是利用文獻集中詞匯對或名詞短語共同出現的情況來確定該文獻集所代表學科中各主題之間的關系。一般認為詞匯對在同一篇文獻中出現的次數越多,則代表這兩個主題的關系越緊密[3]。通過這種方法可以提取所需研究領域的文獻主題詞,統(tǒng)計高頻詞匯,然后利用數學統(tǒng)計將詞匯關系轉化為數值或者圖形。
本文從中國知網(CNKI)中的《中國期刊全文數據庫》《中國碩博士學位論文全文數據庫》《會議論文》三個數據庫中,以“產業(yè)結構”為關鍵詞,以2012年1月—2016年12月為檢索時間段,共檢索到論文27495篇。通過CNKI以ENDNOTE格式提取檢索到文獻的題錄信息。
將從CNKI中導出的題錄信息導入SATI3.2文獻題錄信息統(tǒng)計分析軟件,經過去重處理,共有373218條記錄。然后抽取關鍵詞進行統(tǒng)計,共得到關鍵詞26467個。為了最大限度消除我們對關鍵詞人為合并的主觀影響,體現和反映作者群體對特定關鍵詞的共識度,對關鍵詞并未做同義詞合并處理,僅僅去掉“對策”“影響”“措施”等非實質性詞語,同時,因為本文以“產業(yè)結構”為檢索詞,所以“產業(yè)結構”在共詞分析中無法發(fā)揮作用,故刪除。最終得到關鍵詞26064個。
利用SATI軟件對26064個關鍵詞進行了詞頻統(tǒng)計,選定詞頻高于100次的63個關鍵詞作為本文研究的主要關鍵詞。部分高頻關鍵詞見表1。
表1 部分高頻關鍵詞
然后,對這63個關鍵詞進行兩兩共詞檢索,統(tǒng)計它們在27495篇論文中出現的次數,形成了63*63的共詞矩陣,部分矩陣如表2。
共詞矩陣是一個相關矩陣,對角線上的數字是該詞出現的頻次,如“經濟增長”共出現1205次,它與“新興產業(yè)”同時在29篇論文中出現過。從關鍵詞共詞矩陣可以看出,產業(yè)結構的研究內容相對分散,說明學者們對產業(yè)結構的研究角度存在一定的差異性。
由于本文將運用多元統(tǒng)計分析方法進行相關分析,所以需將共詞矩陣轉化為相似矩陣和相異矩陣以滿足不同的統(tǒng)計方法對數據的要求,于是利用SATI軟件中的相似矩陣和相異矩陣功能對共詞矩陣進行了轉換。SATI3.2為消除多值共現矩陣中頻次懸殊對統(tǒng)計結果造成的影響,采用Equivaience系數,將多值矩陣轉化為元素值在[0,1]區(qū)間取值的相似矩陣[4],部分相似矩陣如表3,具體公式為:
其中,Eij為相似矩陣元素的值,對于詞條Ti和Tj,Fij為 Ti和 Tj的共現次數,Fi為 Ti出現的總頻次,Fj為Tj出現的總頻次。
相似矩陣中的數字代表矩陣元素之間的相似性,兩詞之間的數字越大,越接近1,表示兩詞之間的距離越近,相似度越大;兩詞之間的數字越小,越接近0,表示兩詞之間的距離越遠,相似度越小。對角線上的數據為1,表示該詞自身的相關度。
由于相似矩陣中的0值過多,容易造成較大誤差,因此用1與相似矩陣的數據相減的值作為相異矩陣元素的值,生成相異矩陣,部分相異矩陣如表4。相異矩陣中的數字為不相似數據,數值越大表示兩詞之間的距離越遠,越不相似;數值越小表示兩詞之間的距離越近,相似度越大。
表2 部分高頻關鍵詞共詞矩陣
表3 部分高頻關鍵詞相似矩陣
表4 部分高頻關鍵詞相異矩陣
多元統(tǒng)計分析是統(tǒng)計學中內容十分豐富、應用范圍極為廣泛的一個分支。而在共詞分析中,最常用的多元統(tǒng)計分析方法主要有因子分析、聚類分析和多維尺度分析。本文將利用因子分析和多維尺度分析對高頻關鍵詞進行分析,進而揭示產業(yè)結構研究的現狀和熱點。
1.因子分析。因子分析是利用降維的思想,通過研究眾多變量之間的內部依賴關系,探求觀測數據中的基本結構,并用少數幾個抽象的變量來表示其基本的數據結構。其目的就是用少數幾個因子去描述許多指標或者因素之間的聯系,即將相互關系比較密切的幾個變量歸在同一類別之中,每一類變量就成為一個因子[5]。將共詞矩陣導入SPSS21,得到表5。
從表5可以看出,共提取了5個公共因子,其累計方差貢獻率為88.89%,其中第二、三、四個因子的方差貢獻率較高,分別為64.08%、6.21%和10.84%,這是國內產業(yè)結構研究的三個重要領域??傮w來看,我國產業(yè)結構研究呈現總體分散、相對集中的特點,這與前文統(tǒng)計的關鍵詞詞頻結果基本一致。
從因子個數碎石圖(見圖1)也可以看出,從第6個公因子開始,曲線開始變平,而第四個與第五個的貢獻率不高并且差別不大。根據因子具有命名解釋性的特點,本文對5個公共因子分別命名(見表6)。
圖1 碎石圖
關鍵詞的荷載量反映了關鍵詞在其公共因子中的相關度。根據本文的實際情況,將特征值定為1。表6顯示,63個關鍵詞中共有39個參與了分類,這可能由于有些關鍵詞盡管頻次很高,但涵蓋的主
題范圍比較寬泛,在因子分析中無法體現特色,如“就業(yè)質量”,它在5個主成份中的方差貢獻率分別為0.03、-0.028、-0.093、-0.057、-0.054,貢獻率非常小,沒有實際意義,故剔除。同時,還有一些關鍵詞對幾個主成份的貢獻率幾乎相同,如“城市化進程”,在第1、2、3個公共因子中的貢獻率分別為0.161、0.152、0.146。一個關鍵詞同時出現在3個公共因子當中,并且作用大小幾近相同,這說明不同研究類別之間具有聯系性。
表5 解釋的總方差(部分)
表6 因子分析確定的研究熱點
另外,從公共因子命名和所涵蓋的關鍵詞可以看出,第4個、第5個公共因子雖然和產業(yè)結構相關度很高,但并沒有反映出產業(yè)結構的研究領域和熱點,故主要取前三個公共因子進行研究。
2.多維尺度分析。多維尺度分析試圖通過測定或觀測研究個體之間的距離來發(fā)現數據結構,其目的是將研究個體之間的距離盡可能地用二維或者三維的空間距離加以反映,這樣可以客觀地反映研究個體之間的相似性關系[6]。該方法比較直觀,可以作為因子分析的輔助工具。在多維尺度分析結果中,被分析的對象以點狀分布,每個點的位置表示分析對象之間的相似性;這樣高度相似的對象就會聚集到一起。趨近于中心點的位置且分布較為集中的關鍵詞代表受到較高關注的方向,越在邊緣的說明其研究主題越狹小,或正過渡到其他主題[7]。
本文將相異矩陣導入SPSS21,利用多維尺度分析繪制產業(yè)結構的熱點知識圖譜(見圖2)。通過觀察可以發(fā)現,知識圖譜中點的聚集情況基本呈現出總體相對分散、局部比較集中的特征,這與因子分析的結果基本一致。第四、第五個公共因子所涵蓋的關鍵詞穿插在前三個公共因子所涵蓋的關鍵詞當中,說明我國產業(yè)結構相關研究相對獨立,內部聚合程度不高,同時也說明我們將前三個公共因子所代表的領域作為我國產業(yè)結構研究的熱點領域是符合實際情況的。
圖2 我國就業(yè)結構研究知識圖譜
從產業(yè)結構相關研究的詞頻和多元統(tǒng)計分析可以看出,我國產業(yè)結構相關研究呈現總體分散、局部聚集的特征,也就是說產業(yè)結構在我國得到了很多學者的關注,形成了豐富多樣的研究,但主要都還是圍繞就業(yè)結構、第三產業(yè)、城市化等關鍵詞進行。如果這些因素能夠不斷優(yōu)化組合,將會促進產業(yè)結構調整,進而推動經濟快速增長。
1.產業(yè)結構與就業(yè)結構的協(xié)調發(fā)展研究。我國經濟要想升級,就需要產業(yè)結構與就業(yè)結構協(xié)調發(fā)展,合理的產業(yè)結構能夠推動就業(yè)結構的良性發(fā)展;優(yōu)質的就業(yè)結構也為產業(yè)結構的轉型升級奠定堅實基礎。然而目前關于產業(yè)結構與就業(yè)結構協(xié)調性問題的研究中,更多的是利用結構偏離度、協(xié)整理論等作為定量分析手段,這些分析方法雖然能一定程度地衡量產業(yè)結構和就業(yè)結構之間的協(xié)調性,但缺乏整體性,定量分析的方法也不具優(yōu)勢。所以,如何通過更科學、可靠的手段和方法,分析和研究就業(yè)結構和產業(yè)結構之間的互動關系,是今后產業(yè)結構研究中的一個重要內容。
2.產業(yè)結構調整下的第三產業(yè)發(fā)展研究。第三產業(yè)涵蓋的范圍比較廣,行業(yè)比較多,如何根據實際情況,研究分析各地第三產業(yè)內部結構情況,查找第三產業(yè)發(fā)展較慢的原因,借鑒發(fā)達國家第三產業(yè)發(fā)展的經驗,加快和促進新興第三產業(yè)的快速發(fā)展,是今后相關研究的一個重點方向。同時,如何分析第三產業(yè)的就業(yè)情況,也將為國家制定相應的教育政策和人力資源開發(fā)計劃、宏觀經濟政策,健全和完善勞動力市場的運行,奠定科學基礎。
3.城鎮(zhèn)化進程對產業(yè)結構的影響。城鎮(zhèn)化進程是人力資源、基礎設施、商業(yè)信息等各種要素的整合過程,對產業(yè)結構升級具有重要的拉動作用,也是促進產業(yè)結構升級的重要抓手,《國家新型城鎮(zhèn)化規(guī)劃(2014—2020年)》的出臺,進一步明確了新型城鎮(zhèn)化的發(fā)展方向,將新型城鎮(zhèn)化和工業(yè)化作為我國實現現代化的兩大引擎[8]。那么,如何更加合理科學推動城鎮(zhèn)化進程,在現有產業(yè)結構基礎上,實現兩者之間的有機結合及良性互動,是我國經濟社會發(fā)展面臨的今后面臨的重大課題,也是學者們今后的一個重點研究方向。
[1]儲節(jié)旺,郭春俠.共詞分析法的基本原理及EXCEL實現[J].情報科學,2011,(6):931-934.
[2]Callon M,Law J,Rip A.Mapping the Dynamics of Science and Technology:Sociology of Science in the Real World[M].Macmillan,1986:89.
[3]賀穎,邱均平.同行評議專家遴選的科學計量方法與實證研究[J].圖書情報工作,2012,(3):33-37.
[4]劉啟元,葉鷹.文獻題錄信息挖掘技術方法及其軟件SATI的實現——以中外圖書情報學為例[J].信息資源管理學報,2012,(1):50-58.
[5]趙飛娟.西安市創(chuàng)新型科技人才素質模型構建與實證研究[D].西安:西安郵電學院,2011.
[6]張凌,周春雷,寇廣增.基于共詞分析的國內知識服務研究[J].圖書情報工作,2009,(12):64-68.
[7]賈利軍,管靜娟,楊婭蓓.我國就業(yè)能力的研究熱點及其解析[J].華東師范大學學報(哲學社會科學版),2013,(5):24-31.
[8]郭曉川.內蒙古新型城鎮(zhèn)化、產業(yè)結構合理化協(xié)調發(fā)展研究[J].內蒙古大學學報(自然科學版),2017,(7):1-10.
Research Focus on the Industrial Structure Based on Co-word Analysis
LI Hui-hui1,2
(1.School of Management,BeiFang University of Nationalities,Yinchuan 750021,China;2.School of Management,HeFei University of Technology,HeFei 230009,China)
Based on the co-word analysis method,this paper analyzes 4067 keywords in 2732 articles related to industrial structure,and counts 58 high frequency keywords.From the frequency analysis,we can see that the key words such as"Employment Structure","Employment","upgrading of an industrial structure","Urbanization"and"Industrialization"are very frequent and are hot topics in industrial structure research.At the same time,through the construction of co-word matrix,similarity matrix and dissimilarity matrix of high-frequency keywords,we find that China's industrial structure is mainly concentrated in the tertiary industry,employment structure and urbanization process by multivariate statistical analysis.
industrial structure;co-word analysis;industrial development
F269.24;F224
A
1672-626X(2017)06-0042-06
10.3969/j.issn.1672-626x.2017.06.006
2017-07-06
北方民族大學校級科研一般項目(GLXY201602)
李慧慧(1982-),女,黑龍江牡丹江人,北方民族大學管理學院講師,合肥工業(yè)大學管理學院博士研究生,研究方向為產業(yè)經濟、人力資源管理。
彭晶晶)