李帥 秦江濤
基于CiteSpaceⅢ的股票研究知識圖譜分析
李帥秦江濤
選取美國科學情報研究所(ISI)1997年推出的Web of Science網絡數(shù)據(jù)庫中關于股票研究的相關文獻數(shù)據(jù)。使用CiteSpaceⅢ軟件為工具,結合可視化科學知識圖譜方式展現(xiàn)股票研究領域最具影響力的學者和文獻,描繪股票研究熱點的演進軌跡,探討該領域的國家和研究機構研究實力分布現(xiàn)狀。
股票研究;知識圖譜;CitespaceⅢ
在經濟學、管理學、金融投資等方面,股票研究一直是個熱點課題,結合當下大數(shù)據(jù)、云計算和互聯(lián)網+等信息技術手段,有學者已經對股票研究展開深入剖析。如陳穎瑩的《基于Web挖掘的新股破發(fā)原因探究及預測》[1]、余劍秋的《基于復雜網絡的股票相關性分析研究》。[2]
股票研究到底包含哪些研究熱點呢?雖然有綜述文獻對此作了一些探索性的歸納和概括,但由于這些歸納和概括是建立在不同時期的文獻數(shù)據(jù)基礎上,缺乏數(shù)據(jù)的連續(xù)性、完整性,也無法保證研究方法的客觀性、一致性。
針對研究數(shù)據(jù)和研究方法的不足,本文選取Web of Science數(shù)據(jù)庫中的有關股票研究文獻數(shù)據(jù),在數(shù)據(jù)時間的連續(xù)性、內容完整性和數(shù)據(jù)質量方面進行有力保障;利用CitespaceⅢ知識計量工具,以科學知識圖譜[3]的方式梳理股票研究歷史脈絡,揭示股票研究熱點,把握其發(fā)展趨勢。
1.數(shù)據(jù)來源
在Web of Science數(shù)據(jù)庫中[4],以Web of Science TM核心合集數(shù)據(jù)庫為數(shù)據(jù)源,選取檢索的時間跨度為2005-2015年,共11年,檢索主題為“Stock”,在分類中選擇ECONOMICS分類,共檢索得到1917篇文獻。下載所有文獻的相關信息,包括篇名、作者、來源期刊、機構、摘要、關鍵詞、發(fā)表年份、期(卷)及參考文獻等,并進行數(shù)據(jù)整理,將其作為股票研究狀況整體描述的樣本。在時間分區(qū)中,以1年為單位,將2005-2015的11年分成11個時段。
2.研究方法
本研究選擇2004年由美國Drexel大學陳超美教授研制的CiteSpaceⅢ(版本號為3.9.R6)知識可視化分析工具,該軟件的主要目的是在知識領域中通過運用可視化技術方便用戶進行突發(fā)趨勢和技術預測,它還可以識別和跟蹤研究領域的演變,對某一學科領域根據(jù)時間順序來研究這一領域的熱點變化過程和發(fā)展趨勢。[5]
在國內,最有影響力之一的大連理工大學的劉則淵教授帶領的團隊,使用CiteSpaceⅢ軟件在信息可視化領域創(chuàng)造了豐碩的成果。對于CiteSpaceⅢ在中文數(shù)據(jù)處理上的缺陷,他們提出了改進和優(yōu)化,增加了使其可以對從CSSCI/CNKI數(shù)據(jù)庫上下載的中文數(shù)據(jù)進行分析研究的部分。[6][7]
將下載的2005-2015年符合要求的1917篇“Stock”相關數(shù)據(jù)全部錄入CiteSpaceⅢ軟件中,設定相關選項。首先,設定時間跨度為1年,按文獻出版年劃分為11個時間段。調節(jié)CiteSpaceⅢ的數(shù)據(jù)篩選策略,選擇“Pathfinder”算法和“Clus?ter”分析,依據(jù)分析內容的不同,選定相應的網絡節(jié)點,如作者、關鍵詞、機構、國家、被引期刊等,運行CiteSpaceⅢ軟件。
1.引文概況分析
根據(jù)統(tǒng)計,在Web of Science數(shù)據(jù)庫中以“Stock”為主題詞,在ECONOMICS分類下的文獻由2005年的98篇增長到了2015年的140篇(圖1),2007年次貸危機乃至2008全球金融危機引發(fā)了人們對股票研究的思考,在此期間發(fā)表的文獻數(shù)量高達282篇。股票研究越來越受到研究學者的重視,計算機技術及信息技術的發(fā)展也為股票研究提供了更多的便捷手段。11年間,共搜索得到了1917篇科技文獻,列出引文共11325篇,有效引文10709篇。
圖1 Web of Science中2005-2015年股票研究論文年發(fā)表篇數(shù)
2.被引作者分析
高頻引的被引作者通常是某個學術領域的奠基人或者是在這個領域的發(fā)展過程中貢獻很大的作者。股票研究的發(fā)展必然離不開高頻被引作者對該領域的貢獻,本研究綜合2005-2015年間所有的股票文獻,對收集到的文獻數(shù)據(jù)選擇以下篩選方式:選擇每一時間片段中被引頻次或出現(xiàn)頻次最高的50個數(shù)據(jù),網絡節(jié)點確定為Cited Author,得出可視化圖譜(圖2)。
按照所設篩選條件,11年間圖中共選出作者(nodes)220個,鏈接路徑(links)數(shù)目為248。選取共被引次數(shù)最高的20名作者,結果見表1。
圖2 共被引作者綜合圖譜
表1 被引次數(shù)排名前20位作者(2005-2015)
根據(jù)對Web of Science數(shù)據(jù)庫中2005-2015年股票文獻引證統(tǒng)計,該領域共被引次數(shù)最高的作者是羅伯特·恩格爾(Engle RF)教授。作為近20年來金融計量領域的重要開拓者,他對金融市場分析長期持有濃厚的興趣,在金融計量經濟學的興趣涉及金融市場微觀結構、權益資產、利率、匯率和期權等。在恩格爾看來,隨著電子化交易的發(fā)展,未來的金融計量經濟學可以使金融市場的做市商、經紀人和交易者借助于統(tǒng)計分析,自動地根據(jù)特定市場環(huán)境和目標做出最優(yōu)的策略。他的貢獻在于建立了描述經濟時間序列數(shù)據(jù)時變波動性的關鍵概念:自回歸條件異方差(ARCH),并發(fā)展了一系列波動性模型及統(tǒng)計分析方法。[8]
3.關鍵節(jié)點文獻分析
在CiteSpaceⅢ軟件中,網絡節(jié)點確定為Cited Reference(參考文獻),主題詞來源選擇Title(標題)、Abstract(摘要)和De?scriptors & Identifiers(關鍵詞),調節(jié)閾值分別設置為(2,2,20),(4,3,20)和(4,3,20),運行軟件得到基于文獻共被引的股票研究知識圖譜,見圖3,其中包括節(jié)點735個,連線1927條。
圖3 關鍵節(jié)點文獻圖譜
表2 關鍵節(jié)點文獻信息
根據(jù)陳超美博士的定義,關鍵節(jié)點是共被引網絡圖譜中連接兩個以上不同聚類,且相對中心度和被引頻次較高的節(jié)點。在表2中,10篇關鍵節(jié)點文獻中,被引頻次最高的是羅伯特·恩格爾(Engle RF)教授于1982年在《計量經濟學》(Econo?metrica)上發(fā)表的Autoregressive Condition?al Heteroscedasticity with Estimates of the Variance of United Kingdom Inflation。在這篇文章中,恩格爾創(chuàng)造性地提出以自回歸條件異方差(ARCH)模型對時變的波動率進行建模,他用ARCH模型刻畫英國通貨膨脹率中存在的條件異方差,并認為條件異方差是外生變量、滯后的內生變量、時間、參數(shù)和前期殘差的函數(shù)。
4.股票研究熱點分析
關鍵詞作為文章的核心和精髓是文章主體內容的高度概括和凝練。對一篇文章的關鍵詞進行分析時,人們往往以頻次高的關鍵詞來確定一個研究領域的熱點問題。[9]共詞分析是基于關鍵詞內容的分析方法,根據(jù)在同一篇論文中關鍵詞的共現(xiàn),來確定該篇論文所屬的研究領域里不同主題間所具有的內部相關性,并借此分析某個學科的發(fā)展進程。利用論文關鍵詞的聚類,能夠更好地總結歸納學科的研究熱點與前沿。[10]
選擇閾值(3,2,13),(4,2,15),(5,3,18),網絡節(jié)點確定為Keyword,對所有文獻做關鍵詞共現(xiàn)分析,以時區(qū)視圖顯示。
在圖4中,各年度的重要主題詞清晰可見,這些主題詞的變化,十分準確地反映了股票研究領域中研究熱點的演進情況。
圖4 關鍵詞共現(xiàn)分析圖譜
表3 股票研究高頻次關鍵詞列表
從表中我們注意到,前10位關鍵詞中models和model的頻次相加,發(fā)現(xiàn)“股票模型”(model(s))在2005-2015年出現(xiàn)的頻次實際為292次,居于第一位;stock returns 和returns也是一組近義詞,頻次實際為230次,位居第二。由此可以看出,被工程管理研究者們使用頻次最多的前5個核心詞匯是:股票模型(292次)、股票收益(230次)、風險(127次)、波動(123次)、股價(96次)。這5個關鍵詞匯無論是前5年還是最近5年,以及這10年以來一直都是在股票研究領域中最為熱門的研究主題。
5.國家(地區(qū))研究實力分布
在數(shù)據(jù)分析過程中,將網絡節(jié)點類型設置成“Country”,然后運行軟件,得到有關國家(地區(qū))研究實力分布圖譜,見圖5。
圖5 各國(地區(qū))研究實力分布
從圖5中可以清晰看出在股票研究領域中,美國作為世界第一經濟體,有著完善的經濟制度,股票研究領域居于世界首位,相關文獻452篇;中國目前是世界第二大經濟體,但最新統(tǒng)計報告顯示,中國即將超越美國成為世界最大的經濟體,在經濟發(fā)展的同時,股票研究在中國也異軍突起,發(fā)表410篇相關文獻;英國、德國和加拿大等國在股票研究領域也做出了重要貢獻。由此可見,我國在股票研究領域的研究實力比較強,中國政治和經濟制度的特點,使得中國率先走出金融危機的陰霾,邁出了經濟復蘇的步伐,對于中國股票市場的研究也被更多的學者關注。
通過對收集的1917篇股票研究相關文獻的時間和地區(qū)分布情況可知,以股票研究為主題的文獻不斷涌現(xiàn),尤其在2008年全球金融危機之際,股票研究得到了學者的廣泛關注;美國在該領域的研究實力居于首位,中國排在第二位,我國的股票研究實力在全球范圍內處于領先地位,中美兩國穩(wěn)定而健全的經濟體制為金融領域的研究提供了良好的基礎。
過去10年間,股票模型(model(s))、股票收益(stock returns)、風險(risk)、波動(volatility)、股價(prices)等一直是股票研究領域的熱點課題,而近兩年來風險防御(risk-aversion)、時間數(shù)列(time series)、信貸風險(credit risk)等研究熱點悄然興起,逐漸成為股票研究的前沿領域。2003年諾貝爾經濟學獎獲得者羅伯特·恩格爾(Engle RF)教授提出自回歸條件異方差(ARCH)模型,成為金融計量領域的重要開拓者。在現(xiàn)代科學技術的支持下,利用大數(shù)據(jù)資源,結合各種智能算法的海量數(shù)據(jù)處理,通過建模仿真、云計算等信息化手段,進行股票研究,已經成為該領域的必然趨勢。
[1]張穎瑩,李艷紅.基于Web挖掘的新股破發(fā)原因探究及預測[J].微型機與應用,2015(3):58-60.
[2]余劍秋.基于復雜網絡的股票相關性分析研究[J].中國市場,2015(22): 42-45.
[3]秦長江,侯漢清.知識圖譜——信息管理與知識管理的新領域[J].大學圖書館學報, 2009(27):30-37.
[4] Cronin B,Atkins H B. The web of knowledge: a festschrift in honor of Eugene Garfield. Med?ford: Information Today, 2000.
[5] Chen Chaomei. CiteSpace II: Detecting and vi?sualizing emerging trends and transient pat?terns in scientific literature[J]. Journal of the American Society for Information Science and Technology, 2006,57(3):359-377.
[6]陳悅,陳超美,劉則淵,等. CiteSpace知識圖譜的方法論功能[J].科學學研究,2015,33(2): 242-253.
[7]劉則淵.視覺思維、數(shù)學思維和哲學思維的集成之作——陳超美著《科學前沿圖譜》中譯本推介[J].科學與管理,2014(03):24-26.
[8] Engle RF. Autoregressive conditional het?eroscedasticity with estimates of the variance of U.K. inflation[J].Econometrica, 1982(50): 987-1008.
[9] Bailon-MorenoR,Jurado-Alameda E,Ruiz-Ba?nos R. Analysis of the field of physical chemis?try of surfactants with the unified scienctomet?ric mode l fit of relational and activity indica?tors[J]. Scientometrics, 2005, 63(2) : 259- 276.
[10] Belvaux G, Wolsey LA. Bc- prod: a special?ized branch- and- cut system for lot- sizing problems[J].Management Science,2000,46(5):724-738.
(作者單位:上海理工大學管理學院)
10.16653/j.cnki.32-1034/f.2016.07.008