李帥 秦江濤
基于CiteSpaceⅢ的股票研究知識(shí)圖譜分析
李帥秦江濤
選取美國(guó)科學(xué)情報(bào)研究所(ISI)1997年推出的Web of Science網(wǎng)絡(luò)數(shù)據(jù)庫(kù)中關(guān)于股票研究的相關(guān)文獻(xiàn)數(shù)據(jù)。使用CiteSpaceⅢ軟件為工具,結(jié)合可視化科學(xué)知識(shí)圖譜方式展現(xiàn)股票研究領(lǐng)域最具影響力的學(xué)者和文獻(xiàn),描繪股票研究熱點(diǎn)的演進(jìn)軌跡,探討該領(lǐng)域的國(guó)家和研究機(jī)構(gòu)研究實(shí)力分布現(xiàn)狀。
股票研究;知識(shí)圖譜;CitespaceⅢ
在經(jīng)濟(jì)學(xué)、管理學(xué)、金融投資等方面,股票研究一直是個(gè)熱點(diǎn)課題,結(jié)合當(dāng)下大數(shù)據(jù)、云計(jì)算和互聯(lián)網(wǎng)+等信息技術(shù)手段,有學(xué)者已經(jīng)對(duì)股票研究展開深入剖析。如陳穎瑩的《基于Web挖掘的新股破發(fā)原因探究及預(yù)測(cè)》[1]、余劍秋的《基于復(fù)雜網(wǎng)絡(luò)的股票相關(guān)性分析研究》。[2]
股票研究到底包含哪些研究熱點(diǎn)呢?雖然有綜述文獻(xiàn)對(duì)此作了一些探索性的歸納和概括,但由于這些歸納和概括是建立在不同時(shí)期的文獻(xiàn)數(shù)據(jù)基礎(chǔ)上,缺乏數(shù)據(jù)的連續(xù)性、完整性,也無法保證研究方法的客觀性、一致性。
針對(duì)研究數(shù)據(jù)和研究方法的不足,本文選取Web of Science數(shù)據(jù)庫(kù)中的有關(guān)股票研究文獻(xiàn)數(shù)據(jù),在數(shù)據(jù)時(shí)間的連續(xù)性、內(nèi)容完整性和數(shù)據(jù)質(zhì)量方面進(jìn)行有力保障;利用CitespaceⅢ知識(shí)計(jì)量工具,以科學(xué)知識(shí)圖譜[3]的方式梳理股票研究歷史脈絡(luò),揭示股票研究熱點(diǎn),把握其發(fā)展趨勢(shì)。
1.數(shù)據(jù)來源
在Web of Science數(shù)據(jù)庫(kù)中[4],以Web of Science TM核心合集數(shù)據(jù)庫(kù)為數(shù)據(jù)源,選取檢索的時(shí)間跨度為2005-2015年,共11年,檢索主題為“Stock”,在分類中選擇ECONOMICS分類,共檢索得到1917篇文獻(xiàn)。下載所有文獻(xiàn)的相關(guān)信息,包括篇名、作者、來源期刊、機(jī)構(gòu)、摘要、關(guān)鍵詞、發(fā)表年份、期(卷)及參考文獻(xiàn)等,并進(jìn)行數(shù)據(jù)整理,將其作為股票研究狀況整體描述的樣本。在時(shí)間分區(qū)中,以1年為單位,將2005-2015的11年分成11個(gè)時(shí)段。
2.研究方法
本研究選擇2004年由美國(guó)Drexel大學(xué)陳超美教授研制的CiteSpaceⅢ(版本號(hào)為3.9.R6)知識(shí)可視化分析工具,該軟件的主要目的是在知識(shí)領(lǐng)域中通過運(yùn)用可視化技術(shù)方便用戶進(jìn)行突發(fā)趨勢(shì)和技術(shù)預(yù)測(cè),它還可以識(shí)別和跟蹤研究領(lǐng)域的演變,對(duì)某一學(xué)科領(lǐng)域根據(jù)時(shí)間順序來研究這一領(lǐng)域的熱點(diǎn)變化過程和發(fā)展趨勢(shì)。[5]
在國(guó)內(nèi),最有影響力之一的大連理工大學(xué)的劉則淵教授帶領(lǐng)的團(tuán)隊(duì),使用CiteSpaceⅢ軟件在信息可視化領(lǐng)域創(chuàng)造了豐碩的成果。對(duì)于CiteSpaceⅢ在中文數(shù)據(jù)處理上的缺陷,他們提出了改進(jìn)和優(yōu)化,增加了使其可以對(duì)從CSSCI/CNKI數(shù)據(jù)庫(kù)上下載的中文數(shù)據(jù)進(jìn)行分析研究的部分。[6][7]
將下載的2005-2015年符合要求的1917篇“Stock”相關(guān)數(shù)據(jù)全部錄入CiteSpaceⅢ軟件中,設(shè)定相關(guān)選項(xiàng)。首先,設(shè)定時(shí)間跨度為1年,按文獻(xiàn)出版年劃分為11個(gè)時(shí)間段。調(diào)節(jié)CiteSpaceⅢ的數(shù)據(jù)篩選策略,選擇“Pathfinder”算法和“Clus?ter”分析,依據(jù)分析內(nèi)容的不同,選定相應(yīng)的網(wǎng)絡(luò)節(jié)點(diǎn),如作者、關(guān)鍵詞、機(jī)構(gòu)、國(guó)家、被引期刊等,運(yùn)行CiteSpaceⅢ軟件。
1.引文概況分析
根據(jù)統(tǒng)計(jì),在Web of Science數(shù)據(jù)庫(kù)中以“Stock”為主題詞,在ECONOMICS分類下的文獻(xiàn)由2005年的98篇增長(zhǎng)到了2015年的140篇(圖1),2007年次貸危機(jī)乃至2008全球金融危機(jī)引發(fā)了人們對(duì)股票研究的思考,在此期間發(fā)表的文獻(xiàn)數(shù)量高達(dá)282篇。股票研究越來越受到研究學(xué)者的重視,計(jì)算機(jī)技術(shù)及信息技術(shù)的發(fā)展也為股票研究提供了更多的便捷手段。11年間,共搜索得到了1917篇科技文獻(xiàn),列出引文共11325篇,有效引文10709篇。
圖1 Web of Science中2005-2015年股票研究論文年發(fā)表篇數(shù)
2.被引作者分析
高頻引的被引作者通常是某個(gè)學(xué)術(shù)領(lǐng)域的奠基人或者是在這個(gè)領(lǐng)域的發(fā)展過程中貢獻(xiàn)很大的作者。股票研究的發(fā)展必然離不開高頻被引作者對(duì)該領(lǐng)域的貢獻(xiàn),本研究綜合2005-2015年間所有的股票文獻(xiàn),對(duì)收集到的文獻(xiàn)數(shù)據(jù)選擇以下篩選方式:選擇每一時(shí)間片段中被引頻次或出現(xiàn)頻次最高的50個(gè)數(shù)據(jù),網(wǎng)絡(luò)節(jié)點(diǎn)確定為Cited Author,得出可視化圖譜(圖2)。
按照所設(shè)篩選條件,11年間圖中共選出作者(nodes)220個(gè),鏈接路徑(links)數(shù)目為248。選取共被引次數(shù)最高的20名作者,結(jié)果見表1。
圖2 共被引作者綜合圖譜
表1 被引次數(shù)排名前20位作者(2005-2015)
根據(jù)對(duì)Web of Science數(shù)據(jù)庫(kù)中2005-2015年股票文獻(xiàn)引證統(tǒng)計(jì),該領(lǐng)域共被引次數(shù)最高的作者是羅伯特·恩格爾(Engle RF)教授。作為近20年來金融計(jì)量領(lǐng)域的重要開拓者,他對(duì)金融市場(chǎng)分析長(zhǎng)期持有濃厚的興趣,在金融計(jì)量經(jīng)濟(jì)學(xué)的興趣涉及金融市場(chǎng)微觀結(jié)構(gòu)、權(quán)益資產(chǎn)、利率、匯率和期權(quán)等。在恩格爾看來,隨著電子化交易的發(fā)展,未來的金融計(jì)量經(jīng)濟(jì)學(xué)可以使金融市場(chǎng)的做市商、經(jīng)紀(jì)人和交易者借助于統(tǒng)計(jì)分析,自動(dòng)地根據(jù)特定市場(chǎng)環(huán)境和目標(biāo)做出最優(yōu)的策略。他的貢獻(xiàn)在于建立了描述經(jīng)濟(jì)時(shí)間序列數(shù)據(jù)時(shí)變波動(dòng)性的關(guān)鍵概念:自回歸條件異方差(ARCH),并發(fā)展了一系列波動(dòng)性模型及統(tǒng)計(jì)分析方法。[8]
3.關(guān)鍵節(jié)點(diǎn)文獻(xiàn)分析
在CiteSpaceⅢ軟件中,網(wǎng)絡(luò)節(jié)點(diǎn)確定為Cited Reference(參考文獻(xiàn)),主題詞來源選擇Title(標(biāo)題)、Abstract(摘要)和De?scriptors & Identifiers(關(guān)鍵詞),調(diào)節(jié)閾值分別設(shè)置為(2,2,20),(4,3,20)和(4,3,20),運(yùn)行軟件得到基于文獻(xiàn)共被引的股票研究知識(shí)圖譜,見圖3,其中包括節(jié)點(diǎn)735個(gè),連線1927條。
圖3 關(guān)鍵節(jié)點(diǎn)文獻(xiàn)圖譜
表2 關(guān)鍵節(jié)點(diǎn)文獻(xiàn)信息
根據(jù)陳超美博士的定義,關(guān)鍵節(jié)點(diǎn)是共被引網(wǎng)絡(luò)圖譜中連接兩個(gè)以上不同聚類,且相對(duì)中心度和被引頻次較高的節(jié)點(diǎn)。在表2中,10篇關(guān)鍵節(jié)點(diǎn)文獻(xiàn)中,被引頻次最高的是羅伯特·恩格爾(Engle RF)教授于1982年在《計(jì)量經(jīng)濟(jì)學(xué)》(Econo?metrica)上發(fā)表的Autoregressive Condition?al Heteroscedasticity with Estimates of the Variance of United Kingdom Inflation。在這篇文章中,恩格爾創(chuàng)造性地提出以自回歸條件異方差(ARCH)模型對(duì)時(shí)變的波動(dòng)率進(jìn)行建模,他用ARCH模型刻畫英國(guó)通貨膨脹率中存在的條件異方差,并認(rèn)為條件異方差是外生變量、滯后的內(nèi)生變量、時(shí)間、參數(shù)和前期殘差的函數(shù)。
4.股票研究熱點(diǎn)分析
關(guān)鍵詞作為文章的核心和精髓是文章主體內(nèi)容的高度概括和凝練。對(duì)一篇文章的關(guān)鍵詞進(jìn)行分析時(shí),人們往往以頻次高的關(guān)鍵詞來確定一個(gè)研究領(lǐng)域的熱點(diǎn)問題。[9]共詞分析是基于關(guān)鍵詞內(nèi)容的分析方法,根據(jù)在同一篇論文中關(guān)鍵詞的共現(xiàn),來確定該篇論文所屬的研究領(lǐng)域里不同主題間所具有的內(nèi)部相關(guān)性,并借此分析某個(gè)學(xué)科的發(fā)展進(jìn)程。利用論文關(guān)鍵詞的聚類,能夠更好地總結(jié)歸納學(xué)科的研究熱點(diǎn)與前沿。[10]
選擇閾值(3,2,13),(4,2,15),(5,3,18),網(wǎng)絡(luò)節(jié)點(diǎn)確定為Keyword,對(duì)所有文獻(xiàn)做關(guān)鍵詞共現(xiàn)分析,以時(shí)區(qū)視圖顯示。
在圖4中,各年度的重要主題詞清晰可見,這些主題詞的變化,十分準(zhǔn)確地反映了股票研究領(lǐng)域中研究熱點(diǎn)的演進(jìn)情況。
圖4 關(guān)鍵詞共現(xiàn)分析圖譜
表3 股票研究高頻次關(guān)鍵詞列表
從表中我們注意到,前10位關(guān)鍵詞中models和model的頻次相加,發(fā)現(xiàn)“股票模型”(model(s))在2005-2015年出現(xiàn)的頻次實(shí)際為292次,居于第一位;stock returns 和returns也是一組近義詞,頻次實(shí)際為230次,位居第二。由此可以看出,被工程管理研究者們使用頻次最多的前5個(gè)核心詞匯是:股票模型(292次)、股票收益(230次)、風(fēng)險(xiǎn)(127次)、波動(dòng)(123次)、股價(jià)(96次)。這5個(gè)關(guān)鍵詞匯無論是前5年還是最近5年,以及這10年以來一直都是在股票研究領(lǐng)域中最為熱門的研究主題。
5.國(guó)家(地區(qū))研究實(shí)力分布
在數(shù)據(jù)分析過程中,將網(wǎng)絡(luò)節(jié)點(diǎn)類型設(shè)置成“Country”,然后運(yùn)行軟件,得到有關(guān)國(guó)家(地區(qū))研究實(shí)力分布圖譜,見圖5。
圖5 各國(guó)(地區(qū))研究實(shí)力分布
從圖5中可以清晰看出在股票研究領(lǐng)域中,美國(guó)作為世界第一經(jīng)濟(jì)體,有著完善的經(jīng)濟(jì)制度,股票研究領(lǐng)域居于世界首位,相關(guān)文獻(xiàn)452篇;中國(guó)目前是世界第二大經(jīng)濟(jì)體,但最新統(tǒng)計(jì)報(bào)告顯示,中國(guó)即將超越美國(guó)成為世界最大的經(jīng)濟(jì)體,在經(jīng)濟(jì)發(fā)展的同時(shí),股票研究在中國(guó)也異軍突起,發(fā)表410篇相關(guān)文獻(xiàn);英國(guó)、德國(guó)和加拿大等國(guó)在股票研究領(lǐng)域也做出了重要貢獻(xiàn)。由此可見,我國(guó)在股票研究領(lǐng)域的研究實(shí)力比較強(qiáng),中國(guó)政治和經(jīng)濟(jì)制度的特點(diǎn),使得中國(guó)率先走出金融危機(jī)的陰霾,邁出了經(jīng)濟(jì)復(fù)蘇的步伐,對(duì)于中國(guó)股票市場(chǎng)的研究也被更多的學(xué)者關(guān)注。
通過對(duì)收集的1917篇股票研究相關(guān)文獻(xiàn)的時(shí)間和地區(qū)分布情況可知,以股票研究為主題的文獻(xiàn)不斷涌現(xiàn),尤其在2008年全球金融危機(jī)之際,股票研究得到了學(xué)者的廣泛關(guān)注;美國(guó)在該領(lǐng)域的研究實(shí)力居于首位,中國(guó)排在第二位,我國(guó)的股票研究實(shí)力在全球范圍內(nèi)處于領(lǐng)先地位,中美兩國(guó)穩(wěn)定而健全的經(jīng)濟(jì)體制為金融領(lǐng)域的研究提供了良好的基礎(chǔ)。
過去10年間,股票模型(model(s))、股票收益(stock returns)、風(fēng)險(xiǎn)(risk)、波動(dòng)(volatility)、股價(jià)(prices)等一直是股票研究領(lǐng)域的熱點(diǎn)課題,而近兩年來風(fēng)險(xiǎn)防御(risk-aversion)、時(shí)間數(shù)列(time series)、信貸風(fēng)險(xiǎn)(credit risk)等研究熱點(diǎn)悄然興起,逐漸成為股票研究的前沿領(lǐng)域。2003年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)獲得者羅伯特·恩格爾(Engle RF)教授提出自回歸條件異方差(ARCH)模型,成為金融計(jì)量領(lǐng)域的重要開拓者。在現(xiàn)代科學(xué)技術(shù)的支持下,利用大數(shù)據(jù)資源,結(jié)合各種智能算法的海量數(shù)據(jù)處理,通過建模仿真、云計(jì)算等信息化手段,進(jìn)行股票研究,已經(jīng)成為該領(lǐng)域的必然趨勢(shì)。
[1]張穎瑩,李艷紅.基于Web挖掘的新股破發(fā)原因探究及預(yù)測(cè)[J].微型機(jī)與應(yīng)用,2015(3):58-60.
[2]余劍秋.基于復(fù)雜網(wǎng)絡(luò)的股票相關(guān)性分析研究[J].中國(guó)市場(chǎng),2015(22): 42-45.
[3]秦長(zhǎng)江,侯漢清.知識(shí)圖譜——信息管理與知識(shí)管理的新領(lǐng)域[J].大學(xué)圖書館學(xué)報(bào), 2009(27):30-37.
[4] Cronin B,Atkins H B. The web of knowledge: a festschrift in honor of Eugene Garfield. Med?ford: Information Today, 2000.
[5] Chen Chaomei. CiteSpace II: Detecting and vi?sualizing emerging trends and transient pat?terns in scientific literature[J]. Journal of the American Society for Information Science and Technology, 2006,57(3):359-377.
[6]陳悅,陳超美,劉則淵,等. CiteSpace知識(shí)圖譜的方法論功能[J].科學(xué)學(xué)研究,2015,33(2): 242-253.
[7]劉則淵.視覺思維、數(shù)學(xué)思維和哲學(xué)思維的集成之作——陳超美著《科學(xué)前沿圖譜》中譯本推介[J].科學(xué)與管理,2014(03):24-26.
[8] Engle RF. Autoregressive conditional het?eroscedasticity with estimates of the variance of U.K. inflation[J].Econometrica, 1982(50): 987-1008.
[9] Bailon-MorenoR,Jurado-Alameda E,Ruiz-Ba?nos R. Analysis of the field of physical chemis?try of surfactants with the unified scienctomet?ric mode l fit of relational and activity indica?tors[J]. Scientometrics, 2005, 63(2) : 259- 276.
[10] Belvaux G, Wolsey LA. Bc- prod: a special?ized branch- and- cut system for lot- sizing problems[J].Management Science,2000,46(5):724-738.
(作者單位:上海理工大學(xué)管理學(xué)院)
10.16653/j.cnki.32-1034/f.2016.07.008