董麗 安璐
摘 要:新興主題目前沒有明確統(tǒng)一的定義,它表述為近幾年來逐漸引起人們興趣,并被越來越多的學(xué)者研究的主題領(lǐng)域,也可以理解為發(fā)現(xiàn)某一特定領(lǐng)域中的焦點(diǎn)、熱點(diǎn),并挖掘最新的變化趨勢時(shí)主動(dòng)提示的過程。文章對(duì)新興主題的研究主要集中在兩點(diǎn):一是研究主題的探測方法,如分類與聚類、可視化等,二是關(guān)于特定學(xué)科的新興主題實(shí)證分析,通過總結(jié)現(xiàn)有研究中的不足,指出未來研究新興主題的研究方向。
關(guān)鍵詞:新興主題 分析方法 分類和聚類 前沿
中圖分類號(hào):G353 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1674-098X(2013)03(c)-00-03
從海量的科技信息中探測新興主題是科技創(chuàng)新的關(guān)鍵任務(wù)之一,科研人員及其管理者在進(jìn)行科學(xué)研究前必須要充分了解其研究領(lǐng)域的前沿?zé)狳c(diǎn),把握新興趨勢,從而提出有創(chuàng)新性的研究方向和主題。近年來,新興主題吸引著越來越多的國內(nèi)外科研組織及研究者討論研究,關(guān)于新興主題的概念解析、探測方法、分析工具等方面國內(nèi)外科研組織都相繼做出了卓越貢獻(xiàn),但總的說來研究相對(duì)孤立和分散,分析總結(jié)新興主題研究成果還不夠成熟和完善,因此,對(duì)于新興主題的探測研究和實(shí)證分析已是十分迫切與必要。
隨著信息時(shí)代的發(fā)展,2002年Naohiro等人在海量的數(shù)據(jù)中發(fā)掘出新出現(xiàn)的主題,提出新興主題(Emerging Topics)的概念[1],是指在某個(gè)當(dāng)前正在研究的特定科學(xué)領(lǐng)域中,研究者發(fā)現(xiàn)新的一組由多個(gè)關(guān)鍵詞或詞組來表示的一組主題領(lǐng)域簇,代表著科學(xué)研究中極具發(fā)展?jié)摿Φ难芯糠较蚧蜈厔?。A.Kontostathis等學(xué)者在2003年提出新興研究趨勢(Emerging Trend):隨著時(shí)間推移逐漸引起人們興趣、并被越來越多的學(xué)者討論的主題領(lǐng)域,也可以理解為發(fā)現(xiàn)某一特定領(lǐng)域中的焦點(diǎn)、熱點(diǎn),并挖掘最新的變化趨勢時(shí)主動(dòng)提示的過程。新興研究趨勢是目前文獻(xiàn)挖掘中一個(gè)新興的研究方向,它能夠揭示某個(gè)特定領(lǐng)域在一定時(shí)間內(nèi)顯示出來的研究方向的變化情況。深入挖掘文獻(xiàn)集合中包含的時(shí)間相關(guān)信息具有重要的意義,借助計(jì)算機(jī)技術(shù)去主動(dòng)探測emerging trend[2]可以提高科研人員和情報(bào)人員對(duì)科學(xué)研究動(dòng)態(tài)及時(shí)把握和處理的能力,提示他們注意某些外部事件或者新興的技術(shù)對(duì)研究領(lǐng)域的影響,幫助他們快速的探詢研究方向的進(jìn)展情況,有利于其確定或修改研究計(jì)劃。
Le Minh Hoang[3]引用了Kontostathis對(duì)新興研究趨勢的定義,對(duì)新興研究趨勢的判斷過程分為Topic Representation(主題描述)、Topic Identification(主題界定)、Topic Verfication(主題判斷)三個(gè)部分,并加入了對(duì)關(guān)注主體(研究人員、研究機(jī)構(gòu)、文獻(xiàn)來源等)的專業(yè)性的考慮。他賦予每個(gè)主題6個(gè)屬性值,根據(jù)這6個(gè)屬性值來確定每個(gè)主題的受注意程度以及有用性,其中屬性值1、3、5、6的平均值衡量受注意程度,屬性值2、4、5、6的平均值衡量有用性。屬性值依據(jù)文獻(xiàn)計(jì)量學(xué)的統(tǒng)計(jì)結(jié)果和挖掘法計(jì)算得出。主題根據(jù)受注意程度和有用性屬性值可分為:受注意程度和有用性的屬性值均大于0為新興主題;受注意程度大于0 而有用性小于等于0則為潛在的新興研究趨勢(Potentially Emerging Trends);受注意程度和有用性的衡量值均小于等于0 為陳舊的趨勢(Obsolete Trends);受注意程度小于等于0而有用性大于0則為不顯著但對(duì)研究有用的趨勢(Creative Trends)。普賴斯認(rèn)為一個(gè)研究前沿大概由40~50篇最近發(fā)表的文章組成[4]。
國內(nèi)研究者對(duì)新興主題概念的理解與國外觀點(diǎn)基本一致。楊良選等人認(rèn)為研究前沿(research fronts,RF),又稱科學(xué)研究前沿,是指某一時(shí)點(diǎn)上某一焦點(diǎn)領(lǐng)域和出現(xiàn)的具有發(fā)展?jié)摿Φ难芯糠较颍芯口厔?,是科學(xué)演講中最先進(jìn)的、最有發(fā)展?jié)摿Φ?、最新的研究主題。侯海燕也用研究前沿進(jìn)行了概況,他根據(jù)引文獻(xiàn)聚類[5]將其定義為一組突現(xiàn)的動(dòng)態(tài)概念和潛在的研究問題,知識(shí)基礎(chǔ)(intellecture base)是它在科學(xué)文獻(xiàn)中(即由引用研究前沿術(shù)語的科學(xué)文獻(xiàn)所形成的演化網(wǎng)絡(luò))的引文和共引軌跡[6]。
1 特定學(xué)科新興主題的實(shí)證研究綜述
對(duì)新興主題的研究主要集中在兩點(diǎn):一是研究主題的分析方法,如分類與聚類、可視化等,二是關(guān)于特定學(xué)科的新興主題實(shí)證分析。
國外許多研究機(jī)構(gòu)在新興主題研究的分析上提出多種方法和原型系統(tǒng),許多研究機(jī)構(gòu)在新興研究趨勢探測方面提出了多種方法和相關(guān)的原型系統(tǒng),從自動(dòng)化角度分有需要專家或用戶介入的半自動(dòng)化系統(tǒng)、也有基于機(jī)器學(xué)習(xí)方法的全自動(dòng)化系統(tǒng)。
國內(nèi)殷蜀梅[7]認(rèn)為新興研究趨勢探測的主要指標(biāo)有:文獻(xiàn)中術(shù)語出現(xiàn)的頻率統(tǒng)計(jì)、與主題相關(guān)的關(guān)鍵詞的共同出現(xiàn)頻率統(tǒng)計(jì),還認(rèn)為新興研究趨勢技術(shù)的實(shí)現(xiàn)與信息抽取和命名實(shí)體識(shí)別技術(shù)息息相關(guān)。殷素梅在2008年的《判斷新興研究趨勢的技術(shù)方法分析》中通過分析海外相關(guān)機(jī)構(gòu)開發(fā)的新興研究趨勢探測系統(tǒng),分析它們的實(shí)現(xiàn)特點(diǎn)和設(shè)計(jì)思路,認(rèn)為在具體的評(píng)價(jià)方法上應(yīng)采取多個(gè)評(píng)價(jià)指標(biāo)綜合判斷。
該文從采用的技術(shù)方法角度,分為文獻(xiàn)計(jì)量學(xué)法、機(jī)器學(xué)習(xí)法和共引聚類網(wǎng)絡(luò)分析法對(duì)新興主題進(jìn)行研究。
1.1 文獻(xiàn)計(jì)量學(xué)法
文獻(xiàn)計(jì)量學(xué)法是對(duì)科研論文進(jìn)行統(tǒng)計(jì)、對(duì)科學(xué)研究量化的重要方法之一,它通過對(duì)學(xué)科的文獻(xiàn)數(shù)量進(jìn)行計(jì)算分析科研追溯某一學(xué)科科研的研究情況及其動(dòng)向,同時(shí)通過對(duì)科研發(fā)展過程的需求關(guān)系、內(nèi)部結(jié)構(gòu)的變更情況等潛在的動(dòng)態(tài)趨勢進(jìn)行定量分析、評(píng)價(jià)和預(yù)測,可以有效幫助科研人員了解目前該學(xué)科的研究前沿和發(fā)展趨勢。
它是一個(gè)簡單實(shí)用的方法,可直接應(yīng)用系統(tǒng)將統(tǒng)計(jì)指標(biāo)以時(shí)間序列用圖形表現(xiàn)出來,如ThemeRiver[8]、TOA(Technol2ogy Opportunities Analysis)[9]。分為單純采用文獻(xiàn)計(jì)量學(xué)指標(biāo)法、雜志數(shù)據(jù)庫和網(wǎng)絡(luò)資源綜合指標(biāo)法。它所采用的指標(biāo)有:關(guān)鍵詞的用詞頻率統(tǒng)計(jì)、關(guān)鍵詞的共現(xiàn)用詞頻率統(tǒng)計(jì)、文獻(xiàn)的國家統(tǒng)計(jì)、文獻(xiàn)的機(jī)構(gòu)統(tǒng)計(jì)等,其中關(guān)鍵詞用詞頻率統(tǒng)計(jì)幾乎是所有系統(tǒng)均采用的一個(gè)指標(biāo)。該方法的系統(tǒng)并沒有總結(jié)出新興主題或指出某一領(lǐng)域的研究趨勢,而是根據(jù)時(shí)間序列,通過圖形表現(xiàn)指標(biāo)的變化趨勢,由使用者總結(jié)出新興主題或其他,如TOA系統(tǒng)將關(guān)鍵詞用詞頻率(這個(gè)是使用者確定的)、文獻(xiàn)的國家、文獻(xiàn)的機(jī)構(gòu)等按年份(如2001年-2012年)進(jìn)行排列,以直方圖、對(duì)數(shù)圖、Fisher-Pry曲線圖以及地域研究圖譜來表明這些指標(biāo)的變化趨勢;Theme River系統(tǒng)仍以時(shí)間為序列,將文獻(xiàn)庫中某時(shí)間段的關(guān)于某一主題數(shù)量多少作為該主題的濃淡度,在圖形上表現(xiàn)出來是一條著墨不均的曲線,再把多個(gè)主題標(biāo)識(shí)到一個(gè)圖形上,可以對(duì)比出任一時(shí)間點(diǎn)上主題的新興程度;美國LEHIGH大學(xué)計(jì)算機(jī)科學(xué)與工程學(xué)院開發(fā)的CIMEL項(xiàng)目屬于綜合網(wǎng)絡(luò)資源和科學(xué)文獻(xiàn)數(shù)據(jù)庫輔助人工判斷,用戶列出主要的新興主題,然后通過數(shù)據(jù)庫檢索或GOOGLE、BAIDU搜索這些新興主題,搜索出的文獻(xiàn)由用戶刪選成文獻(xiàn)集后輸入系統(tǒng),系統(tǒng)計(jì)算文獻(xiàn)集每年相關(guān)文獻(xiàn)數(shù)量、文獻(xiàn)機(jī)構(gòu)、文獻(xiàn)國別等,并進(jìn)行圖表化
展示。
除此之外,國內(nèi)學(xué)者還采用內(nèi)容分析法、引文分析法等對(duì)文獻(xiàn)內(nèi)容進(jìn)行系統(tǒng)的定量分析方法,對(duì)大量的文獻(xiàn)進(jìn)行標(biāo)注,通過特征識(shí)別研究文獻(xiàn)中隱含的深層信息。國內(nèi)學(xué)者陳悅利用多維尺度等方法繪制了中國管理科學(xué)作者的合作情況知識(shí)圖譜[10]。
1.2 機(jī)器學(xué)習(xí)法
計(jì)算機(jī)訓(xùn)練學(xué)習(xí)如分層分布式動(dòng)態(tài)索引文獻(xiàn)挖掘算法(HDDI),計(jì)算機(jī)自動(dòng)抽取信息進(jìn)行文獻(xiàn)選擇和挖掘,探測新興主題,掌握對(duì)新興主題的判斷。計(jì)算機(jī)首先對(duì)文獻(xiàn)做處理,按規(guī)則表達(dá)式抽取復(fù)雜名詞短語,然后設(shè)置0、1可變閾值,對(duì)復(fù)雜名詞短語(新興主題)歸類。該方法認(rèn)為一個(gè)新興主題應(yīng)該具有兩個(gè)特點(diǎn):概念更加豐富;被引用次數(shù)增多,與之相關(guān)的概念增加[11]。
機(jī)器學(xué)習(xí)法通過閾值使機(jī)器可自動(dòng)歸納新興主題,機(jī)器學(xué)習(xí)法對(duì)文獻(xiàn)不是一視同仁,而是考慮了各個(gè)文獻(xiàn)指標(biāo)在主題研究趨勢判斷中占有的權(quán)重,通過對(duì)閾值的調(diào)整來修正輸出的結(jié)果。但是應(yīng)用該方法在最終效果評(píng)價(jià)上并不很好,精度和召回率都不算高,而且機(jī)器學(xué)習(xí)法選用的文獻(xiàn)計(jì)量指標(biāo)至選擇了詞頻和共詞,而且將概念包含的主題作為其中一個(gè)衡量指標(biāo),這樣雖然在信息抽取上獲得的精度和召回率都比較好,但在新興主題判定上得到的效果并不理想。
1.3 共引聚類網(wǎng)絡(luò)分析法
共引聚類網(wǎng)絡(luò)分析方法是由Small提出的,指兩篇文獻(xiàn)通過另外一篇或者多篇文獻(xiàn)建立聯(lián)系。他認(rèn)為研究文獻(xiàn)的主題,研究的是文獻(xiàn)之間的引用與被引用的關(guān)系,文獻(xiàn)的引用能反映主題之間的關(guān)系,可以反映出文獻(xiàn)之間的聯(lián)系程度和結(jié)構(gòu)關(guān)系,引用的文獻(xiàn)主題是被引用文獻(xiàn)主題的發(fā)展、改進(jìn)。Morris[12]在《研究前沿的時(shí)間線可視模型》、 Boyack[13]在《資金支持?jǐn)?shù)量的影響和引用研究文章數(shù)量的可視化》和 White[14]在《探索網(wǎng)絡(luò)和筆者共被引研究》均對(duì)可視化做出努力。共引聚類網(wǎng)絡(luò)分析中,以Citespace系列軟件最為常用。該軟件分析某一學(xué)科的新興主題的變化,以及研究新興主題的關(guān)系,利用共被引聚類,分析不同新興主題之間的內(nèi)部聯(lián)系,最后通過可視化,使用戶能直接分辨新興主題的變化路徑。具體流程為:取一時(shí)間段(如2001-2012年),以特定關(guān)鍵詞檢索數(shù)據(jù)庫,得到文獻(xiàn)集合。計(jì)算集合中每個(gè)文獻(xiàn)被引用的次數(shù),以一定閾值挑選文獻(xiàn),縮小文獻(xiàn)集,然后再對(duì)文獻(xiàn)集聚集,形成文獻(xiàn)簇。Chen在2006年發(fā)表《CiteSpace II:科學(xué)文獻(xiàn)中新趨勢與新動(dòng)的識(shí)別與可視化》[15],進(jìn)一步完善了可視化軟件。Small等發(fā)表《跟蹤和預(yù)測科學(xué)增長領(lǐng)域》提出共被引聚類,并預(yù)測術(shù)語[16]。
國內(nèi)韓濤提出采用共詞、共引等方法對(duì)數(shù)據(jù)庫聚類。通過對(duì)共被引分析中主題簇聚集程度的強(qiáng)弱和主題簇間關(guān)系由特定閾值的共詞或共引關(guān)聯(lián)強(qiáng)弱來確定,通過不同閾值層聚類結(jié)構(gòu)之間差異性的自動(dòng)進(jìn)行檢測分析、系統(tǒng)自動(dòng)發(fā)現(xiàn)宏觀結(jié)構(gòu)性的潛在結(jié)構(gòu),系統(tǒng)反應(yīng)科學(xué)領(lǐng)域的主題分布結(jié)構(gòu)。該研究揭示了同被引分析中隱藏在低閾值層中有重要意義的潛在簇[17]。2008年王翼等利用John Hopcroft[18]對(duì)中國生命科學(xué)中一百五十萬論文雜志聚類,找到我國醫(yī)學(xué)研究前沿[19]。章成志、梁勇等人采用主題聚類方法,從主題角度對(duì)包括時(shí)間信息的學(xué)科學(xué)術(shù)論文集進(jìn)行主題分析與主題聚類,通過全面分析后歸納出某一特定學(xué)科的研究熱點(diǎn)和這些熱點(diǎn)的發(fā)展趨勢。實(shí)驗(yàn)結(jié)果表明,基于主題聚類的學(xué)科熱點(diǎn)及其趨勢監(jiān)測方法,其監(jiān)測結(jié)果在很大程度上接近于常規(guī)方法的監(jiān)測結(jié)果,但基于主題聚類的監(jiān)測方法,在監(jiān)測成本和監(jiān)測信息時(shí)效方面得到改善。通過對(duì)學(xué)科領(lǐng)域的文獻(xiàn)信息可視化使研究者能夠直觀的辨識(shí)出學(xué)科前沿的演化路徑及學(xué)科領(lǐng)域的經(jīng)典基礎(chǔ)文獻(xiàn)[20]。
荷蘭阿姆斯特丹大學(xué)的Loet Leydesdorff選取期刊數(shù)據(jù)庫中文獻(xiàn)的引文,利用多元統(tǒng)計(jì)分析方法,通過Pajek等軟件繪制了期刊之間的引文網(wǎng)絡(luò)圖譜,反映出各學(xué)科之間的關(guān)系。
共引聚類網(wǎng)絡(luò)分析法能精選文獻(xiàn)并研究文獻(xiàn)間的關(guān)系,自行推測新興主題,但文獻(xiàn)的引用次數(shù)與文獻(xiàn)發(fā)表的時(shí)長有關(guān)。總體而言,新發(fā)表的文獻(xiàn)被引用次數(shù)低。
2 特定學(xué)科的新興主題實(shí)證研究
特定學(xué)科的前沿問題、發(fā)展趨勢之類文獻(xiàn)眾多,大部分是對(duì)可視化的運(yùn)用。如許振亮[21]等在《基于知識(shí)圖譜的國際生物科學(xué)與工程前沿計(jì)量研究》中,運(yùn)用可視化技術(shù),展示國際生物科學(xué)與工程技術(shù)領(lǐng)域存在以“基因工程、蛋白質(zhì)工程、酶工程”、“基因組學(xué)、蛋白質(zhì)組學(xué)”與“細(xì)胞工程、組織工程”為內(nèi)涵的三個(gè)主流知識(shí)群,繪制出國際生物科學(xué)與工程技術(shù)前沿領(lǐng)域的知識(shí)圖譜。
2008年,賴茂生[22-24]采用調(diào)查問卷、論文分析、研究項(xiàng)目統(tǒng)計(jì)分析三者結(jié)合,定量總結(jié)出情報(bào)學(xué)的前沿領(lǐng)域。
劉菁在《基于科學(xué)知識(shí)圖譜的國內(nèi)移動(dòng)學(xué)習(xí)演進(jìn)與前沿?zé)狳c(diǎn)分析》中,根據(jù)《中文核心期刊要目總覽》(2008 年版)和的CSSCI數(shù)據(jù)庫中1998-2009年所有“移動(dòng)學(xué)習(xí)”文獻(xiàn),通過定量分析和定性分析相結(jié)合的方法,應(yīng)用CiteSpace軟件進(jìn)行數(shù)據(jù)問題,繪制了共現(xiàn)網(wǎng)絡(luò),對(duì)國內(nèi)移動(dòng)學(xué)習(xí)的變化趨勢和研究熱點(diǎn)進(jìn)行了可視化分析[25]。
我國的劉則淵、侯劍華等許多專家學(xué)者把CitesSpace Ⅱ 信息可視化技術(shù)應(yīng)用到科技期刊文獻(xiàn)信息可視化分析當(dāng)中,充分展示了該項(xiàng)技術(shù)在科學(xué)知識(shí)可視化研究中特色及其強(qiáng)大的功能。
王偉[26]在《國際信息計(jì)量學(xué)研究前沿與熱點(diǎn)分析》中對(duì)ISSI、COLLNET/WIS和S&TI國際會(huì)議主題選擇分析,得出國際信息計(jì)量學(xué)研究關(guān)注的前沿領(lǐng)域和研究熱點(diǎn),指出其發(fā)展趨勢。
李雅在《知識(shí)圖譜方法科學(xué)前沿進(jìn)展實(shí)證分析—以動(dòng)物腸道纖維素酶基因工程研究為例》中,以Web of Science為數(shù)據(jù)庫,通過多元統(tǒng)計(jì)中聚類分析與多維尺度分析(MDS)圖譜相互驗(yàn)證的方法,把相關(guān)的關(guān)鍵詞聚為關(guān)鍵詞集,根據(jù)關(guān)鍵詞集反映動(dòng)物腸道纖維素酶基因工程的研究趨勢及關(guān)鍵詞的相關(guān)性[27]。
馬費(fèi)成和張勤利用詞頻分析的方法,根據(jù)知網(wǎng)中世界知識(shí)管理類論文和雜志的關(guān)鍵詞,找出知識(shí)管理的新興主題[28]。
趙蓉英在《網(wǎng)絡(luò)計(jì)量學(xué)研究熱點(diǎn)與前沿的知識(shí)圖譜分析》中,以ISI WEB OF KNOWLEDGE為數(shù)據(jù)庫,以網(wǎng)絡(luò)計(jì)量學(xué)為主題,利用CITESPACE軟件進(jìn)行圖譜分析,通過檢測主題變化來確定網(wǎng)絡(luò)計(jì)量學(xué)的研究熱點(diǎn)和發(fā)展趨勢。文中選擇的文獻(xiàn)信息為作者、題目、摘要和文獻(xiàn)引文,選擇闕值為1997年至2009年,根據(jù)文獻(xiàn)法得出文獻(xiàn)的時(shí)間、機(jī)構(gòu)和地域分布圖。除此之外,還繼續(xù)使用CITESPACE軟件對(duì)數(shù)據(jù)進(jìn)行了分析,得出網(wǎng)絡(luò)計(jì)量學(xué)的新興主題:網(wǎng)絡(luò)站點(diǎn)、社會(huì)網(wǎng)絡(luò)、鏈接分析等[29]。
陳立新等在《力學(xué)各分支學(xué)科研究前沿和發(fā)展趨勢的可視化分析》中,以《流體力學(xué)》、《固體力學(xué)》、《計(jì)算力學(xué)和振動(dòng)》等力學(xué)領(lǐng)域的14種國際代表性期刊為研究對(duì)象,通過CITESPACE軟件對(duì)引文數(shù)據(jù)和主題詞數(shù)據(jù)的分析和處理,生成共被引文獻(xiàn)網(wǎng)絡(luò)和施引文獻(xiàn)主題詞共詞網(wǎng)絡(luò)組成的共被引與共詞的混合網(wǎng)絡(luò)圖。以知識(shí)圖譜的方式展示了力學(xué)各分支學(xué)科的重要被引文獻(xiàn)、主要學(xué)術(shù)人物以及由施引文獻(xiàn)主題詞所表達(dá)的力學(xué)重要研究領(lǐng)域,揭示了流體力學(xué)主流研究、固體力學(xué)主流研究和計(jì)算力學(xué)主流研究等的演化過程、研究熱點(diǎn)和前沿發(fā)展趨勢[30]。
3 研究存在的問題及趨勢展望
從上述國內(nèi)外研究的現(xiàn)狀我們可以看出,新興主題目前沒有明確統(tǒng)一的定義,目前國內(nèi)外學(xué)者對(duì)新興主題的研究主要集中在探測方法和特定學(xué)科的實(shí)證分析。從理論上看,國內(nèi)對(duì)新興主題的研究還相當(dāng)缺乏,可參考的文獻(xiàn)主要是對(duì)國外探測方法進(jìn)行介紹和分析。在研究方法上,國內(nèi)學(xué)者多局限于理論層面的分析而沒有將理論分析與實(shí)證研究結(jié)合起來進(jìn)行綜合考察,真正有理論根據(jù)的定性研究和規(guī)范的實(shí)證研究為數(shù)甚少。目前采用的TOA系統(tǒng)、Theme River系統(tǒng)、CIMEL系統(tǒng)等雖以圖形展現(xiàn)各項(xiàng)指標(biāo),使得指標(biāo)的變化趨勢更加直觀,能省去科研者的大量時(shí)間,使他們能夠迅速把握可以發(fā)展趨勢,確定研究前沿,但均不能自行判斷指標(biāo)的變化趨勢,確定新興主題,均需通過人為加以判斷及區(qū)分。總而言之,新興主題的研究尚處于起步階段,關(guān)于新興主題的定量定性探測方法還需進(jìn)一步的探索,建立及完善新興主題理論體系也十分必要,最終促進(jìn)開發(fā)更具實(shí)際意義的研究模型也是一個(gè)亟待研究的問題。
參考文獻(xiàn)
[1] Matsumur Naohiro Matsumura,Yutaka Matsuo,Yukio Ohsawa,et al.Discovering Emerg ing Topicsfrom WWW[J].Journal of Contingencies and Crisis Management,2002
(2).
[2] Mawhinney T C.Total Ouality Management andOrganizational Behavior Management:An Integration forContinual Improvement[J].Journal of AppIied BehaviorAnalysis,1992,25(3):524-543.
[3] Le Minh Hoang.Emerging Trend Detection from Scientific Online Documents.http://www.jaist.ac.jp/library/thesis/ks-do ctor-2006/paper/hoangle/paper.pdf.(2007-08-01).
[4] Price D D.Networks of scientific papers[J].Science,1965(149):510-515.
[5] Staw B M,SandeIands L E,Dutton J E.Threat-Rigidity Effects in OrganizationaI Behavior:A MuItiIeveI AnaIysis[J].Administrative Science OuarterIy,1981,26:501-524.
[6] 侯海燕.科學(xué)計(jì)量學(xué)知識(shí)圖譜[M].大連.大連理工大學(xué)出版社,2008.
[7] 殷蜀梅.判斷新興研究趨勢的技術(shù)方法分析[J].情報(bào)科學(xué),
2008,4.
[8] Brian Lent ,Rakesh Agrawal ,Ramakrishnan Srikant.Discovering Trends in Text Database[Z].Proceedings of KDD-97 ,1997:227-230.
[9] Soma Roy ,David Gery ,William M.Pottenger.Methologies forTrend Detection in Textual Data Mining[EB/OL].http:PPdi2macs.rutgers.edubillpPpubsPETDMethodologies.pdf,2007-08-01.
[10] Chen Yue,Liu Zeyuan.Co-authorship on ManagementScience in China[C]//10th Internationai conference of theinternationai society for scitometrics and informetrics.Stockhoim,Sweden:Karoiinska unversity press,2005.
[11] William M.Pottenger,Yong-Bin Kin,Daryl D.Meling.HDDIT M:Hierarchical Distributed Dynamic Indexing.http://www.cse.lehigh.edu/billp/pubs/HDDIFina-l Chapter.pdf,2007-08-01.
[12] Morris S A,Yen G.Timeline visualization of researc fronts[J].Journal of the American Society for Information Science and Technology,2003,55(5):413-422.
[13] Boyack W.Indicator-assisted evaluation and funding of research:Visualizing the influence of grants on the number and citation counts of research papers[J].Journal of the American Society for Information Science and Technology,2003,54(5):447-461.
[14] White D.Pathfinder networks and author cocitation analysis[J].Journal of the American Society for Information Science and Technology,2003,54(5):423-434.
[15] Garfield Historiographic mapping of knowledge domains literature[J].Journal of Information Science,2004,30(2):119-145
[16] Small H.Tracking and predicting growth areas in science[J].Scientomitrics,2006,68(3):595-610.
[17] 韓濤.知識(shí)結(jié)構(gòu)演化深度分析的方法及其實(shí)現(xiàn)[D].中國科學(xué)院文獻(xiàn)情報(bào)中心,2008.
[18] Cohen J,Cohen P,West S G,et aI.AppIied multiple regression/correlation analysis for the behavioral sciences[M].Mahwah,NJ:Erlbaum,2003.
[19] 章成志.基于樣本加權(quán)的文本聚類算法研究[J].情報(bào)學(xué)報(bào),2008(1).
[20] 侯劍華,陳悅.戰(zhàn)略管理學(xué)前沿演進(jìn)可視化研究[J].科學(xué)學(xué)研究,2007,25(S1):15-21.
[21] 許振亮.基于知識(shí)圖譜的國際生物科學(xué)與工程前沿計(jì)量研究[J].情報(bào)學(xué)報(bào),2009(4).
[22] 賴茂生,王琳,李宇寧.情報(bào)學(xué)前沿領(lǐng)域的調(diào)查與分析[J].圖書情報(bào)工作,2008,52(3):6-10.
[22] 楊文欣,杜杏葉,張麗麗,等.基于文獻(xiàn)的情報(bào)學(xué)前沿領(lǐng)域調(diào)查分析[J].圖書情報(bào)工作,2008,52(3):11-14.
[24] 賴茂生,王琳,楊文欣.情報(bào)學(xué)前沿領(lǐng)域的確定與討論[J].圖書情報(bào)工作,2008,52(3):15-18.
[25] 劉菁.基于科學(xué)知識(shí)圖譜的國內(nèi)移動(dòng)學(xué)習(xí)演進(jìn)與前沿?zé)狳c(diǎn)分析[J].中國電化教育,2012(2).
[26] 王偉.國際信息計(jì)量學(xué)研究前沿與熱點(diǎn)分析[J].醫(yī)學(xué)信息學(xué)雜志,2010(2).
[27] 李雅.知識(shí)圖譜方法科學(xué)前沿進(jìn)展實(shí)證分析—以動(dòng)物腸道纖維素酶基因工程研究為例[J].情報(bào)學(xué)報(bào),2012(5).
[28] 韓客松.中文全文標(biāo)引的主題詞標(biāo)引和主題概念標(biāo)引方法[J].情報(bào)學(xué)報(bào),2011(2).
[29] 趙蓉英.網(wǎng)絡(luò)計(jì)量學(xué)研究熱點(diǎn)與前沿的知識(shí)圖譜分析[J].情報(bào)學(xué)報(bào),2011(4).
[30] 陳立新.力學(xué)各分支學(xué)科研究前沿和發(fā)展趨勢的可視化分析[J].情報(bào)學(xué)報(bào),2009(10).