亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        研究前沿識別方法探析*

        2015-02-12 22:34:01宮小翠趙迎光安新穎
        關(guān)鍵詞:文獻文本方法

        宮小翠 趙迎光 安新穎

        (中國醫(yī)學(xué)科學(xué)院醫(yī)學(xué)信息研究所 北京 100020)

        ?

        ?醫(yī)學(xué)信息研究?

        研究前沿識別方法探析*

        宮小翠 趙迎光 安新穎

        (中國醫(yī)學(xué)科學(xué)院醫(yī)學(xué)信息研究所 北京 100020)

        總結(jié)研究前沿的識別方法,包括基于文獻計量學(xué)的識別方法和基于計算機的自動、半自動化方法,指出各自的優(yōu)缺點,提出研究前沿識別應(yīng)利用語義網(wǎng)絡(luò)等工具向更深的粒度、更高的準(zhǔn)確度方向發(fā)展。

        研究前沿;發(fā)展趨勢;文獻計量學(xué);LDA;網(wǎng)絡(luò)主題

        1 引言

        研究前沿是具有較高發(fā)展?jié)摿Φ闹R,是指伴隨著某一領(lǐng)域的重要事件的發(fā)生而大量出現(xiàn)的知識,其實質(zhì)就是某一個研究領(lǐng)域內(nèi)處于領(lǐng)先位置的成果和思想。這一概念最早是Price[1]為了描述某一領(lǐng)域的瞬時性特征而提出的,認(rèn)為在一個給定的研究領(lǐng)域內(nèi),科學(xué)家積極引用的近期文獻的集合所表征的研究領(lǐng)域就是研究前沿。 之后這一概念又產(chǎn)生了多種描述,但至今尚未形成明確、統(tǒng)一的定義。在科學(xué)領(lǐng)域中,技術(shù)、方法以及科學(xué)概念的知識數(shù)不勝數(shù),研究前沿不斷產(chǎn)生、成熟、平穩(wěn)和衰退。Upham等[2]認(rèn)為,成功的研究前沿會產(chǎn)兩種結(jié)果:成長為獨立的研究領(lǐng)域或者被其他領(lǐng)域吸收。成為獨立的研究領(lǐng)域表現(xiàn)在本身的發(fā)文量增加,被其他的領(lǐng)域吸收表現(xiàn)在引用量增加。多學(xué)科性顯著的前沿內(nèi)生性強,多學(xué)科性不顯著的前沿引用量增加,內(nèi)生性不強[2]。

        研究前沿知識這種循環(huán)演化也是科學(xué)技術(shù)研究中推動科技創(chuàng)新的力量之所在。從浩瀚的科技信息文獻中,識別研究前沿,不僅可以幫助科研人員全面、及時、準(zhǔn)確地發(fā)現(xiàn)研究領(lǐng)域潛在的知識,而且可以幫助決策人員快速制定相關(guān)政策,合理分配科研資源。高潛力的研究前沿挖掘還可能帶來新的科技發(fā)現(xiàn),給社會帶來利益,吸引更多的科學(xué)家參與研究,產(chǎn)生更多的科學(xué)發(fā)現(xiàn)。

        研究前沿挖掘技術(shù)在國外的研究較多,相對比較成熟,而在國內(nèi)的研究目前還比較少。研究前沿的識別方法主要為基于文獻計量學(xué)的方法和基于計算機技術(shù)的自動半自動化方法。

        2 基于文獻計量學(xué)的方法

        2.1 基于引用關(guān)系的方法

        基于引用關(guān)系的方法主要包括共被引、文獻耦合和直接引用的方法。Small等[3]用共被引方法分析了有機膜傳感器領(lǐng)域的新主題突顯、發(fā)展、消亡的過程。李柏洲等[4]采用國際領(lǐng)先的知識分子結(jié)構(gòu)法進行文獻收集與萃取,該方法集成作者同被引分析(Author Co-citation Analysis,ACA)與探路者網(wǎng)絡(luò)(Pathfinder Network, PFNET),通過引入信息學(xué)方法分析相關(guān)知識單元間聯(lián)系的文獻,引用和被引用的文獻以地圖的形式表示并形成樹樁或鏈狀等不同形態(tài)的網(wǎng)絡(luò)結(jié)構(gòu),揭示文獻間隱含的關(guān)系。Schiebel[5]認(rèn)為可以從文獻耦合聚類的文獻簇中識別研究前沿,共被引文獻簇中識別知識基礎(chǔ),提出模仿地理地圖的二維和三維圖像探測研究前沿和研究基礎(chǔ)的可視化方法。萬小軍等提出一種自動評估引用強度的方法,利用LibSVM等工具將引文長度、引用密度、是否自引、施引位置、提及次數(shù)、被引與施引的時間間隔考慮在內(nèi),對引用文獻進行打分,此方法可用于引用關(guān)系的前期處理,將打分低微的文獻不考慮在內(nèi)。探測研究前沿以共被引和文獻耦合方法居多,直接引用方法則較少較新?;谝藐P(guān)系的方法識別研究前沿具有可行性,但存在時間的滯后性這一顯著的缺點。

        2.2 基于內(nèi)容詞的方法

        基于內(nèi)容詞的方法包括基于詞頻和基于共詞的方法。基于詞頻的方法通過識別文獻中的爆發(fā)詞,根據(jù)爆發(fā)詞的時間分布和變化特征識別前沿知識發(fā)展趨勢?;诠苍~的方法是對一組詞的兩兩統(tǒng)計它們在同一篇文獻中出現(xiàn)的次數(shù),對這些詞進行聚類分析,進而分析這些詞所代表的學(xué)科和主題的結(jié)構(gòu)變化,是一種運用相對較多的研究前沿識別方法。Ohniwa等[6]選取增長率高的MeSH術(shù)語,用共詞的方法將其分組,通過不同的時間窗比較探究生命科學(xué)領(lǐng)域的研究前沿[6]?;趦?nèi)容詞的角度探究前沿知識只是基于單詞的共現(xiàn)角度,很難從語義角度進行前沿知識的揭示。

        2.3 混合方法

        2.3.1 引文與共詞的方法相結(jié)合 這樣更具有優(yōu)勢,可以彌補二者的不足。Chen[7]開發(fā)的CiteSpace II將引文與詞檢測方法相結(jié)合,用爆發(fā)詞檢測、引文聚類視圖、關(guān)鍵點文獻發(fā)掘和時區(qū)視圖方法揭示研究前沿[7]?;旌戏椒ǖ难芯窟€包括用共被引分析得到高被引核心文獻,再用共詞分析界定前沿領(lǐng)域,或是基于文獻耦合的引文-文本相結(jié)合的方法等。

        2.3.2 作者耦合分析、h-b指數(shù)和計算參考文獻相對年等 也是撐握研究前沿較為常用的方法。馬瑞敏等[8]用作者耦合方法對圖書情報學(xué)的知識結(jié)構(gòu)進行可視化分析,證明作者耦合分析能較好地挖掘一個學(xué)科的前沿知識結(jié)構(gòu)。楊露[9]提出基于h-b指數(shù)和m值識別新的熱點話題的方法,某一領(lǐng)域有h-b篇論文的每篇被引次數(shù)不少于h-b次,再用h-b除以自科學(xué)家發(fā)表第一篇論文起計算的年數(shù)得到m值,較大的m值表現(xiàn)該領(lǐng)域的論文迄今時間較短,但引用較多可能為新興領(lǐng)域。計算參考文獻中近兩年發(fā)表的文獻占的比例和引文的平均年份也能粗略地估計此文獻是否是較新的科研成果。

        2.3.3 基于文獻計量學(xué)方法 比較單薄,不能從多個指標(biāo)維度系統(tǒng)分析構(gòu)建熱點識別方法,這些方法雖然從發(fā)表量、引用頻次等各種角度在數(shù)量上進行統(tǒng)計分析,但是反映的只是知識演化的整體過程和宏觀走向,無法體現(xiàn)知識體系演化的歷史階段特征和微觀特征?;谟嬎銠C的全自動化或半自動化系統(tǒng),在研究前沿的探測上相對比較高效,且目前正處起步階段,有比較大的發(fā)展空間和比較好的應(yīng)用前景。

        3 基于計算機的全自動或半自動化方法

        3.1 文獻中前沿話題識別

        文本挖掘是利用自動或半自動方法發(fā)現(xiàn)文本中潛在的、先前未知的知識的過程。文本挖掘是一個多學(xué)科交叉領(lǐng)域,融合了數(shù)據(jù)挖掘、自然語言處理、機器學(xué)習(xí)和信息檢索方面的知識。

        3.1.1 研究現(xiàn)狀 文本挖掘中的自動探測方法大體上可以分為主題特征表示、主題識別、主題判定3個階段。國內(nèi)相關(guān)研究比較少,國外關(guān)于學(xué)科趨勢的研究不少,熱點及趨勢分析只是其研究中的分支,并沒有被系統(tǒng)地研究和分析。R.Swan 和D.Jensen開發(fā)出了Time-Mines系統(tǒng),利用信息抽取技術(shù)、自然語言處理技術(shù)來抽取有時間標(biāo)簽的自由文本數(shù)據(jù),并采用假設(shè)檢驗技術(shù)來判定給定時間框中最相關(guān)的主題,主題是否是新興交由用戶判斷。Havre等[10]開發(fā)的可視化主題演化系統(tǒng)Theme River,每條河流代表一個主題,河流用不同的顏色表示,河流的寬度代表主題強度,可以直觀地觀測主題強度隨時間的變化。Patent Miner系統(tǒng)旨在用動態(tài)生成的SQL查詢發(fā)現(xiàn)專利數(shù)據(jù)中的發(fā)展趨勢,系統(tǒng)與包含所有美國專利的IBM DB2數(shù)據(jù)庫相連,主要包含兩個組件:基于序列模式挖掘的短語識別和基于形狀查詢的趨勢預(yù)測。Rapid Miner[11]系統(tǒng)是一個機器學(xué)習(xí)和數(shù)據(jù)挖掘試驗環(huán)境,它允許試驗由大量任意嵌套的操作構(gòu)成,提供一個圖形用戶接口(Graphical User Interface,GUI)設(shè)計分析管道,由GUI產(chǎn)生XML文件,XML文件中定義了用戶希望對數(shù)據(jù)實施的分析操作,這個文件然后由Rapid Miner自動讀取。Weka是一套用JAVA編寫的流行的機器學(xué)習(xí)軟件,Weka工作臺包括一批可視化工具和數(shù)據(jù)分析算法,并有一些圖形用戶接口,方便用戶實現(xiàn)數(shù)據(jù)分析預(yù)測功能。各種文本挖掘過程在進行數(shù)據(jù)預(yù)處理后,然后進行聚類、分類等過程,在識別研究前沿方面,語義關(guān)聯(lián)關(guān)系識別是非常重要的。語義關(guān)聯(lián)關(guān)系識別需要考慮兩個方面的問題:命名實體識別和實體關(guān)系識別,基于規(guī)則和統(tǒng)計是兩種常用的方法,基于規(guī)則的方法需要許多的領(lǐng)域?qū)<覅⑴c制定規(guī)則。目前廣泛使用的統(tǒng)計方法有隱馬爾科夫模型、最大熵模型以及條件隨機場模型,但是隨著大量新術(shù)語的不斷出現(xiàn)和語義關(guān)系的不斷豐富,給單純的基于規(guī)則和統(tǒng)計的方法帶來了極大的挑戰(zhàn)。

        3.1.2 主題模型 文本挖掘技術(shù)是幫助科研人員從海量文獻中快速發(fā)現(xiàn)新興主題的途徑之一,而主題模型作為一套新的能夠?qū)ξ墨I資源語義抽取的算法[12],提供了一種新的解決問題的方法,并成為國際研究的熱點。主題模型是文本降維技術(shù)的一種。Hofmann[13]等提出PLSI模型,認(rèn)為一篇文檔由條件依賴于文檔的多個主題組成,表示主題的單詞服從于主題的多項式分布;但模型的參數(shù)隨著文集增長呈線性增長,即出現(xiàn)過擬合問題。之后,Blei等[14]提出隱含狄利克雷分布(Latent Dirichlet Allocation, LDA)模型,認(rèn)為文檔由服從多項分布的主題構(gòu)成,每個主題由服從多項分布的單詞構(gòu)成。

        基于LDA話題演化主要采用了3種方法:(1)時間演化話題(Topic Over Time, TOT)[15],該模型把連續(xù)的時間信息引入到LDA模型中,對共現(xiàn)詞和文檔的時間共同建模,這樣模型的時間是連續(xù)的,不會出現(xiàn)在離散時間的方法中時間粒度選取的問題,但此模型僅考慮話題強度的變化趨勢,而忽略了話題內(nèi)容的變化;另外,該模型必須一次對所有文檔運用,無法對新文檔擴展。(2)LDA 后離散方法,在整個文集上應(yīng)用LDA 模型, 然后根據(jù)文檔的時間戳劃分子集,再用子集的話題分布表征該段時間的話題,該方法認(rèn)為不同時間的話題數(shù)不變,難以探測新話題產(chǎn)生與舊話題消失。(3)先離散分析方法,在建模前,根據(jù)時間段劃分文檔,然后依次處理每個時間窗口上的文本集合,最終形成話題隨時間的演化,在離散分析的方法中,下一時刻的模型參數(shù)往往依賴于當(dāng)前時刻或前幾個時刻的模型參數(shù)的后驗或者模型輸出結(jié)果,如動態(tài)話題模型(Dynamic Topic Model,DTM)[16]和在線話題模型(Online- LDA, OLDA)[17]。

        在數(shù)據(jù)挖掘方面,對LDA模型已有大量研究,產(chǎn)生各種變體。結(jié)合AT、TOT模型史慶偉等[18]提出作者主題演化模型(Author -Topic over Time,AToT),用主題-詞項分布與作者-主題分布分別用來描述主題隨時間的變化規(guī)律和作者研究興趣的變化規(guī)律。將引文分析引入主題模型中,改進對主題演化的預(yù)測正得到越來越多人的關(guān)注,Nallapati等[19]提出將施引文獻和被引文獻構(gòu)成一個文獻對,將文獻對放在主題模型中聯(lián)合建模,主題之間的影響是服從于一個超參數(shù)決定的概率分布。葉春蕾等[20]在貝葉斯概率模型中引入引文因素,將引文作為模型的一項參數(shù),與關(guān)鍵詞共同建立引文-主題模型,并通過試驗表明該模型能全面、深入地識別科技文獻中的主題內(nèi)容。曹建平等[21]根據(jù)時效性較強的在線的文本數(shù)據(jù)流,提出一種基于LDA的雙軌道在線主題演化模型(BPE-OLDA),在下一時間片生成文本時考慮文本的內(nèi)容遺傳和強度遺傳,估算模型參數(shù)對Gibbs采樣算法進行了簡化,試驗證明該模型在提取時效性較強的文本數(shù)據(jù)流的主題方面具有明顯的效果。LDA主要是基于Kullback Leibler (KL)[22]相對熵或Jensen-Shannon(JS)[23]來計算主題間的相似性,用改進的Z-Score方法計算主題隨時間的偏移反應(yīng)主題演化的情況,從而發(fā)現(xiàn)主題演化中的主題遺傳和主題變異[24]。雖然該方法可以探測到主題間一對多,多對多的演化關(guān)系,但反映的仍是宏觀走向,不能體現(xiàn)知識演化的微觀特征。

        3.2 網(wǎng)絡(luò)中新話題檢測方法

        3.2.1 基于傳統(tǒng)的話題檢測方法 基于關(guān)鍵詞的方法對于熱門話題挖掘是較好的方法,但是對于新興話題的識別效果則不是很好。Cataldi等[26]把在一段時間內(nèi)突發(fā)出現(xiàn)的頻次較高的詞稱為新興關(guān)鍵詞,他們識別新興關(guān)鍵詞并利用共詞的方法找到與它們高頻共現(xiàn)的詞從而發(fā)現(xiàn)新興話題。

        3.2.2 基于詞典學(xué)習(xí)和非概率矩陣分解的方法 Saha和Sindhwani[26]采用一個非負(fù)因式分解的方法學(xué)習(xí)社會媒體文本流中的新興話題,當(dāng)連續(xù)時間戳方面的主題矩陣連續(xù)性考慮在內(nèi)時,會表現(xiàn)出一個更好的話題建模性能。

        3.2.3 從多個維度來分析熱點話題 姜曉偉等[27]首先在網(wǎng)上搜集并格式化出現(xiàn)感興趣的詞的微博,對于這些微博中的所有詞匯,綜合考慮影響力、突發(fā)性和相關(guān)性3個要素對其重要性進行評估;其次用含有同一關(guān)鍵詞的微博的集合為輸入文檔訓(xùn)練LDA模型;然后通過對主題關(guān)鍵詞的概率分布的推導(dǎo),實現(xiàn)對詞的聚類和主題的挖掘。

        3.2.4 綜合考慮多個主客體 通過分析訪問者留言及鏈接關(guān)系等來發(fā)現(xiàn)熱點話題,這些方法都使得結(jié)果更加客觀。如諶志群等[28]在采用共詞分析和Bisecting K-means 聚類算法檢測網(wǎng)絡(luò)論壇熱點話題基礎(chǔ)上,提出了一個綜合考慮話題帖子篇數(shù)與帖子熱度的熱點話題關(guān)注度計算方法。陳立偉等[29]將各向異性擴散技術(shù)引入詞網(wǎng),在詞網(wǎng)中體現(xiàn)相關(guān)詞語的影響,同時保護主題間的邊界,提出有限記憶和被動冷卻機制,利用有限的存儲空間對詞網(wǎng)進行部分索引,不掃描和處理不活動詞語,實現(xiàn)熱門主題及其詞語的快速訪問,利用有限的存儲資源記錄互聯(lián)網(wǎng)文字中包含的主題,對于未知主題可以自動識別和記錄,對相關(guān)主題自動聯(lián)想[29]。

        4 結(jié)論

        研究前沿識別方面的研究在國內(nèi)研究的比較少,在國外相對比較多,大多基于統(tǒng)計學(xué)和計量學(xué)進行識別,但是該方法角度比較單一,沒能從多維度、深角度對研究前沿知識進行識別,前沿知識粒度識別不夠精深?;谟嬎銠C的自動半自動化方法正在興起,但仍處于起步階段,LDA模型是近年來研究的熱點,由于LDA本身是概率式的產(chǎn)生模式,存在不確定性,主題演化的粒度描述同樣存在不夠?qū)I畹膯栴}。網(wǎng)絡(luò)中熱點話題的識別方法研究比較多,對于文獻前沿?zé)狳c挖掘有許多值得借鑒的地方。

        雖然研究前沿識別方面已有一定的成果,但是還有以下幾個問題需要解決:(1)研究前沿的定義沒有形成統(tǒng)一的共識,需要有一個系統(tǒng)的揭示和綜合的解釋。研究前沿的定義及判定標(biāo)準(zhǔn)隨所采用方法的不同而不同,雖然已有研究者嘗試設(shè)計一套指標(biāo)來輔助判定研究前沿,但公認(rèn)的客觀可信賴的指標(biāo)體系還有待進一步研究。(2)對研究前沿的特征沒有形成客觀統(tǒng)一的描述。國內(nèi)關(guān)于研究前沿特征的研究還比較少,關(guān)于研究前沿基本特征的描述還沒有形成客觀、科學(xué)的模型,盡管有學(xué)者指出研究前沿的一些特點和規(guī)律,但是比較系統(tǒng)、客觀的描述還沒有形成,需要進一步研究。(3)研究前沿的解讀缺乏一定的語義環(huán)境。國內(nèi)研究前沿的發(fā)現(xiàn)大部分是基于統(tǒng)計的方法,這樣對于研究前沿的解讀帶來一定困難。如果利用一些語義網(wǎng)絡(luò)工具,不僅可以提高前沿監(jiān)測的準(zhǔn)確度,而且還可以從更深的粒度對研究前沿進行解讀。

        在未來的研究中,應(yīng)嘗試?yán)蒙芷?、知識傳播、系統(tǒng)動力學(xué)等理論,開展研究前沿識別研究,同時將語義網(wǎng)絡(luò)應(yīng)用到研究前沿發(fā)現(xiàn)的重要環(huán)節(jié),為知識單元內(nèi)部關(guān)系識別、知識群間關(guān)系識別以及知識演化分析等方面提供技術(shù)支持,從而提高研究前沿發(fā)現(xiàn)的效率和精度。

        1 Price D D.Networks of science papers [J].Science,1965,(149):510-515.

        2 Uphams, Small H.Emerging Research Fronts in Science and Technology:patterns of new knowledge development[J].Scientometrics,2010,83(1):15-38.

        3 Small H,Upham P. Citation structure of an Emerging Research Area on the Verge of Application[J]. Scientometrics, 2009,79(2):365-375.

        4 李柏洲,趙健宇,襲希,等.基于知識分子結(jié)構(gòu)法的知識管理研究主題演化趨勢分析[J].研究與發(fā)展管理,2014,26(2):59-75.

        5 Schiebel E. Visualization of Research Fronts and Knowledge Bases by Three-dimensional Areal Densities of Bibliographically Coupled Publications and Co-citations [J]. Scientometrics, 2012, (91): 557-566.

        6 Ohniwa R, Hibino A, Takeyasu K.Trends in Research Foci in Life Science Fields Over the Last 30 Years Monitored by Emerging Topics [J].Scientometrics,2010,(85):111-127.

        7 Chen C.CiteSpace II: detecting and visualizing emerging trendsand transient patterns in scientific Literature [J].Journal of the American Society for Information Science and Technology,2006,57(3):359-377.

        8 馬瑞敏,倪超群.作者耦合分析:一種新學(xué)科知識結(jié)構(gòu)發(fā)現(xiàn)方法的探索性研究[J].中國圖書館學(xué)報,2012,38(198):4-11.

        9 楊露.h-b 指數(shù): 一種確定學(xué)術(shù)研究熱點的新方法[J].四川教育學(xué)院報,2012,28(5):24-26.

        10 Havre S, Hetzier B, Nowell L. Theme River:visualizing thematic changes in large document collections[J].IEEE Transactions on Visualization and Computer Graphics,2002,8(1):9-20.

        11 Ganesh M S, Reddy CHP, Manikandan,et al.TDPA: trend detection and predictive analytics[J].International Journal on Computer Science and Engineering ,2011,3(3):1033-1039.

        12 Blei D M.Probabilistic Topic Models[J]. Communications of the ACM, 2012,55(4):77-84.

        13 Hofmann T.Probablistic Latent Semantic Indexing[C].New York:Proceedings of the 22ndAnnual International ACM SIGIR Conference on Research and Development in Information Retrieval(SIGIR'99).1999:50-57.

        14 Blei D M,Ng A Y,Jondan M I.Latent Dirichlet Allocation[J].Journal of Machine Learning Research,2003,(3):993-1022.

        15 Wang X,McCallum A. Topic Over Time :a non-markov continuous-time model of topical trends [C].Philadelphia,USA: ACM SIGKDD-2006, 2006:424-433.

        16 Blei D M,Lafferty J D.Dynamic topic models[C].Pittsburgh, Pernsylvania:Proceedings of the 23rd International Conference on Machine Learning,2006:113-120.

        17 Alsumait L, Barbara D, Domeniconi C.On-line LDA: adaptive topic models for mining text streams with applications to topic detection and tracking[C].Pisa,Italy: In ICDM, 2008:3-12.

        18 史慶偉,李艷妮,郭朋亮.科技文獻中作者研究興趣動態(tài)發(fā)現(xiàn)[J].計算機應(yīng)用,2013, 33 (11) : 3080-3083.

        19 Nallapati R M,Ahmed A,Xing E P,et al.Joint Latent Topic Models for Text and Citations[C].New York:Proceedings of the 14th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (KDD'08), 2008:542-550.

        20 葉春蕾,冷伏海.基于引文-主題概率模型的科技文獻主題識別方法研究[J].信息系統(tǒng), 2013,36(9):100-103.

        21 曹建平,王暉,夏友清,等.基于LDA雙通道在線主題演化模型[J].自動化學(xué)報, 2014,40(12):2877-2886.

        22 李保利,楊星.基于LDA模型和話題過濾的研究主題演化分析[J].小型微型計算機系統(tǒng),2012,33(12):2738-2743.

        23 李湘東,張嬌,袁滿.基于LDA模型的科技期刊主題演化研究[J].情報雜志, 2014,33(7): 115 - 121.

        24 崔凱,周斌,賈焰,等.一種基于LDA的在線主題演化挖掘模型[J].計算機科學(xué), 2010,37(11):156-159.

        25 Cataldi M.Caro L D, Schifanella C.Emerging Topic Detection on Twitter Based on Temporal and Social Terms Evaluation[C].New York:Proceedings of the 10th International Workshop on Multimedia Data Mining,2010.

        26 Saha A, Sindhwani.Learning Evolving and Emerging Topics in Social Media:a dynamic nmf approach with temporal regularization[C]. Seattle Washington: Proceedings of the 5th ACM International Conference on Web Search and Data Mining,2012.

        27 姜曉偉,王建民,丁貴廣.基于主題模型的微博重要話題發(fā)現(xiàn)與排序方法[J].計算機研究與發(fā)展,2013,(50):179-185.

        28 諶志群,徐寧,王榮波.基于主題演化圖的網(wǎng)絡(luò)論壇熱點跟蹤[J].情報科學(xué),2013,31(3):147 - 150.

        29 陳立偉,謝朝陽,唐權(quán)華.基于各向異性熱度擴散的主題檢測方法[J].計算機工程與設(shè)計,2014,35(8):2886-2889.

        Exploration and Analysis of Identification Methods for Research Fronts

        GONGXiao-cui,ZHAOYing-guang,ANXin-ying,

        InstituteofMedicalInformation,ChineseAcademyofMedicalSciences,Beijing100020,China

        The paper summarizes identification methods for research fronts, including the method based on bibliometrics and the automatic and semi-automatic methods based on computers. Their respective advantages and disadvantages are noted and it is suggested that such tools as semantic network should be utilized to identify research fronts in a deeper and more accurate manner.

        Research fronts; Development trend; Literature metrology; LDA; Web topics

        2015-05-06

        宮小翠,在讀碩士研究生;通訊作者:安新穎,博士,副研究員,發(fā)表論文20余篇。

        國家自然科學(xué)基金項目“基于語義的醫(yī)學(xué)領(lǐng)域前沿知識發(fā)現(xiàn)及演化機制研究”(項目編號:71303259);教育部人文社會科學(xué)研究青年基金項目“基于知識組織體系的科技文獻新主題監(jiān)測研究(項目編號:11YJC870001)。

        R-058

        A 〔DOI〕10.3969/j.issn.1673-6036.2015.09.011

        猜你喜歡
        文獻文本方法
        Hostile takeovers in China and Japan
        速讀·下旬(2021年11期)2021-10-12 01:10:43
        在808DA上文本顯示的改善
        Cultural and Religious Context of the Two Ancient Egyptian Stelae An Opening Paragraph
        大東方(2019年12期)2019-10-20 13:12:49
        基于doc2vec和TF-IDF的相似文本識別
        電子制作(2018年18期)2018-11-14 01:48:06
        The Application of the Situational Teaching Method in English Classroom Teaching at Vocational Colleges
        The Role and Significant of Professional Ethics in Accounting and Auditing
        商情(2017年1期)2017-03-22 16:56:36
        可能是方法不對
        用對方法才能瘦
        Coco薇(2016年2期)2016-03-22 02:42:52
        文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學(xué)隱喻
        四大方法 教你不再“坐以待病”!
        Coco薇(2015年1期)2015-08-13 02:47:34
        大陆老熟女自拍自偷露脸| 无码欧美毛片一区二区三| 无码人妻精品一区二区蜜桃网站 | 亚洲24小时免费视频| 一区二区三区日韩亚洲中文视频| 麻豆亚洲一区| 人人妻人人妻人人片av| 国产精品美女久久久浪潮av| 亚洲AⅤ樱花无码| 日韩精品极品视频在线观看蜜桃| 一区二区三区四区免费国产视频 | 特级婬片国产高清视频| 中国亚洲女人69内射少妇| 欧洲国产成人精品91铁牛tv| av在线一区二区精品| 亚洲一区二区三区日本久久九 | 内射合集对白在线| 国精无码欧精品亚洲一区| 欧美日韩亚洲一区二区精品| 色婷婷亚洲十月十月色天| 免费观看人妻av网站| 免费国产黄网站在线观看可以下载 | 国产一品二品精品在线| 日本丰满熟妇videossex8k| 日韩在线不卡免费视频| 国产精品女同久久久久久| 日本一区二区在线播放| 国产精品对白一区二区三区| 国产精品白浆在线观看免费| 久久国产劲暴∨内射| 亚洲国产精品国语在线| 国产在线视频网站不卡| 亚洲国产国语对白在线观看| 人人人妻人人澡人人爽欧美一区 | 国产肥熟女视频一区二区三区| 黑人老外3p爽粗大免费看视频| 成人做受黄大片| 国产成人亚洲精品无码h在线| 亚洲中文无码久久精品1| 久久国产精品男人的天堂av | 亚洲一区在线二区三区|