亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        PageRank算法在學(xué)術(shù)網(wǎng)絡(luò)平臺中的應(yīng)用研究

        2017-09-15 23:26:47白瑩瑩
        無線互聯(lián)科技 2017年17期

        白瑩瑩

        摘 要:隨著學(xué)術(shù)網(wǎng)絡(luò)平臺上科技論文的大量發(fā)表,高效地從復(fù)雜的學(xué)術(shù)網(wǎng)絡(luò)中找到符合用戶需要的有價值的文章及其作者成為當(dāng)前一項重要而困難的工作。文章首先對學(xué)術(shù)社區(qū)發(fā)現(xiàn)算法的研究現(xiàn)狀進行說明;然后對論文排名和作者影響力評估算法進行論述;最后總結(jié)論文排名和作者影響力評估算法存在的不足和面臨的挑戰(zhàn),并對學(xué)術(shù)影響力排名的發(fā)展前景進行展望。

        關(guān)鍵詞:學(xué)術(shù)社區(qū);文獻排名;PageRank算法;作者影響力

        隨著科技的進步,越來越多的學(xué)者參與到科學(xué)研究工作當(dāng)中,導(dǎo)致文獻的數(shù)量呈現(xiàn)海量增長。這些文獻為我們開展研究工作提供了很大方便的同時也帶來了一些困難。在開展科研工作的過程中,我們不可能閱讀所有的文獻,而是要在大量的數(shù)據(jù)中找到屬于自己研究領(lǐng)域的高水平文章和學(xué)者。這時就需要根據(jù)論文信息構(gòu)建學(xué)術(shù)網(wǎng)絡(luò),并根據(jù)論文的主題對學(xué)術(shù)網(wǎng)絡(luò)進行領(lǐng)域劃分。目前,學(xué)術(shù)網(wǎng)絡(luò)的相關(guān)研究得到了相當(dāng)大的關(guān)注,是極具活力和熱度的研究領(lǐng)域。

        1 學(xué)術(shù)社區(qū)發(fā)現(xiàn)

        近年來,很多學(xué)者研究復(fù)雜網(wǎng)絡(luò)的社區(qū)結(jié)構(gòu)得到許多不同的理論,提出了很多社區(qū)劃分算法,例如基于圖分割的算法、基于層次聚類的算法、基于模塊度優(yōu)化的算法和基于啟發(fā)式社區(qū)挖掘的算法等。

        Kemighan等[1]提出了著名的K-L算法,主要是將效益函數(shù)和貪婪算法相結(jié)合來劃分網(wǎng)絡(luò)中的節(jié)點,或者將不同社區(qū)節(jié)點的位置進行交換,最終劃分社區(qū);辛娟娟[2]提出了一種基于拉普拉斯矩陣的譜特征劃分網(wǎng)絡(luò)社區(qū)的譜二分法;唐杰等[3]運用不同的函數(shù)對譜二分法進行改進,降低了算法的時間復(fù)雜度的算法也被提出;Girvan等[4]提出了GN算法,通過刪除最大網(wǎng)絡(luò)邊界數(shù)來實現(xiàn)社區(qū)劃分;運用統(tǒng)計學(xué)方法,一種與GN算法類似的算法被提出,降低了算法運行的時間復(fù)雜度;Newman[5]提出“模塊度”的概念用來評價社區(qū)質(zhì)量好壞,他們認為模塊度越大,社區(qū)結(jié)構(gòu)越明顯。隨著對模塊度概念的進一步理解,研究者提出許多關(guān)于優(yōu)化模塊度來尋找網(wǎng)絡(luò)社區(qū)最佳劃分的算法。

        在社區(qū)發(fā)現(xiàn)算法中,標簽傳播算法因其簡單高效而被廣泛應(yīng)用,但是算法也存在著準確率低、穩(wěn)定性差、易產(chǎn)生標簽震蕩現(xiàn)象的缺點[6]。針對這些情況,很多科研人員提出了改進的標簽傳播算法,在傳統(tǒng)標簽傳播算法的基礎(chǔ)上改善了標簽的更新策略和傳播策略,從而在保證算法效率的基礎(chǔ)上提高了算法的準確性和穩(wěn)定性,提升了社區(qū)劃分的質(zhì)量。

        2 文獻排名算法

        目前國內(nèi)外對于文獻排名算法的研究有很多,很多學(xué)者根據(jù)引文網(wǎng)絡(luò)和鏈接網(wǎng)絡(luò)的相似性將PageRank算法應(yīng)用到文獻排名算法中,其計算公式如下:

        其中,N為引文網(wǎng)絡(luò)中文獻總數(shù);PR(A)表示引用了文獻A的文獻Pi的PageRank值;C(Pi)表示引用了文獻的文獻數(shù);α為處于0~1之間的經(jīng)驗常數(shù)。

        隨著PageRank算法的廣泛應(yīng)用,有學(xué)者開始在學(xué)術(shù)文獻排名中將PageRank算法和其他指標相結(jié)合來得到更好的排名結(jié)果[7]。Age-based PageRank算法[8]加入論文發(fā)表時間來改進排名算法;CiteRank算法是針對引用網(wǎng)絡(luò)而設(shè)計的一種文獻排名算法,它是一種基于文獻發(fā)表時間和隨機游走的方式對文獻進行排名的算法;FutureRank算法用來實現(xiàn)文獻未來的影響力的排名;和PageRank算法一樣,HITS算法最初也被用來定義網(wǎng)頁的重要性,劉大有等[9]將HITS算法應(yīng)用到學(xué)術(shù)網(wǎng)絡(luò)中,定義了一對與作者相關(guān)且彼此關(guān)聯(lián)的評分標準一撰寫權(quán)威值和引用權(quán)威值,并基于FutureRank算法將文獻發(fā)表時間作為影響未來引用頻次的因素,預(yù)測文獻價值。

        3 作者影響力評估

        作者是學(xué)術(shù)活動中的主體,作者影響力評估是當(dāng)前學(xué)術(shù)領(lǐng)域研究的熱點問題,獲得了科研工作者的廣泛關(guān)注,具有較強的應(yīng)用價值。

        Hirsch[10]將作者的發(fā)文量和被引次數(shù)進行綜合考量,提出h指數(shù)(H-index)[11]對作者進行評價研究,h指數(shù)是指某位學(xué)者至多有h篇論文分別被引用了至少h次,H-index綜合考慮了作者的發(fā)文數(shù)量和文獻的被引用次數(shù);此后很多學(xué)者考慮到h指數(shù)的缺陷,在此基礎(chǔ)上對h指數(shù)進行修正,提出了一系列衍生算法。

        傳統(tǒng)的PageRank算法評價作者影響力的算法評價作者的影響力忽略了時間因素,發(fā)表時間越久的論文被引用的次數(shù)可能更多,相應(yīng)的PageRank值越大。但是在現(xiàn)實生活中,我們一般認為最新發(fā)表的論文應(yīng)該具有更大的參考價值;H-index算法只考慮文章的被引頻次,忽略了文章本身的價值。文章結(jié)合這兩個算法,并加入時間因素對算法進行改進[12]。

        4 作者影響力評估算法的改進

        作者影響力評估算法改進的思想是:基于論文的引用關(guān)系矩陣[13],使用PageRank算法迭代計算每篇文章的PageRank值,然后基于作者和論文之間的關(guān)系矩陣采用HITS算法迭代求解作者和文獻的權(quán)威值[14],同時考慮加入時間因素對文獻排名算法進行改進,用改進的PageRank算法對社區(qū)內(nèi)的文章進行影響力排名。

        在文獻排名的基礎(chǔ)上對作者的影響力進行排名,使用改進的PageRank算法替換H-index算法中的引用數(shù),可以得到一個改進的作者影響力評估算法。

        5 結(jié)語

        隨著科研工作的發(fā)展,越來越多的學(xué)者參與到科研工作中,大量的學(xué)術(shù)論文被發(fā)表。如何從龐大的科研工作數(shù)據(jù)庫中找到影響力較大的作者和文獻,是目前影響力評估算法研究的重點工作。本文對社區(qū)發(fā)現(xiàn)、論文排名和作者影響力評估相關(guān)算法研究成果進行分析綜述,總結(jié)了算法改進的措施,確定了下一步研究內(nèi)容,為未來學(xué)術(shù)網(wǎng)絡(luò)的研究提供幫助。

        [參考文獻]

        [1]KEMIGHAN B W, LIN S.An efficient heuristic procedure for partitioning graphs[J].Bell System Technical Journal, 1970(49):291-307.endprint

        [2]辛娟娟.社區(qū)劃分算法的研究與應(yīng)用[D].北京:北京林業(yè)大學(xué),2015.

        [3]唐杰,宮繼兵,劉柳,等.基于話題模型的學(xué)術(shù)社會網(wǎng)絡(luò)建模以及應(yīng)用[J].中國科技論文在線,2011(1):25-31.

        [4]GIRVAN M,NEWMAN M E J. Community structure in social and biological networks[J].Proceedings of the National Academy of Sciences, 2002(12):7821-7826.

        [5]NEWMAN M E J. Modularity and community in networks[J].Proceedings of the National Academy of Sciences, 2006(23):8577-8582.

        [6]張俊麗,常艷麗,師文.標簽傳播算法理論及其應(yīng)用研究綜述[J].計算機應(yīng)用研究,2013(1):21-25.

        [7]ERJIA Y, YING D. Discovering author impact:a page rank perspective:information processing and management[M].Amsterdam Elsevier Ltd., 2011.

        [8]SAYYADI H, GETOOR L. FutureRank:ranking scientific articles by predicting their future PageRank[C].Siam International Conference on Data Mining , 2009 :533-544.

        [9]劉大有,薛銳青,齊紅.基于作者權(quán)威值的論文價值預(yù)測算法[J].自動化學(xué)報,2012(10):1654-1662.

        [10]HIRSCH J E.An index to quantify an individuals scientific output[J].Proceedings of the National Academy of Sciences of the United States of America, 2005(46):16569-16572.

        [11]YAN R, TANG J, LIU X, et al. Citation count prediction:learning to estimate future citations for literature[C].Proceedings of the 20th ACM International Conference Information and Knowledge Management, Association for Computing Machinery, 2011:1247-1252.

        [12]周金夢.基于學(xué)術(shù)異構(gòu)網(wǎng)絡(luò)的學(xué)者影響力評估算法[D].大連:大連理工大學(xué),2016.

        [13]曾瑋.文獻排名預(yù)測算法及作者影響力評估算法研究[D].成都:西南大學(xué),2014.

        [14]薛銳青.基于作者權(quán)威值的論文排名預(yù)測算法研究[D].長春:吉林大學(xué),2012.endprint

        女色av少妇一区二区三区| 国产真实伦视频在线视频| 日本不卡一区二区三区在线| 伊人加勒比在线观看视频| 777米奇色8888狠狠俺去啦| 丰满多毛少妇做爰视频| 久久国产av在线观看| 国产国语按摩对白av在线观看| 国产人妻人伦精品1国产| 亚洲日韩欧美国产高清αv | 国产三级在线观看性色av | 亚洲中字幕永久在线观看| 亚洲精品中文字幕91| 97久久久久人妻精品区一| 久久无码av三级| 91极品尤物国产在线播放| 丝袜美足在线视频国产在线看| 国产婷婷色一区二区三区在线 | 欧美黄色免费看| 日本一区二区高清视频在线| 日本妇人成熟免费2020| 50岁熟妇的呻吟声对白| 色播中文字幕在线视频| 日韩av一区二区蜜桃| 国产日韩av在线播放| 国产精品久久国产精麻豆99网站| 偷拍激情视频一区二区| 蜜桃传媒一区二区亚洲av婷婷| 免费无码一区二区三区蜜桃大 | 欧美日韩色另类综合| 人妻少妇无码中文幕久久| 亚洲av熟女少妇一区二区三区| 久久久久人妻精品一区三寸| 久久精品日韩av无码| 亚洲人妻有码中文字幕| 午夜天堂av天堂久久久| 色欲av亚洲一区无码少妇| 无码国产精品一区二区免费式芒果 | 亚洲欧美日韩精品久久亚洲区色播| 白嫩少妇高潮喷水av| 久久久av波多野一区二区|