亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        大數(shù)據(jù):何去何從*——基于文獻計量學的視角

        2014-01-01 02:54:22孔成果
        圖書館學刊 2014年11期
        關(guān)鍵詞:領(lǐng)域研究

        肖 明 孔成果

        (北京師范大學政府管理學院,北京 100875)

        1 引言

        網(wǎng)絡(luò)應(yīng)用的多樣化發(fā)展和社會生活的信息化構(gòu)建引發(fā)數(shù)據(jù)的爆發(fā)式增長,美國互聯(lián)網(wǎng)數(shù)據(jù)中心指出,互聯(lián)網(wǎng)上的數(shù)據(jù)每年按50%的速度增長,每兩年便將翻一番[1]。目前,人們關(guān)注的不僅僅是數(shù)據(jù)增長的量變,也更加重視數(shù)據(jù)增長的質(zhì)變,正是這種對數(shù)據(jù)價值的渴求催生了大數(shù)據(jù)時代的到來?!按髷?shù)據(jù)(big data)”可謂無處不在,政府部門、科技界、產(chǎn)業(yè)界均對其追捧不已。

        為什么大數(shù)據(jù)會成為新時代的寵兒呢?一個顯見的解釋是:雜亂無章的龐大數(shù)據(jù)中蘊含著潛在的驚人價值。毫無疑問,大數(shù)據(jù)隱含著巨大的經(jīng)濟、社會、科研等價值,科學、有效地組織和使用大數(shù)據(jù)將給世界各國帶來前所未有的機遇。究竟什么是大數(shù)據(jù)?它與哪些技術(shù)手段相結(jié)合?它能夠應(yīng)用在哪些領(lǐng)域?它能夠解決什么樣的問題?筆者利用文獻計量學這一傳統(tǒng)的理論工具,以文獻及其引文作為研究對象,結(jié)合知識圖譜工具來描繪大數(shù)據(jù)研究領(lǐng)域的概況,探究大數(shù)據(jù)的發(fā)展歷程、應(yīng)用領(lǐng)域及其未來發(fā)展趨勢。

        2 背景簡介

        大數(shù)據(jù)一經(jīng)提出,便迅速引起了政界、商界以及學術(shù)界的濃厚興趣,競相投入大數(shù)據(jù)研究的浪潮中,部分國家甚至將大數(shù)據(jù)作為國家戰(zhàn)略,置于極其重要的地位。筆者將從以下3個方面來對大數(shù)據(jù)的研究背景進行簡要介紹。

        ①政府部門。2012年3月,美國奧巴馬政府宣布“大數(shù)據(jù)研究和發(fā)展倡議(Big Data Research and Development Initiative)”,將“大數(shù)據(jù)戰(zhàn)略”上升為國家意志[2]。歐盟(European Union)在大數(shù)據(jù)領(lǐng)域也不甘示弱,投入高達1億多歐元用于科學數(shù)據(jù)基礎(chǔ)設(shè)施建設(shè),并將大數(shù)據(jù)列為Horizon2020戰(zhàn)略計劃的優(yōu)先領(lǐng)域之一[3]。聯(lián)合國(United Nations)也在2012年發(fā)布了大數(shù)據(jù)政務(wù)白皮書,認為通過對豐富的數(shù)據(jù)資源進行實時分析,可以幫助各國政府更好地響應(yīng)社會和經(jīng)濟運行,提高國家競爭力和民眾生活水平[4]。

        目前,我國還沒有明確意義上的國家級大數(shù)據(jù)發(fā)展戰(zhàn)略,但種種跡象已經(jīng)表明,中國政府對大數(shù)據(jù)領(lǐng)域懷有濃厚的興趣。

        ②商業(yè)領(lǐng)域。2011年6月,全球知名的咨詢公司麥肯錫公司(McKinsey&Company)發(fā)布了一份名為《big data:the next frontier for innovation,competition,and productivity》的研究報告[5]。該報告對大數(shù)據(jù)的關(guān)鍵技術(shù)及其在醫(yī)療、公共、零售、制造業(yè)和個人定位等5個領(lǐng)域的應(yīng)用進行了詳細分析,并得出大數(shù)據(jù)可以在任何一個行業(yè)內(nèi)創(chuàng)造出更多價值的結(jié)論。

        目前,國內(nèi)外眾多互聯(lián)網(wǎng)及社交網(wǎng)絡(luò)公司(如Google、Facebook、百度、騰訊等)也針對自身龐大的用戶數(shù)據(jù)信息展開相關(guān)大數(shù)據(jù)研究,發(fā)掘數(shù)據(jù)中潛在的商業(yè)價值,并取得了不菲的業(yè)績。

        ③學術(shù)領(lǐng)域。學術(shù)界也對大數(shù)據(jù)保持了較高的關(guān)注度。《Nature》《Science》等國際頂級學術(shù)刊物啟用??瘉砀櫞髷?shù)據(jù)研究成果。早在2008年,Nature就洞悉了大數(shù)據(jù)的發(fā)展脈搏,開辟??禕ig Data》[6]。2011年,Science推出《Dealing with Data》[7]專刊,這是Science第一個關(guān)于科學數(shù)據(jù)的???。中國計算機學會成立了專門針對大數(shù)據(jù)研究的大數(shù)據(jù)專家委員會,中國計算機學會(CCF)大數(shù)據(jù)專家委員會于2013年底發(fā)布了《2013年中國大數(shù)據(jù)發(fā)展白皮書與2014年大數(shù)據(jù)發(fā)展趨勢預(yù)測》報告,主要論述了2013年中國大數(shù)據(jù)的發(fā)展狀況。

        3 概念與特點

        3.1 概念

        “大數(shù)據(jù)(big data)”術(shù)語的提出,可以追溯至Apacheorg的開源項目Nutch。當時,大數(shù)據(jù)是指用來描述為更新網(wǎng)絡(luò)搜索索引需要同時進行批量處理或分析的大量數(shù)據(jù)集。

        然而,由于大數(shù)據(jù)本身是一個比較抽象的概念,在其定義這一問題上目前還沒有完全達成一致的認識。例如,Chris[8]等人(2012)認為:大數(shù)據(jù)是由巨型數(shù)據(jù)集組成,這些數(shù)據(jù)集的規(guī)模巨大到無法通過人工方式在可接受的時間內(nèi)達到采集、加工、整理并為人類所能解讀的信息,大數(shù)據(jù)必須借助計算機對其進行統(tǒng)計、分析,最終得出客觀結(jié)果。MIKE2[9]認為大數(shù)據(jù)應(yīng)該包含3個方面元素:數(shù)據(jù)集的復(fù)雜程度、數(shù)據(jù)所蘊含的價值量、利用縱向信息來輔助分析。

        3.2 特點

        作為一種海量、復(fù)雜的數(shù)據(jù)集合,大數(shù)據(jù)具有4個層面的特點,通常將其歸納為4V,即:Volume(規(guī)模性)、Velocity(高速性)、Variety(多樣性)、Veracity(真實性)[10]。其中,規(guī)模性要求大數(shù)據(jù)必須具有足夠的數(shù)據(jù)量,但它同時也強調(diào)數(shù)據(jù)的復(fù)雜性;高速性要求大數(shù)據(jù)必須具有高效的數(shù)據(jù)處理能力;多樣性說明大數(shù)據(jù)包含多種類型的數(shù)據(jù);真實性強調(diào)數(shù)據(jù)的完整性和可信性,決策者能夠據(jù)此做出關(guān)鍵性決策。

        4 研究方法

        大數(shù)據(jù)的提出吸引了大批國內(nèi)外學者,他們對大數(shù)據(jù)的研究關(guān)注點主要集中在探尋其起源、技術(shù)手段、存在的挑戰(zhàn)、應(yīng)用價值等方面[5~7,11]。多方位的研究使得大數(shù)據(jù)的輪廓越發(fā)明晰,然而很少有學者從大數(shù)據(jù)這一學科領(lǐng)域的本身來全貌地展現(xiàn)其研究現(xiàn)狀,而這又具有非常重要的意義。為此,筆者從文獻計量學的角度結(jié)合知識圖譜工具來介紹大數(shù)據(jù)研究的歷史沿革,并對其國內(nèi)外研究狀況進行對比分析,力圖讓讀者更加清晰地了解大數(shù)據(jù)。

        4.1 數(shù)據(jù)庫選擇

        Web of Science(以下簡稱WOS)是ISI旗下的著名引文數(shù)據(jù)庫,其中包含SCI(科學引文索引)等知名索引庫,其權(quán)威性和文章質(zhì)量都有保證。利用WOS的引文數(shù)據(jù)可以有效揭示某一學科領(lǐng)域歷史概況、研究現(xiàn)狀、未來發(fā)展趨勢及其與其他學科研究的關(guān)系。正因如此,筆者以WOS作為國外大數(shù)據(jù)研究的數(shù)據(jù)源。

        CNKI(中國知網(wǎng))是目前全球資源規(guī)模最大的數(shù)字內(nèi)容出版商,其收錄的信息內(nèi)容經(jīng)過了深度加工、編輯和整合,并以數(shù)據(jù)庫的方式進行有序管理,具有較高的質(zhì)量保證。對于某一主題的中文文獻,CNKI收錄的數(shù)據(jù)比較全面,能夠很好地反映該主題的研究狀況。因此,筆者以CNKI作為國內(nèi)大數(shù)據(jù)研究的數(shù)據(jù)源。

        4.2 可視化工具

        本研究主要借助美國Drexel大學陳超美博士開發(fā)的引文可視化工具Citespace III[12],對大數(shù)據(jù)的研究機構(gòu)和關(guān)鍵詞等進行可視化展示。

        4.3 檢索策略

        “大數(shù)據(jù)”是近年來逐漸進入公眾視野的新興概念,經(jīng)過初期的文獻預(yù)檢索發(fā)現(xiàn),大數(shù)據(jù)是從2009年才開始逐步形成研究熱潮。因此,筆者以近5年(2009~2013年)來WOS和CNKI收錄的有關(guān)大數(shù)據(jù)的文章為研究對象,從文獻計量學角度來進行多方位的分析和研究。

        在設(shè)置中外文數(shù)據(jù)庫的檢索條件時,將時間范圍統(tǒng)一限定為2009~2013年,時間跨度為5年,檢索時間是2014年3月15日。

        外文文獻的檢索策略是:在WOS中以“TI=big data”作為檢索式,共計得到502條結(jié)果記錄。經(jīng)過數(shù)據(jù)預(yù)處理后,最終得到439條相關(guān)結(jié)果記錄。

        中文文獻的檢索策略是:在CNKI中以“大數(shù)據(jù)”作為關(guān)鍵詞進行檢索,共計得到684條結(jié)果記錄,經(jīng)過數(shù)據(jù)預(yù)處理后,最終得到465條相關(guān)結(jié)果記錄。

        5 結(jié)果分析

        從圖1中可以直觀看出,國內(nèi)外刊發(fā)的大數(shù)據(jù)研究論文是逐年增長的,且國外的研究起步早于國內(nèi)。從2011年開始,大數(shù)據(jù)研究論文每年增幅達到100%以上,隨著云計算、物聯(lián)網(wǎng)等相關(guān)領(lǐng)域的快速發(fā)展以及大數(shù)據(jù)表現(xiàn)出來的巨大學術(shù)價值和商業(yè)價值,大數(shù)據(jù)研究也進入高峰期(2011~2013年),產(chǎn)出了大量文獻,為大數(shù)據(jù)研究的持續(xù)發(fā)展打下了堅實基礎(chǔ)。

        圖1 WOS和CNKI的發(fā)文數(shù)量

        5.1 高被引文章

        筆者選取WOS和CNKI中有關(guān)大數(shù)據(jù)研究的被引頻次前15位的文章,分別介紹了其被引頻次、作者和文章名、發(fā)表時間、發(fā)表期刊(分別如表1、表2、表3所示)。

        表1 WOS中被引頻次前15位的文章

        表2 WOS中被引頻次前15位的文章統(tǒng)計

        表3 CNKI中被引頻次前15位的文章

        從一篇文章的被引頻次可以看出在該研究領(lǐng)域中該篇文章的重要程度以及其他學者對該篇文章的認可度,結(jié)合表1、表2和表3的數(shù)據(jù),我們可以清晰地勾勒出國內(nèi)外大數(shù)據(jù)領(lǐng)域的研究概貌。

        從表1的被引頻次可以看出,在國外有關(guān)大數(shù)據(jù)研究的文章中被引頻次最高的前3位都集中在2009年和2010年這兩年中,其中奠基作是Jacobs、Adam在2009年發(fā)表的《The Pathologies of Big Data》[13]。在這篇文章中,Adam結(jié)合美國人口普查數(shù)據(jù)庫,從數(shù)據(jù)庫規(guī)模的變化、數(shù)據(jù)庫的訪問速度等角度闡述了大數(shù)據(jù)所帶來的改變和影響以及大數(shù)據(jù)所面臨的問題。其他被引頻次較高的文章也嘗試從特定角度來論述大數(shù)據(jù)。例如,Murdoch、TB[14](2013)以大數(shù)據(jù)在醫(yī)療中的應(yīng)用為例來介紹大數(shù)據(jù)對醫(yī)療行業(yè)的影響及其帶來的變革;Trelles、Oswaldo[15](2011)則以我們是否已經(jīng)準備好迎接大數(shù)據(jù)的到來為主題進行分析研究。

        表2對WOS中被引頻次前15位的文章的引用情況進行了詳細統(tǒng)計,其中h指數(shù)[16]為9說明這15篇文章中有9篇文章至少被引用9次,這也從側(cè)面佐證了這些文章的重要性。

        從表3的被引頻次可以看出,我國有關(guān)大數(shù)據(jù)研究的被引頻次較高的主要集中在2011年和2012年。王珊等人[17](2011)為了滿足大數(shù)據(jù)分析的特點,設(shè)計了適合大數(shù)據(jù)分析的數(shù)據(jù)倉庫架構(gòu),從技術(shù)角度闡述了大數(shù)據(jù)環(huán)境下給數(shù)據(jù)分析處理帶來的變革和挑戰(zhàn)。覃雄派等人[18](2012)主要從技術(shù)層面分析了大數(shù)據(jù)環(huán)境下數(shù)據(jù)管理面臨的挑戰(zhàn)以及相應(yīng)的技術(shù)革新。李國杰等人[3](2012)分析了在科技及經(jīng)濟社會的發(fā)展中大數(shù)據(jù)研究與應(yīng)用面臨的問題和挑戰(zhàn),并提出了大數(shù)據(jù)發(fā)展戰(zhàn)略的若干建議。孟小峰、慈祥[11](2013)則從大數(shù)據(jù)管理的角度對大數(shù)據(jù)的概念、技術(shù)、基本處理框架以及挑戰(zhàn)進行了詳細論述。

        從國內(nèi)外相關(guān)的研究中可以看出,對于大數(shù)據(jù)基礎(chǔ)理論的探討,國內(nèi)外學者并沒有表現(xiàn)出濃厚的興趣,更多的研究主要偏向于大數(shù)據(jù)的應(yīng)用,包括:大數(shù)據(jù)給各行各業(yè)帶來的變革、存在的問題、潛在的價值和面臨的挑戰(zhàn)等方面。

        5.2 高產(chǎn)作者

        對高產(chǎn)作者的統(tǒng)計能夠幫助讀者快速獲取該領(lǐng)域的核心研究人員信息,從而更有針對性地深入了解該領(lǐng)域的相關(guān)研究。

        表4列舉了WOS中近5年來發(fā)表的有關(guān)大數(shù)據(jù)的文章作者及其發(fā)文量(兩篇及以上)。例如,Michael Stonebraker發(fā)表過3篇與大數(shù)據(jù)相關(guān)的文章,他是一位著名的數(shù)據(jù)庫專家,并于1992年提出了關(guān)系數(shù)據(jù)庫模型,現(xiàn)為麻省理工學院(MIT)的客座教授,具有豐富的大數(shù)據(jù)理論研究和實戰(zhàn)經(jīng)驗;Eric E.Schadt為西奈山伊坎醫(yī)學院教授,主要從事生物信息學、計算神經(jīng)學、遺傳學等領(lǐng)域的研究;Daniel E.O'Leary現(xiàn)為南加州大學商學院教授,主要研究領(lǐng)域為電子商務(wù)、ERP、知識管理、虛擬組織。

        表4 WOS中近5年來大數(shù)據(jù)研究的作者及其發(fā)文量(兩篇及以上)

        續(xù)表

        表5是對CNKI中收錄的我國大數(shù)據(jù)領(lǐng)域研究學者及其發(fā)文量(兩篇及以上)的統(tǒng)計。其中,發(fā)文量最多的作者為喻國明,他是中國人民大學新聞學院副院長、中國人民大學輿論研究所所長,其從事的新聞傳媒工作與大數(shù)據(jù)之間有著密切聯(lián)系,僅在2013年就以第一作者的身份發(fā)表了5篇有關(guān)大數(shù)據(jù)的論文;進行相關(guān)研究的國內(nèi)學者還有吉林大學的李抵飛博士、中國人民大學信息學院的王珊教授等。值得一提的是,桂林理工大學的張興旺和李晨暉兩人合作發(fā)表了4篇有關(guān)大數(shù)據(jù)與圖書館相結(jié)合的研究論文。

        表5 CNKI中大數(shù)據(jù)研究的作者信息

        結(jié)合對表4和表5的分析可知,從事大數(shù)據(jù)研究的學者擁有不同的學科背景,研究的重點是將自己的研究方向或領(lǐng)域與大數(shù)據(jù)相結(jié)合。此外,國內(nèi)外學者在大數(shù)據(jù)的研究切入點上存在著一定差異:國外學者主要側(cè)重于計算機科學、生物學、生態(tài)學等自然科學或信息科技領(lǐng)域,而國內(nèi)學者則更多地側(cè)重于社會學、圖書館學、管理學等人文社會科學領(lǐng)域。

        5.3 應(yīng)用領(lǐng)域

        通過對WOS中有關(guān)大數(shù)據(jù)的研究文章進行分析歸納,可以得出國外的大數(shù)據(jù)研究主要集中在計算機科學、工程學、通信科學、圖書情報學、生物化學、生物化學、分子生物學、遺傳學、生命科學、經(jīng)濟學、管理學、醫(yī)學、化學、生態(tài)學等學科領(lǐng)域(如圖2所示)。大數(shù)據(jù)的研究為什么會集中在這些領(lǐng)域?究其原因,隨著科學技術(shù)的發(fā)展,人類的認知水平也在不斷地提升,計算機科學、生物學、醫(yī)學等領(lǐng)域信息被更深層次地挖掘,總量巨大、結(jié)構(gòu)復(fù)雜的數(shù)據(jù)集層出不窮,其存儲量早已達到PB級或以上。大數(shù)據(jù)給這些領(lǐng)域造成了巨大的壓力,傳統(tǒng)的技術(shù)手段和思想觀念早已不再適用?!白儎t通,通則久遠”,解決問題的需求往往是科學發(fā)展的助推劑,大數(shù)據(jù)在帶來壓力的同時也蘊含著巨大的潛在價值。

        圖2 WOS中大數(shù)據(jù)的相關(guān)研究領(lǐng)域

        經(jīng)過統(tǒng)計分析,國內(nèi)學者對大數(shù)據(jù)的研究主要集中在如圖3所示的諸多領(lǐng)域。其中,大數(shù)據(jù)與圖書情報領(lǐng)域相結(jié)合的研究論文占到了全部研究的15%左右,可見圖情學者對大數(shù)據(jù)的關(guān)注程度。圖書情報領(lǐng)域的學者從事圖書館和信息服務(wù)等方面的工作,具有敏銳的洞察力以及準確把握科學發(fā)展脈搏的能力,他們不僅僅局限于自身的領(lǐng)域知識,同時也將目光投向其他學科的研究熱點和前沿,從而更好地提供專業(yè)服務(wù)。例如,在大數(shù)據(jù)背景下,韓翠峰[20](2012)分析了大數(shù)據(jù)時代圖書館在數(shù)據(jù)儲存、數(shù)據(jù)挖掘、數(shù)據(jù)分析等方面的挑戰(zhàn),并預(yù)測了大數(shù)據(jù)背景下圖書館服務(wù)模式的改變。

        圖3 CNKI中大數(shù)據(jù)的相關(guān)研究領(lǐng)域

        此外,計算機科學、云計算、物聯(lián)網(wǎng)、經(jīng)濟學、社會學、新聞傳播等領(lǐng)域也和大數(shù)據(jù)緊密結(jié)合,彼此之間相互促進,共同發(fā)展。

        5.4 研究機構(gòu)

        研究機構(gòu)是進行一項或多項研究的專門性組織,一定程度上可以理解為學術(shù)群體的代名詞。發(fā)掘某一領(lǐng)域的核心研究機構(gòu),關(guān)注其動態(tài)能讓我們準確地把握該領(lǐng)域的研究風向標,大大降低獲取研究信息的盲目性。

        進行大數(shù)據(jù)研究的境外機構(gòu)中既有科研單位,也有企業(yè)部門。從圖4可以看出,除歐美國家的機構(gòu)以外,中科院、香港科技大學和香港理工大學在國際大數(shù)據(jù)研究領(lǐng)域是比較活躍的,且研究成果顯著。聚焦國外研究機構(gòu)分布,麻省理工學院(Massachusetts Institute of Technology)、哈佛大學(Harvard University)、斯坦福大學(Stanford University)、加州大學洛杉磯分校(University of California,Los Angeles)、牛津大學(University of Oxford)等著名高等學府以雄厚的科研實力占據(jù)了大數(shù)據(jù)研究的半壁江山。此外,微軟研究院、IBM研究院也利用自身的資源和技術(shù)優(yōu)勢展開了大數(shù)據(jù)的深層研究。

        圖4 境外大數(shù)據(jù)研究機構(gòu)

        我國在大數(shù)據(jù)領(lǐng)域進行深入研究的主要機構(gòu)如圖5所示。從圖5中可以看出,大數(shù)據(jù)的研究既有各大高校,也有科研單位,且呈南北鼎力之勢。北方主要以中國人民大學新聞學院和信息學院、北京大學新聞與傳播學院、中國標準化研究院、國家標準委員會標準信息中心、工業(yè)和信息化部等單位或機構(gòu)組成大數(shù)據(jù)研究的陣營,其中中國人民大學(以下簡稱人民大學)是大數(shù)據(jù)研究的主力軍,這一方面是因為人民大學具有濃厚的大數(shù)據(jù)研究底蘊,擁有較強的學科背景;另一方面人民大學也抓住了大數(shù)據(jù)興起帶來的機遇,占領(lǐng)大數(shù)據(jù)研究的制高點。南方進行大數(shù)據(jù)研究的機構(gòu)主要分布在電信行業(yè)、高等教育學府和圖書情報機構(gòu),中國電信股份有限公司廣東研究院、中興通訊股份有限公司、復(fù)旦大學新聞學院、上海圖書館、上海科學技術(shù)情報研究所等科研單位從各自的專業(yè)領(lǐng)域出發(fā),成為大數(shù)據(jù)研究的主力軍。

        圖5 國內(nèi)大數(shù)據(jù)研究機構(gòu)

        5.5 關(guān)鍵詞

        關(guān)鍵詞是一篇文章所要論述的精髓所在,通過提取文章中的關(guān)鍵詞,進而構(gòu)建關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò),揭示出該領(lǐng)域的研究熱點。

        從圖6可以直觀地看出,國外大數(shù)據(jù)研究與云計算、可視化、社交網(wǎng)絡(luò)、數(shù)據(jù)庫、編程、算法、系統(tǒng)、性能等信息技術(shù)或應(yīng)用領(lǐng)域關(guān)系密切。其中,云計算是指通過網(wǎng)絡(luò)提供可伸縮的廉價的分布式計算能力,它是進行大數(shù)據(jù)研究最不可或缺的一環(huán)。而大數(shù)據(jù)通常是數(shù)量巨大的半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),實時的大型數(shù)據(jù)分析需要借助如Map Reduce框架來為數(shù)以千計的電腦分配工作。

        圖6 國外大數(shù)據(jù)研究的關(guān)鍵詞共現(xiàn)

        在可視化和社交網(wǎng)絡(luò)方面,大數(shù)據(jù)也具有非常廣闊的應(yīng)用前景。社交網(wǎng)絡(luò)在近幾年風靡全球,注冊用戶節(jié)節(jié)攀升,看似雜亂無章的龐大后臺數(shù)據(jù)中蘊含著驚人價值。Facebook、Twitter等著名社交網(wǎng)站正基于自身的數(shù)據(jù)源開展大數(shù)據(jù)的分析研究。此外,大數(shù)據(jù)的可視化也是目前研究的重要方向之一。

        結(jié)合圖7可知,我國在大數(shù)據(jù)領(lǐng)域的研究中涉及的關(guān)鍵詞主要有云計算、物聯(lián)網(wǎng)、數(shù)據(jù)挖掘、數(shù)據(jù)分析、信息服務(wù)、圖書館等。圖7中,云計算、物聯(lián)網(wǎng)、數(shù)據(jù)挖掘、圖書館、信息服務(wù)等數(shù)據(jù)節(jié)點比較突出,說明它們與大數(shù)據(jù)研究關(guān)系更加密切。究其原因,大數(shù)據(jù)的根本在于數(shù)據(jù)挖掘,目的是從大量的半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)中獲取有用的知識或潛在的價值。從總體上來看,云計算是進行數(shù)據(jù)挖掘的重要技術(shù)平臺支撐,物聯(lián)網(wǎng)是大數(shù)據(jù)產(chǎn)生的源泉之一,而圖書館則是借助大數(shù)據(jù)環(huán)境下的有利因素更好地為讀者提供信息服務(wù)。

        圖7 國內(nèi)大數(shù)據(jù)研究的關(guān)鍵詞共現(xiàn)

        從關(guān)鍵詞共現(xiàn)的角度來看,國內(nèi)外學者都十分重視大數(shù)據(jù)與云計算的結(jié)合,充分利用云計算的分布式并行計算能力進行海量的、復(fù)雜的數(shù)據(jù)處理,實現(xiàn)大數(shù)據(jù)的高效處理。然而,國內(nèi)外學者研究的側(cè)重點也有所不同:國外學者的研究主要集中在算法、框架、編程、系統(tǒng)性能、可視化等技術(shù)領(lǐng)域,從底層來豐富和完善大數(shù)據(jù);國內(nèi)學者則主要偏向于大數(shù)據(jù)的應(yīng)用研究,涉及信息服務(wù)、移動互聯(lián)網(wǎng)、電子政務(wù)、圖書館等多個方面。

        5.6 期刊

        通過對WOS中有關(guān)大數(shù)據(jù)研究的刊發(fā)期刊(如圖8所示)進行分析不難發(fā)現(xiàn):美國計算機協(xié)會通訊(COMMUN ACM)、科學雜志(Science)和自然雜志(Nature)是國外大數(shù)據(jù)研究成果匯聚的核心期刊,2012年三大期刊的影響因子(Impact Factor)分別為2.511、31.027和38.579。還有一些為大數(shù)據(jù)研究開辟的??鏐IG DATA NEXT FRONTI,這些期刊共同構(gòu)成了國外大數(shù)據(jù)研究的知識共享陣地。

        圖8 WOS中大數(shù)據(jù)研究的刊發(fā)期刊

        國內(nèi)大數(shù)據(jù)研究所刊發(fā)的期刊涉及的領(lǐng)域主要有計算機科學、圖書情報學、信息通信技術(shù)、新聞傳媒、電子政務(wù)、企業(yè)管理等方面(如圖9所示)。其中,圖書情報領(lǐng)域的核心期刊《圖書與情報》刊發(fā)了多篇有關(guān)大數(shù)據(jù)給圖書館帶來的機遇與挑戰(zhàn)的文章,具有較高的影響力。

        圖9 CNKI中大數(shù)據(jù)研究的刊發(fā)期刊

        6 結(jié)語

        筆者以近5年(2009~2013年)來WOS和CNKI中有關(guān)大數(shù)據(jù)研究的論文為研究對象,從計量學的角度,利用知識圖譜工具剖析了大數(shù)據(jù)領(lǐng)域的國內(nèi)外研究現(xiàn)狀,著重分析了高被引文章、高產(chǎn)作者、研究機構(gòu)、期刊、關(guān)鍵詞和應(yīng)用領(lǐng)域等方面的內(nèi)容,歸納后得到以下幾點結(jié)論。

        ①國內(nèi)外學者都非常重視大數(shù)據(jù)的研究,國外研究起步較早,主要偏向于大數(shù)據(jù)的應(yīng)用方面;而國內(nèi)的研究則相對較晚,但既注重基礎(chǔ)理論的探討也重視應(yīng)用領(lǐng)域的研究。

        ②大數(shù)據(jù)涉及的學科主要有計算機科學、醫(yī)學、生物學、經(jīng)濟學、政治學、信息科學、生態(tài)學、社會學等,可見大數(shù)據(jù)研究是一個多學科交叉融合的典型,它為其他學科的發(fā)展提供了新的視角,但其自身也處在不斷發(fā)展完善之中。

        ③大數(shù)據(jù)研究的相關(guān)熱點領(lǐng)域主要有云計算、物聯(lián)網(wǎng)、圖書與情報、商業(yè)管理、移動互聯(lián)網(wǎng)、新聞傳媒等。大數(shù)據(jù)的研究歸根結(jié)底在于應(yīng)用,就目前的發(fā)展趨勢來看,大數(shù)據(jù)擁有非常廣泛的應(yīng)用前景。

        ④高等院校和商業(yè)研究機構(gòu)是大數(shù)據(jù)研究的兩大主力軍,從事大數(shù)據(jù)研究的機構(gòu)既有像哈佛大學、北京大學、中國人民大學這樣的高等學府,也有諸如微軟研究院、麥肯錫研究院、中國電信研究院之類的商業(yè)研究機構(gòu),這些都是產(chǎn)學研相結(jié)合的最佳實踐。

        從目前發(fā)展趨勢來看,大數(shù)據(jù)與云計算、物聯(lián)網(wǎng)等技術(shù)手段的融合將會更加深入,應(yīng)用領(lǐng)域也將不斷擴展,處理結(jié)果將會更多地以可視化方式加以呈現(xiàn),最終成為戰(zhàn)略決策的支撐。

        [1]工業(yè)和信息化部電信研究院.大數(shù)據(jù)引發(fā)的安全問題及應(yīng)對措施.[EB/OL].[2014-03-15].http://www.catr.cn/kxyj/catrgd/201403/t20140314_1003862.html.

        [2]Big Data Across the Federal Government[EB/OL].[2014-03-15].http://www.whitehouse.gov/sites/default/files/microsites/ostp/big_data_fact_sheet_final_1.pdf.

        [3]李國杰,程學旗.大數(shù)據(jù)研究:未來科技及經(jīng)濟社會發(fā)展的重大戰(zhàn)略領(lǐng)域——大數(shù)據(jù)的研究現(xiàn)狀與科學思考[J].中國科學院院刊,2012(6):647-657.

        [4]Big Data for Development:Opportunities&Challenges[EB/OL].[2014-03-15].http://www.unglobalpulse.org/sites/default/files/Big Data for Development-UNGlobal Pulse June 2012.pdf.

        [5]Big Data:The Next Frontier for Innovation,Competition,and Productivity[R/OL].[2014-03-15].http://www.mckinsey.com/insights/business_technology/big_data_the_next_frontier_for_innovation.

        [6]Big Data.Nature,2008(7209):1-136.

        [7]Science.SpecialOnlineCollection:DealingwithData[EB/OL].[2014-03-15].http://www.sciencemag.org/site/special/data/.

        [8]Chris Snijders,Uwe Matzat,Reips.“Big Data”:Big Gaps of Knowledge in the Field of Internet Science[J].International Journal of Internet Science,2012(1):1-5.

        [9]Big Data Definition.[EB/OL].[2014-03-15].http://mike2.openmethodology.org/wiki/Big_Data_Definition.

        [10]What Is Big Data?[EB/OL].[2014-03-15].http://www.villanovau.com/university-online-programs/what-is-bigdata/.

        [11]孟小峰,慈祥.大數(shù)據(jù)管理:概念、技術(shù)與挑戰(zhàn)[J].計算機研究與發(fā)展,2013(1):146-169.

        [12]Chen,CM.CiteSpace II:Detecting and Visualizing Emerging Trends and Transient Patterns in Scientific Literature[J].JOURNAL OF THE AMERICAN SOCIETY FOR INFORMATION SCIENCE AND TECHNOLOGY,2006(3):359-377.

        [13]Jacobs,Adam.The Pathologies of Big Data[J].COMMUNICATIONS OF THE ACM,2009(8):36-44.

        [14]Murdoch,TB,Detsky,AS.The Inevitable Application of Big Data to Health Care[J].JAMA,2013(13):1351-1352.

        [15]Trelles O,Prins P,Snir M,Jansen RC.Big Data,But Are We Ready?[J].Nature Reviews Genetics,2011(3):224.

        [16]Hirsch,J.E.An Index to Quantify an Individual’s Scientific Research Output[J].Proceedings of the National Academy of Sciences of the United States of America,2005(46):16569-16572.

        [17]王珊,等.架構(gòu)大數(shù)據(jù):挑戰(zhàn)、現(xiàn)狀與展望[J].計算機學報,2011(10):1741-1752.

        [18]覃雄派,等.大數(shù)據(jù)分析——RDBMS與MapReduce的競爭與共生[J].軟件學報,2012(1):32-45.

        [19]韓翠峰.大數(shù)據(jù)帶給圖書館的影響與挑戰(zhàn)[J].圖書與情報,2012(5):37-40.

        猜你喜歡
        領(lǐng)域研究
        FMS與YBT相關(guān)性的實證研究
        將現(xiàn)代科技應(yīng)用于Hi-Fi領(lǐng)域 Perlisten S7tse
        2020年國內(nèi)翻譯研究述評
        遼代千人邑研究述論
        視錯覺在平面設(shè)計中的應(yīng)用與研究
        科技傳播(2019年22期)2020-01-14 03:06:54
        領(lǐng)域·對峙
        青年生活(2019年23期)2019-09-10 12:55:43
        EMA伺服控制系統(tǒng)研究
        新版C-NCAP側(cè)面碰撞假人損傷研究
        別在必敗的領(lǐng)域里競爭
        山東青年(2016年3期)2016-02-28 14:25:59
        新常態(tài)下推動多層次多領(lǐng)域依法治理初探
        亚洲精品国偷拍自产在线观看| 日韩中文无线码在线视频观看| 18无码粉嫩小泬无套在线观看| 日本大片免费观看完整视频| 一级毛片60分钟在线播放| 国产小屁孩cao大人| 真人在线射美女视频在线观看| 综合图区亚洲另类偷窥| 国产影院一区二区在线| 精品一级一片内射播放| 亚洲熟妇自偷自拍另类| 国产欧美日韩中文久久| 乱人伦精品视频在线观看| 国产内射在线激情一区| 在线精品国产一区二区| 无码三级国产三级在线电影| 一区二区三区视频在线免费观看| 亚洲av免费看一区二区三区| 乱码窝窝久久国产无人精品| 比较有韵味的熟妇无码| 亚洲日韩一区二区三区| 国产精品va在线观看无码| 在线观看国产精品91| av天堂手机在线免费| 精品国产一区二区三区a | 亚洲国产精品无码久久| 亚洲人午夜射精精品日韩| a在线免费| 成人性生交大片免费看i| 欧美日韩午夜群交多人轮换| 国产精品黄在线观看免费软件| 国产精品主播视频| 白白白色视频在线观看播放| 国产成人自拍视频播放| 国产成人一区二区三区| 亚洲av无码一区二区三区网站| 亚洲中文字幕无码卡通动漫野外| 东京热日本道免费高清| 日韩人妻精品中文字幕专区| 欧美a级情欲片在线观看免费| 久久精品伊人无码二区|