李麗梅 吳新年
摘 要:文章以1996-2015年Web of Science數(shù)據(jù)庫(kù)收錄的大數(shù)據(jù)領(lǐng)域文獻(xiàn)為研究樣本,從總體態(tài)勢(shì)、空間格局演變特征和當(dāng)前研究力量布局三個(gè)角度進(jìn)行了分析。結(jié)果顯示,大數(shù)據(jù)領(lǐng)域研究正處于中前期加速發(fā)展期,學(xué)科交叉性強(qiáng);研究中心正在向中、美、英、德等多個(gè)核心區(qū)演變,呈現(xiàn)"核心-邊緣"結(jié)構(gòu),并且各國(guó)研發(fā)實(shí)力相差懸殊,核心區(qū)主要發(fā)達(dá)國(guó)家研究力量和影響力穩(wěn)步增長(zhǎng),而中國(guó)及亞洲地區(qū)的研究成果產(chǎn)出量增長(zhǎng)較快,但研究成果學(xué)術(shù)質(zhì)量亟待提升。
關(guān)鍵詞:大數(shù)據(jù);空間格局演變;多中心;核心—邊緣;研究力量布局
中圖分類號(hào): G250.252 文獻(xiàn)標(biāo)識(shí)碼: A DOI:10.11968/tsyqb.1003-6938.2016061
Space Pattern Evolvement and Distribution of Research Strengths of the Study of Big Data
Abstract The paper is to scan the study characteristics of big data in detail, thereby to provide reference for an in-depth development of big data. The author collects literatures on the subject of big data of Web of Science from 1996 to 2015. The overall trend, space pattern evolvement and distribution of research strengths are analyzed. The results show that the study of big data is stepping into the golden development period, and has a strong interdisciplinary nature. Global research has evolved from America to multiple centers——China, America, England and Germany, and demonstrates a “core-peripheral” structure. And there are wide disparities in countries around the world. The strength and impact of R&D; about major developed countries in core areas steadily increase over time, but China still has a way to go.
Key words big data; space pattern evolvement; multi-center; core-peripheral; distribution of research strengths
大數(shù)據(jù)是信息技術(shù)與經(jīng)濟(jì)社會(huì)交匯融合的產(chǎn)物,強(qiáng)調(diào)采集和存儲(chǔ)數(shù)量巨大、來(lái)源分散、格式多樣的數(shù)據(jù),并從中挖掘新知識(shí)、創(chuàng)造新價(jià)值。大數(shù)據(jù)“病毒”式地快速蔓延,正日益深刻變革各行各業(yè)的商業(yè)模式、經(jīng)濟(jì)運(yùn)行機(jī)制、國(guó)家治理方式以及人類生產(chǎn)生活的方方面面。當(dāng)前,各國(guó)政府、企業(yè)、高校和研究機(jī)構(gòu)都開始積極探索大數(shù)據(jù)發(fā)展和應(yīng)用。
本文基于Web of Science核心集合數(shù)據(jù)庫(kù),采用文獻(xiàn)計(jì)量方法,對(duì)大數(shù)據(jù)研究的相關(guān)文獻(xiàn)數(shù)據(jù)進(jìn)行分析,以期全方位了解大數(shù)據(jù)領(lǐng)域空間格局演變特征及當(dāng)前研究力量布局情況。
1 數(shù)據(jù)來(lái)源
任何科學(xué)計(jì)量分析和知識(shí)圖譜繪制的科學(xué)性都根源于數(shù)據(jù)基礎(chǔ),即保證精確全面地檢索到擬定研究主題的全部文獻(xiàn)是一項(xiàng)關(guān)鍵問(wèn)題。盡管學(xué)術(shù)界正式提出“大數(shù)據(jù)”始于2008年9月《自然》雜志發(fā)表的“Big Data:Science in the petabyte era”系列專題文章,但它并不是一個(gè)新概念,此前早已存在“大數(shù)據(jù)量”“海量數(shù)據(jù)”“大數(shù)據(jù)集”等多種與之相近的表達(dá)方式,因此有必要根據(jù)“大數(shù)據(jù)”概念演化的過(guò)程,構(gòu)建完整而精確的檢索式,以保證獲取全面且可靠的數(shù)據(jù)集。
本文基于大量文獻(xiàn)確定出“big data”的相近概念,并經(jīng)過(guò)多次檢索實(shí)驗(yàn)和抽查驗(yàn)證,制訂了相對(duì)完善的檢索策略,并進(jìn)行了檢索式構(gòu)建和數(shù)據(jù)獲取。
數(shù)據(jù)選自于Web of Science平臺(tái)。檢索策略為:主題=((big data or big-data) or“mega-data” or “enormous data” or “huge data” or “magnanim* data” or “mass* data” or “l(fā)arge data” or “tremendous data” or (massive-scale-data or data-massive-scale) or (large-scale-data or data-large-scale)),出版年=1996-2015;設(shè)定檢索范圍為:數(shù)據(jù)庫(kù)=SCI-EXPANDED、SSCI和CPCI-SSH,時(shí)間跨度=ALL-YEAR(檢索時(shí)間為2016年4月16日),文獻(xiàn)類型=(ARTICLE OR PROCEEDINGS PAPER)。執(zhí)行檢索,選擇“全記錄與引用的參考文獻(xiàn)”,以純文本格式下載,共獲得21771條文獻(xiàn)數(shù)據(jù)。
2 總體態(tài)勢(shì)分析
2.1 文獻(xiàn)增長(zhǎng)趨勢(shì)
科學(xué)文獻(xiàn)數(shù)量是衡量科學(xué)知識(shí)量的重要尺度之一,某一時(shí)期文獻(xiàn)數(shù)量的增長(zhǎng)速度在一定程度上揭示出該學(xué)科領(lǐng)域研究的理論水平和發(fā)展速度[1]。本文利用專業(yè)繪圖軟件OriginPro 8.0,將WOS中大數(shù)據(jù)領(lǐng)域1996-2015年期間文獻(xiàn)產(chǎn)出量和累積量隨時(shí)間變化曲線繪制成圖(見圖1)。
可以發(fā)現(xiàn)1996-2015年,大數(shù)據(jù)研究一直處于良好發(fā)展態(tài)勢(shì),文獻(xiàn)數(shù)量呈逐年波動(dòng)增長(zhǎng)趨勢(shì),大體可以分為三個(gè)階段:(1)1996-2002年,文獻(xiàn)增長(zhǎng)緩慢,年發(fā)文量不足500篇;(2)2002-2009年,文獻(xiàn)開始呈現(xiàn)快速增長(zhǎng)狀態(tài),2008年突破千篇;(3)2010-2015年,文獻(xiàn)持續(xù)猛增(2010年雖較2009年有所下降,但仍有千余篇研究成果產(chǎn)出),尤其是2013年增幅很大。
經(jīng)計(jì)算,擬合曲線為指數(shù)型函數(shù),曲線擬合度,表明大數(shù)據(jù)研究領(lǐng)域文獻(xiàn)累積增長(zhǎng)趨勢(shì)符合普賴斯增長(zhǎng)規(guī)律。按照科學(xué)文獻(xiàn)增長(zhǎng)的四階段理論[2],大數(shù)據(jù)領(lǐng)域的研究目前正處在中前期加速發(fā)展期,文獻(xiàn)數(shù)量進(jìn)入一個(gè)相對(duì)穩(wěn)定的指數(shù)增長(zhǎng)階段,呈現(xiàn)“知識(shí)爆炸”態(tài)勢(shì)。
2.2 學(xué)科類別分布
通過(guò)分析WOS數(shù)據(jù)庫(kù)中1996-2015年文獻(xiàn)的學(xué)科類別構(gòu)成,有利于把握研究?jī)?nèi)容的側(cè)重點(diǎn),發(fā)現(xiàn)驅(qū)動(dòng)該領(lǐng)域發(fā)展的核心學(xué)科。依據(jù)Web of Science數(shù)據(jù)庫(kù)對(duì)文獻(xiàn)的學(xué)科分類標(biāo)準(zhǔn),發(fā)現(xiàn)樣本數(shù)據(jù)分屬于232種不同類型的學(xué)科。(排名前20位的學(xué)科類別占比情況見圖2)。
不難看出,計(jì)算機(jī)科學(xué)(Computer Science,Theory & Methods;Computer Science,Information Systems;Computer Science,Artificial Intelligence;Computer Science,Software Engineering)和電子與電氣工程(Engineering,Electrical & Electronic)一直是推動(dòng)大數(shù)據(jù)發(fā)展的主要學(xué)科領(lǐng)域。此外,大數(shù)據(jù)領(lǐng)域?qū)W科交叉性強(qiáng),來(lái)自不同學(xué)科的研究人員各有側(cè)重,針對(duì)大數(shù)據(jù)的產(chǎn)出與應(yīng)用,不斷產(chǎn)生重大創(chuàng)新成果,造就了大數(shù)據(jù)領(lǐng)域研究?jī)?nèi)容寬、應(yīng)用范圍廣的現(xiàn)狀,通常涉及天文學(xué)、生物化學(xué)、環(huán)境科學(xué)、地球科學(xué)、數(shù)學(xué)與計(jì)算生物學(xué)、遙感、通信等。
3 研究中心的空間格局演變特征分析
從大數(shù)據(jù)研究領(lǐng)域文獻(xiàn)增長(zhǎng)情況可以看出,2002年和2009年分別是一個(gè)拐點(diǎn)年。2002年以前大數(shù)據(jù)領(lǐng)域一直處于緩慢發(fā)展態(tài)勢(shì),2002年以后出現(xiàn)快速增長(zhǎng),2009年達(dá)到一次小的峰值,之后發(fā)生短暫下滑,轉(zhuǎn)而呈現(xiàn)猛增勢(shì)頭。因此,選擇1996、2002、2009、2015年四個(gè)橫斷面數(shù)據(jù),以世界各國(guó)作為空間觀測(cè)單元,以文獻(xiàn)數(shù)量作為科研產(chǎn)出的衡量指標(biāo),對(duì)WOS中大數(shù)據(jù)領(lǐng)域科研產(chǎn)出的分布情況進(jìn)行逐一刻畫,旨在揭示本領(lǐng)域研究中心在全球的空間格局演變特征(見圖3)。
注:顏色越深,則該國(guó)家或地區(qū)的科研產(chǎn)出越多,反之亦然。
縱觀1996-2015年大數(shù)據(jù)研究領(lǐng)域科研產(chǎn)出排名前10的國(guó)家歷年來(lái)排名變動(dòng)情況(見圖4),可以發(fā)現(xiàn)美國(guó)一直是大數(shù)據(jù)研究的主要推動(dòng)者和重要貢獻(xiàn)者。1996-2000年,僅次于美國(guó)的英、德兩國(guó)科研產(chǎn)出穩(wěn)步增長(zhǎng),法國(guó)小幅度下滑,加拿大則大幅度上升,日本上下波動(dòng)較大;2000-2004年,中國(guó)研發(fā)實(shí)力大增,成為除美、英、德三國(guó)之外重要的研究力量;2004-2009年,美、中、英、德四國(guó)穩(wěn)居前四,意大利、法國(guó)、加拿大、日本等國(guó)家發(fā)文量不相上下;2010-2015年,各國(guó)大數(shù)據(jù)研究勢(shì)頭強(qiáng)勁,競(jìng)爭(zhēng)激烈,逐步涌現(xiàn)一批如西班牙、澳大利亞、韓國(guó)、印度等新生研究力量,而原來(lái)的強(qiáng)國(guó)日本2015年則跌出了前十位。另外,一些國(guó)家只是在個(gè)別年份進(jìn)入了世界前十,如瑞典在1996-1999年間排名由第八下滑至第十,之后再未進(jìn)入過(guò)前十;瑞士和韓國(guó)分別出現(xiàn)過(guò)兩次,且排位均靠后。
綜上分析,大數(shù)據(jù)領(lǐng)域研究中心在全球的總體格局和基本走向呈現(xiàn)以下特征:
(1)空間格局呈現(xiàn)多中心發(fā)展。20世紀(jì)90年代末,美國(guó)在大數(shù)據(jù)研究領(lǐng)域的發(fā)文量占全球總量的1/3以上,遠(yuǎn)遠(yuǎn)超出德國(guó)(穩(wěn)居第二名)5倍之多;如今,美國(guó)發(fā)文比例降至1/5左右,逐漸失去霸主地位。全球大數(shù)據(jù)研究中心空間分布核心區(qū)的國(guó)家或者地區(qū)已經(jīng)從20世紀(jì)90年代末占據(jù)絕對(duì)優(yōu)勢(shì)的美國(guó)逐步轉(zhuǎn)變?yōu)楫?dāng)前由北美的美國(guó)、西歐的英國(guó)和德國(guó)以及亞洲的中國(guó)等組成的多個(gè)核心區(qū)。
(2)各地區(qū)呈現(xiàn)“核心—邊緣”結(jié)構(gòu)。除上述核心區(qū)外,各地區(qū)也呈現(xiàn)明顯的“核心—邊緣”結(jié)構(gòu)。在研究期內(nèi),北美的加拿大,歐洲的法國(guó)、西班牙和意大利,亞洲的日本、韓國(guó)和印度,以及大洋洲的澳大利亞等多個(gè)國(guó)家或地區(qū)逐漸成為除核心區(qū)之外的一批新興大數(shù)據(jù)研究力量,并且在地域上與美國(guó)、英國(guó)、德國(guó)和中國(guó)等主要研究中心相近。
4 當(dāng)前大數(shù)據(jù)領(lǐng)域研究力量布局分析
4.1 基于國(guó)家層面的產(chǎn)出及影響力分析
被引率是美國(guó)學(xué)者M(jìn)arkusov[3]和Smart等[4]分別于1973年和1981年提出的概念,其高低反映著科學(xué)文獻(xiàn)的學(xué)術(shù)價(jià)值和適用價(jià)值,因此逐漸成為評(píng)估學(xué)術(shù)機(jī)構(gòu)文獻(xiàn)質(zhì)量高低的重要參考標(biāo)志。被引頻次是衡量文獻(xiàn)質(zhì)量的另一重要指標(biāo),被引用次數(shù)越高說(shuō)明該文獻(xiàn)影響力越大[5]。一般情況下,高被引文獻(xiàn)可能極具創(chuàng)新性和前瞻性,提出了本領(lǐng)域亟待解決的實(shí)際問(wèn)題,具有極大的指導(dǎo)意義。需要指出的是,本文所提到的被引率、篇均被引頻次等多個(gè)文獻(xiàn)計(jì)量指標(biāo)均指某時(shí)期數(shù)據(jù),如被引率是指某觀測(cè)單位在某時(shí)期文獻(xiàn)的被引篇數(shù)/某時(shí)期文獻(xiàn)總篇數(shù),篇均被引頻次是指某觀測(cè)單位在某時(shí)期文獻(xiàn)的總被引頻次/某時(shí)期文獻(xiàn)總篇數(shù)。
H指數(shù)是2005年由美國(guó)加州大學(xué)圣地亞哥分校物理系J.E.Hirsch教授設(shè)計(jì)的一種混合量化指標(biāo)[6],其計(jì)算兼顧了文獻(xiàn)數(shù)量和質(zhì)量[7],彌補(bǔ)了單純以文獻(xiàn)數(shù)量測(cè)度和評(píng)價(jià)研究機(jī)構(gòu)等學(xué)術(shù)共同體成員影響力和貢獻(xiàn)度的不足,能夠較為全面客觀地反映科研生產(chǎn)力和影響力。
本文借助WOS強(qiáng)大的數(shù)據(jù)分析功能和文本挖掘軟件TDA,對(duì)文獻(xiàn)的國(guó)家分布情況展開分析。通過(guò)統(tǒng)計(jì)和計(jì)算1996-2015年世界上發(fā)文總量居前20位的國(guó)家在大數(shù)據(jù)研究領(lǐng)域的出產(chǎn)及影響力情況,可以發(fā)現(xiàn)1996-2015年全球共有143個(gè)國(guó)家發(fā)表了大數(shù)據(jù)領(lǐng)域相關(guān)研究文獻(xiàn),其中:(1)發(fā)文量方面:美國(guó)穩(wěn)居第一,占世界總量的33.774%,是位居第二的中國(guó)的1.863倍;發(fā)文量達(dá)1000篇以上的國(guó)家還包括英、德兩國(guó);(2)文獻(xiàn)被引方面:比利時(shí)、瑞典、荷蘭、瑞士、英國(guó)、德國(guó)和加拿大被引率達(dá)70%以上,遠(yuǎn)遠(yuǎn)超出二十國(guó)的平均被引率(63.526%);而中國(guó)在大數(shù)據(jù)研究領(lǐng)域的文獻(xiàn)被引率僅為35.445%,即每100篇文獻(xiàn)中約有35篇被引用,研究成果的學(xué)術(shù)影響力偏低;美國(guó)總被引頻次最高,而德、英、法和加拿大四國(guó)被引頻次和篇均被引頻次均在20國(guó)平均水平之上(20國(guó)平均值分別為20498.2次和18.32次),研究成果具有一定影響力;而中國(guó)篇均被引頻次排名倒數(shù)第二;(3)H指數(shù)方面:北美地區(qū)的美國(guó)穩(wěn)居第一,西歐的英、德兩國(guó)稍次之,加拿大、法國(guó)、荷蘭、意大利、中國(guó)和澳大利亞是除上述3個(gè)國(guó)家之外H指數(shù)相對(duì)較好的國(guó)家,但與英、德相比還存在明顯差距,與美國(guó)的差距更大。
可見,以美國(guó)和加拿大為主的北美洲和以德國(guó)、英國(guó)和法國(guó)為主的歐洲地區(qū)科研實(shí)力相對(duì)較強(qiáng),而以中國(guó)為主的亞洲和以澳大利亞為主的大洋洲地區(qū)也正在積極開展大數(shù)據(jù)研究工作。雖然中國(guó)發(fā)文量較高,但研究成果的學(xué)術(shù)影響力較低,需要引起重視。
本文利用TDA繪制大數(shù)據(jù)研究領(lǐng)域發(fā)文國(guó)家之間的合作網(wǎng)絡(luò)(見圖5),旨在了解各國(guó)之間科研合作聯(lián)系的緊密度,以及各國(guó)在合作研究中所處位置的情況。結(jié)果顯示:大數(shù)據(jù)研究領(lǐng)域發(fā)文國(guó)家主要存在獨(dú)立研究和小團(tuán)體合作兩種模式,且跨國(guó)合作具有明顯的地域特征,尤其是歐洲地區(qū)。諸如美國(guó)、中國(guó)、日本、韓國(guó)、印度、新加坡、馬來(lái)西亞、泰國(guó)、墨西哥等國(guó)家雖然都是大數(shù)據(jù)研究領(lǐng)域的主要國(guó)家,但對(duì)外的合作強(qiáng)度普遍較低;相反地,諸如丹麥、挪威、瑞典、芬蘭等北歐地區(qū),英國(guó)、法國(guó)、荷蘭、比利時(shí)、愛爾蘭等西歐地區(qū),德國(guó)、瑞士、波蘭、奧地利等中歐地區(qū),俄羅斯、愛沙尼亞等東歐地區(qū),意大利、西班牙、
希臘、斯洛文尼亞、塞爾維亞等南歐地區(qū)國(guó)家間的合
作相對(duì)活躍。此外,南非在大數(shù)據(jù)研究領(lǐng)域的國(guó)際合作也較多。
4.2 基于機(jī)構(gòu)層面的產(chǎn)出及影響力分析
本文以發(fā)文機(jī)構(gòu)作為空間觀測(cè)單元,以文獻(xiàn)數(shù)量作為科研產(chǎn)出的衡量指標(biāo),得出1996-2015年世界上發(fā)表大數(shù)據(jù)相關(guān)研究文獻(xiàn)總量居前20位的研究機(jī)構(gòu)科研產(chǎn)出及影響力情況(見表2)。
對(duì)1996-2015年發(fā)文機(jī)構(gòu)進(jìn)行查重和歸并,結(jié)果顯示共有10618個(gè)研究機(jī)構(gòu)有成果產(chǎn)出,其中:(1)從發(fā)文量看,排名前20的機(jī)構(gòu)中,除有中國(guó)的2個(gè)、加拿大的1個(gè)機(jī)構(gòu)外,其余全部是美國(guó)的高校,其中排名第一的中國(guó)科學(xué)院發(fā)文量是排名第二的哈佛大學(xué)的兩倍多;(2)從文獻(xiàn)被引情況看,哈佛大學(xué)、華盛頓大學(xué)和牛津大學(xué)被引率高達(dá)80%以上(20個(gè)研究機(jī)構(gòu)的平均被引率為71.781%);哈佛大學(xué)、斯坦福大學(xué)和華盛頓大學(xué)的總被引頻次則突破萬(wàn)次,篇均被引頻次超過(guò)70次;(3)從H指數(shù)看,即使在大數(shù)據(jù)這樣的新興研究領(lǐng)域,美國(guó)高校的整體學(xué)術(shù)水平依然是很高的,處于大數(shù)據(jù)研究領(lǐng)域的核心地位,諸如哈佛大學(xué)、加州大學(xué)伯克利分校、斯坦福大學(xué)、華盛頓大學(xué)等院校的H指數(shù)均在平均值(24)之上,加拿大的多倫多大學(xué)對(duì)本領(lǐng)域的貢獻(xiàn)度處于中等水平,而中國(guó)的兩家研究機(jī)構(gòu)發(fā)文量位居前列,但H指數(shù)不高,表明在本領(lǐng)域的學(xué)術(shù)影響力不高,研究實(shí)力還需提升。
本文利用TDA繪制大數(shù)據(jù)研究領(lǐng)域發(fā)文機(jī)構(gòu)合作網(wǎng)絡(luò)(見圖6),旨在發(fā)現(xiàn)領(lǐng)域內(nèi)相對(duì)活躍的研究機(jī)構(gòu),并快速了解其合作關(guān)系概貌。結(jié)果表明:(1)大數(shù)據(jù)研究領(lǐng)域發(fā)文機(jī)構(gòu)中,英美地區(qū)的一些著名高校之間存在較為密切的合作交流,但中美著名高校之間的合作關(guān)系薄弱。如美國(guó)的哈佛大學(xué)、耶魯大學(xué)、賓西法尼亞大學(xué)、約翰-霍普金斯大學(xué)、密歇根大學(xué)、華盛頓大學(xué)、哥倫比亞大學(xué)、北卡羅萊那大學(xué)等與英國(guó)的牛津大學(xué)、劍橋大學(xué)、帝國(guó)理工學(xué)院等形成了較為緊密的合作網(wǎng)絡(luò),中國(guó)的清華大學(xué)、北京大學(xué)、北京理工大學(xué)、中國(guó)科學(xué)技術(shù)大學(xué)和中國(guó)科學(xué)院之間有合作產(chǎn)出,但合作度仍然偏低。更多的研究機(jī)
構(gòu)對(duì)外的合作研究則很少或幾乎沒(méi)有,尤其是圖片右下方分布著數(shù)量龐大但孤立的節(jié)點(diǎn),如明尼蘇達(dá)大學(xué)、伊利諾伊大學(xué)、南洋理工大學(xué)、法國(guó)國(guó)家科學(xué)研究院、IBM等,都是大數(shù)據(jù)研究領(lǐng)域的重要力量,但對(duì)外合作似乎很少,說(shuō)明大數(shù)據(jù)研究領(lǐng)域機(jī)構(gòu)之間合作還不是很普遍;(2)盡管一些研究機(jī)構(gòu)擁有跨機(jī)構(gòu)的合作研究,但合作對(duì)象相對(duì)集中,說(shuō)明這些主要機(jī)構(gòu)的對(duì)外合作廣泛度并不太高;(3)即使是主要研究機(jī)構(gòu)也尚未在合作網(wǎng)絡(luò)中形成權(quán)威地位和影響力。
4.3 基于作者層面的產(chǎn)出及影響力分析
本文以發(fā)文作者作為空間觀測(cè)單元,以文獻(xiàn)數(shù)量作為科研產(chǎn)出的衡量指標(biāo),得出1996-2015年世界上發(fā)表大數(shù)據(jù)相關(guān)研究文獻(xiàn)總量居前20位的研究人員科研產(chǎn)出及影響力情況(見表3)。
對(duì)1996-2015年發(fā)文作者名稱進(jìn)行清洗和合并,結(jié)果顯示,共有個(gè)60855位研究人員有成果產(chǎn)出。其中:(1)從發(fā)文量看,排名前20位的作者中中國(guó)的作者占30%、美國(guó)的作者占25%、澳大利亞的作者占15%、韓國(guó)的作者占10%,但人均發(fā)文不足24篇,發(fā)文量排名前5位的作者是韓國(guó)生物科學(xué)和生物技術(shù)研究所的Kim J(45篇)、德國(guó)波鴻魯爾大學(xué)的Lee J(42篇)、韓國(guó)高麗大學(xué)的Lee S(39篇)、美國(guó)弗吉尼亞理工大學(xué)的Kim S(38篇)和美國(guó)南佛羅里達(dá)大學(xué)的Hall Lawrence O.(30篇);(2)文獻(xiàn)被引方面,比利時(shí)布魯塞爾大學(xué)的Chamel N.教授、加拿大蒙特利爾大學(xué)的Pearson J.M.教授和澳大利亞墨爾本大學(xué)的Bezdek James C.教授在被引率和被引頻次方面統(tǒng)計(jì)結(jié)果最佳,表明他們?cè)诒绢I(lǐng)域具有較高的學(xué)術(shù)影響力;(3)從H指數(shù)看,前20位作者的平均值僅為5.5,其中加拿大蒙特利爾大學(xué)的Pearson J.M.教授排名第一,比利時(shí)布魯塞爾大學(xué)的Chamel N.教授排名第二,中國(guó)及其他亞洲國(guó)家的作者進(jìn)入發(fā)文量前20的不少,但篇均被引率和H指數(shù)都不高。
另外在大數(shù)據(jù)研究領(lǐng)域,除科研院所和大學(xué)外,IBM等跨國(guó)公司在研發(fā)產(chǎn)品的同時(shí)也積極開展大數(shù)據(jù)基礎(chǔ)和應(yīng)用技術(shù)研究,并將可共享的成果以論文形式進(jìn)行發(fā)表。
本文利用TDA繪制大數(shù)據(jù)研究領(lǐng)域發(fā)文作者合作網(wǎng)絡(luò)(見圖7),旨在了解該領(lǐng)域合作密切的作者群、每位作者在合作中所處的地位以及活躍度。結(jié)果顯示:(1)大數(shù)據(jù)研究領(lǐng)域發(fā)文作者目前仍然表現(xiàn)為獨(dú)立發(fā)文和小團(tuán)隊(duì)合作為主,合作范圍仍然較窄。其中,合作網(wǎng)絡(luò)中的大部分作者只與少數(shù)作者之間存在合作關(guān)系,尤其以同一機(jī)構(gòu)內(nèi)的同事之間合作為主。如,合作者群#1中的Li Jian教授來(lái)自IBM奧斯汀研究院,而與其合作的Li Yan教授和Wang Kun教授均來(lái)自IBM中國(guó)研究院;合作者群#2中的Goriely S.教授和Chamel N.教授均來(lái)自布魯塞爾大學(xué);合作者群#3中的Leckie Christopher教授和Bezdek James C.
教授均來(lái)自墨爾本大學(xué);合作者群#4中的Yang Chi教授、Liu Chang教授、Chen Jinjun教授等均來(lái)自悉尼科技大學(xué),而與其合作的Ranjan Rajiv教授和Nepal Surya教授均來(lái)自聯(lián)邦科學(xué)與工業(yè)研究組織(簡(jiǎn)稱CSIRO)。另外,Ranjan Rajiv教授是連通合作者群#1中兩個(gè)合作簇的關(guān)鍵節(jié)點(diǎn),其擁有豐富的社會(huì)資本,有助于科研交流的發(fā)生;(2)大數(shù)據(jù)領(lǐng)域研究人員組成的合作網(wǎng)絡(luò)存在明顯的同地域特征。如合作者群#1中,IBM中國(guó)研究院的Li Yan教授、Wang Kun教授和東北大學(xué)的Guo Lei教授均來(lái)自中國(guó);合作者群#2中,Goriely S.教授和Chamel N.教授均來(lái)自比利時(shí);合作者群#3中,Leckie Christopher教授和Bezdek James C.教授均來(lái)自澳大利亞,而與其合作的Hall Lawrence O.教授和Havens Timothy C.教授分別來(lái)自美國(guó)的南佛羅里達(dá)大學(xué)和密歇根大學(xué);合作者群#4中,CSIRO的Ranjan Rajiv教授和Nepal Surya教授、悉尼科技大學(xué)的Chen Jinjun教授和Yang Chi教授均來(lái)自澳大利亞,南京大學(xué)的Dou Wanchun教授和中國(guó)科學(xué)院的Wang Lizhe教授均來(lái)自中國(guó)地區(qū);(3)一些作者依托不同的機(jī)構(gòu)開展研究,為機(jī)構(gòu)間的合作交流起到推動(dòng)作用。如合作者群#4中的Zhang Xuyun教授和Liu Chang教授同時(shí)依托于華中科技大學(xué)和悉尼科技大學(xué),而Khan Samee U教授同時(shí)依托于清華大學(xué)和美國(guó)的北達(dá)科他州立大學(xué),這有利于帶動(dòng)中澳和中美地區(qū)實(shí)現(xiàn)資源共享及研究交流;(4)還可以發(fā)現(xiàn),絕大部分發(fā)文作者不具備相對(duì)權(quán)威的學(xué)術(shù)影響力。
從前文分析可得,當(dāng)前大數(shù)據(jù)領(lǐng)域的研究力量布局龐大且分散,包括美國(guó)、中國(guó)、英國(guó)在內(nèi)的世界各國(guó)紛紛制定了相應(yīng)的大數(shù)據(jù)發(fā)展戰(zhàn)略或計(jì)劃,但該領(lǐng)域的科研合作緊密度和廣泛度普遍偏低,合作對(duì)象主要還集中在同一地區(qū)、同一機(jī)構(gòu)內(nèi)部,且科研團(tuán)隊(duì)規(guī)模較小,跨地域、跨機(jī)構(gòu)的對(duì)外合作仍然偏少,另外大數(shù)據(jù)研究領(lǐng)域也還尚未出現(xiàn)核心機(jī)構(gòu)和核心領(lǐng)袖人物。
5 結(jié)語(yǔ)
本文通過(guò)分析大數(shù)據(jù)研究領(lǐng)域空間格局基本走向和當(dāng)前研究力量布局形勢(shì),發(fā)現(xiàn)全球大數(shù)據(jù)研究領(lǐng)域正在形成多個(gè)核心區(qū)和“核心—邊緣”結(jié)構(gòu),其中以北美的美國(guó)、西歐的英國(guó)和德國(guó)以及亞洲的中國(guó)為主。這一空間格局的演變與大數(shù)據(jù)正日益成為國(guó)家重要的基礎(chǔ)性戰(zhàn)略資源、正引領(lǐng)新一輪的科技創(chuàng)新,以及各國(guó)或各地區(qū)的政策傾斜和扶持力度大幅上升具有密不可分的關(guān)系。另外,各國(guó)在大數(shù)據(jù)領(lǐng)域研發(fā)實(shí)力相差懸殊,合作項(xiàng)目較少,今后應(yīng)該鼓勵(lì)加強(qiáng)合作,尤其是加強(qiáng)跨機(jī)構(gòu)甚至跨國(guó)家的合作研究,以提高全球大數(shù)據(jù)領(lǐng)域的整體研究水平,推動(dòng)其快速發(fā)展。
參考文獻(xiàn):
[1] 邱均平.信息計(jì)量學(xué)[M].武漢:武漢大學(xué)出版社,2007:36-66.
[2] 邱均平.信息計(jì)量學(xué)(二)第二講文獻(xiàn)信息增長(zhǎng)規(guī)律與應(yīng)用[J].情報(bào)理論與實(shí)踐,2000,23(2):153-157.
[3] MARKUSOV.VA.Comparative study of citation rates of Soviet scientific and technical publications[J].NAUCHNO-TEKHNICHESKAYA INFORMATSIYA SERIYA 1-ORGANIZATSIYA I METODIKA INFORMATSIONNOI RABOTY,1973(1):27-31.
[4] Smart J C,Elton C F.Structural characteristics and citation rates of education journals[J].American Educational Research Journal,1981,18(4):399-413.
[5] 蘇君華.中國(guó)檔案學(xué)核心期刊影響力分析——以 2000-2009 年所載論文為研究對(duì)象[J].檔案學(xué)通訊,2010(5):15-20.
[6] 趙基明,邱均平,黃凱,等.一種新的科學(xué)計(jì)量指標(biāo)——h 指數(shù)及其應(yīng)用述評(píng)[J].中國(guó)科學(xué)基金,2008(1):23-32.
[7] 張凌云,齊飛,吳平.近十年我國(guó)旅游學(xué)術(shù)共同體成果的 h 指數(shù)測(cè)度與評(píng)價(jià)[J].旅游學(xué)刊,2014,29(6):14-23.
作者簡(jiǎn)介:李麗梅(1991-),女,中國(guó)科學(xué)院蘭州文獻(xiàn)情報(bào)中心、中國(guó)科學(xué)院大學(xué)碩士研究生,研究方向:情報(bào)理論與方法;吳新年(1968-),男,中國(guó)科學(xué)院蘭州文獻(xiàn)情報(bào)中心研究員,研究方向:情報(bào)理論與方法、產(chǎn)業(yè)競(jìng)爭(zhēng)情報(bào)分析、知識(shí)管理與知識(shí)服務(wù)、區(qū)域發(fā)展研究。