宋星卓
摘 要:在大數(shù)據(jù)浪潮的席卷下,中外學(xué)術(shù)研究者都在大數(shù)據(jù)研究上取得了巨大的成功,為大數(shù)據(jù)在實(shí)踐中的應(yīng)用做出了很好的表率作用。文章基于學(xué)科分布研究方法研究中外文文獻(xiàn)在大數(shù)據(jù)研究上的相同與差異,進(jìn)一步對中文文獻(xiàn)在大數(shù)據(jù)研究上的發(fā)展做出建議。
關(guān)鍵詞:中文文獻(xiàn) 外文文獻(xiàn) Web of Science 中國知網(wǎng) 壹學(xué)者
中圖分類號:F062.3 ?文獻(xiàn)標(biāo)識碼:A
文章編號:1004-4914(2015)08-039-05
全球著名的咨詢公司麥肯錫(Mckinsey)在2011年6月份發(fā)布的“Big data:the next frontier for innovation, competition,and productivity”的報(bào)告中說到:“數(shù)據(jù),已經(jīng)滲透到當(dāng)今每一個(gè)行業(yè)和業(yè)務(wù)職能領(lǐng)域,成為重要的生產(chǎn)因素。人們對于海量數(shù)據(jù)的挖掘和運(yùn)用,預(yù)示著新一波生產(chǎn)率增長和消費(fèi)者盈余浪潮的到來?!?/p>
在大數(shù)據(jù)時(shí)代的浪潮下,2014年3月5日,李克強(qiáng)同志在十二屆全國人大二次會(huì)議上作政府工作報(bào)告時(shí)提出,要設(shè)立新興產(chǎn)業(yè)創(chuàng)業(yè)創(chuàng)新平臺(tái),在新一代移動(dòng)通信、集成電路、大數(shù)據(jù)、先進(jìn)制造、新能源、新材料等方面趕超先進(jìn),引領(lǐng)未來產(chǎn)業(yè)發(fā)展。
根據(jù)EnfoDesk易觀智庫發(fā)布的《中國大數(shù)據(jù)整體市場趨勢預(yù)測報(bào)告2014-2017》數(shù)據(jù)顯示,2014年進(jìn)入大數(shù)據(jù)應(yīng)用市場的快速增長期,增長速度將接近30%。預(yù)計(jì)2016年國內(nèi)大數(shù)據(jù)市場規(guī)??偭繉⑼黄?00億人民幣。
各項(xiàng)數(shù)據(jù)均表明中國政府及公民都將或多或少地參與到大數(shù)據(jù)中,認(rèn)識大數(shù)據(jù),了解大數(shù)據(jù),利用大數(shù)據(jù),但據(jù)工業(yè)和信息化部電信研究院(2014年5月)發(fā)布的《大數(shù)據(jù)白皮書》,可以看出國內(nèi)與國外在大數(shù)據(jù)應(yīng)用與普及上還存在明顯差距。
一、國內(nèi)外研究文獻(xiàn)比較
本文外文文獻(xiàn)研究所選取的數(shù)據(jù)源為Web of Science數(shù)據(jù)庫,Web of Science數(shù)據(jù)庫是國際上權(quán)威的大型綜合性核心期刊引文索引數(shù)據(jù)庫,具有很高的查全率和權(quán)威性。本文分析研究選擇了Web of Science中的SCI-EXPANDED、CCR-EXPANDED及IC索引作為檢索源。Web of Science檢索式為:(主題=BigData)+ (文獻(xiàn)類型=Article)+(時(shí)間跨度=2003-2014),檢索時(shí)間節(jié)點(diǎn)為 2015年1月14日。
從表1中可以看出從2003年到2014年在大數(shù)據(jù)研究領(lǐng)域中,美國發(fā)文量為316篇,約占總數(shù)的49.3%,遙遙領(lǐng)先我國的78篇,中國在這一領(lǐng)域中論文發(fā)表量雖然居于第二位,但發(fā)文量僅僅約為美國的1/4,說明大數(shù)據(jù)的發(fā)展主要集中在資金與技術(shù)均密集的國家,例如美國、英格蘭、德國等,大數(shù)據(jù)的發(fā)展需要資金與技術(shù)的支持,中國在改革開放以來經(jīng)濟(jì)實(shí)力明顯上升,但是在技術(shù)層面上還是略落后于以美國為首的發(fā)達(dá)國家,使得中國的論文發(fā)表量落后于美國。
(一)大數(shù)據(jù)相關(guān)論文的年代分布
首先,通過對Web of Science中檢索得到的641篇有關(guān)大數(shù)據(jù)研究的文獻(xiàn)進(jìn)行年代分布分析,總結(jié)出從2011年到2014年大數(shù)據(jù)研究成為熱點(diǎn),所研究的論文數(shù)成直線上升。
本文中文文獻(xiàn)研究所選取的數(shù)據(jù)源為中國知網(wǎng),中國知網(wǎng)憑借優(yōu)質(zhì)的內(nèi)容資源、領(lǐng)先的技術(shù)和專業(yè)的服務(wù),在業(yè)界享有極高的聲譽(yù)。檢索式:SCI收錄刊=Y或者EI收錄刊=Y或者 CSSCI期刊=Y并且年between(2003,2014and主題=大數(shù)據(jù)) (精確匹配),檢索范圍:期刊,檢索時(shí)間節(jié)點(diǎn)為2015年1月19日。
其次,本文對中國知網(wǎng)所檢索出來的1853篇論文同樣進(jìn)行年代分布分析,發(fā)現(xiàn)中文文獻(xiàn)與外文文獻(xiàn)的發(fā)展趨勢大體相同,但中文文獻(xiàn)從2012年開始成上升現(xiàn)象,而外文文獻(xiàn)從2011年已經(jīng)有明顯的上升,然后從2012年開始更是呈直線上升,中文文獻(xiàn)較外文文獻(xiàn)起點(diǎn)晚,與外文文獻(xiàn)相差了一年,使得中文文獻(xiàn)在之后的發(fā)展中想要趕上外文文獻(xiàn)需要花費(fèi)更多的時(shí)間和精力。
(二)大數(shù)據(jù)相關(guān)論文的研究方向分析
通過利用Web of Science的檢索工具可以分析得到,外文文獻(xiàn)主要的研究方向主要集中在計(jì)算機(jī)科學(xué)、工程學(xué)和科學(xué)技術(shù)其他主題,尤其是計(jì)算機(jī)科學(xué),所占比率高達(dá)34.22%。
本文利用壹學(xué)者數(shù)據(jù)挖掘工具(“壹學(xué)者”有著先天的資源優(yōu)勢,憑借著中國人民大學(xué)居于國內(nèi)首位的人文社科學(xué)術(shù)力量,“壹學(xué)者”在數(shù)據(jù)挖掘和學(xué)術(shù)研究具有較高的權(quán)威性。)檢索出來的結(jié)果顯示中文文獻(xiàn)的研究方向主要集中在文化信息傳播類和經(jīng)濟(jì)學(xué)與經(jīng)濟(jì)管理學(xué)類,關(guān)聯(lián)熱詞主要為數(shù)據(jù)鴻溝和Hadoop。
從以上圖表可以發(fā)現(xiàn),中文文獻(xiàn)在大數(shù)據(jù)技術(shù)方面的關(guān)注度不及外文文獻(xiàn),但大數(shù)據(jù)的發(fā)展首先需要的是技術(shù)的鋪墊,中文文獻(xiàn)在這方面的認(rèn)知還是很缺乏,無法為實(shí)踐工作做出更多的推動(dòng)作用。王元卓(2013)認(rèn)為“網(wǎng)絡(luò)大數(shù)據(jù)平臺(tái)在輿情監(jiān)控、模式和關(guān)鍵字搜索、數(shù)據(jù)工程、情報(bào)分析、市場營銷、醫(yī)藥衛(wèi)生等領(lǐng)域具有重要的應(yīng)用”,從上面圖表可以發(fā)現(xiàn),外文文獻(xiàn)在工程學(xué),醫(yī)療科學(xué)服務(wù)等基礎(chǔ)領(lǐng)域已逐步推行大數(shù)據(jù),而中文文獻(xiàn)在基礎(chǔ)領(lǐng)域并沒有多大的涉及,例如文學(xué)藝術(shù)類、法律類。
二、中文文獻(xiàn)的研究關(guān)注點(diǎn)
本文通過對中國知網(wǎng)搜集的1853篇文章進(jìn)行文獻(xiàn)學(xué)科領(lǐng)域分類,發(fā)現(xiàn)信息科技占比高達(dá)59.96%,其次為經(jīng)濟(jì)與管理科學(xué)和社會(huì)科學(xué),分別為16.89%和15.70%,在學(xué)科分類中農(nóng)業(yè)科技和醫(yī)藥衛(wèi)生科技占比最小,共占1853篇文章的0.49%。
(一)醫(yī)藥衛(wèi)生科技學(xué)科領(lǐng)域研究匱乏
從表3中可以看出外文文獻(xiàn)研究方向集中于計(jì)算機(jī)科學(xué)、工程學(xué)、通訊、保健科學(xué)服務(wù)、一般內(nèi)科、神經(jīng)科學(xué)神經(jīng)病學(xué)、應(yīng)用生物技術(shù)微生物學(xué)、化學(xué)和藥理學(xué)藥學(xué),其中保健科學(xué)服務(wù)、一般內(nèi)科、神經(jīng)科學(xué)神經(jīng)病學(xué)、應(yīng)用生物技術(shù)微生物學(xué)、化學(xué)和藥理學(xué)藥學(xué)共占25.36%,而中文文獻(xiàn)在醫(yī)藥科學(xué)領(lǐng)域的占比僅為0.22%。
Travis B.Murdoch(2013)等人認(rèn)為根據(jù)隨著技術(shù)的進(jìn)步,通常需要較少的投入,產(chǎn)生相同或更多輸出的生產(chǎn)函數(shù)定理,在衛(wèi)生保健中的大數(shù)據(jù)應(yīng)用是不可避免的。醫(yī)學(xué)的第一次信息技術(shù)革命是醫(yī)療記錄的數(shù)字化;第二次肯定是利用其中所載的信息,并結(jié)合其他來源。
在中文文獻(xiàn)中喻國明和何睿(2013)在對健康信息大數(shù)據(jù)的來源和分類的基礎(chǔ)上,從學(xué)術(shù)研究和實(shí)踐應(yīng)用兩個(gè)方面,分別闡釋了大數(shù)據(jù)在健康傳播與調(diào)查研究以及對個(gè)人、組織、社會(huì)等層面的可能影響。而后劉穎(2014)初步探討大數(shù)據(jù)分析在醫(yī)療行業(yè)的應(yīng)用,徐緒堪、房道偉、魏建香(2014)進(jìn)一步研究出在大數(shù)據(jù)環(huán)境下,借助各類情報(bào)技術(shù),以藥品安全性突發(fā)事件情報(bào)為主線,以藥品安全性突發(fā)事件情報(bào)分析為中心,從組織機(jī)構(gòu)、業(yè)務(wù)流程和信息流程三個(gè)層次系統(tǒng)角度全方位分析藥品安全性突發(fā)事件處理全過程,構(gòu)建藥品安全性突發(fā)事件情報(bào)分析總體框架、業(yè)務(wù)流程框架和信息流程框架,為藥品安全性突發(fā)事件應(yīng)急決策的快速響應(yīng)提供信息支撐。然而這也建立在理論之上,并未有深入實(shí)踐應(yīng)用之中。
在外文文獻(xiàn)中Brinkmann,Benjamin H.;Bower,Mark R.; Stengel,Keith A.(2009)等已經(jīng)利用大數(shù)據(jù)技術(shù)試驗(yàn)出電生理系統(tǒng)可以要求從大量的電極和在較寬的動(dòng)態(tài)范圍內(nèi)的記錄,描述人類生理平臺(tái),能夠記錄從320電極(可擴(kuò)展到1024年通道),每通道采樣率為32千赫。Mavandadi,Sam(2012)更是研究出在診斷一個(gè)二進(jìn)制的決定的情況下(例如,陽性與陰性或感染與未感染),使用BioGames有可能更準(zhǔn)確地診斷由人群采購的原始數(shù)據(jù)(例如,標(biāo)本/細(xì)胞顯微圖像)。這個(gè)BioGames平臺(tái)有望向遠(yuǎn)程病理學(xué)(遠(yuǎn)程病理學(xué)是指在一定距離間進(jìn)行的病理實(shí)踐)發(fā)展,并用來進(jìn)行提高醫(yī)務(wù)人員的培訓(xùn),也可以用來管理下一代數(shù)字芯片實(shí)驗(yàn)室設(shè)備新興的“大數(shù)據(jù)”問題。
中文文獻(xiàn)在大數(shù)據(jù)對醫(yī)藥衛(wèi)生科技學(xué)科領(lǐng)域的研究較少,并且局限于理論研究,外文文獻(xiàn)對此領(lǐng)域的研究已經(jīng)突破到應(yīng)用領(lǐng)域,并對生產(chǎn)實(shí)踐帶來直接有利影響。但是從發(fā)展形勢上來看,中文文獻(xiàn)正在向著應(yīng)用實(shí)踐方向上發(fā)展,可以期待中文文獻(xiàn)的研究在此領(lǐng)域上的突破。
(二)工程科技領(lǐng)域研究相對較少
通過表5可看出中文文獻(xiàn)在工程科技上占比為7.45%,在表3中外文文獻(xiàn)研究方向于工程類的占比12.13%,但中文文獻(xiàn)在工程科技領(lǐng)域研究數(shù)量高于外文文獻(xiàn),這也可以說中文文獻(xiàn)對工程科技上的研究重視度并不亞于外文文獻(xiàn),中文文獻(xiàn)對此領(lǐng)域的研究相當(dāng)重視。
本文對Web of Science搜索的641篇文章中78篇工程類文獻(xiàn)再一次進(jìn)行國家地區(qū)分布進(jìn)行分析,可以看出中國在此領(lǐng)域上雖然在文章數(shù)量上依然落后于美國,但是相較于在整體大數(shù)據(jù)文獻(xiàn)的差距有明顯縮小。
中文文獻(xiàn)中大數(shù)據(jù)在工程科技領(lǐng)域的研究與在醫(yī)藥衛(wèi)生科技學(xué)科領(lǐng)域不同的是,在此領(lǐng)域上的研究已經(jīng)步入應(yīng)用實(shí)踐階段。
牛東曉、谷志紅、邢棉、王會(huì)青(2006)提出了一種基于數(shù)據(jù)挖掘預(yù)處理的支持向量機(jī)預(yù)測系統(tǒng)。將該系統(tǒng)應(yīng)用于短期負(fù)荷預(yù)測中,與單純的SVM方法和BP神經(jīng)網(wǎng)絡(luò)法相比,得到了較高的預(yù)測精度。曲朝陽、陳帥、楊帆、朱莉(2014)提出一種基于云計(jì)算技術(shù)的電力大數(shù)據(jù)預(yù)處理屬性約簡方法。該方法剖析了粗糙集中相對正域理論的特性,利用MapReduce模型設(shè)計(jì)了可以并行計(jì)算正域中元素個(gè)數(shù)的屬性約簡算法MP-POSRS。屈志堅(jiān)、郭亮、劉明光、陳秋琳、蔣俊?。?013)針對智能配電網(wǎng)量測點(diǎn)多、運(yùn)行變化快,容易造成海量大數(shù)據(jù)集信息,使調(diào)度產(chǎn)生處理延遲、響應(yīng)慢的問題,提出了融合變斷面壓縮存取和分布式集群無損壓縮的柔性壓縮新算法。周國亮、宋亞奇、王桂蘭、朱永利(2013)研究出了基于云計(jì)算平臺(tái)并考慮狀態(tài)監(jiān)測數(shù)據(jù)的特點(diǎn),將監(jiān)測數(shù)據(jù)海量小文件組合成大的序列文件,并壓縮存儲(chǔ),從而提高存儲(chǔ)和處理效率的方法,實(shí)驗(yàn)結(jié)果表明該方法可以有效存儲(chǔ)狀態(tài)監(jiān)測大數(shù)據(jù)并對其聚類劃分,對提高設(shè)備的狀態(tài)評估及故障診斷水平具有一定輔助作用。
中文文獻(xiàn)在此領(lǐng)域上的研究已步入佳境,不僅研究已步入應(yīng)用實(shí)踐階段,更是取得了各種研究突破,為社會(huì)生產(chǎn)的發(fā)展奠定基礎(chǔ)。
(三)經(jīng)濟(jì)與管理科學(xué)領(lǐng)域研究發(fā)展良好
中國知網(wǎng)搜集的1853篇文章中經(jīng)濟(jì)與管理科學(xué)占比達(dá)到16.89%,可以看出中文文獻(xiàn)在此領(lǐng)域上的研究相當(dāng)重視,鄔賀銓(2013)認(rèn)為要從戰(zhàn)略上重視大數(shù)據(jù)的開發(fā)利用,將它作為轉(zhuǎn)變經(jīng)濟(jì)增長方式的有效抓手,但要注意科學(xué)規(guī)劃,切忌一哄而上。目前,大數(shù)據(jù)標(biāo)準(zhǔn)和產(chǎn)業(yè)格局尚未形成,這是我國實(shí)現(xiàn)跨越式發(fā)展的寶貴機(jī)會(huì)。
應(yīng)維云、覃正、趙宇、李兵、李秀(2007)針對客戶流失問題,建立了支持向量機(jī)預(yù)測模型。通過實(shí)際銀行信貸客戶數(shù)據(jù)集測試,該算法與傳統(tǒng)預(yù)測算法比較,更適合解決大數(shù)據(jù)集和不平衡數(shù)據(jù),取得較好的客戶流失預(yù)測效果。為企業(yè)制定目標(biāo)戰(zhàn)略提供直接有效的模型支持。而后黃曉斌、鐘輝新(2013)認(rèn)為基于大數(shù)據(jù)的企業(yè)競爭情報(bào)系統(tǒng)的功能是由核心層、支撐層和表現(xiàn)層組成,并由此提出基于大數(shù)據(jù)的企業(yè)競爭情報(bào)系統(tǒng)模型,此模型為企業(yè)競爭提供理論基礎(chǔ)。倪寧、金韶(2014)以布爾迪厄的“場域理論”為理論基礎(chǔ),提出“新媒體場域”概念,在此基礎(chǔ)上,研究新媒體場域中廣告?zhèn)鞑ト绾文軌驅(qū)崿F(xiàn)精準(zhǔn),分別是:目標(biāo)受眾精準(zhǔn)定位、消費(fèi)需求深度挖掘、投放過程精準(zhǔn)可控、廣告效果精準(zhǔn)評估,這一概念的提出為企業(yè)營銷的實(shí)踐提高了精準(zhǔn)度和效率。中文文獻(xiàn)在此領(lǐng)域上的研究,不僅為企業(yè)發(fā)展提供了各種寶貴的建議,同時(shí)也為政府的管理效率進(jìn)一步提高奠定基礎(chǔ)。
王向東、王文匯、王再堂、黃瑩(2014)首次提出“管數(shù)制”這一概念,構(gòu)建“管數(shù)制”稅收征管模式,建議稅務(wù)部門應(yīng)以大數(shù)據(jù)技術(shù)應(yīng)用為契機(jī),積極推進(jìn)我國稅收征管模式二次轉(zhuǎn)型,逐步實(shí)現(xiàn)征管模式由“管事制”向“管數(shù)制”的轉(zhuǎn)變。許小樂(2013)認(rèn)為政府統(tǒng)計(jì)應(yīng)當(dāng)通過優(yōu)化統(tǒng)計(jì)機(jī)構(gòu)設(shè)置、扎實(shí)推進(jìn)統(tǒng)計(jì)業(yè)務(wù)數(shù)據(jù)化、提高數(shù)據(jù)挖掘分析能力、完善統(tǒng)計(jì)數(shù)據(jù)發(fā)布等方面加快推進(jìn)政府統(tǒng)計(jì)的改革。
在經(jīng)濟(jì)與管理科學(xué)領(lǐng)域,中文文獻(xiàn)的研究對政府和企業(yè)都有很好的促進(jìn)作用,政府的進(jìn)步促進(jìn)企業(yè)能力的增強(qiáng),企業(yè)的進(jìn)步又反向促使政府的能力進(jìn)一步提升,中文文獻(xiàn)在此領(lǐng)域的研究發(fā)展良好,在應(yīng)用實(shí)踐階段尋求突破,為社會(huì)生產(chǎn)力的發(fā)展貢獻(xiàn)力量。
(四)信息科技領(lǐng)域上的研究偏于理論
中文文獻(xiàn)在這一學(xué)科上的占比最高——59.96%,但是,在信息科技領(lǐng)域上,中文文獻(xiàn)集中于理論的研究,對大數(shù)據(jù)進(jìn)行深層次的探討。李建中、劉顯敏(2013)在文中討論大數(shù)據(jù)可用性的挑戰(zhàn),探討大數(shù)據(jù)可用性方面的研究問題,并綜述數(shù)據(jù)可用性方面的研究成果。李清泉、李德仁(2014)針對大數(shù)據(jù)的幾個(gè)“V”特性分析了傳統(tǒng)GIS所受到的挑戰(zhàn),在前期相關(guān)研究的基礎(chǔ)上,從GIS空間數(shù)據(jù)管理、空間數(shù)據(jù)分析以及可視化三方面進(jìn)一步闡述了大數(shù)據(jù)GIS應(yīng)具有的特征。秦曉珠、李晨暉、麥范金(2013)結(jié)合大數(shù)據(jù)知識服務(wù)模式下對各種類型大數(shù)據(jù)管理和處理需求,給出了大數(shù)據(jù)知識服務(wù)概念模型。宗威、吳鋒(2013)梳理了大數(shù)據(jù)的基本特征,結(jié)合中國當(dāng)下企業(yè)發(fā)展現(xiàn)狀及大數(shù)據(jù)在國內(nèi)的發(fā)展態(tài)勢,從流程、技術(shù)和管理視角討論了大數(shù)據(jù)時(shí)代下企業(yè)保證數(shù)據(jù)質(zhì)量的挑戰(zhàn)、重要性及應(yīng)對措施。
雖然中文文獻(xiàn)在此學(xué)科領(lǐng)域的研究大多偏重于理論研究,但是其對大數(shù)據(jù)的進(jìn)一步研究和將大數(shù)據(jù)投入到生產(chǎn)力中提供了理論基礎(chǔ),并且其中的建議都具有很強(qiáng)的實(shí)踐意義。
綜上分析,中文文獻(xiàn)與外文文獻(xiàn)存在這巨大的不同,筆者認(rèn)為中文文獻(xiàn)并不需要盲目地追隨外文文獻(xiàn)的研究發(fā)展,而更應(yīng)該在大數(shù)據(jù)的學(xué)術(shù)研究上尋求自身的發(fā)展,中外文獻(xiàn)各有各的特點(diǎn),但無法否認(rèn)中文文獻(xiàn)在大數(shù)據(jù)技術(shù)與發(fā)展上不及外文文獻(xiàn),這是中文文獻(xiàn)需要加緊腳步跟上的關(guān)鍵點(diǎn),而在大數(shù)據(jù)的應(yīng)用研究上,中文文獻(xiàn)完全可以走出自己的特色與風(fēng)格出來。
三、建議
中文文獻(xiàn)在大數(shù)據(jù)方面的研究還有很大的發(fā)展空間,從中文文獻(xiàn)關(guān)注點(diǎn)這一章可以看出中文文獻(xiàn)在大數(shù)據(jù)方面的研究有自己的風(fēng)格特色,但在醫(yī)藥科技類等領(lǐng)域都與外文文獻(xiàn)在大數(shù)據(jù)方面的研究相差一段距離,通過閱讀大量文獻(xiàn),認(rèn)為中文文獻(xiàn)在大數(shù)據(jù)方面的研究可以加強(qiáng)以下兩點(diǎn)來尋求自身的突破。
(一)隱私安全保護(hù)
數(shù)據(jù)本身具有價(jià)值,就會(huì)引起惡意的侵害,也可以說只要有數(shù)據(jù),就必然存在安全與隱私的問題。隨著數(shù)據(jù)的增多,大數(shù)據(jù)面臨著重大的風(fēng)險(xiǎn)和威脅,大數(shù)據(jù)隱私安全就越需要引起人們的重視。
Schadt,Eric E.(2012)認(rèn)為大數(shù)據(jù)革命的開始,預(yù)示著我們更加需要重視隱私安全的重視和保護(hù)。需要通過法律在國家政府層面保障個(gè)人隱私的安全。他們建議大數(shù)據(jù)隱私安全保護(hù)的法律應(yīng)該盡快起草并實(shí)施。
馮登國等人(2014)認(rèn)為大數(shù)據(jù)在引入安全問題的同時(shí),也是解決信息安全問題的有效手段,它為信息安全領(lǐng)域的發(fā)展帶來了新的契機(jī)。他們通過介紹數(shù)據(jù)發(fā)布匿名保護(hù)技術(shù)、社交網(wǎng)絡(luò)匿名保護(hù)技術(shù)、數(shù)據(jù)水印技術(shù)、數(shù)據(jù)溯源技術(shù)、角色挖掘和風(fēng)險(xiǎn)自適應(yīng)的訪問控制等相關(guān)大數(shù)據(jù)安全關(guān)鍵技術(shù)來證明大數(shù)據(jù)隱私安全的可控性,進(jìn)一步證明大數(shù)據(jù)帶來了新的安全問題,但它自身也是解決問題的重要手段。
(二)信息公開化
豐富的高質(zhì)量數(shù)據(jù)資源是大數(shù)據(jù)產(chǎn)業(yè)發(fā)展的前提。近幾年在互聯(lián)網(wǎng)產(chǎn)業(yè)及金融、電信信息化快速發(fā)展的帶動(dòng)下,我國數(shù)據(jù)資源總量有了快速增長,已達(dá)到全球的13%,但其他行業(yè)受信息化水平制約,數(shù)據(jù)儲(chǔ)量仍不豐富。
張毅菁(2013)認(rèn)為大數(shù)據(jù)開啟了一次重大的時(shí)代轉(zhuǎn)型,客觀地改變了政府信息公開的廣度、深度和速度。我國應(yīng)盡快提升《政府信息公開條例》的立法層級,并對相關(guān)內(nèi)容進(jìn)行精細(xì)化的調(diào)整,全面提高政府信息公開的力度,提升政府信息的使用效率和效果,迎頭趕上這場以大數(shù)據(jù)為代表的第三次信息化浪潮。
Marx,Vivien(2013)提出了數(shù)據(jù)高速公路這一概念,認(rèn)為大數(shù)據(jù)如今的發(fā)展存在這極大的基于,同樣,挑戰(zhàn)也是相伴而至,在面對各種困難的情況下,大數(shù)據(jù)的發(fā)展需要大量的信息,數(shù)以萬計(jì)的數(shù)據(jù)信息在大數(shù)據(jù)技術(shù)的加工下將變成各種適用的數(shù)據(jù)資源。
四、總結(jié)
本文通過對年代分布和地域分布分析,基于學(xué)科分類的角度對中文文獻(xiàn)和外文文獻(xiàn)在大數(shù)據(jù)方面的研究區(qū)別進(jìn)一步比較歸納,發(fā)現(xiàn)中文文獻(xiàn)在大數(shù)據(jù)方面的研究與外文文獻(xiàn)在此上的研究相比雖存在差距,但卻有很大的自我發(fā)展空間,中文文獻(xiàn)在大數(shù)據(jù)方面的研究應(yīng)該在加強(qiáng)隱私安全保護(hù)和信息公開化的基礎(chǔ)上,尋求在實(shí)踐應(yīng)用上的進(jìn)一步發(fā)展,進(jìn)而成為具有中國特色的大數(shù)據(jù)文獻(xiàn)研究特色。
參考文獻(xiàn):
[1] Big data. 2011. http://en.wikipedia.org/wiki/Big_data
[2] Beyer M A,Laney D. The Importance of‘Big Data’ : A Definition[EB/OL].https://www.gartner.com/doc/2057415/importance-big-data
-definition,2014.1.2
[3] Laney D. 3D data management: Controlling data volume, velocity and variety[EB/OL].http://blogs.gartner.com/doug-laney/files/2012/01/
ad949-3D-Data-Management-Controlling-Data-Volume-Velocity-
andVariety.pdf,2014.1.2.
[4] Beyer M. Gartner says solving‘big data’ challenge involves more than just managing volumes of data[EB/OL].http://www.gartner.com/newsroom/id/1731916,2014.1.2
[5] Howe D, Costanzo M, Fey P, et al. Big data: The future of biocuration [J]. Nature, 2008
[6] Duncan L E, Keller M C. A critical review of the first 10 years of candidate gene-by-environment interaction research in psychiatry [J]. American Journal of Psychiatry, 2011 (10)
[7] Schadt E E,Linderman M D, Sorenson J,et al. Computational solutions to large-scale data management andAnalysis [J]. Nature Reviews Genetics,2010(9)
[8] Demchenko Y, Grosso P, de Laat C, et al. Addressing big data issues in Scientific Data Infrastructure[C]//Collaboration Technologies and Systems (CTS), 2013 International Conference on,UK:IEEE, 2013
[9] Boyd D, Crawford K. Critical questions for big data: Provocations for a cultural, technological,and scholarly phenomenon [J].Information, Communication & Society, 2012 (5)
[10] Zhang D. Granularities and inconsistencies in big data analysis [J].International Journal of Software Engineering and KnowledgeEngineering, 2013(6)
[11] Liu Ling. Computing infrastructure for big data processing [J]. Frontiers of Computer Science, 2013 (2)
[12] Ji C, Li Y, Qiu W, et al. Big data processing in cloud computing environments[C]//Pervasive Systems, Algorithms and Networks (ISPAN), 2012 12th International Symposium on.IEEE, 2012
[13] Zhang X, Liu C, Nepal S, et al. SaC- FRAPP: a scalable and cost- effective framework for privacy preservation over big data on cloud [J]. Concurrency and Computation: Practice and Experience, 2013 (18)
[14] 彭蘭.“大數(shù)據(jù)”時(shí)代:新聞業(yè)面臨的新震蕩[J].編輯之友,2013(1)
[15] 孟小峰,慈祥.大數(shù)據(jù)管理:概念、技術(shù)與挑戰(zhàn)[J].計(jì)算機(jī)研究與發(fā)展,2013(1)
[16] 吳金紅,張飛,鞠秀芳.大數(shù)據(jù):企業(yè)競爭情報(bào)的機(jī)遇、挑戰(zhàn)及對策研究[J].情報(bào)雜志,2013(1)
[17] 韓翠峰.大數(shù)據(jù)時(shí)代圖書館的服務(wù)創(chuàng)新與發(fā)展[J].圖書館,2013(1)
[18] 劉高勇,汪會(huì)玲,吳金紅.大數(shù)據(jù)時(shí)代的競爭情報(bào)發(fā)展動(dòng)向探析[J].圖書情報(bào)知識,2013(2)
[19] 姜山,王剛.大數(shù)據(jù)對圖書館的啟示[J].圖書館工作與研究,2013(4)
[20] 王捷.大數(shù)據(jù)時(shí)代下圖書館開展信息服務(wù)的對策[J].現(xiàn)代情報(bào),2013(3)
[21] 朱東華,張嶷,汪雪鋒,李兵,黃穎,馬晶,許幸榮,楊超,朱福進(jìn).大數(shù)據(jù)環(huán)境下技術(shù)創(chuàng)新管理方法研究[J].科學(xué)學(xué)與科學(xué)技術(shù)管理,2013(4)
[22] 宋亞奇,周國亮,朱永利.智能電網(wǎng)大數(shù)據(jù)處理技術(shù)現(xiàn)狀與挑戰(zhàn)[J].電網(wǎng)技術(shù),2013(4)
[23] 朱靜薇,李紅艷.大數(shù)據(jù)時(shí)代下圖書館的挑戰(zhàn)及其應(yīng)對策略[J].現(xiàn)代情報(bào),2013(5)
[24] 李建中,劉顯敏.大數(shù)據(jù)的一個(gè)重要方面:數(shù)據(jù)可用性[J].計(jì)算機(jī)研究與發(fā)展,2013(6)
[25] 王元卓,靳小龍,程學(xué)旗.網(wǎng)絡(luò)大數(shù)據(jù):現(xiàn)狀與展望[J].計(jì)算機(jī)學(xué)報(bào),2013(6)
[26] 秦曉珠,李晨暉,麥范金.大數(shù)據(jù)知識服務(wù)的內(nèi)涵、典型特征及概念模型[J].情報(bào)資料工作,2013(2)
[27] 郭自寬,張興旺,麥范金.大數(shù)據(jù)生態(tài)系統(tǒng)在圖書館中的應(yīng)用[J].情報(bào)資料工作,2013(2)
[28] 賈利軍,許鑫.談“大數(shù)據(jù)”的本質(zhì)及其營銷意蘊(yùn)[J].南京社會(huì)科學(xué),2013(7)
[29] 劉煒,夏翠娟,張春景.大數(shù)據(jù)與關(guān)聯(lián)數(shù)據(jù):正在到來的數(shù)據(jù)技術(shù)革命[J].現(xiàn)代圖書情報(bào)技術(shù),2013(4)
[30] 容春琳.公共圖書館應(yīng)用大數(shù)據(jù)的策略研究[J].圖書館建設(shè),2013(7)
[31] 王斌.大數(shù)據(jù)與新聞理念創(chuàng)新——以全球首屆“數(shù)據(jù)新聞獎(jiǎng)”為例[J].編輯之友,2013(6)
[32] 李鳳英,齊宇歆,薛慶水.大數(shù)據(jù)視域下的虛擬學(xué)習(xí)社區(qū)安全研究——基于門限代理簽名的協(xié)同學(xué)習(xí)系統(tǒng)探討[J].遠(yuǎn)程教育雜志,2013(4)
[33] 王武彬.大數(shù)據(jù)浪潮中的傳媒業(yè)——兼談大數(shù)據(jù)討論的若干誤區(qū)[J].新聞?dòng)浾撸?013(6)
[34] 喻國明,王斌,李彪,楊雅.傳播學(xué)研究:大數(shù)據(jù)時(shí)代的新范式[J].新聞?dòng)浾撸?013(6)
[35] 宗威,吳鋒.大數(shù)據(jù)時(shí)代下數(shù)據(jù)質(zhì)量的挑戰(zhàn)[J].西安交通大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),2013(5)
[36] 徐鵬,王以寧,劉艷華,張海.大數(shù)據(jù)視角分析學(xué)習(xí)變革——美國《通過教育數(shù)據(jù)挖掘和學(xué)習(xí)分析促進(jìn)教與學(xué)》報(bào)告解讀及啟示[J].遠(yuǎn)程教育雜志,2013(6)
[37] 金陵.大數(shù)據(jù)與信息化教學(xué)變革[J].中國電化教育,2013(10)
[38] 崔慧紅.基于大數(shù)據(jù)的CDRS知識整合研究框架構(gòu)建[J].圖書館學(xué)研究,2013(17)
[39] 張燕南,趙中建.大數(shù)據(jù)時(shí)代思維方式對教育的啟示[J].教育發(fā)展研究,2013(21)
[40] 顧濤.基于大數(shù)據(jù)的競爭情報(bào)協(xié)作分析研究[J].情報(bào)科學(xué),2013(12)
[41] 劉紅,胡新和.數(shù)據(jù)革命:從數(shù)到大數(shù)據(jù)的歷史考察[J].自然辯證法通訊,2013(6)
[42] 祝智庭,沈德梅.基于大數(shù)據(jù)的教育技術(shù)研究新范式[J].電化教育研究,2013(10)
[43] 張彥華.大數(shù)據(jù)時(shí)代國內(nèi)傳媒產(chǎn)業(yè)的挑戰(zhàn)與機(jī)遇[J].現(xiàn)代傳播(中國傳媒大學(xué)學(xué)報(bào)),2013(11)
[44] 鮑翠梅.面向大數(shù)據(jù)時(shí)代的圖書館知識服務(wù)[J].現(xiàn)代情報(bào),2013(10)
[45] 蔣勛,劉喜文.大數(shù)據(jù)環(huán)境下面向知識服務(wù)的數(shù)據(jù)清洗研究[J].圖書與情報(bào),2013(5)
[46] 祝森生.大數(shù)據(jù)時(shí)代關(guān)于智慧圖書館的幾個(gè)研究問題探討[J].圖書與情報(bào),2013(5)
[47] 張軍,姚飛.大數(shù)據(jù)時(shí)代的國家創(chuàng)新系統(tǒng)構(gòu)建問題研究[J].中國科技論壇,2013(12)
[48] 史衛(wèi)民.大數(shù)據(jù)時(shí)代個(gè)人信息保護(hù)的現(xiàn)實(shí)困境與路徑選擇[J].情報(bào)雜志,2013(12)
[49] 周國亮,宋亞奇,王桂蘭,朱永利.狀態(tài)監(jiān)測大數(shù)據(jù)存儲(chǔ)及聚類劃分研究[J].電工技術(shù)學(xué)報(bào),2013(S2)
[50] 霍然,王宏志,朱鎔,李建中,高宏.基于Map-Reduce的大數(shù)據(jù)實(shí)體識別算法[J].計(jì)算機(jī)研究與發(fā)展,2013(S2)
[51] 張引,陳敏,廖小飛.大數(shù)據(jù)應(yīng)用的現(xiàn)狀與展望[J].計(jì)算機(jī)研究與發(fā)展,2013(S2)
[52] 黃冬梅,杜艷玲,賀琪.混合云存儲(chǔ)中海洋大數(shù)據(jù)遷移算法的研究[J].計(jì)算機(jī)研究與發(fā)展,2014(1)
[53] 梅德明.大數(shù)據(jù)時(shí)代語言生態(tài)研究[J].外語電化教學(xué),2014(1)
[54] JohnCarloBertot,鄭磊,徐慧娜,包琳達(dá).大數(shù)據(jù)與開放數(shù)據(jù)的政策框架:問題、政策與建議[J].電子政務(wù),2014(1)
[55] 白如江,冷伏海.“大數(shù)據(jù)”時(shí)代科學(xué)數(shù)據(jù)整合研究[J].情報(bào)理論與實(shí)踐,2014(1)
[56] 鄭淑蓉.零售業(yè)大數(shù)據(jù):形成、應(yīng)用及啟示[J].理論探索,2014(2)
[57] 馮登國,張敏,李昊.大數(shù)據(jù)安全與隱私保護(hù)[J].計(jì)算機(jī)學(xué)報(bào),2014(1)
[58] 耿直.大數(shù)據(jù)時(shí)代統(tǒng)計(jì)學(xué)面臨的機(jī)遇與挑戰(zhàn)[J].統(tǒng)計(jì)研究,2014(1)
[59] 李金昌.大數(shù)據(jù)與統(tǒng)計(jì)新思維[J].統(tǒng)計(jì)研究,2014(1)
[60] 邱東.大數(shù)據(jù)時(shí)代對統(tǒng)計(jì)學(xué)的挑戰(zhàn)[J].統(tǒng)計(jì)研究,2014(1)
[61] 朱建平,章貴軍,劉曉葳.大數(shù)據(jù)時(shí)代下數(shù)據(jù)分析理念的辨析[J].統(tǒng)計(jì)研究,2014(2)
[62] 周江,王偉平,孟丹,馬燦,古曉艷,蔣杰.面向大數(shù)據(jù)分析的分布式文件系統(tǒng)關(guān)鍵技術(shù)[J].計(jì)算機(jī)研究與發(fā)展,2014(2)
[63] 劉俊,張昕.大數(shù)據(jù)視域下的科技期刊數(shù)據(jù)庫建設(shè)[J].編輯學(xué)報(bào),2014(1)
(作者單位:江南大學(xué)商學(xué)院 江蘇無錫 214000)(責(zé)編:賈偉)