常雪平
(蘭州大學 新聞與傳播學院,甘肅 蘭州 730000)
大數據研究現狀分析
常雪平
(蘭州大學 新聞與傳播學院,甘肅 蘭州 730000)
在這個信息大爆炸時代,“大數據”作為一個新生兒強勢入侵學術研究領域。發(fā)表的大量大數據學術論文吸引了我們的注意力。但是,當太多的人力、物力投入大數據學術研究后,其研究成果如何?本文帶著這一問題,通過研究已發(fā)表論文的量和質來探討我國目前關于大數據研究的現狀,從而為我們進行有效、高質量的大數據研究提供借鑒。
大數據;研究現狀;宏觀;微觀
隨著信息技術、網絡技術的發(fā)展,信息傳播極為迅速,各種數據滲透著我們的生活。從一條條滿載心情的朋友圈消息到一次次實用到家的網購經歷,數據都作為一種不可或缺的存在影響、改變著我們生活的每一天。傳播技術的發(fā)展和數據指數級的增長,讓通常只用在天文學、基因學的“大數據”概念,從傳統(tǒng)的幕后支持默默走到了前臺第一線,從少數專家的學術術語走進了各行各業(yè)的新興用語,并逐步在我們的生產生活中應用開來。
“大小超出常規(guī)的數據庫工具獲取、存儲、管理和分析能力的數據集?!边@是全球知名咨詢公司麥肯錫在其報告《大數據:創(chuàng)新、競爭和生產力的新前線》中對“大數據”下的定義。也有學者認為,從各種各樣的數據中快速獲取有價值的信息能力即為大數據。筆者認為,大數據主要包含兩方面的信息:一方面,是“大”,這是一種量的表達,相對的是過去的小樣本、小數據,代表著樣本量的豐富性和多樣性,以及由這兩個屬性延伸而來的高價值;另一方面,就是“數據”,這是一種性質的表達,代表的是眾多信息的數字化狀態(tài)。
本文主要是通過分析國內學術界關于大數據文獻的發(fā)表狀態(tài),來探討目前我國大數據的研究現狀。研究現狀在態(tài)度上主要分為批判性和非批判性。研究類別上又主要分為物理、化學、天文、公衛(wèi)、新聞、互聯網等不同的類別。本文以中國知網為檢視平臺,以這幾年有關大數據的論文發(fā)表量及發(fā)表內容為研究對象,從宏觀和微觀兩個角度探索大數據研究的現狀,從而得出相關結論。
通過在知網輸入“大數據”“大數據技術”“大數據應用”“大數據產業(yè)”及“大數據批判性”等不同關鍵詞檢索信息,從相關論文題目中整體把握我國大數據的研究現狀,為清晰認識研究中出現的問題和優(yōu)勢奠定堅實的基礎。
基于以上方法,主要得出以下結論:
第一,大數據研究在我國由一種“僅僅存在”的狀態(tài)變成了一股洶涌的研究熱潮,且還在不斷升溫。主要表現在論文數量逐年上升。我國的大數據研究始于2003年的信息產業(yè)、計算機產業(yè)等領域,且每年論文發(fā)表數量僅僅維持在1篇而已。那時的大數據研究只是一種維持存在的狀態(tài)。但從2012年起,大數據研究論文的數量突然有了顯著增長,由1篇增長到68篇,2013年急劇增加,2014年繼續(xù)保持增長的勢頭,2015年更是達到一個新高度,有5079篇,2016年大數據研究熱潮還在持續(xù)。
第二,大數據涉及的領域逐步廣泛,由原來主要集中于計算機信息領域,逐步擴展到科技、金融、經濟、管理等,甚至最近幾年還發(fā)展到了新聞、電子政務等領域。大數據最初的研究始于計算機,這一領域在以后的研究總量中也占據了很大一部分。除此以外,圖書情報學期刊和農業(yè)圖書情報學期刊也刊載了一些大數據的文章,這不僅代表著大數據研究涉及領域廣泛,也昭示了其學科交叉研究的趨勢。
第三,對大數據的應用實踐研究不太重視,且開始較晚。主要表現在包含和實踐應用相關的關鍵詞“大數據應用”“大數據技術”和“大數據產業(yè)”的論文數量比較少,即使是三者的總量也僅僅占論文總量的2.9%,且這些論文出現的時間都在2013年之后。
第四,我國對大數據支持性的觀點較多,而批判性的反思論述相對太少。最直觀的是統(tǒng)計的數字沖擊,在9472條與大數據有關的論述中,僅有不到20篇文章是對大數據帶有批判、反思基調的。從這一點得出,在大數據時代,在大多數人對技術崇拜和迷戀的時代,能夠冷靜、反思才是難能可貴的。
第五,大數據研究越來越受關注,除相關論文發(fā)表外,也召開了相關學術會議。例如,以“大數據應用”檢索中國知網,針對關鍵詞搜索得出的有關大數據在軌道交通運營管理行業(yè)、城市空間研究進行大數據應用研究分析的會議,2016年更有許多學術會議把大數據提上議程。
對論文發(fā)表量宏觀的分析,能夠幫助我們了解目前研究的整體成果、環(huán)境和問題。但要了解具體的論文質量和估計它能給我們現實提供多大程度的指導,還需要對論文研究的具體內容進行分析。本文隨機從《新聞導刊》上選取數篇有關大數據的文章進行文本的內容的詳細分析,帶有一定的片面性,但也可窺得一斑。
大數據研究的最初階段更側重于界定大數據的概念,如在選取的10篇文章中,2013年發(fā)表的《“大數據”概念考辨》和《理解“大數據”時代》2篇就側重于大數據概念的界定,但以后的研究偏向于大數據理論和具體研究實物的結合。一些人文社科類、管理類文章主要側重于大數據的理論探討和現實借鑒(也就是理論的套用),雖然不同文章套用的套路各不相同,但關于大數據的實質內容創(chuàng)新觀點較少。大多數論文都是對大數據理論特點的套用,硬生生將已成功或未成功的實踐事件和大數據的功能特點聯系起來。這種聯系對解決生活中的實際問題沒有實質性意義,但也不能完全否定,只是我們需要一些更加創(chuàng)新性的理論和實踐結合的實證研究??偟膩碚f,在《新聞導刊》這個社科類雜志上,大多內容僅停留于大數據理論的表面工作,沒有滲透到大數據處理技術的實質改進。在這一方面就需要相關管理和技術部門加快相關研究,從而為大數據的跨越發(fā)展提供技術可能性。
本文僅從論文發(fā)表的質和量角度看研究現狀,有一定的局限性,不能展現最新的大數據技術的發(fā)展現狀,但在一定程度上可以為科研論文發(fā)表提出一些意見,并起到一定的反思和警醒作用。
[1] 周品.云時代的大數據[M]. 北京:電子工業(yè)出版社,2013:68-70.
[2] 郭云麒.我國新聞實踐“大數據”應用熱的批判性分析[J].新聞研究導刊,2015(06):280-281.
[3] 鄧靈斌.大數據研究“熱”的冷思考[J].圖書館雜志,2014,33(12):57-61.
TP311.13
A
1674-8883(2016)18-0117-01