◎ 徐明華 馮亞凡
近幾年隨著 互聯(lián)網(wǎng)、云計算、物聯(lián)網(wǎng)和人工智能技術(shù)的迅猛發(fā)展,有關(guān)“大數(shù)據(jù)”“社會計算”等概念在新聞傳播領(lǐng)域的研究呈井噴趨勢,成果豐富,角度多元。然而在大量的研究文獻(xiàn)中,有關(guān)“社會計算”和“大數(shù)據(jù)”在概念和方法的運用上經(jīng)?;煜磺濉⑾嗷ゴ?。相關(guān)研究內(nèi)容龐雜多元,亟待梳理出清晰的研究體系。
在新聞傳播領(lǐng)域,“大數(shù)據(jù)”的相關(guān)研究大都從宏觀層面概括性闡述大數(shù)據(jù)的概念與社會意義,或探析它為新聞傳播學(xué)科帶來的相關(guān)思考,仍較缺少用具體的案例來解讀大數(shù)據(jù)方法的應(yīng)用和問題的解決。例如喻國明教授指出大數(shù)據(jù)時代傳播學(xué)研究的模式、邏輯和手段已經(jīng)產(chǎn)生了新的變化。彭蘭也認(rèn)為大數(shù)據(jù)技術(shù)將在一定程度上對現(xiàn)有新聞生產(chǎn)的模式與機(jī)制產(chǎn)生影響,新聞業(yè)務(wù)發(fā)展需要更多跨界的合作。而“社會計算”被提及的次數(shù)更是微乎其微,相關(guān)的研究內(nèi)容也停留在宏觀概念的敘述和探究上,缺乏深入具體的應(yīng)用與分析。對于“社會計算”與“大數(shù)據(jù)”,學(xué)者們尚未厘清及統(tǒng)一它的概念和界限,相關(guān)定義模糊不清,不同學(xué)者各執(zhí)一詞。例如沈浩指出,大數(shù)據(jù)時代下進(jìn)行社會計算會讓我們越來越多地從數(shù)據(jù)中觀察到人類社會的復(fù)雜行為模式。他認(rèn)為“大數(shù)據(jù)”是環(huán)境和時代的特征,而“社會計算”是研究方法的存在。但在王飛躍等學(xué)者的研究中,社會計算利用大數(shù)據(jù)來解析復(fù)雜系統(tǒng),即大數(shù)據(jù)是社會計算視域下的一種計算方法和解決思路。綜上,這種未將“大數(shù)據(jù)”“社會計算”的概念定義明確,甚至將其界限混為一談的現(xiàn)象,容易造成方法論使用上的混淆。本文試圖通過對兩者進(jìn)行概念梳理和內(nèi)涵思辨,為新聞傳播學(xué)領(lǐng)域的相關(guān)發(fā)展建言獻(xiàn)策。
“大數(shù)據(jù)”的概念首見于1998年《科學(xué)》(Science)中的《大數(shù)據(jù)的管理者》(A Handler for Big Data)一文。2008年9月《自然》(Nature)出版了“big data”???,使得“大數(shù)據(jù)”爆發(fā),在學(xué)術(shù)界得到認(rèn)可和廣泛利用。究竟何為大數(shù)據(jù)?學(xué)者M(jìn)anyika等認(rèn)為“大數(shù)據(jù)”是指超越傳統(tǒng)典型數(shù)據(jù)各方特性的新型數(shù)據(jù)集合。研究機(jī)構(gòu)Gartner對“大數(shù)據(jù)”的定義是海量、高增長率和多樣化的信息資產(chǎn)。國內(nèi)學(xué)者劉建明、丁柏銓等也曾論述,“大數(shù)據(jù)”是信息爆炸的表現(xiàn),是巨量資料、浩瀚信息的另一種稱呼。所以,“大數(shù)據(jù)”被理解為一種超越常規(guī)工具收集和處理極限的巨量數(shù)據(jù)集合。而另一方面,一些學(xué)者則對“大數(shù)據(jù)”的概念持有更廣義的詮釋。方環(huán)非指出大數(shù)據(jù)在指向數(shù)據(jù)集合或信息資產(chǎn)之外,更多地意味著技術(shù)層面的大數(shù)據(jù)技術(shù)概念。喻國明在其研究中表示,大數(shù)據(jù)分析的關(guān)鍵其實并不在于掌握大的數(shù)據(jù),而是在于從數(shù)據(jù)中提取意義的能力,以及發(fā)現(xiàn)隱藏的模式與可能的關(guān)系的能力。因而,“大數(shù)據(jù)”不僅只強調(diào)數(shù)據(jù)的海量,更進(jìn)一步指出數(shù)據(jù)背后的復(fù)雜形式以及對數(shù)據(jù)的分析、處理等專業(yè)化能力,體現(xiàn)了多重技術(shù)的協(xié)同。在新聞傳播領(lǐng)域,關(guān)于“大數(shù)據(jù)”概念的爭論,不同的學(xué)者往往圍繞上述兩個方向各抒己見。
而“社會計算”的概念早于“大數(shù)據(jù)”,在1994年就已經(jīng)第一次出現(xiàn),Schuler認(rèn)為:“社會計算可以是任何一種類型的計算應(yīng)用, 以軟件作為社交關(guān)系的媒介或聚焦”。在英文中“Social Computing”實質(zhì)內(nèi)容多指“社會軟件(Social Software)”,而非面向社會活動、社會過程、社會組織等的計算方法研究和應(yīng)用。但隨著信息網(wǎng)絡(luò)的興起和科學(xué)技術(shù)的快速發(fā)展,社會計算被不斷賦予新的內(nèi)涵和意義。近年來,社會計算不僅是一種技術(shù)、一種社會現(xiàn)象,也成為各學(xué)科研究的手段和趨勢,對其概念的理解和界定也存在著較大差異。王飛躍指出,除了技術(shù)層面的認(rèn)識之外,“社會計算”可以理解為是技術(shù)與人文交融、研究視角多元的學(xué)科領(lǐng)域。王琳琳也指出社會計算是一門現(xiàn)代計算技術(shù)與社會科學(xué)之間的交叉學(xué)科,是一個社會行為和計算系統(tǒng)交叉融合而成的研究領(lǐng)域。而另有一些學(xué)者,對于“社會計算”的概念思辨偏向于研究范式的理解。孟小峰等認(rèn)為社會計算是一種理論和方法論體系,使用系統(tǒng)科學(xué)、人工智能、數(shù)據(jù)挖掘等科學(xué)計算理論作為研究方法,結(jié)合社會科學(xué)理論與計算理論,來解決復(fù)雜性社會問題。
由此,“大數(shù)據(jù)”和“社會計算”的概念并未在學(xué)術(shù)界得到統(tǒng)一,它們的內(nèi)涵和意義仍然不斷蛻化、不斷發(fā)展,在各個研究者的論述與定義中一直流變。
其實大數(shù)據(jù)從提出伊始在信息科學(xué)領(lǐng)域并不存在較大爭議,即具有規(guī)模性(volu me)、多樣性(variety)、高速性(velocity)和有價值(value)等特點的數(shù)據(jù)集合。自然科學(xué)中“大數(shù)據(jù)”作為瑣碎龐大的原材料,需要經(jīng)歷諸多步驟才能實現(xiàn)其最終的價值;如圖1所示,“原材料”首先被篩選成“目標(biāo)數(shù)據(jù)”;經(jīng)過預(yù)處理、變換后,成為數(shù)據(jù)結(jié)構(gòu)完整的規(guī)則數(shù)據(jù);然后通過智能化數(shù)據(jù)挖掘和可視化得到“能讀懂的信息”。而后,在跨學(xué)科領(lǐng)域的后半段過程中,人文社會科學(xué)等再對其進(jìn)行進(jìn)一步的歸納和解釋,通過對一些研究方法的運用和既有理論的再加工,將“信息”處理成為“知識”。而對“知識”的后續(xù)思辨根據(jù)人文社科的研究格局可分為三個遞進(jìn)領(lǐng)域:一是“知識發(fā)現(xiàn)”,指通過對基礎(chǔ)數(shù)據(jù)的計算展開的現(xiàn)象描述,例如對傳播要素、傳播過程的解釋和分析等;二是“知識提取”,是在現(xiàn)象描述的基礎(chǔ)上,發(fā)現(xiàn)和探索現(xiàn)象背后的組織構(gòu)造和運行原理,即機(jī)制,例如深入論證各要素之間的因果關(guān)系;三是“模式分析”,是基于前兩者,通過科學(xué)方法對事物的發(fā)展趨勢具有預(yù)測性的推理,以期實現(xiàn)人們看待事物的方法或者學(xué)科思維結(jié)構(gòu)上的“創(chuàng)新”。綜上,數(shù)據(jù)的挖掘、處理,信息的加工,知識的生產(chǎn),是一個需要多重學(xué)科知識、跨領(lǐng)域的復(fù)雜過程。期間環(huán)環(huán)相扣,缺少任何一個步驟都不能完全實現(xiàn)數(shù)據(jù)最終的有效價值。
圖1 跨學(xué)科領(lǐng)域中數(shù)據(jù)處理及知識生產(chǎn)流程圖
以上過程中,自然科學(xué)領(lǐng)域研究者通常關(guān)注如何將原始“大數(shù)據(jù)”一步步處理變換得到所謂的“信息”與“知識”,沉浸在算法優(yōu)化等客觀表述中。而社會科學(xué)領(lǐng)域的研究者對問題具有較高敏感度,更擅長于對所謂的“知識”進(jìn)行分析、發(fā)現(xiàn)和提取。所以在跨學(xué)科合作的研究中,信息計算學(xué)者實現(xiàn)的往往是知識生產(chǎn)前的計算工作,而社會科學(xué)學(xué)者更偏向于人文思辨的知識生產(chǎn)。由于對前一部分的計算工作了解并不深入,社會科學(xué)經(jīng)常提及的“大數(shù)據(jù)”便囊括了數(shù)據(jù)從獲取、篩選到各種處理變換的整個過程。所以,社會科學(xué)領(lǐng)域出現(xiàn)了一批將“大數(shù)據(jù)”理解為方法技術(shù)的學(xué)者。
而“大數(shù)據(jù)”實質(zhì)上是不斷增長的海量復(fù)雜信息的客觀存在。繁雜瑣碎的數(shù)據(jù)必須經(jīng)過一套系統(tǒng)化的方法處理才能實現(xiàn)其應(yīng)有的價值。其實從19世紀(jì)開始,社會學(xué)者們便一直致力于建構(gòu)系統(tǒng)的方法論。網(wǎng)絡(luò)科學(xué)的出現(xiàn)使原本相對獨立的自然科學(xué)和社會科學(xué),相互交匯誕生了社會計算科學(xué)、計算廣告學(xué)、計算傳播學(xué)等一系列跨學(xué)科研究?!吧鐣嬎悖╯ocial computing)”的概念就是在這種背景下被提出的,它的產(chǎn)生并不是簡單的自然科學(xué)技術(shù)與人文社會科學(xué)的疊加, 而是來自于學(xué)者們試圖擺脫傳統(tǒng)思辨,科學(xué)探索問題的一種思維創(chuàng)新。傳播學(xué)之父施拉姆就曾指出,將自然科學(xué)的概念引入人文社會科學(xué)用以研究人類的傳播方式與過程,將成為一種新的研究模式。
“社會計算”便是這樣一種新的研究模式和研究范式,利用信息科學(xué)和計算機(jī)技術(shù)來解決社會科學(xué)的相關(guān)議題。它實現(xiàn)了知識共享,為社科研究引進(jìn)了全新的計算方法和工具。如圖2所示,以一個形象的比喻來描述“大數(shù)據(jù)”和“社會計算”的關(guān)系?!按髷?shù)據(jù)”可以理解為建筑原材料,研究中所涉及的方法(如復(fù)雜網(wǎng)絡(luò)分析法、數(shù)據(jù)建模等)則是建筑的設(shè)計圖,運用的軟件工具(如Ucinet、CiteSpace、Python等)是建筑的工具,最后可視化呈現(xiàn)的是建筑的外觀,而“社會計算”則類比為整個建筑過程。
圖2 “大數(shù)據(jù)”與“社會計算”關(guān)系類比圖
所以,“社會計算”就是以“大數(shù)據(jù)”為前提,利用相關(guān)計算方法來挖掘數(shù)據(jù)背后所蘊含的有意義的信息和價值的一套方法論。社會計算關(guān)注的重點:一是信息技術(shù)中如何嵌入人文知識使之更好地服務(wù)于社會活動,二是信息技術(shù)如何作為研究工具被使用和發(fā)展。祝建華指出,“社會計算”是最近10年內(nèi)興起的一種采用互聯(lián)網(wǎng)、大數(shù)據(jù)、機(jī)器學(xué)習(xí)等計算技術(shù)來研究社會科學(xué)問題的新思潮和新方法?!吧鐣嬎恪辈皇巧鐣茖W(xué)家們的專利,而是一個涉及科學(xué)、技術(shù)、醫(yī)學(xué)、社會、人文等各領(lǐng)域的跨學(xué)科“群眾運動”。作為新興崛起的研究范式和方法論,將“社會計算”引入新聞傳播學(xué)科將受益無窮。沈浩也認(rèn)為,網(wǎng)絡(luò)科學(xué)和社會網(wǎng)絡(luò)分析等社會計算方法是“大數(shù)據(jù)”分析的重要技術(shù)和方法論。王成軍也在“社會計算”和計算社會科學(xué)的基礎(chǔ)上提出了計算傳播學(xué)的概念。因此,“社會計算”應(yīng)當(dāng)比“大數(shù)據(jù)”這一說法更加切合當(dāng)下的技術(shù)發(fā)展前景。
新聞傳播學(xué)科正在經(jīng)歷一場變革與創(chuàng)新,其研究范式正在從以定性描述為主轉(zhuǎn)向以數(shù)據(jù)實證為主,分析格局由傳統(tǒng)的個體統(tǒng)計數(shù)據(jù)轉(zhuǎn)向海量的關(guān)系數(shù)據(jù)。在這樣的時代背景下,新聞傳播領(lǐng)域的方法論將注入更多復(fù)雜、龐大的計算特色??捎嬎愕姆椒ㄊ沟贸了臄?shù)據(jù)寶藏逐漸蘇醒。從傳播學(xué)研究的立場來看,如何在當(dāng)前技術(shù)和信息科學(xué)的影響下,立足于人文社會的本質(zhì)問題,加強學(xué)科建設(shè),是傳播研究者們的關(guān)注焦點。 總之,傳播學(xué)和媒介研究在保持對最前沿技術(shù)的關(guān)注的同時,更應(yīng)深入思考一個關(guān)鍵性問題:“社會計算”等新型研究范式的崛起能否又如何成為傳播學(xué)學(xué)科變革與繼續(xù)發(fā)展的生長基質(zhì)?縱觀技術(shù)革新背景下整個新聞傳播學(xué)科格局的衍化及走向,由此產(chǎn)生以下兩點反思。
第一,傳統(tǒng)的量化方法無法解決日益復(fù)雜的傳播行為,由此突顯了“計算”的重要性。隨著技術(shù)的發(fā)展演進(jìn),媒體的更迭激發(fā)了受眾無上限的信息欲望,不斷沖擊著信息的產(chǎn)生和流動,引導(dǎo)著受眾,使其傳播行為更加復(fù)雜化。如圖3左所示,傳統(tǒng)量化研究方法基于人類對社會已形成的認(rèn)知和判斷之上,采用一定的統(tǒng)計方法對既有理論、對社會問題或規(guī)律提出相關(guān)假設(shè)并驗證真?zhèn)?。而大?shù)據(jù)時代的新型計算過程在部分保留傳統(tǒng)研究思維的同時,更多地呈現(xiàn)出一種逆向思維模式。如圖3右所示,在價值密度低、量級龐大、爆炸式增長的大數(shù)據(jù)中,通過智能化的機(jī)器算法,從沒有形成人類“知識預(yù)判”的數(shù)據(jù)中挖掘隱匿復(fù)雜的人類行為模式,并以此為基礎(chǔ)深入探索新型的社會特征、演化規(guī)律、受眾需求等。這種逆向思維的計算過程可以幫助現(xiàn)有的經(jīng)典理論在技術(shù)發(fā)展視角下完成新的驗證,也可以展開對未知領(lǐng)域的探索,實現(xiàn)認(rèn)知上的創(chuàng)新,為傳播學(xué)的發(fā)展帶來不可多得的機(jī)會與革命。
圖3 量化研究的“正向思維”與“逆向思維”
第二,算法和闡釋相粘合才易產(chǎn)生新的學(xué)科發(fā)展。機(jī)器算法能夠通過標(biāo)簽幫助實現(xiàn)受眾的精準(zhǔn)分類,更能基于不同的社會群體提供不同的媒介服務(wù)。然而這種依賴于算法的傳播路徑侵蝕了人文社會領(lǐng)域的建設(shè)和發(fā)展,思維容易囿于惰性并僵化。提出對大數(shù)據(jù)和社會計算方法的重視,并非意味著對機(jī)器算法的依賴,甚至停止人類的思考。對于不斷數(shù)字化、信息化的未來社會,學(xué)術(shù)領(lǐng)域為此或?qū)⒎殖蓛膳蛇M(jìn)行博弈:一是技術(shù)理性派,認(rèn)為機(jī)器算法等科學(xué)技術(shù)是揭示人類社會的有效途徑;二是技術(shù)批判派,認(rèn)為盲目的技術(shù)壟斷會阻礙社會進(jìn)步,造成更多的倫理困境。然而,技術(shù)理性和人文探索之間的取舍并非一道難解命題。隨著人文社會科學(xué)領(lǐng)域的研究、算法、數(shù)據(jù)、模型等不斷更迭,方法體系的嬗變從未影響人們對未知領(lǐng)域的探索和創(chuàng)新,哲學(xué)思辨一直是人類思考的最高境界。兩者更加融洽的粘合而非相互排斥,才能拓寬人類社會科學(xué)的領(lǐng)域范疇,甚至促成一個嶄新的認(rèn)知體系。
注釋:
① 喻國明,王斌,李彪,楊雅.傳播學(xué)研究:大數(shù)據(jù)時代的新范式[J].新聞記者,2013 (06):22-27.
② 彭蘭“.大數(shù)據(jù)”時代:新聞業(yè)面臨的新震蕩[J]. 編輯之友, 2013(1):6-10.
③ 沈浩,黃曉蘭.大數(shù)據(jù)助力社會科學(xué)研究:挑戰(zhàn)與創(chuàng)新[J].現(xiàn)代傳播,2013(08):13-18.
④ 王飛躍,曾大軍,毛文吉.社會計算的意義、發(fā)展與研究狀況[J].科研信息化技術(shù)與應(yīng)用, 2010(2):3-15.
⑤ Cass T. A Handler for Big Data[J]. Science, 1998, 282(5389):636-636.
⑥ 劉紅,胡新和.數(shù)據(jù)革命:從數(shù)到大數(shù)據(jù)的歷史考察[J].自然辯證法通訊,2013(6):33-39.
⑦ 馬建光,姜巍.大數(shù)據(jù)的概念、特征及其應(yīng)用[J].國防科技, 2013(2):10-17.
⑧ Schuler D. Social computing[J]. Communication of the ACM,1994,37(1):28-29
⑨ 王琳琳,陳云芳,耿路.社會計算:計算的新應(yīng)用方向[J].淮海工學(xué)院學(xué)報(自然科學(xué)版), 2012(2):19-22.
⑩ 孟小峰,李勇,祝建華.社會計算:大數(shù)據(jù)時代的機(jī)遇與挑戰(zhàn)[J].計算機(jī)研究與發(fā)展, 2013,(12):2483-2491.
? 陳浩,樂國安,李萌,等.計算社會科學(xué):社會科學(xué)與信息科學(xué)的共同機(jī)遇[J].西南大學(xué)學(xué)報(社會科學(xué)版), 2013 (3):87-93.
? 祝建華,彭泰權(quán),梁海,等.計算社會科學(xué)在新聞傳播研究中的應(yīng)用[J].科研信息化技術(shù)與應(yīng)用,2014(02):3-13.
? 沈浩,黃曉蘭.大數(shù)據(jù)助力社會科學(xué)研究:挑戰(zhàn)與創(chuàng)新[J].現(xiàn)代傳播,2013(08):13-18.
? 王成軍.社交網(wǎng)絡(luò)上的計算傳播學(xué)[M] .北京:高等教育出版社,2015:3-5.