亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        數(shù)據(jù)科學研究在社會科學中的應用前景

        2018-11-28 09:36:42章昌平米加寧李大宇
        社會科學 2018年9期
        關鍵詞:研究范式知識圖譜社會科學

        章昌平 米加寧 李大宇

        摘要:在網(wǎng)絡化、信息化不斷深化,大數(shù)據(jù)滲透到整個世界的背景下,我們以WOK平臺核心合集為數(shù)據(jù)來源,采用文獻計量和知識圖譜分析方法,梳理了數(shù)據(jù)科學研究的總體態(tài)勢、演化進程、發(fā)展現(xiàn)狀、研究結構及與其他學科之間交叉、滲透的關系。在此基礎上,結合數(shù)據(jù)科學交叉學科特性和在社會科學領域應用取得的成果,我們認為數(shù)據(jù)科學對社會科學研究轉(zhuǎn)型的作用機制及應用前景主要表現(xiàn)在六個方面:(1)為解決目前社會科學研究存在的問題提供可能,(2)對社會科學認知體系產(chǎn)生結構性的影響,(3)構建社會科學全新的研究路徑,(4)社會科學研究轉(zhuǎn)向跨學科的事件導向建構方法,(5)實現(xiàn)對真實世界的多路徑“涌現(xiàn)”,(6)為我國社會科學發(fā)展提供重要機遇。在此過程中,我們應當處理好交叉學科研究、辯證看待大數(shù)據(jù)、建立風險意識、處理好大數(shù)據(jù)與小數(shù)據(jù)的關系、構建新的研究技能與團隊合作及促進政府數(shù)據(jù)開放和建設數(shù)據(jù)科學基礎設施等問題。

        關鍵詞:數(shù)據(jù)科學;社會科學;研究范式;知識圖譜

        中圖分類號:C0; TP311.13文獻標識碼:A文章編號:0257-5833(2018)09-0078-11

        作者簡介:章昌平,桂林理工大學公共管理與傳媒學院副教授、哈爾濱工業(yè)大學管理學院博士研究生;米加寧,哈爾濱工業(yè)大學管理學院教授;李大宇,哈爾濱商業(yè)大學財政與公共管理學院講師(廣西桂林541004)

        一、問題的提出

        人類社會正在快速進入大數(shù)據(jù)時代。數(shù)據(jù)開始滲透并充斥著整個世界,成為重要的生產(chǎn)要素和戰(zhàn)略資源。數(shù)據(jù)科學也越來越受到人們的重視。然而,目前對數(shù)據(jù)科學的綜述卻不盡如人意,一方面偏向歷史演進的總結和研究現(xiàn)狀中期刊、作者的展示,另一方面偏向具體應用領域。同時,關于數(shù)據(jù)科學的理論淵源的梳理也過于注重計算機科學,對其與數(shù)學、統(tǒng)計學、信息學等學科的滲透關系,與大數(shù)據(jù)、數(shù)據(jù)挖掘、機器學習、人工智能等領域間的交叉關系關注不夠,缺乏數(shù)據(jù)科學在人文社會科學領域應用的總結和趨勢分析。據(jù)此,本文擬利用一源多圖(一個文獻題錄數(shù)據(jù)來源和多種知識圖譜分析)和內(nèi)容分析相結合的方法,從文獻信息資源外部形態(tài)特征和知識源屬性兩大角度入手,綜合文獻學、科學學和計算機科學等多學科理論和工具對數(shù)據(jù)科學研究進展進行分析,揭示其與其他學科之間交叉、滲透的關系及自身的研究結構,并對數(shù)據(jù)科學在社會科學研究中的應用前景、機遇和挑戰(zhàn)進行探討,以期發(fā)現(xiàn)數(shù)據(jù)科學研究的規(guī)律性內(nèi)容和發(fā)展趨勢,從而指導其在人文社會科學領域的應用。

        二、數(shù)據(jù)獲取與研究方法

        (一)數(shù)據(jù)獲取

        本文選擇科睿唯安Web of Knowledge(WOK)檢索平臺的核心合集(含SCI、SSCI、A&HCI;、CPCI四大核心數(shù)據(jù)庫)作為數(shù)據(jù)來源。WOK平臺能夠利用文獻信息資源之間的內(nèi)在聯(lián)系,把各種相關資源提供給研究人員,為學術界提供可靠、有效的數(shù)據(jù)支持,其引文統(tǒng)計數(shù)據(jù)記錄了各領域研究人員共同評判出來的最具影響力的研究成果,能夠為挖掘各領域研究的演化、結構和滲透、交叉關系提供數(shù)據(jù)基礎。筆者使用Topic=“data science” &Timespan;=“1960-2017”檢索式進行檢索,檢索時間為2018年1月15日。返回檢索結果為1123篇文獻,為避免非學術研究成果、重復研究成果對數(shù)據(jù)分析的干擾,我們對檢索結果進行精煉和去重,在此基礎上統(tǒng)計出與數(shù)據(jù)科學主題相關的文獻共有1014篇,其中期刊論文530篇,會議論文390篇,綜述類論文63篇,圖書章節(jié)等其他類型文獻31篇。

        (二)研究方法

        從WOK平臺導出文獻題錄數(shù)據(jù)后,本文采用文獻計量、知識圖譜等研究方法對數(shù)據(jù)科學研究進展進行分析。文獻計量對文獻基本特征進行統(tǒng)計,揭示數(shù)據(jù)科學研究的總體概況;社會網(wǎng)絡分析對文獻互引或共現(xiàn)網(wǎng)絡節(jié)點及節(jié)點間關系進行分析,構建互引網(wǎng)絡中節(jié)點之間的關系模型,描述個體對群體關系結構和整體功能的影響,尋找具有重要地位的文獻和主題,揭示數(shù)據(jù)科學研究的演化規(guī)律;共詞分析對關鍵詞共詞網(wǎng)絡進行分析,揭示數(shù)據(jù)科學研究的結構特點,分析發(fā)展趨勢;信息可視化技術則用于繪制可視化的知識圖譜。其中,HistCite能夠分析文獻基本的計量指標,生成引文編年圖譜,發(fā)現(xiàn)研究重大進展和發(fā)展趨勢,展示學者的文獻數(shù)量和引證關系,快速找出關鍵文獻李瑞波、張琳、王玨:《基于Histcite工具的引文網(wǎng)絡實證研究》,《情報科學》2015年第10期。。VOSviewer可使用共現(xiàn)網(wǎng)絡構造知識圖譜,挖掘和呈現(xiàn)可視化結果Van Eck N J, Waltman L,“Software Survey: VOSviewer, a Computer Program for Bibliometric Mapping”,Scientometrics,vol.84,No.2,2010,pp.523-538.。

        三、數(shù)據(jù)科學研究演化與主題分布

        (一)數(shù)據(jù)科學研究的學術史梳理

        數(shù)據(jù)科學起源于20世紀60年代對數(shù)據(jù)分析未來的預測和計算機科學即“數(shù)據(jù)處理的科學”根本理念與原則的研究Gil Press,“A Very Short History Of Data Science”,Web of pitt,https://classes.dbmi.pitt.edu/sites/default/files/averyshorthistory.pdf,2016-03-01.。數(shù)學家J.W.Tukey在1962年提出數(shù)據(jù)分析是一門新的科學,而不僅僅是數(shù)學的分支,確定了數(shù)據(jù)分析發(fā)展的四大驅(qū)動力:統(tǒng)計學理論、計算機和顯示設備的快速發(fā)展、各領域大量數(shù)據(jù)帶來的挑戰(zhàn)和廣泛多樣的學科對量化的強調(diào),明確了統(tǒng)計學在其中的作用J.W. Tukey,“The Future of Data Analysis”, Annals of Mathematical Statistics,vol.33,No.2,1962,pp.1-67.。1966年,計算機科學家P. Naur提出了“datalogy”的概念,強調(diào)計算機科學為“本質(zhì)和數(shù)據(jù)使用的科學”,系統(tǒng)討論了數(shù)據(jù)、數(shù)據(jù)表示和數(shù)據(jù)處理構成的數(shù)據(jù)科學基本概念和實用技術,并積極推動數(shù)據(jù)科學在計算機教育中的地位,形成了計算機科學的哥本哈根傳統(tǒng)Sveinsdottir E, Frkjr E, “Datalogy—The Copenhagen Tradition of Computer Science”, Bit Numerical Mathematics, vol.28,NO.3,1988,pp.450-472.。20世紀90年代以后,數(shù)據(jù)科學獲得較大發(fā)展,數(shù)據(jù)科學的術語和過程被正式提出,并強調(diào)用“數(shù)據(jù)”分析和理解實際現(xiàn)象,是不同于傳統(tǒng)的視角和思維方式Hayashi C, Yajima K, Bock H H, et al, Data Science, Classification, and Related Methods.Proceedings of the 5th Conference of the International Federation of Classification Societies (IFCS-96), Kobe, Japan, March 27–30, 1996,Springer,1998.pp.40-51.。2012年以后,隨著大數(shù)據(jù)的崛起,數(shù)據(jù)科學也迎來了爆發(fā)式的發(fā)展,快速成為多個領域的研究熱點。

        為找出數(shù)據(jù)科學的研究脈絡和重點內(nèi)容,揭示其演化過程和發(fā)展階段,本文選擇HistCite知識圖譜軟件,利用WOK平臺LCS(Local Citation Score,本地被引次數(shù))為文獻重要程度衡量指標,繪制引文編年圖譜(如圖1所示,顯示了LCS排名前40位的文獻及相互關系)。縱向表示重要文獻發(fā)表的年份變化情況,橫向則標注了重要文獻分布的主要研究領域。

        從圖1我們可以清晰地看出數(shù)據(jù)科學研究的文獻數(shù)量變化、研究方式和研究內(nèi)容的演化,由此,我們把數(shù)據(jù)科學以2001年和2012年為分界點,大致劃分為三個研究階段:

        (1)1960-2001年醞釀階段。該階段主要是計算機科學、統(tǒng)計學與數(shù)學等領域?qū)?shù)據(jù)科學的概念、方法與工具等方面進行研究,并在生物學、地球科學等領域開展科學數(shù)據(jù)采集、挖掘與分析的應用,在商業(yè)領域利用交易和行為數(shù)據(jù)進行預測和決策優(yōu)化。該階段在圖1中出現(xiàn)的關鍵文獻有2篇,其中2號文獻總結了日、法科學家的研究經(jīng)驗,認為統(tǒng)計方法和數(shù)據(jù)挖掘并不能覆蓋數(shù)據(jù)的意義和帶來的機遇與挑戰(zhàn),強調(diào)從數(shù)據(jù)分析轉(zhuǎn)向數(shù)據(jù)科學的重要性Ohsumi NFrom Data Analysis to Data Science,F(xiàn)rom Henk A. L,Data Analysis, Classification, and Related Methods.Berlin:Springer Berlin Heidelberg,2000,pp.329-334.。7號文獻則論述了數(shù)據(jù)科學的起源和內(nèi)涵,并強調(diào)了計算機科學、數(shù)學、統(tǒng)計學等思維、方法和工具,理論與數(shù)據(jù)的連接在數(shù)據(jù)科學中的重要性Cleveland W S,“Data Science: An Action Plan for Expanding the Technical Areas of the Field of Statistics”,International Statistical Review,vol.69,No.1,2001,pp.21-26.。上述文獻的發(fā)表使得關于數(shù)據(jù)的跨學科研究和計算取得了顯著進展,被認為是數(shù)據(jù)科學發(fā)展過程中最重要的兩篇源頭文獻Mukkamala R R, Hussain A, Vatrapu R,Towards a Formal Model of Social Data,Copenhagen: ITUniversitetet i Kbenhavn,2013,pp.1-21.。

        (2)2002-2011年為全面滲透階段。在此階段,數(shù)據(jù)科學開始滲透到多個領域,分散的應用隨著互聯(lián)網(wǎng)的普及逐漸走向融合,數(shù)據(jù)科學開始影響人們的生活,并在社會科學領域逐步獲得廣泛應用。日本慶應義塾大學推出數(shù)據(jù)科學系列叢書,涵蓋從數(shù)據(jù)素養(yǎng)到數(shù)據(jù)采集、挖掘、建模、驗證、算法,再到空間、金融、環(huán)境、健康、運動等具體領域的數(shù)據(jù)應用柴田里程、北川源四郎、清水邦夫等:《データサイエンス?シリーズ 全12巻》,共立出版社網(wǎng)站http://www.kyoritsupub.co.jp/series/20/,2013-12-30。。這一階段還發(fā)生了許多影響深遠的事件:包括CODATA官方學術期刊Data Science Journal在內(nèi)的多本刊物創(chuàng)辦;與聯(lián)合國信息社會世界峰會、政府間氣候變化委員會等國際機構的合作積極展開,發(fā)布數(shù)據(jù)科學的科學議程全球倡議;數(shù)據(jù)科學家共同體或群體建設問題得到關注等。

        (3)2012至今為爆發(fā)階段。在該階段,數(shù)據(jù)科學在大數(shù)據(jù)的驅(qū)動下,與人工智能、機器學習、數(shù)據(jù)挖掘等逐漸融合,在各領域的研究、技術開發(fā)和應用不斷增多,領域數(shù)據(jù)科學得到極大發(fā)展,并在應用基礎上對大數(shù)據(jù)驅(qū)動的數(shù)據(jù)科學可能帶來的思維、社會經(jīng)濟系統(tǒng)和科研范式變革進行了思考,數(shù)據(jù)科學家的能力要求、人才培養(yǎng)和職業(yè)認同進一步加強Baker M,“Data Science: Industry Allure”,Nature,vol.520,No.7546,2015,pp.253-255;Inmon W H, Linstedt D,“Data Architecture: A Primer for the Data Scientist : Big Data, Data Warehouse and Data Vault”,Data Architecture A Primer for the Data Scientist,No.13-15,2015,pp.57–62.。

        從圖1的橫向結構來看,數(shù)據(jù)科學主要研究內(nèi)容包含基礎理論、數(shù)據(jù)處理、平臺工具、基礎設施、人才培養(yǎng)和領域數(shù)據(jù)科學(如材料數(shù)據(jù)科學)等。其中,基礎理論的關鍵文獻出現(xiàn)較早,主要是從統(tǒng)計學、計算機科學視角進行分析;商業(yè)領域數(shù)據(jù)科學關鍵文獻最多,這與近年來數(shù)據(jù)科學和大數(shù)據(jù)結合越來越緊密有關系;而對大數(shù)據(jù)環(huán)境下科學研究范式轉(zhuǎn)化的思考則體現(xiàn)了數(shù)據(jù)科學研究縱深層次的不斷加深,從技術驅(qū)動的應用實踐開始走向更為抽象的理論總結。從關鍵文獻的引用關系來看,基礎理論研究為領域數(shù)據(jù)科學應用提供了理論基礎,而領域數(shù)據(jù)科學內(nèi)部相互引用的關系比與外部的關系更緊密,說明數(shù)據(jù)科學在各領域的應用并未完全打破學科之間的藩籬。部分研究內(nèi)部的關鍵文獻缺少引用關系,說明內(nèi)部研究較為分散,沒有形成較為固定的合作網(wǎng)絡。

        從時間來看,大部分關鍵文獻出現(xiàn)在2013年以后,且與大數(shù)據(jù)相關文獻數(shù)量較多,體現(xiàn)了數(shù)據(jù)科學在與大數(shù)據(jù)融合前后的差異性。這種差異性體現(xiàn)在各領域大數(shù)據(jù)的興起促進了數(shù)據(jù)科學的快速發(fā)展??梢哉f數(shù)據(jù)科學研究伴隨著大數(shù)據(jù)的熱潮而興盛,大數(shù)據(jù)驅(qū)動的數(shù)據(jù)科學研究逐步涵蓋知識發(fā)現(xiàn)和提取的各個過程,如數(shù)據(jù)采樣、挖掘、建模和算法等Dhar V,“Data Science and Prediction”, Communications of the Acm,vol.56,No.12,2013,pp.64-73;Li T, Lu J,“Preface: Intelligent Techniques for Data Science”,International Journal of Intelligent Systems,vol.30,No.8,2015,pp.851-853.,開發(fā)了多種分布式存儲、數(shù)據(jù)分析工具楊京等:《大數(shù)據(jù)背景下數(shù)據(jù)科學分析工具現(xiàn)狀及發(fā)展趨勢》,《情報理論與實踐》2015年第3期。。大數(shù)據(jù)在科學領域的表現(xiàn)是數(shù)據(jù)科學的興起,數(shù)據(jù)科學將成為科研體系中的重要組成部分,并逐漸達到與物理、化學、生命科學等自然科學分庭抗禮的地位趙國棟、易歡歡、糜萬軍等:《大數(shù)據(jù)時代的歷史機遇》,清華大學出版社2013年版,第278-286頁。。隨著大數(shù)據(jù)的發(fā)展,數(shù)據(jù)科學文獻數(shù)量和滲透的領域都急劇增長,不再局限于數(shù)據(jù)的收集和處理,還包括數(shù)據(jù)管理、知識獲取以及信息可視化等內(nèi)容,數(shù)據(jù)科學與具體應用領域大數(shù)據(jù)的結合促進了對數(shù)據(jù)操作、轉(zhuǎn)化、分析和處理復雜數(shù)據(jù)能力和數(shù)據(jù)分析平臺工具的關注Mcleod J, Childs S,“The Cynefin Framework: A Tool for Analyzing Qualitative Data in Information Science?”,Library & Information Science Research,vol.35,No.4,2013,pp.299-309.。在大數(shù)據(jù)之前,數(shù)據(jù)科學發(fā)展較為緩慢,主要以數(shù)據(jù)獲取和存儲為主,注重數(shù)據(jù)獲取的完整性,而隨著大數(shù)據(jù)的快速發(fā)展,數(shù)據(jù)科學逐漸深入到人類社會各方面,研究者開始轉(zhuǎn)向側(cè)重數(shù)據(jù)的分析處理,挖掘數(shù)據(jù)蘊含的真正價值。

        (二)數(shù)據(jù)科學研究的結構狀態(tài)

        為更好揭示研究的結構狀態(tài),本文利用VOSviewer繪制數(shù)據(jù)科學研究知識圖譜,形成Density Visualization(密度可視化視圖)和Network Visualization(網(wǎng)絡可視化視圖),如圖2所示。密度可視化視圖能夠直觀地展示聚類與圖譜區(qū)域分布,有助于我們快速了解關鍵詞共現(xiàn)圖譜的整體結構與主題分布;網(wǎng)絡可視化視圖可以通過節(jié)點大小和節(jié)點連線的粗細表示各關鍵詞共現(xiàn)的頻次及相互間聯(lián)系的疏密關系Van Eck N J, Waltman L,“Software Survey: VOSviewer, A Computer Program for Bibliometric Mapping”,Scientometrics, vol.84,No.2,2010,pp.523-538.。從圖2可以看出數(shù)據(jù)科學研究具有典型的交叉學科特點,與數(shù)學、統(tǒng)計學、計算機科學、自然科學和社會科學各領域交叉滲透,知識群內(nèi)外之間均具有緊密相關性的特點,各主題之間的交叉滲透關系較為明顯,并形成了不同的研究主題和應用(共形成10個聚類)。根據(jù)聚類情況本文將其總結為以下三個方面的內(nèi)容:

        1.數(shù)據(jù)科學基本內(nèi)涵的研究

        該研究主題包含圖2中的基礎理論研究、復雜性科學、統(tǒng)計學、倫理和大數(shù)據(jù)等聚類的主要內(nèi)容。研究的問題包括:(1)數(shù)據(jù)科學學科性質(zhì)的討論,分為統(tǒng)計學的延伸或交叉學科兩類觀點,前者認為無論數(shù)據(jù)量大還是小,都是統(tǒng)計學數(shù)據(jù)處理的范圍內(nèi)張程:《數(shù)據(jù)科學的統(tǒng)計學內(nèi)涵探究》,《電大理工》2016年第4期。,后者認為數(shù)據(jù)科學更多地呈現(xiàn)跨學科或交叉學科的特點Baumer B, “A Data Science Course for Undergraduates: Thinking With Data”, American Statistician, vol.69,No.4,2015, pp.334-342.。(2)數(shù)據(jù)科學概念和內(nèi)涵的界定研究,基本沿著兩條核心路徑進行概括:一是將其視為研究“數(shù)據(jù)”的科學,二是將其視為利用數(shù)據(jù)開展研究的科學,為自然科學和社會科學提供新的范式和方法朱揚勇、熊赟:《數(shù)據(jù)學》,復旦大學出版社2009年版,前言。。前者認為數(shù)據(jù)科學處理幾乎所有與數(shù)據(jù)生命周期有關的事務David D, “50 Years of Data Science”, Web Of MIT http://courses.csail.mit.edu/18.337/2015/docs/50YearsDataScience.pdf, 2015-09-18.,其目的是提取以前無法獲得的、潛在有用的信息Li T, Lu J, “Preface: Intelligent Techniques for Data Science”, International Journal of Intelligent Systems, vol.30, No.8, 2015, pp.851-853.,并能實現(xiàn)預測和決策優(yōu)化Aalst W V D, Damiani E, “Processes Meet Big Data: Connecting Data Science with Process Science”, IEEE Transactions on Services Computing, vol.8, No.6, 2015, pp.810-819.。后者則從數(shù)據(jù)科學所涉及的技術方法和學科領域?qū)ζ溥M行界定,如視為統(tǒng)計學中一個新的領域延伸,主要關注重點為數(shù)據(jù)分析,涉及數(shù)據(jù)建模與方法、數(shù)據(jù)處理等Myers K, Wiel S V, “Discussion of ‘Data Science: An Action Plan for Expanding the Technical Areas of the Field of Statistics”, International Statistical Review, vol.7, No.6, 2015, pp.420-422.;從計算機科學的視角出發(fā),認為數(shù)據(jù)科學已經(jīng)發(fā)展成為包含機器學習、數(shù)據(jù)挖掘、人工智能、信息可視化等內(nèi)容混合的研究方法Li T, Lu J, “Preface: Intelligent Techniques for Data Science”, International Journal of Intelligent Systems, vol.30, No.8, 2015, pp.851-853.;從數(shù)學的角度則包含信號處理、概率模型、模式識別和不確定性建模等Moraes R M D, López L M, “Computational Intelligence Applications for Data Science”, KnowledgeBased Systems, vol.87, No.6, 2015, pp.1-2.。甚至將行為社會科學、倫理學等學科范圍也納入其中Aalst W V D, Damiani E, “Processes Meet Big Data: Connecting Data Science with Process Science”, IEEE Transactions on Services Computing, vol.8, No.6, 2015, pp.810-819.。(3)數(shù)據(jù)科學的構成方面的研究也遵循了這一路徑,將其按數(shù)據(jù)處理流程劃分為數(shù)據(jù)探索與準備、數(shù)據(jù)表示與轉(zhuǎn)換、數(shù)據(jù)計算、數(shù)據(jù)建模、數(shù)據(jù)可視化和演示或按統(tǒng)計學活動、計算機相關技術、數(shù)學或信息科學相結合的要點進行論述葉鷹、馬費成:《數(shù)據(jù)科學興起及其與信息科學的關聯(lián)》,《情報學報》2015年第6期;劉瀟、楊建梅:《基于數(shù)據(jù)科學的復雜元網(wǎng)絡方法及應用》,科學出版社2015年版,第4-11頁。。綜合各方觀點,其中對數(shù)據(jù)的管理、統(tǒng)計、機器學習和可視化被認為是數(shù)據(jù)科學發(fā)展的核心內(nèi)容。

        2.數(shù)據(jù)科學研究方法、技術與平臺

        該主題研究主要包含圖2中的機器學習、數(shù)據(jù)分類、信息可視化、平臺工具和大數(shù)據(jù)等聚類。具體可分為以下幾類內(nèi)容:(1)是對數(shù)據(jù)科學方法和技術的系統(tǒng)介紹,如按照數(shù)據(jù)生命周期介紹數(shù)據(jù)采集、數(shù)據(jù)預處理相關數(shù)據(jù)審計、數(shù)據(jù)清洗、數(shù)據(jù)變換、數(shù)據(jù)集成、數(shù)據(jù)脫敏、數(shù)據(jù)規(guī)約和數(shù)據(jù)標注技術等;按照數(shù)據(jù)科學方法或技術主題,如機器學習與數(shù)據(jù)挖掘、統(tǒng)計模型和方法、預測與描述、探索性數(shù)據(jù)分析、溝通和可視化、數(shù)據(jù)處理、編程等介紹相關技術。(2)是對某一種方法、技術在數(shù)據(jù)科學中的應用進行深入介紹,如利用R、Python語言進行數(shù)據(jù)科學分析方法的研究,利用MapReduce、PageRank、Kmeans進行數(shù)據(jù)計算的研究等。(3)是特定領域內(nèi)專用數(shù)據(jù)分析工具的開發(fā)與應用研究,如在醫(yī)療領域利用機器學習建立全新綜合數(shù)據(jù)模型(DIPULSE)以避免通過觀測傳統(tǒng)、單一醫(yī)療數(shù)據(jù)識別QT間期,診斷非心源性適應癥風險大的問題。(4)是對不同環(huán)境或所處理的數(shù)據(jù)變化帶來的技術挑戰(zhàn)與應對進行研究,如針對TB和PB級數(shù)據(jù)處理、管理及應用的對策和技術方案研究。(5)是各領域大型數(shù)據(jù)科學平臺的建設的研究,如美國政府發(fā)起的BD2K倡議、中國科學院科學數(shù)據(jù)共享工程等。

        3.領域數(shù)據(jù)科學研究

        當今已沒有無數(shù)據(jù)的科學,也沒有無科學的數(shù)據(jù)趙鵬大:《大數(shù)據(jù)時代呼喚各科學領域的數(shù)據(jù)科學》,《中國科技獎勵》2014年第9期。。Jim Gray在“eScience科學方法的一次革命”的演講中認為,與“計算思維”類似,我們正在見證每個學科演變?yōu)閮蓚€分支:收集分析信息的XInfo和計算、仿真的CompX。數(shù)據(jù)科學理論和方法應用于各個領域或?qū)W科,從而形成專門領域的數(shù)據(jù)學或數(shù)據(jù)科學。微軟研究院出版的《第四范式:數(shù)據(jù)密集型科學發(fā)現(xiàn)》一書,展示了環(huán)境應用科學、生態(tài)學、海洋科學、天文學、醫(yī)學、生物學等學科領域數(shù)據(jù)驅(qū)動的科學研究案例Hey T, The Fourth Paradigm—DataIntensive Scientific Discovery,Berlin & Heidelberg: Springer,2012,p.1.。此外,數(shù)據(jù)科學在空間、環(huán)境、健康、醫(yī)學、運動、金融等諸多領域均有豐富的應用案例劉德權、蘇荷:《基于大數(shù)據(jù)的城市環(huán)境治理對策》,《哈爾濱商業(yè)大學學報(社會科學版)》2016年第6期。。從圖1和2中我們也可以看出,材料科學、生物學和商業(yè)、管理學等領域與數(shù)據(jù)科學的結合比較緊密。有人對國外數(shù)據(jù)科學研究進行分析后,指出數(shù)據(jù)科學與各領域的應用主要體現(xiàn)在面向優(yōu)化和面向創(chuàng)新兩個方面,前者包括使用數(shù)據(jù)科學更有效地實現(xiàn)預測、優(yōu)化方法和決策,后者主要是實現(xiàn)新的科學發(fā)現(xiàn)和突破研究瓶頸王曰芬、謝清楠、宋小康:《國外數(shù)據(jù)科學研究的回顧與展望》,《圖書情報工作》2016年第14期。。

        四、關鍵詞與熱點分析:不斷增長的數(shù)據(jù)科學知識體系與方法工具

        通過VOSviewer繪制的知識圖譜中節(jié)點大小和顏色深淺,可以獲知節(jié)點的權重,權重越大說明該節(jié)點代表的關鍵詞參與共現(xiàn)詞越多,越能代表該領域研究熱點,在圖2(a)中顯示越接近黑色,在圖2(b)中顯示節(jié)點越大。同時,各聚類間產(chǎn)生交互聯(lián)系的中間關鍵詞顯示了兩個以上聚類產(chǎn)生聯(lián)系或過渡的關鍵點,往往具有較高的出現(xiàn)頻次和中心度。因此,根據(jù)知識圖譜、關鍵詞中心度和文獻被引頻次,我們發(fā)現(xiàn)在數(shù)據(jù)科學研究領域重點關鍵詞包括:

        (1)“Data Science”、“Statistics”、“Machine Learning”、“Big Data”、“Knowledge Discovery”,探討內(nèi)容包括數(shù)據(jù)科學的歷史淵源、概念體系、基本假設、學理根據(jù)等;數(shù)據(jù)、大數(shù)據(jù)相關概念,數(shù)據(jù)生命周期規(guī)律等基礎理論;數(shù)據(jù)科學的方法體系,包括機器學習、知識發(fā)現(xiàn)及涉及的基本方法、工具和算法等。

        (2)“Data Mining”、“Classification”、“Clustering”、“Visual Analytics”、“Internet ofThings”、“MapReduce”、“Hadoop”,探討數(shù)據(jù)作為資源對其進行獲取、分析、感知的系列方法、工具和平臺;數(shù)據(jù)科學作為方法和工具在科學研究過程中的應用方法、過程;具體的數(shù)據(jù)分析技術與工具開發(fā)等內(nèi)容。

        (3)“Business Intelligence”、“Predictive Analytics”、“Computational Social Science”,探討數(shù)據(jù)科學在具體學科或應用領域的發(fā)展對策、應用前景、應用過程和方法工具等,其中商業(yè)、材料、天氣、健康、輿情、城市管理等為該類關鍵詞涉及較多的領域。

        (4)“Decision Tree”、“Twitter”、“Bioinformatics”、“Precision Medicine”。

        (5)“Uncertainty”、“Metadata”、“Nature Language Processing”、“Methodology”、“Theory”、“Algorithm”、“Privacy”、“Ethic”分布在圖2視圖中離中心區(qū)域較遠的外圍聚類或連接較少的節(jié)點,代表該研究領域未來的生長點,從關鍵詞的主要內(nèi)容可以看出,研究內(nèi)容有向數(shù)據(jù)科學基礎理論和具體研究領域兩個方向不斷細化和深入的趨勢。

        作為典型的橫斷學科,數(shù)據(jù)科學具有明顯的跨學科、交叉學科特點。由于數(shù)據(jù)科學剛剛邁入成長期,并且信息技術發(fā)展不斷加速,因此無論從數(shù)據(jù)科學學科體系建設還是其在各領域應用的發(fā)展,我們都需要對數(shù)據(jù)科學知識體系和方法工具進行梳理與總結。但是數(shù)據(jù)科學作為一門新興學科,其理論來源和知識構成仍處在動態(tài)發(fā)展的過程中,目前建立一個固定的學科體系和方法工具系統(tǒng)顯然是不可能的。學者們對數(shù)據(jù)科學的構成也因其出發(fā)點的不同呈現(xiàn)較大的差異。例如,Cleveland的數(shù)據(jù)科學行動計劃認為,數(shù)據(jù)科學需要發(fā)展跨領域數(shù)據(jù)分析能力、數(shù)據(jù)建模和方法、數(shù)據(jù)計算能力、學科規(guī)劃、工具、基礎理論William S. Cleveland, “Data Science: An Action Plan for Expanding the Technical Areas of the Field of Statistics”, International Statistical Review, vol.69,No.1,2001,pp.21-26.。國內(nèi)學者認為,數(shù)據(jù)科學主要包括理論數(shù)據(jù)學、數(shù)據(jù)方法論、數(shù)據(jù)科學發(fā)展史、資源數(shù)據(jù)學、管理數(shù)據(jù)學、技術數(shù)據(jù)學、工程數(shù)據(jù)學和部門數(shù)據(jù)學等劉闖:《地理科學數(shù)據(jù)流及其關鍵節(jié)點前沿科學問題與案例研究》,騰沖,2011年數(shù)據(jù)密集型科研與數(shù)據(jù)科學研討暨CODATA中委會人才團隊建設啟動會。。更有學者構建了從數(shù)據(jù)科學基本假設和基礎理論到數(shù)據(jù)學基礎再到數(shù)據(jù)科學應用的基本框架。

        根據(jù)知識圖譜分析的結果,并結合上述學者對數(shù)據(jù)科學理論體系構成的探討,對數(shù)據(jù)科學研究的熱點關鍵詞進行歸納可以大致得出數(shù)據(jù)科學知識體系和方法工具的構成框架(如圖3所示)。該框架劃分為理論數(shù)據(jù)科學、工程數(shù)據(jù)科學和應用數(shù)據(jù)科學(分別對應熱點關鍵詞1-3)。其中理論數(shù)據(jù)科學主要探討數(shù)據(jù)生命周期規(guī)律及數(shù)據(jù)科學研究中的基本假設、基礎理論和方法論體系;工程數(shù)據(jù)科學則傾向于數(shù)據(jù)作為資源和數(shù)據(jù)科學作為方法與工具的處理過程,包括數(shù)據(jù)獲取、分析、感知的具體技術與工具研發(fā)等;應用數(shù)據(jù)科學則是數(shù)據(jù)科學根據(jù)其應用對象所涉獵的具體學科或應用領域而產(chǎn)生的專門領域。

        從關鍵文獻、重要關鍵詞和熱點主題分析可以看出,目前處于研究熱點的主題多集中在軟硬件架構(IT視角)和商業(yè)領域(應用視角),主要分布在工程數(shù)據(jù)科學這一層面魏瑾瑞、蔣萍:《數(shù)據(jù)科學的統(tǒng)計學內(nèi)涵》,《統(tǒng)計研究》2014年第5期。,而代表研究生長點的關鍵詞則出現(xiàn)向上和向下延伸的趨勢(對應生長關鍵4-5)。關鍵文獻和演化路徑顯示的特征表明數(shù)據(jù)科學促進學科融合的作用并未得到充分發(fā)揮。數(shù)據(jù)科學研究內(nèi)部也較為分散,對學科性質(zhì)和目標定位不清晰,沒有形成較為固定的合作網(wǎng)絡。在高被引文獻中,缺少基礎理論研究,重應用輕基礎、重技術輕理論的傾向明顯。數(shù)據(jù)科學更多地像是多個相關學科“拼接”起來的新興學科,存在目標不明確和尚未形成完整的學科框架體系等問題。當然,科學研究的道路常常是先做“白盒研究”,知識積累多了才可能抽象出通用性較強的“黑盒模型”和普適規(guī)律李國杰、程學旗:《大數(shù)據(jù)研究:未來科技及經(jīng)濟社會發(fā)展的重大戰(zhàn)略領域——大數(shù)據(jù)的研究現(xiàn)狀與科學思考》,《中國科學院院刊》2012年第6期。。目前數(shù)據(jù)科學已經(jīng)積累了一定數(shù)量的案例和經(jīng)驗,“白盒研究”成果不斷豐富,亟需在此基礎上開展更深入的思考和研究,探討通用性更強,具有普遍規(guī)律的理論。未來,數(shù)據(jù)科學的發(fā)展方向一方面將繼續(xù)探討大數(shù)據(jù)環(huán)境下的技術發(fā)展,另一方面也將不斷增加基礎理論的構建,同時推動在不同的應用領域發(fā)揮重要作用。D.Donoho認為數(shù)據(jù)科學的下一個50年發(fā)展趨勢將體現(xiàn)在三個方面:開放科學接管、把科學本身作為數(shù)據(jù)和科學的數(shù)據(jù)分析、可被實證檢驗;而要實現(xiàn)最后一點,數(shù)據(jù)科學的科學性必須有一個不斷發(fā)展、基于事實的方法:科學范圍的元分析、交叉研究分析和跨工作流程分析。因此,圖3所示的數(shù)據(jù)科學知識體系和方法工具只是提供了一個基本的構成框架,在今后的發(fā)展過程中,這個框架必將隨著數(shù)據(jù)科學邊界、內(nèi)涵、理論的發(fā)展和應用的拓展而不斷增長。

        五、數(shù)據(jù)科學促進社會科學研究轉(zhuǎn)型的應用前景

        (一)改變與應對:社會科學研究轉(zhuǎn)型正在發(fā)生

        雖然社會科學界對是否接受大數(shù)據(jù)帶來的挑戰(zhàn)還在猶豫不決,存在社會科學家被逐漸邊緣化的擔憂。但數(shù)據(jù)科學在社會科學研究中的應用已經(jīng)逐漸拓展和深入,改變已經(jīng)悄然來臨。從圖1我們可以看出,商業(yè)大數(shù)據(jù)是領域數(shù)據(jù)科學研究的重要組成部分,內(nèi)容涵蓋商業(yè)智能、供應鏈管理、商業(yè)決策、招聘信息文本挖掘、可持續(xù)制造等多個領域,并且在內(nèi)外部的文獻互引上表現(xiàn)出比其他主題更趨緊密的關系。在基礎設施聚類中也涵蓋了公共醫(yī)學、城市治理和智能情報等社會科學研究內(nèi)容;數(shù)據(jù)處理聚類包括股票市場波動與搜索行為關系的研究;工具平臺含有對社交網(wǎng)絡通信效率的關注;研究范式聚類中也論述了XInformation范式在市場、公共政策和社會問題等領域的轉(zhuǎn)變。圖2中也含有可計算社會科學、商業(yè)智能、社交網(wǎng)絡、健康管理等社會科學研究領域的關鍵詞,部分關鍵詞出現(xiàn)在熱點聚類之中,并在統(tǒng)計學、復雜性系統(tǒng)、倫理學等代表理論的關鍵詞和數(shù)據(jù)分析、信息可視化、計算、數(shù)據(jù)挖掘、機器學習等代表技術的關鍵詞之間起到連接和過度的作用,占有十分重要的地位。在對合作網(wǎng)絡進行的補充分析中,我們發(fā)現(xiàn),數(shù)據(jù)科學研究已經(jīng)開始打破各自為政的局面,呈現(xiàn)出合作的廣泛性和國際性,來自多個國家的機構在共現(xiàn)網(wǎng)絡上產(chǎn)生了較為緊密的連接,在機構類型中除了研究型大學外,政府機構、研究所、企業(yè)也參與其中。數(shù)據(jù)科學研究已經(jīng)從“村舍”活動逐漸過渡到大規(guī)?!靶袠I(yè)化”努力。

        數(shù)據(jù)科學對社會科學研究轉(zhuǎn)型的作用還體現(xiàn)在相應研究方法的使用和研究成果的取得。研究方法主要包括:復雜性科學與計算機技術相結合,使用仿真方法對社會科學領域問題進行研究,在虛擬環(huán)境中模擬現(xiàn)實世界可能發(fā)生的現(xiàn)象,從而進行預測或優(yōu)化;使用計算實驗方法,通過人工個體代替現(xiàn)實系統(tǒng)的人,把現(xiàn)實社會系統(tǒng)轉(zhuǎn)化成智能主體構成的演化系統(tǒng),從而揭示社會系統(tǒng)中個體微觀行為和系統(tǒng)宏觀行為之間的動力學機制王眾托:《大力推進社會科學研究方法論的創(chuàng)新》,載盛昭瀚《社會科學計算實驗理論與應用》,上海三聯(lián)書店2009年版,序言第1-3頁;米傳民等:《經(jīng)濟學研究的新范式:芻議基于agent的計算經(jīng)濟學》,《經(jīng)濟與管理評論》2004年第6期。;通過社會科學和數(shù)據(jù)科學的交叉融合,實現(xiàn)計算社會科學、社會網(wǎng)絡分析、基于主體的數(shù)據(jù)挖掘等,從而達到以人和社會為表征的建模、實驗與分析評估等目的毛文吉:《社會計算發(fā)展研究》,載中國科學技術協(xié)會主編《控制科學與工程學科發(fā)展報告2010-2011》,中國科技出版社2011年版,第161-165頁。。這些研究方法在全球問題、危機管理、輿情監(jiān)控、消費決策、技術創(chuàng)新、土地覆被變化、生態(tài)系統(tǒng)服務等領域的建模仿真;在社會安全、社交網(wǎng)絡、決策行為、軍事工程等領域的數(shù)據(jù)挖掘、分析與人機交互;在公共管理領域的精準治理和國家治理技術平臺、情報學領域的知識圖譜研究、科學學領域的技術創(chuàng)新等方面均取得了豐碩的成果。數(shù)據(jù)科學中的數(shù)據(jù)集成與聯(lián)結,數(shù)據(jù)挖掘與分析技術在其中發(fā)揮重要作用。隨著海量數(shù)據(jù)存儲、傳遞、挖掘和整理技術的不斷進步,數(shù)據(jù)科學利用大數(shù)據(jù)挖掘相對于傳統(tǒng)數(shù)據(jù)分析的優(yōu)勢更加明顯,無論是算法還是工具都優(yōu)于傳統(tǒng)數(shù)據(jù)挖掘,更能應對數(shù)據(jù)的大體量、數(shù)據(jù)多樣性和復雜性的處理??商幚韺ο髞碓闯斯芾硇畔⑾到y(tǒng)、Web信息系統(tǒng)外,還包括感知信息系統(tǒng)等傳感設備自動產(chǎn)生的數(shù)據(jù),數(shù)據(jù)體量呈指數(shù)級增長,數(shù)據(jù)類型轉(zhuǎn)變?yōu)槎喾N數(shù)據(jù)類型大量并存的狀態(tài),數(shù)據(jù)結構復雜化程度加深。在此背景下,大數(shù)據(jù)時代的到來和數(shù)據(jù)科學的發(fā)展,為社會科學研究方法突破困境創(chuàng)造了條件,一個以計算機技術、互聯(lián)網(wǎng)為基礎,具有無限可能性的新計算社會科學成為現(xiàn)實Lazer D, Pentland A, et al, “Computational Social Science”, Science,vol.323,No.1,2009,pp.721-723.,這給社會科學研究帶來了革命性的變革和創(chuàng)新,并將深刻改變著社會科學的研究范式。

        (二)數(shù)據(jù)科學在社會科學研究中的應用前景

        從數(shù)據(jù)科學研究進展的梳理和社會科學研究已經(jīng)發(fā)生的轉(zhuǎn)變來看,大數(shù)據(jù)驅(qū)動數(shù)據(jù)科學在社會科學研究轉(zhuǎn)型中的作用前景將主要體現(xiàn)在以下六個方面:

        (1)為解決目前社會科學研究存在的問題提供可能。大數(shù)據(jù)中的行為數(shù)據(jù)彰顯社會科學研究的人本特性,數(shù)據(jù)科學將重構社會科學,并從理論范式上重繪學術圖景、延伸經(jīng)典學說,從學科范式上豐富學科目標、促進學科融合、提升學科應用,在研究實踐上疏解方法分歧、優(yōu)化變量測量、提供高質(zhì)量數(shù)據(jù)支撐、增加展示形式等陳云松、吳青熹等:《大數(shù)據(jù)何以重構社會科學》,《新疆師范大學學報(哲學社會科學版)》2015年第3期;米加寧、章昌平、李大宇等:《第四研究范式:大數(shù)據(jù)驅(qū)動的社會科學研究轉(zhuǎn)型》,《學?!?018年第2期。。

        (2)數(shù)據(jù)科學將對社會科學認知體系產(chǎn)生結構性的影響,這意味著無論是個體的認知體系還是社會性的認知功能體系都正在發(fā)生質(zhì)性的轉(zhuǎn)變:在社會科學研究層面形成新的研究范式,形成新的認識論、方法論、方法和工具,在認知的操作結果上則會發(fā)現(xiàn)新的相關關系,產(chǎn)生超越傳統(tǒng)認知方式的洞見,使經(jīng)典理論取得新的發(fā)展和更加切近真實的檢驗。新的認知方式正在將社會科學研究導向開放的基于數(shù)據(jù)的分析模式,通過分析基于數(shù)據(jù)科學的社會科學認知體系的內(nèi)部結構、邏輯過程及其結果的結構變化有利于我們把握數(shù)據(jù)科學條件下社會科學認知發(fā)生的有效機制,并對其做出發(fā)展和改進。

        (3)數(shù)據(jù)科學將改變傳統(tǒng)社會科學用“小數(shù)據(jù)”來驗證邏輯的路徑,實現(xiàn)用“大數(shù)據(jù)”來發(fā)現(xiàn)邏輯的研究路徑。數(shù)據(jù)科學時代的社會科學研究可能不再需要我們做出理論預設,而是在大數(shù)據(jù)分析得到的奇點相關的引導下建構因果和結構關系,進而發(fā)現(xiàn)其中蘊藏著的知識或規(guī)律。數(shù)據(jù)即現(xiàn)象和經(jīng)驗,“科學始于數(shù)據(jù)”而非直接觀察和傳統(tǒng)測量。大數(shù)據(jù)更高的精確度和整體性,延展了知識發(fā)現(xiàn)的新途徑和新方法。

        (4)傳統(tǒng)社會科學以學科為導向的問題構建轉(zhuǎn)向大數(shù)據(jù)時代的以跨學科為導向的事件的構建?;跀?shù)據(jù)科學的可計算社會科學的發(fā)展正在淡化、溝通甚至徹底消除學科邊界,將還原論下的專業(yè)性社會認知和建構升級為社會整體系統(tǒng)認知和建構過程。數(shù)據(jù)科學正在將傳統(tǒng)認識能夠抵達的對象社會孤立的數(shù)據(jù)流進行整合和連通,在科學家、決策者、專業(yè)工作人員和普羅大眾之間建立集中共享的新的社會和環(huán)境圖式,催生一體化、有機的、速度更快、關聯(lián)更緊密、響應更敏捷的可計算科學體系。

        (5)數(shù)據(jù)科學可以實現(xiàn)對真實世界的多路徑“涌現(xiàn)”。真實世界的進化路徑,偶然性非常大。但在大數(shù)據(jù)支持下,基于HS+CA的一體化建模與計算實驗平臺王國成:《行為大數(shù)據(jù),通宏洞微與人類決策——計算社會科學的興起與發(fā)展》,《科研信息化技術與應用》2015年第6期。,對真實世界的多路徑“涌現(xiàn)”仿真就成為可能。數(shù)據(jù)科學、復雜性科學(特別是對復雜性系統(tǒng)建模仿真方面)、社會計算的綜合發(fā)展,使得現(xiàn)實世界和理論(仿真)世界融合并建立平行系統(tǒng)成為可能,這也意味著提供了社會科學全景式認識社會經(jīng)濟系統(tǒng)的可能性,促進社會科學預測目標的回歸和預測、解釋、說明能力的融合。

        (6)數(shù)據(jù)科學為我國社會科學的發(fā)展提供了加速超越西方和形成中國特色、中國氣派的重要機遇羅瑋、羅教講:《新計算社會學:大數(shù)據(jù)時代的社會學研究》,《社會學研究》2015年第3期。。當代中國正經(jīng)歷著歷史上最為廣泛而深刻社會轉(zhuǎn)型,整個社會充斥著“三千年未有之大變局”中的大問題,需要構建宏大的新理論、新方法予以解決汪丁?。骸渡鐣茖W定量分析方法基礎探討》,《社會科學戰(zhàn)線》2010年第1期。。這種前無古人的偉大實踐,必將給理論創(chuàng)造、學術繁榮提供強大動力和廣闊空間。通過數(shù)據(jù)科學驅(qū)動社會科學研究轉(zhuǎn)型,將促進我國社會科學研究更符合中國的現(xiàn)實發(fā)展場景,實現(xiàn)由學習到創(chuàng)新,再到領跑。

        同時,我們認為,在社會科學研究轉(zhuǎn)型過程需要注意處理好以下幾個方面的問題:(1)需要交叉學科的研究。大數(shù)據(jù)每一種具體形式都僅能呈現(xiàn)事物本身的一個側(cè)面而并非全貌,如何加工處理并轉(zhuǎn)化成智能知識,仍然需要通過多學科交叉來研究和討論石勇:《大數(shù)據(jù)三個重要的技術問題》,長沙,2013年全國報社新聞技術工作會議暨中國報業(yè)技術年會。。(2)需要辯證看待大數(shù)據(jù)。準確把握大數(shù)據(jù)的生成背景,研判大數(shù)據(jù)對社會科學研究的可能性與適應性,辯證認識大數(shù)據(jù)對于重構社會科學研究范式的作用陳泓茹、趙寧、汪偉:《大數(shù)據(jù)融入人文社會科學的基本問題》,《社會科學文摘》2016年第2期。。(3)要意識到風險的存在。大數(shù)據(jù)分析可能失靈,要理性認識大數(shù)據(jù)的優(yōu)勢與劣勢。(4)處理好大數(shù)據(jù)與小數(shù)據(jù)之間的關系。(5)大數(shù)據(jù)需要新的研究技能與團隊合作。(6)需要構筑適應大數(shù)據(jù)環(huán)境的基礎設施,促進政府數(shù)據(jù)開放等。

        結論

        綜上所述,本文對數(shù)據(jù)科學演化進程、主題分布進行了梳理,并構建了數(shù)據(jù)科學知識體系和方法工具的動態(tài)框架,認為數(shù)據(jù)科學未來發(fā)展的方向?qū)墓こ虜?shù)據(jù)科學的技術研究逐漸向基礎理論和具體應用領域研究深化發(fā)展。這加強了數(shù)據(jù)科學與社會科學的內(nèi)在聯(lián)系,一方面數(shù)據(jù)科學基礎理論需要哲學、社會科學更深層次的思考,提供理論支撐,另一方面社會科學發(fā)展存在的問題和面臨的全新環(huán)境需要數(shù)據(jù)科學提供新的支持。數(shù)據(jù)科學對社會科學轉(zhuǎn)型的重大影響已經(jīng)顯現(xiàn),引起了國內(nèi)外多個領域?qū)W者們的重視,社會科學研究人員科研行為方式和數(shù)據(jù)、方法需求已經(jīng)發(fā)生改變。大數(shù)據(jù)驅(qū)動的數(shù)據(jù)科學將在社會科學研究轉(zhuǎn)型中扮演十分重要的角色,應用前景廣闊。同時,由于數(shù)據(jù)科學和大數(shù)據(jù)存續(xù)時間較短,其對社會科學的影響和作用機制需要長期、系統(tǒng)地跟蹤研究。科學研究范式轉(zhuǎn)換的研究主要集中在自然科學研究領域,而是否適用于社會科學研究的討論則不多見。厘清大數(shù)據(jù)、數(shù)據(jù)科學和社會科學研究范式轉(zhuǎn)型之間的作用機制,對我們擺脫社會科學現(xiàn)有的困境,從研究方法的范式轉(zhuǎn)型對社會科學研究進行分析與批判,并提供大數(shù)據(jù)驅(qū)動的數(shù)據(jù)科學對策具有十分重要的作用,需要進一步深入分析。

        (責任編輯:輕舟)

        猜你喜歡
        研究范式知識圖譜社會科學
        《云南社會科學》征稿征訂啟事
        《河北農(nóng)業(yè)大學(社會科學版)》2021年喜報
        我國犯罪論體系之變革及刑法學研究范式之轉(zhuǎn)型
        卷宗(2016年10期)2017-01-21 19:10:25
        近十五年我國小學英語教學研究的熱點、問題及對策
        基于知識圖譜的產(chǎn)業(yè)集群創(chuàng)新績效可視化分析
        智富時代(2016年12期)2016-12-01 16:28:41
        基于知識圖譜的智慧教育研究熱點與趨勢分析
        從《ET&S》與《電化教育研究》對比分析中管窺教育技術發(fā)展
        數(shù)學在社會科學中的應用
        論我國刑事錯案防范的研究范式
        行為會計理論與應用研究綜述
        消費導刊(2015年9期)2015-11-18 01:57:28
        中文字幕人成乱码中文乱码| 国产精品久久久久影院嫩草| 麻豆av传媒蜜桃天美传媒| 成人麻豆日韩在无码视频| 人妻av乱片av出轨| 狠狠色噜噜狠狠狠狠888奇禾| 亚洲乱码少妇中文字幕| 青青草是针对华人绿色超碰| 天天综合网网欲色| 少妇装睡让我滑了进去| 免费黄色福利| 凹凸世界视频a一二三| 日韩视频在线观看| 久久精品亚洲中文字幕无码网站| 99精品欧美一区二区三区美图| 少妇性l交大片免费1一少| 日本高清在线一区二区三区| 欧美日韩国产一区二区三区不卡| 欧美色aⅴ欧美综合色| 亚洲乱精品中文字字幕| 人妻久久一区二区三区| 国产精品自在拍在线拍| 欧美伊人网| 国产精品一区二区黄色片| 精品国产品香蕉在线| 国模少妇一区二区三区| 亚洲色四在线视频观看| 手机免费高清在线观看av| 亚洲av鲁丝一区二区三区黄| 欧美成人久久久免费播放| 国产av一区仑乱久久精品| 丰满少妇被猛烈进入高清播放| 国产真人无码作爱视频免费| 亚洲日日噜噜噜夜夜爽爽| 色综合悠悠88久久久亚洲| 亚洲综合激情五月丁香六月| 中年人妻丰满AV无码久久不卡| 成年男女免费视频网站点播| 在线观看免费无码专区| 国产成人无码一二三区视频| 日韩乱码精品中文字幕不卡|