佟澤華 豐佰恒 石江瀚 孫曉彬
(山東理工大學(xué)信息管理研究院 淄博 255000)
科研大數(shù)據(jù)作為國(guó)家大數(shù)據(jù)戰(zhàn)略基礎(chǔ)資源引發(fā)多國(guó)研究[1]。美國(guó)率先以Big Data Research and Development Initiative[2]拉開(kāi)科研數(shù)據(jù)治理的序幕,并在Big data Research and Development program中提及醫(yī)療、航天等眾多領(lǐng)域的科研大數(shù)據(jù)管理[3],英國(guó)在Seizing the Opportunities presented by data: the UK data Capability Strategy中警醒數(shù)據(jù)機(jī)遇[4],中國(guó)在《科學(xué)數(shù)據(jù)管理辦法》中制定科研大數(shù)據(jù)管理規(guī)范[5]。雖然各國(guó)均聚焦于科研大數(shù)據(jù)的治理工作,但數(shù)據(jù)維度混亂、數(shù)據(jù)不對(duì)稱(chēng)引用、生態(tài)關(guān)系薄弱、國(guó)際數(shù)據(jù)壁壘等問(wèn)題依然存在[6]??蒲写髷?shù)據(jù)治理能力是科研人員所必備的一種能力,是科研創(chuàng)新活動(dòng)的關(guān)鍵,否則引用無(wú)效數(shù)據(jù)甚至錯(cuò)誤數(shù)據(jù)將會(huì)直接影響數(shù)據(jù)質(zhì)量、危害數(shù)據(jù)安全,使科研活動(dòng)步履維艱。基于此,本文在已有研究的基礎(chǔ)上,構(gòu)建了多螺旋聯(lián)動(dòng)模型并對(duì)其應(yīng)用場(chǎng)景進(jìn)行進(jìn)一步探究,以期提升科研人員數(shù)據(jù)治理能力,維護(hù)科研大數(shù)據(jù)生態(tài)系統(tǒng)的和諧穩(wěn)定。
螺旋模型最早起源于生物學(xué)[7],后被相關(guān)學(xué)者引入到經(jīng)濟(jì)、管理、教育等領(lǐng)域,大致經(jīng)歷了從雙螺旋到三螺旋再至四螺旋模型的發(fā)展歷程,如圖1所示,雙螺旋模型直接引入生物雙螺旋結(jié)構(gòu)而構(gòu)建,例如,主客觀效率二者形成的雙螺旋結(jié)構(gòu)[8],企業(yè)文化與戰(zhàn)略雙螺旋[9],線上線下協(xié)同創(chuàng)新的創(chuàng)客空間[10],技術(shù)與網(wǎng)絡(luò)能力的創(chuàng)新力模型[11],學(xué)習(xí)與服務(wù)相關(guān)聯(lián)的學(xué)習(xí)支持服務(wù)模型[12]等研究從不同的學(xué)科與角度給雙螺旋模型帶來(lái)了新的生命活力。后隨時(shí)代發(fā)展在協(xié)同創(chuàng)新領(lǐng)域三螺旋模型已經(jīng)成為研究主流[13],以政產(chǎn)研三螺旋[14]為代表的三螺旋模型探討了科技孵化[15]、計(jì)量化研究、技術(shù)轉(zhuǎn)移[16]等問(wèn)題。但隨社會(huì)分工的細(xì)化,傳統(tǒng)的“政、產(chǎn)、研”三螺旋模型已經(jīng)無(wú)法滿足完美表述現(xiàn)階段社會(huì)發(fā)展互動(dòng)主體的需要,因此“政、產(chǎn)、研、資”[17]、“政、產(chǎn)、研、服”[18]、“政、產(chǎn)、研、介”[19-20]等四螺旋模型逐漸涌現(xiàn)。由此實(shí)現(xiàn)了由雙螺旋至四螺旋模型的演化。但科研大數(shù)據(jù)治理問(wèn)題復(fù)雜多變,涉及到政治、經(jīng)濟(jì)、科技、人員、服務(wù)、組織、數(shù)據(jù)等,在傳統(tǒng)的“政產(chǎn)研”三螺旋模型上增加的“資”“服”“介”等第四螺旋并不能完美囊括所有因素,從整體性的研究思路出發(fā)就會(huì)發(fā)現(xiàn),即便是增加到五螺旋模型也難以處理數(shù)據(jù)維度混亂、數(shù)據(jù)不對(duì)稱(chēng)引用、生態(tài)關(guān)系薄弱、國(guó)際數(shù)據(jù)壁壘等變幻莫測(cè)的科研大數(shù)據(jù)治理問(wèn)題。實(shí)際上早在2013年鄒益民等就提出了N螺旋模型的構(gòu)想[21],該模型可以涵蓋多種因素,很好地解決復(fù)雜系統(tǒng)的問(wèn)題,但對(duì)該模型如何具體構(gòu)建并未作出明確解釋。
圖1 螺旋模型研究史
科研大數(shù)據(jù)治理始于信息治理,是大數(shù)據(jù)治理一分支[22],涵蓋了治理的原則、框架、方法、活動(dòng)、功能和規(guī)范[23]等內(nèi)容。同時(shí)科研大數(shù)據(jù)作為大數(shù)據(jù)的重要組成部分 具有“規(guī)模性、高速性、價(jià)值性、多樣性”4V特征[24],因此相關(guān)學(xué)者認(rèn)為科研大數(shù)據(jù)治理需根據(jù)信息治理與大數(shù)據(jù)治理之框架,結(jié)合科研大數(shù)據(jù)之特征完善其治理體系、推進(jìn)其共享機(jī)制、維護(hù)其合法權(quán)益[25],例如,針對(duì)此Maguire S倡導(dǎo)統(tǒng)一元數(shù)據(jù)標(biāo)準(zhǔn),Horsburgh J S主張引入數(shù)據(jù)倉(cāng)儲(chǔ)技術(shù)[26],馬玲玲則提出保障質(zhì)量控制[27],Hao S建立了科研大數(shù)據(jù)全過(guò)程質(zhì)量控制的計(jì)算機(jī)可識(shí)別的規(guī)則庫(kù)[28]等。隨時(shí)代發(fā)展,在已有的科研大數(shù)據(jù)理論基礎(chǔ)之上,中國(guó)公共數(shù)據(jù)質(zhì)量控制模型[29](主要針對(duì)于政府?dāng)?shù)據(jù)等公共數(shù)據(jù)的質(zhì)量管控),自識(shí)別功能的數(shù)據(jù)質(zhì)量控制模型[30](將先進(jìn)的自動(dòng)識(shí)別技術(shù)等大數(shù)據(jù)技術(shù)引入到數(shù)據(jù)質(zhì)量控制過(guò)程中)等大數(shù)據(jù)治理模型應(yīng)運(yùn)而生。后隨科研大數(shù)據(jù)研究的進(jìn)一步深入,科研大數(shù)據(jù)質(zhì)量管控模型[31]、科研大數(shù)據(jù)再生模型[32]、科研大數(shù)據(jù)共生模型[33]、科研大數(shù)據(jù)變異模型[34]等專(zhuān)對(duì)于科研大數(shù)據(jù)治理的模型逐漸涌現(xiàn)。
綜上可知,螺旋模型誕生于生物學(xué),后被廣泛的應(yīng)用到經(jīng)濟(jì)、管理、教育、行政等領(lǐng)域,且經(jīng)歷了從雙螺旋到三螺旋再至四螺旋的逐步演化,在國(guó)家倡導(dǎo)大數(shù)據(jù)戰(zhàn)略的今天,大數(shù)據(jù)井噴式增長(zhǎng),科研大數(shù)據(jù)作為大數(shù)據(jù)的重要組成部分,其治理的相關(guān)研究逐漸增多,但經(jīng)典的螺旋模型與科研大數(shù)據(jù)治理相結(jié)合的研究鮮有耳聞,基于此本文將兩者有機(jī)結(jié)合構(gòu)建了科研大數(shù)據(jù)治理多螺旋聯(lián)動(dòng)模型。
科研數(shù)據(jù)多次引用導(dǎo)致其維度飆升,造成維度混亂。因此本文設(shè)計(jì)了“人員、數(shù)據(jù)、管理”多層集成,“挖掘、存儲(chǔ)、剪枝”三位一體的科研數(shù)據(jù)降維旋,整合其“查找、理解、評(píng)估、降維、引用”等技術(shù),降低科研數(shù)據(jù)維度,厘清各維度間關(guān)系,推動(dòng)科研大數(shù)據(jù)治理實(shí)踐的進(jìn)程。
劣質(zhì)數(shù)據(jù)具有較強(qiáng)的迷惑性,受眾人員難以把握數(shù)據(jù)的真?zhèn)?,引用時(shí)極易出現(xiàn)科研數(shù)據(jù)的不對(duì)稱(chēng)引用、甚至錯(cuò)誤引用現(xiàn)象,對(duì)于科研大數(shù)據(jù)生態(tài)系統(tǒng)中的虛假數(shù)據(jù)難以定位。因此本文引入定位螺旋以解決上述問(wèn)題,定位螺旋主要由X旋、Y旋、Z旋3個(gè)子螺旋構(gòu)成,在快速定位科研數(shù)據(jù)解決數(shù)據(jù)不對(duì)稱(chēng)引用的同時(shí)還可查找劣質(zhì)數(shù)據(jù)。
科研大數(shù)據(jù)生態(tài)系統(tǒng)其構(gòu)成要素繁雜,科研大數(shù)據(jù)治理問(wèn)題可以看作是一個(gè)難以測(cè)度的非線性問(wèn)題。為更好地化解科研大數(shù)據(jù)治理的復(fù)雜性,可引進(jìn)經(jīng)典線性模型對(duì)各要素進(jìn)行量化分析,溝通各要素間關(guān)聯(lián)關(guān)系將其轉(zhuǎn)化為線性問(wèn)題,因此本文設(shè)計(jì)轉(zhuǎn)化旋,將科研大數(shù)據(jù)治理要素間關(guān)系轉(zhuǎn)化成線性關(guān)系,以解決生態(tài)關(guān)系初建各要素間權(quán)責(zé)邊界不明晰的問(wèn)題,同時(shí)輔助監(jiān)管者科學(xué)制定各類(lèi)策略弱化國(guó)際數(shù)據(jù)壁壘。
綜合以上,針對(duì)科研大數(shù)據(jù)治理現(xiàn)存問(wèn)題本文構(gòu)建了科研大數(shù)據(jù)治理多螺旋聯(lián)動(dòng)模型(Multi-screw Linkage Model of Scientific Research Big Data Governance,MLM-SRBDG)(見(jiàn)圖2)。
圖2 多螺旋聯(lián)動(dòng)模型
與傳統(tǒng)意義上螺旋模型[35]不同的是,降維旋依據(jù)科研大數(shù)據(jù)高維性特征建立,由人員旋、服務(wù)旋、管理旋、數(shù)據(jù)旋、技術(shù)旋以上5個(gè)子螺旋組成(見(jiàn)圖3)。各子螺旋具體分工如下:
a.人員旋:人員旋通過(guò)計(jì)算機(jī)與數(shù)據(jù)相連,實(shí)現(xiàn)人與數(shù)據(jù)間的互通,其主要由數(shù)據(jù)監(jiān)管者、平臺(tái)維護(hù)者、數(shù)據(jù)消費(fèi)者、數(shù)據(jù)生產(chǎn)者、數(shù)據(jù)專(zhuān)家等相關(guān)人員構(gòu)成。根據(jù)科研大數(shù)據(jù)全生命周期特點(diǎn),對(duì)整條數(shù)據(jù)生態(tài)鏈進(jìn)行管控,生產(chǎn)者作為數(shù)據(jù)的提供方有義務(wù)提供真實(shí)可靠的數(shù)據(jù),監(jiān)管者與平臺(tái)維護(hù)者有責(zé)任監(jiān)管數(shù)據(jù)質(zhì)量杜絕數(shù)據(jù)造假,消費(fèi)者作為數(shù)據(jù)接收方有權(quán)維護(hù)自己獲取真實(shí)數(shù)據(jù)的權(quán)利。數(shù)據(jù)專(zhuān)家則是利用自己專(zhuān)業(yè)化的知識(shí)鑒別數(shù)據(jù)真?zhèn)?、檢索需求數(shù)據(jù)。人員作為科研大數(shù)據(jù)生態(tài)系統(tǒng)的重要組成部分,在科研大數(shù)據(jù)治理中發(fā)揮著不可或缺的作用。
b.服務(wù)旋:服務(wù)旋主要指科研數(shù)據(jù)服務(wù)機(jī)構(gòu),其具有數(shù)據(jù)的記錄、預(yù)覽、刷新、設(shè)計(jì)、打印等功能。服務(wù)旋常見(jiàn)的存在形式是數(shù)據(jù)平臺(tái),例如數(shù)據(jù)中介機(jī)構(gòu)、代理機(jī)構(gòu)、咨詢(xún)機(jī)構(gòu)等,核心的功能是數(shù)據(jù)檢索,科研人員將從服務(wù)旋直接獲取數(shù)據(jù),因此服務(wù)旋對(duì)于科研數(shù)據(jù)的監(jiān)管可在源頭處明顯降低科研大數(shù)據(jù)治理難度。
c.管理旋:管理旋由數(shù)據(jù)管理系統(tǒng)構(gòu)成,例如科研數(shù)據(jù)資產(chǎn)管理系統(tǒng)、科研數(shù)據(jù)轉(zhuǎn)發(fā)與接收系統(tǒng)、科研數(shù)據(jù)整合系統(tǒng)、科研數(shù)據(jù)匯聚系統(tǒng)。科研數(shù)據(jù)資產(chǎn)管理系統(tǒng)主要負(fù)責(zé)科研數(shù)據(jù)調(diào)度,控制其質(zhì)量、保障其安全,預(yù)防劣質(zhì)科研大數(shù)據(jù)的災(zāi)難性后果??蒲袛?shù)據(jù)轉(zhuǎn)發(fā)與接收系統(tǒng)除負(fù)責(zé)常規(guī)的數(shù)據(jù)接收與轉(zhuǎn)發(fā)外,還要負(fù)責(zé)數(shù)據(jù)的初檢與群析??蒲袛?shù)據(jù)整合系統(tǒng)根據(jù)數(shù)據(jù)間關(guān)聯(lián)進(jìn)行數(shù)據(jù)分類(lèi),對(duì)于結(jié)構(gòu)不明晰的數(shù)據(jù)類(lèi)型進(jìn)行數(shù)據(jù)轉(zhuǎn)換,然后進(jìn)行統(tǒng)一的數(shù)據(jù)配置??蒲袛?shù)據(jù)匯聚系統(tǒng)以數(shù)據(jù)引擎為核心,主動(dòng)采集科研數(shù)據(jù)并對(duì)其進(jìn)行鏡像處理。
圖3 降維旋細(xì)化模型
d.數(shù)據(jù)旋:數(shù)據(jù)旋又稱(chēng)劣質(zhì)數(shù)據(jù)處理旋,由挖掘單元、觀察單元、剪枝單元三部分組成。劣質(zhì)數(shù)據(jù)挖掘單元主要在數(shù)據(jù)庫(kù)中進(jìn)行數(shù)據(jù)抽取并進(jìn)行分析,看其是否維度混亂,若為混維科研數(shù)據(jù)便將其引流至觀察單元的數(shù)據(jù)集市。觀察單元主要負(fù)責(zé)在數(shù)據(jù)集市中選取數(shù)據(jù)進(jìn)行分析,看其是否存在錯(cuò)位屬性、是否容易造成數(shù)據(jù)劣質(zhì),并將劣質(zhì)數(shù)據(jù)放置剪枝單元中。數(shù)據(jù)剪枝單元對(duì)混維科研數(shù)據(jù)進(jìn)行剪枝處理,根據(jù)數(shù)據(jù)消費(fèi)者需求降低數(shù)據(jù)維度,或?qū)⑵浼糁閱尉S科研數(shù)據(jù),以降低維度混亂問(wèn)題概率。
e.技術(shù)旋:技術(shù)旋主要涵蓋了挖掘技術(shù)(模型擬合、過(guò)濾采樣、分組聚合)、儲(chǔ)存技術(shù)(分布式儲(chǔ)存、交互引擎、互聯(lián)網(wǎng)計(jì)算)、降維技術(shù)(線性降維、非線性降維)等三大技術(shù)。其中降維技術(shù)是技術(shù)旋的關(guān)鍵,本模型將主成分分析、線性判別、線性嵌入、特征映射、多維尺度分析、等距離映射、擴(kuò)散映射、自動(dòng)多層編碼等技術(shù)有機(jī)整合共同致力于科研大數(shù)據(jù)治理。
綜合以上,科研大數(shù)據(jù)治理經(jīng)過(guò)由人員旋、服務(wù)旋、管理旋、數(shù)據(jù)旋、技術(shù)旋所構(gòu)成的降維旋過(guò)濾可在一定程度上刪除數(shù)據(jù)冗余屬性,降低數(shù)據(jù)維度,解決科研數(shù)據(jù)維度混亂的問(wèn)題,從而降低劣質(zhì)科研大數(shù)據(jù)出現(xiàn)的概率。
劣質(zhì)科研大數(shù)據(jù)難以定位捕捉,而定位螺旋主要由X旋、Y旋、Z旋3個(gè)子螺旋構(gòu)成,如圖4所示,各個(gè)子螺旋間聯(lián)動(dòng)協(xié)同,X旋、Y旋、Z旋分別形成定位夾角,3角交叉重疊區(qū)域S即為定位范圍,可一定程度縮小數(shù)據(jù)范圍。如表1所示各螺旋間共有以下30種聯(lián)動(dòng)網(wǎng)絡(luò)方式,具體分析如下:
表1 螺旋匹配種類(lèi)
a.X旋:根據(jù)科研大數(shù)據(jù)生命周期理論,X旋涵蓋了科研數(shù)據(jù)的生產(chǎn)、傳遞、消費(fèi)、分解、再生5個(gè)階段,在圖4中分別依次表示為X1、X2、X3、X4、X5。結(jié)合上文所設(shè)計(jì)的人員旋,以X旋為中軸線探尋科研大數(shù)據(jù)定位機(jī)理。在X1階段主要的定位人員為科研數(shù)據(jù)生產(chǎn)者,在此階段扼制虛假數(shù)據(jù)的產(chǎn)生,預(yù)防數(shù)據(jù)劣質(zhì)突變。X2階段的定位人員為科研數(shù)據(jù)傳遞者,在這一階段對(duì)科研數(shù)據(jù)進(jìn)行研判,看其是否存在劣質(zhì)傾向。X3階段定位人員是科研數(shù)據(jù)消費(fèi)者,在此階段需引導(dǎo)科研數(shù)據(jù)消費(fèi)者引用正確數(shù)據(jù),提高鑒別能力。X4階段定位人員為分解者,在此階段對(duì)虛假數(shù)據(jù)進(jìn)行分解亦或淘汰。X5階段定位人員為再生者,在此階段對(duì)科研數(shù)據(jù)的劣質(zhì)程度進(jìn)行評(píng)級(jí),對(duì)于可修復(fù)的數(shù)據(jù)類(lèi)型進(jìn)行再生處理。
圖5 定位旋細(xì)化模型
b.Y旋:Y旋包括數(shù)據(jù)發(fā)現(xiàn)、數(shù)據(jù)研判、數(shù)據(jù)分級(jí)3大過(guò)程,在圖4中分別表示為Y1、Y2、Y3。三大過(guò)程貫穿于X1至X5五個(gè)階段,根據(jù)其全數(shù)據(jù)生命周期探尋科研數(shù)據(jù)的生產(chǎn)、傳遞、消費(fèi)、分解、再生中是否存在科研大數(shù)據(jù)劣質(zhì)現(xiàn)象,對(duì)整個(gè)科研數(shù)據(jù)生態(tài)鏈中的數(shù)據(jù)質(zhì)量進(jìn)行嚴(yán)格把控,在監(jiān)管數(shù)據(jù)質(zhì)量的同時(shí)監(jiān)督科研人員行為,杜絕科研數(shù)據(jù)造假。對(duì)于已經(jīng)出現(xiàn)的劣質(zhì)數(shù)據(jù)進(jìn)行分級(jí),并對(duì)科研人員的行為進(jìn)行警示。幫助科研數(shù)據(jù)接收方了解數(shù)據(jù)質(zhì)量,在進(jìn)行數(shù)據(jù)引用的時(shí)候避免失誤,減小實(shí)驗(yàn)誤差。
c.Z旋:Z旋指以人員Z1、數(shù)據(jù)Z2為檢測(cè)對(duì)象,以人員行為的監(jiān)管與數(shù)據(jù)質(zhì)量的管控為核心活動(dòng)的子螺旋。在這一螺旋中可對(duì)科研人員精確定位,方便今后的數(shù)據(jù)溯源與追責(zé)。同樣對(duì)于科研數(shù)據(jù)的精確定位,可判斷分析數(shù)據(jù)在哪一環(huán)節(jié)出現(xiàn)了問(wèn)題,有無(wú)補(bǔ)救的辦法,對(duì)于易解決的問(wèn)題可在當(dāng)前環(huán)節(jié)彌補(bǔ)施救,以節(jié)約成本。
綜合以上科研大數(shù)據(jù)治理經(jīng)過(guò)由X旋、Y旋、Z旋所構(gòu)成定位旋過(guò)濾可根據(jù)科研大數(shù)據(jù)人員的需求在一定程度上縮小數(shù)據(jù)范圍,合理高效的匹配數(shù)據(jù),對(duì)所需數(shù)據(jù)進(jìn)行精準(zhǔn)定位,解決科研數(shù)據(jù)不對(duì)稱(chēng)引用的問(wèn)題,從而降低科研大數(shù)據(jù)檢索成本。
科研大數(shù)據(jù)生態(tài)系統(tǒng)變幻莫測(cè)是一個(gè)非線性的系統(tǒng),科研大數(shù)據(jù)治理是一個(gè)難以測(cè)度的非線性問(wèn)題。其構(gòu)成要素繁雜、獨(dú)立、差異大,大致可分為數(shù)據(jù)、人員、環(huán)境三部分[36]。不同的數(shù)據(jù)類(lèi)型管控難度也相差甚遠(yuǎn),相較于結(jié)構(gòu)化數(shù)據(jù)而言,半結(jié)構(gòu)化與非結(jié)構(gòu)化數(shù)據(jù)涵蓋種類(lèi)多樣、監(jiān)管困難,且人員體系龐大(可分為競(jìng)爭(zhēng)者與合作者)且素養(yǎng)良莠不齊,所處環(huán)境(包括科研數(shù)據(jù)平臺(tái)、政治、科技、經(jīng)濟(jì))復(fù)雜多變。對(duì)于無(wú)序性問(wèn)題、突變性問(wèn)題難以把握其規(guī)律,很難將其轉(zhuǎn)化為線性問(wèn)題。但在治理科研大數(shù)據(jù)時(shí)仍有偽線性問(wèn)題、可計(jì)量問(wèn)題、模板性問(wèn)題等諸多問(wèn)題可轉(zhuǎn)化為線性問(wèn)題進(jìn)行處理。如圖5,為更好的治理科研大數(shù)據(jù),可引進(jìn)經(jīng)典線性模型對(duì)各要素進(jìn)行量化分析,溝通各要素間關(guān)聯(lián)關(guān)系將其轉(zhuǎn)化為線性問(wèn)題,為今后科研大數(shù)據(jù)生態(tài)問(wèn)題應(yīng)對(duì)戰(zhàn)略的制定提供可靠依據(jù),同時(shí)統(tǒng)一的數(shù)據(jù)標(biāo)準(zhǔn)與線性模型的建立可弱化科研大數(shù)據(jù)迷霧,促進(jìn)世界范圍內(nèi)的科研大數(shù)據(jù)交流共享,從而進(jìn)一步達(dá)到弱化科研數(shù)據(jù)壁壘的目的。
圖5 轉(zhuǎn)化旋細(xì)化模型
轉(zhuǎn)化旋的關(guān)鍵在于線性模型的構(gòu)建,在模型構(gòu)建過(guò)程中應(yīng)堅(jiān)持目標(biāo)性原則(以提高科研大數(shù)據(jù)治理效率、維護(hù)科研大數(shù)據(jù)生態(tài)系統(tǒng)穩(wěn)定為目標(biāo))、系統(tǒng)性原則(依據(jù)科研大數(shù)據(jù)生態(tài)系統(tǒng)構(gòu)建系統(tǒng)化的治理模型)、動(dòng)態(tài)性原則(根據(jù)不同時(shí)期的不同數(shù)據(jù)類(lèi)型對(duì)模型進(jìn)行靈活轉(zhuǎn)換)、獨(dú)特性原則(在構(gòu)建線性模型的過(guò)程中要根據(jù)不同的數(shù)據(jù)結(jié)構(gòu)針對(duì)性構(gòu)建)、科學(xué)預(yù)測(cè)原則(線性轉(zhuǎn)換的主要目的是對(duì)應(yīng)對(duì)策略作用效果的預(yù)估)等原則。在線性模型構(gòu)建的過(guò)程中主要用到數(shù)據(jù)挖掘工具(例如,QUEST系統(tǒng)、MineSet系統(tǒng)、DBMiner系統(tǒng)等)、量化評(píng)估工具(可在已搭建好的量化平臺(tái)中加入所需的特定條件,免除從無(wú)到有的基礎(chǔ)框架搭建過(guò)程)、模擬仿真工具(具體可使用MATLAB、Vensim等軟件操作)等三大工具。在線性模型構(gòu)建中遵循一體化建模方法,要具體考慮到科研大數(shù)據(jù)治理線性模型轉(zhuǎn)化的時(shí)空交錯(cuò)(科研大數(shù)據(jù)具有規(guī)模性需要治理的數(shù)據(jù)往往存在于不同的時(shí)間與空間)、現(xiàn)實(shí)與功能兼具、要素分析等。本文以科研大數(shù)據(jù)供需為例構(gòu)建線性模型,ISLM模型是經(jīng)典的供給需求模型[37],可根據(jù)其構(gòu)建科研數(shù)據(jù)供給曲線DM,與數(shù)據(jù)需求曲線AP。將結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)、競(jìng)爭(zhēng)者、合作者、政治、科技、經(jīng)濟(jì)、平臺(tái)、政府等子螺旋依次表示為d1、d2、d3、c、p、G、t、e、f、g。數(shù)據(jù)劣質(zhì)度從0到1,劣質(zhì)度越高其供給者獲利越大,需求曲線隨劣質(zhì)度的升高而降低。該模型要求同時(shí)達(dá)到以下條件:
A(Y)=P(c)
M/P=D1(Y)+D2(c)
Y=P+E
P=d1+d2+d2+p-c
E=G+t+e+f+g
其中,A為數(shù)據(jù)共享,P為劣質(zhì)數(shù)據(jù),M為名義數(shù)據(jù)傳遞量,Q為數(shù)據(jù)價(jià)值系數(shù),M/Q為實(shí)際數(shù)據(jù)利用量,Y總數(shù)據(jù)價(jià)值水平,D是數(shù)據(jù)需求。通常將M/Q視為由數(shù)據(jù)生態(tài)系統(tǒng)確定的定值,劣質(zhì)度和數(shù)據(jù)需求量呈反向關(guān)系,而提供者既得利益和數(shù)據(jù)需求量呈正向關(guān)系,從而得出一條數(shù)據(jù)價(jià)值水平曲線Y,斜率大小由實(shí)際數(shù)據(jù)需求及價(jià)值決定,而位置由實(shí)際數(shù)據(jù)利用量決定。利用模擬數(shù)值對(duì)可實(shí)施的部分策略進(jìn)行模擬仿真,在數(shù)據(jù)共享中,均衡條件為A(Y)=P(c),所以A和P的變動(dòng)會(huì)引起AP曲線的移動(dòng)。數(shù)據(jù)傳遞增加Δa則傳遞曲線向右移動(dòng)Δa,這將使AP曲線向右移動(dòng)kΔa,其中k科研數(shù)據(jù)傳遞乘數(shù)。設(shè)科研數(shù)據(jù)共享保持不變,若劣質(zhì)數(shù)據(jù)增加Δs,則科研數(shù)據(jù)消費(fèi)者總數(shù)據(jù)價(jià)值水平會(huì)下降Δs,AP曲線會(huì)向左移動(dòng),移動(dòng)量為kΔs。類(lèi)似地,劣質(zhì)數(shù)據(jù)減少使AP曲線右移,其移動(dòng)量也是kΔs。我們將數(shù)據(jù)監(jiān)管者所采取的一系列措施統(tǒng)稱(chēng)為m,m增加,劣質(zhì)度下降,從而使Y增加,故DM曲線右移;m減少,數(shù)據(jù)保留價(jià)值率上升,從而使數(shù)據(jù)消費(fèi)者所得收益減少,故DM曲線左移 ;其中m作為可控變量,是監(jiān)管者進(jìn)行策略仿真的重要依據(jù)??蒲袛?shù)據(jù)的供需可構(gòu)建出多種線性模型,科研數(shù)據(jù)監(jiān)管人員利用轉(zhuǎn)化旋將科研大數(shù)據(jù)治理問(wèn)題轉(zhuǎn)換為線性問(wèn)題,并可以利用多種仿真軟件對(duì)預(yù)策略進(jìn)行仿真,可大大提高策略的制定效率與科學(xué)性。
降維旋、定位旋、轉(zhuǎn)化旋三者之間緊密相連、相輔相成,且三者之間存在互動(dòng)、互助、互益關(guān)系。a.互動(dòng)關(guān)系指多螺旋聯(lián)動(dòng)模型各個(gè)螺旋之間是相互聯(lián)動(dòng)的,每一次科研大數(shù)據(jù)治理都是多螺旋模型依次聯(lián)動(dòng)的過(guò)程。首先,定位旋定位,在定位旋的作用下科研大數(shù)據(jù)治理聯(lián)動(dòng)模型對(duì)數(shù)據(jù)進(jìn)行時(shí)空定位,獲取所需治理的科研大數(shù)據(jù)所處的學(xué)科領(lǐng)域和所處的生命周期,并將其統(tǒng)一保存;其次,降維旋降維,降維旋接受定位旋所獲取的數(shù)據(jù)并判斷其是否需要剪枝,以便進(jìn)一步處理;最后,轉(zhuǎn)化旋轉(zhuǎn)化,轉(zhuǎn)化旋對(duì)精簡(jiǎn)后的科研大數(shù)據(jù)進(jìn)一步進(jìn)行影響因素分析,將其轉(zhuǎn)化為線性問(wèn)題處理并科學(xué)預(yù)測(cè)戰(zhàn)略效果。b.互助關(guān)系是指各個(gè)螺旋之間協(xié)同合作,共同完成科研大數(shù)據(jù)的治理工作。降維旋的工作需要定位旋的幫助,因?yàn)橹挥性诰珳?zhǔn)定位的前提下才能獲取所需治理的數(shù)據(jù)并進(jìn)一步分析。同時(shí)轉(zhuǎn)化旋的工作也需要降維旋的輔助,科研大數(shù)據(jù)在經(jīng)過(guò)降維旋的剪枝處理之后可明確其主要的相關(guān)影響因素,從而進(jìn)行線性模型的構(gòu)建。對(duì)不需要降維的部分科研大數(shù)據(jù)亦是需要定位旋的提前定位,但定位旋的工作并不是單獨(dú)進(jìn)行的,其工作過(guò)程需要人員旋的科研大數(shù)據(jù)人員的操作,技術(shù)旋的技術(shù)支撐,管理旋的統(tǒng)籌管理等等。c.互益關(guān)系指多螺旋聯(lián)動(dòng)模型各子螺旋之間互惠互利。例如,降維旋的存在降低了轉(zhuǎn)化旋線性模型構(gòu)建的難度,定位旋的存在使科研大數(shù)據(jù)人員快速獲取數(shù)據(jù)信息降低了數(shù)據(jù)檢索成本,轉(zhuǎn)化旋的作用簡(jiǎn)化了科研大數(shù)據(jù)治理的流程反饋至其他兩旋,提高了其工作效率。
降維旋、定位旋、轉(zhuǎn)化旋三者之間聯(lián)動(dòng)方式也是多種多樣的,具體可分為依次聯(lián)動(dòng)、交叉聯(lián)動(dòng)、反向聯(lián)動(dòng)等聯(lián)動(dòng)方式。依次聯(lián)動(dòng)指科研大數(shù)據(jù)按照多螺旋模型的既定路線依次走完定位、降維、轉(zhuǎn)化的路線,這種聯(lián)動(dòng)方式具有層層推進(jìn)、化繁為簡(jiǎn)的特點(diǎn);交叉聯(lián)動(dòng)具體可分為降維旋與定位旋的聯(lián)動(dòng)(適用于存在固有線性模型的科研大數(shù)據(jù)類(lèi)型)、降維旋與轉(zhuǎn)化旋的聯(lián)動(dòng)(適用于已知的特定學(xué)科特定生命周期范圍內(nèi)的科研大數(shù)據(jù)類(lèi)型)、定位旋與轉(zhuǎn)化旋的聯(lián)動(dòng)(適用于原本維度較低的科研大數(shù)據(jù)類(lèi)型);反向聯(lián)動(dòng)指首先進(jìn)行化線旋的轉(zhuǎn)化,將其轉(zhuǎn)變?yōu)榫€性問(wèn)題,然后再進(jìn)行降維并逐維分析的聯(lián)動(dòng)路徑,這種聯(lián)動(dòng)方式適用于具有較高緯度且需要對(duì)不同維度進(jìn)行分析的科研大數(shù)據(jù)治理情況。由此科研大數(shù)據(jù)螺旋模型形成了以點(diǎn)帶面的聯(lián)動(dòng)關(guān)系。對(duì)科研大數(shù)據(jù)的聯(lián)動(dòng)治理可維護(hù)科研大數(shù)據(jù)的和諧穩(wěn)定,鞏固科研大數(shù)據(jù)、科研人員、科研環(huán)境之間的生態(tài)關(guān)系。
人工智能在核軍備方面的大規(guī)模應(yīng)用,意味著一旦出現(xiàn)大數(shù)據(jù)質(zhì)量問(wèn)題,人工對(duì)誤警難以干預(yù),將大大提高風(fēng)險(xiǎn)概率,造成連帶災(zāi)難。建立長(zhǎng)期的公共安全數(shù)據(jù)保存系統(tǒng)至關(guān)重要,在公共安全領(lǐng)域大數(shù)據(jù)質(zhì)量問(wèn)題的出現(xiàn)將會(huì)影響數(shù)據(jù)采集的精確度,從而影響公共安全科研事業(yè)的發(fā)展。科技的進(jìn)步可促進(jìn)科研人員間數(shù)據(jù)的傳遞,促進(jìn)創(chuàng)新成果轉(zhuǎn)化,在科研領(lǐng)域大數(shù)據(jù)質(zhì)量問(wèn)題的出現(xiàn)將會(huì)直接阻礙社會(huì)科教事業(yè)的發(fā)展,從而影響國(guó)家的進(jìn)步與發(fā)展。企業(yè)間合作有助于經(jīng)濟(jì)發(fā)展,當(dāng)競(jìng)爭(zhēng)對(duì)手釋放迷惑性數(shù)據(jù)時(shí),企業(yè)以此類(lèi)數(shù)據(jù)為依據(jù)進(jìn)行科研并提供決策建議時(shí)易產(chǎn)生經(jīng)濟(jì)數(shù)據(jù)質(zhì)量問(wèn)題,多螺旋聯(lián)動(dòng)模型具有較強(qiáng)的領(lǐng)域適用性,從軍事、公共安全、科研、經(jīng)濟(jì)等領(lǐng)域均可看見(jiàn)其主螺旋或是子螺旋發(fā)揮作用,如圖6所示,本文謹(jǐn)以“中國(guó)科學(xué)院數(shù)據(jù)云”為例[38],闡述其在科研領(lǐng)域的適用性,具體分析如下:
圖6 模型的應(yīng)用場(chǎng)景圖
數(shù)據(jù)降維處理指的是,隨5G時(shí)代的到來(lái),科研數(shù)據(jù)量的暴增,處于人員旋的科研工作人員在數(shù)據(jù)引用時(shí)會(huì)遭受大量數(shù)據(jù)噪聲的影響,此時(shí)利用多螺旋聯(lián)動(dòng)模型降低科研大數(shù)據(jù)維度,以減少科研大數(shù)據(jù)質(zhì)量問(wèn)題出現(xiàn)概率。由前文分析知科研大數(shù)據(jù)的超高引用頻次使得數(shù)據(jù)維度激增,從而引起數(shù)據(jù)維度混亂造成維度災(zāi)難,數(shù)據(jù)維度混亂是科研大數(shù)據(jù)質(zhì)量問(wèn)題產(chǎn)生的主要原因之一,因此科研大數(shù)據(jù)的降噪處理將是多螺旋聯(lián)動(dòng)模型的主要應(yīng)用場(chǎng)景。數(shù)據(jù)降維處理以多螺旋聯(lián)動(dòng)模型降維旋為核心,以定位旋與轉(zhuǎn)化旋等為輔助多螺旋聯(lián)動(dòng)應(yīng)用。如圖6所示,以“中國(guó)科學(xué)院數(shù)據(jù)云”為例,在“中國(guó)科學(xué)院數(shù)據(jù)云”降維旋中以“IA(iAnalysis)交互分析云服務(wù)系統(tǒng)”為例的管理旋將會(huì)聯(lián)動(dòng)技術(shù)旋,利用docker技術(shù)、獨(dú)立容器技術(shù)、鏡像技術(shù)等對(duì)科研大數(shù)據(jù)進(jìn)行管理,此時(shí)效力于服務(wù)旋的科研大數(shù)據(jù)管理與分析平臺(tái)基本建成。人員旋同時(shí)聯(lián)動(dòng)服務(wù)旋與管理旋,向平臺(tái)申請(qǐng)算法庫(kù)。該平臺(tái)采用容器技術(shù)設(shè)計(jì),以物理、虛擬主機(jī)為科研大數(shù)據(jù)資源節(jié)點(diǎn),對(duì)科研大數(shù)據(jù)進(jìn)行橫向擴(kuò)展,聯(lián)動(dòng)定位旋來(lái)定位學(xué)科領(lǐng)域與所處生命周期階段,以形成特定領(lǐng)域科研大數(shù)據(jù)資源池,目前“IA(iAnalysis)交互分析云服務(wù)系統(tǒng)”已經(jīng)涵蓋海洋科學(xué)、極地?cái)?shù)據(jù)、煙草預(yù)測(cè)、大氣科學(xué)、生命健康、生態(tài)科學(xué)、地理空間以及重大專(zhuān)項(xiàng)等科研大數(shù)據(jù)資源池,資源池內(nèi)科研大數(shù)據(jù)隨所處學(xué)科與所屬數(shù)據(jù)類(lèi)型分門(mén)別類(lèi)地存放,從而進(jìn)一步構(gòu)建數(shù)據(jù)旋。數(shù)據(jù)旋以獨(dú)立容器的方式呈現(xiàn),后人員旋聯(lián)動(dòng)轉(zhuǎn)化旋將其轉(zhuǎn)化為特定算法模型,即通過(guò)科研工作人員的API申請(qǐng)來(lái)匹配相應(yīng)的算法資源,減少次級(jí)相關(guān)科研大數(shù)據(jù)的質(zhì)量問(wèn)題干擾。
對(duì)稱(chēng)引用處理指的是,隨科研數(shù)據(jù)量增加,科研大數(shù)據(jù)良莠不齊造成科研大數(shù)據(jù)人員數(shù)據(jù)引用失范,此時(shí)利用多螺旋聯(lián)動(dòng)模型規(guī)范科研大數(shù)據(jù)引用,進(jìn)一步提高檢索效率,以減少科研大數(shù)據(jù)質(zhì)量問(wèn)題出現(xiàn)概率。當(dāng)科研大數(shù)據(jù)供需沖突時(shí),科研數(shù)據(jù)寡頭根據(jù)利好發(fā)布數(shù)據(jù),甚至于為迷惑對(duì)手發(fā)布錯(cuò)誤數(shù)據(jù),從而科研大數(shù)據(jù)出現(xiàn)質(zhì)量問(wèn)題,從而造成數(shù)據(jù)引用時(shí)供需不對(duì)稱(chēng),數(shù)據(jù)不對(duì)稱(chēng)引用是科研大數(shù)據(jù)劣質(zhì)產(chǎn)生的主要原因之一,因此科研大數(shù)據(jù)的供需對(duì)稱(chēng)處理是多螺旋聯(lián)動(dòng)模型的又一主要應(yīng)用場(chǎng)景。對(duì)稱(chēng)引用處理以多螺旋聯(lián)動(dòng)模型定位旋為核心,以降維旋為輔助多螺旋聯(lián)動(dòng)應(yīng)用。由科研大數(shù)據(jù)生命周期理論知,科研大數(shù)據(jù)質(zhì)量問(wèn)題有可能爆發(fā)于生產(chǎn)、傳遞、消費(fèi)、分解、再生任意階段,此時(shí)需要定位旋對(duì)造成科研大數(shù)據(jù)質(zhì)量問(wèn)題的科研人員與數(shù)據(jù)進(jìn)行定位。如圖6所示,以多螺旋聯(lián)動(dòng)模型的研究方法來(lái)看待“中國(guó)科學(xué)院數(shù)據(jù)云”,該服務(wù)平臺(tái)的“科學(xué)數(shù)據(jù)存儲(chǔ)庫(kù)(ScienceDB)”[39]探索人員間聯(lián)系,利用Z旋定位科研人員、科研期刊、高校等利益相關(guān)者、邊緣相關(guān)者,并結(jié)合科研大數(shù)據(jù)的匯交、保存、出版、共享、獲取等服務(wù),對(duì)其與已有科研大數(shù)據(jù)質(zhì)量問(wèn)題相關(guān)的一系列科研成果結(jié)合技術(shù)旋與X旋進(jìn)行生產(chǎn)、傳遞、消費(fèi)、分解、再生等科研大數(shù)據(jù)全生命周期的審視,在進(jìn)行數(shù)據(jù)審視過(guò)程中需應(yīng)用降維旋中多項(xiàng)技術(shù)對(duì)數(shù)據(jù)進(jìn)行爬取并在必要時(shí)進(jìn)行降維,利用Y旋對(duì)科研大數(shù)據(jù)質(zhì)量問(wèn)題進(jìn)行分級(jí),淘汰錯(cuò)誤科研大數(shù)據(jù)。在保障科研大數(shù)據(jù)安全的基礎(chǔ)上,促進(jìn)科研大數(shù)據(jù)的可發(fā)現(xiàn)、可定位、可重用。
生態(tài)鞏固應(yīng)用指的是,在科研大數(shù)據(jù)生態(tài)系統(tǒng)形成初期,科研大數(shù)據(jù)生態(tài)制度并不完善,缺乏統(tǒng)一的行業(yè)標(biāo)準(zhǔn)規(guī)范,此時(shí)利用多螺旋聯(lián)動(dòng)模型規(guī)范科研大數(shù)據(jù)行業(yè)標(biāo)準(zhǔn),鞏固科研大數(shù)據(jù)生態(tài)關(guān)系,以減少科研大數(shù)據(jù)質(zhì)量問(wèn)題出現(xiàn)概率??蒲写髷?shù)據(jù)生態(tài)治理重理論乏實(shí)踐、重人工干預(yù)忽略生態(tài)自我修復(fù)功能、修復(fù)具有短期性、缺乏修復(fù)效益評(píng)價(jià)、法律不健全造假成本低、人員權(quán)責(zé)邊界不明晰等問(wèn)題都催生了科研大數(shù)據(jù)質(zhì)量問(wèn)題。科研大數(shù)據(jù)生態(tài)關(guān)系薄弱是科研大數(shù)據(jù)質(zhì)量問(wèn)題產(chǎn)生的主要原因之一,因此鞏固科研大數(shù)據(jù)生態(tài)關(guān)系是多螺旋聯(lián)動(dòng)模型的再一主要應(yīng)用場(chǎng)景??蒲写髷?shù)據(jù)生態(tài)鞏固以多螺旋聯(lián)動(dòng)模型中服務(wù)旋為核心,以管理旋與人員旋等為輔助多螺旋聯(lián)動(dòng)應(yīng)用。例如,在“中國(guó)科學(xué)院數(shù)據(jù)云”中“標(biāo)準(zhǔn)規(guī)范體系”涵蓋了指導(dǎo)規(guī)范、數(shù)據(jù)采集與整理、元數(shù)據(jù)與元模型、系統(tǒng)與接口、數(shù)據(jù)管理、數(shù)據(jù)服務(wù)六大標(biāo)準(zhǔn)板塊內(nèi)容[40],又如“指導(dǎo)規(guī)范”類(lèi)型的“主題數(shù)據(jù)庫(kù)建設(shè)規(guī)范”,本規(guī)范聯(lián)動(dòng)服務(wù)旋與技術(shù)旋規(guī)定了主題數(shù)據(jù)庫(kù)的技術(shù)工作、運(yùn)行維護(hù)和服務(wù)要求。再如“數(shù)據(jù)管理”類(lèi)型中的“數(shù)據(jù)質(zhì)量管理規(guī)范”管理旋聯(lián)動(dòng)服務(wù)旋與數(shù)據(jù)旋闡述了科研大數(shù)據(jù)質(zhì)量管控、科研大數(shù)據(jù)質(zhì)量描述、科研大數(shù)據(jù)質(zhì)量評(píng)價(jià)。標(biāo)準(zhǔn)的行業(yè)規(guī)范使科研大數(shù)據(jù)生態(tài)關(guān)系更加牢固、生態(tài)環(huán)境更加美好,日益優(yōu)化的科研大數(shù)據(jù)生態(tài)環(huán)境可減少科研大數(shù)據(jù)質(zhì)量問(wèn)題的產(chǎn)生。
數(shù)據(jù)破壁指的是,在數(shù)字化的今天,各國(guó)的科學(xué)數(shù)據(jù)交流愈加頻繁,但科研大數(shù)據(jù)種類(lèi)多樣,各國(guó)科研大數(shù)據(jù)使用標(biāo)準(zhǔn)不盡相同,缺乏統(tǒng)一的科研大數(shù)據(jù)模型,數(shù)據(jù)共享壁壘依然存在,此時(shí)利用多螺旋聯(lián)動(dòng)模型為不易分享的非線性科研大數(shù)據(jù)構(gòu)建線性模型,突破科研大數(shù)據(jù)共享壁壘,以減少科研大數(shù)據(jù)質(zhì)量問(wèn)題出現(xiàn)概率。非結(jié)構(gòu)化與半結(jié)構(gòu)化科研數(shù)據(jù)難以自由流動(dòng)與保存,當(dāng)數(shù)據(jù)需求者鑒別能力較弱時(shí),非官方渠道獲取數(shù)據(jù)的方法難以保障所得科研大數(shù)據(jù)的精確性,科研誤差累積至一定程度時(shí)催生科研大數(shù)據(jù)質(zhì)量問(wèn)題,從而造成災(zāi)難性后果。數(shù)據(jù)共享壁壘是科研大數(shù)據(jù)質(zhì)量問(wèn)題產(chǎn)生的主要原因之一,因此科研大數(shù)據(jù)的破壁處理是多螺旋聯(lián)動(dòng)模型的另一主要應(yīng)用場(chǎng)景。數(shù)據(jù)破壁處理以多螺旋聯(lián)動(dòng)模型轉(zhuǎn)化旋為核心,以數(shù)據(jù)旋、服務(wù)旋與定位旋等為輔助多螺旋聯(lián)動(dòng)應(yīng)用??蒲写髷?shù)據(jù)生態(tài)系統(tǒng)是一個(gè)非線性的系統(tǒng),所處環(huán)境復(fù)雜多變引起科研大數(shù)據(jù)質(zhì)量問(wèn)題的出現(xiàn)具有波動(dòng)性。在治理科研大數(shù)據(jù)質(zhì)量問(wèn)題的偽線性、可計(jì)量、模板性等問(wèn)題時(shí)可利用轉(zhuǎn)化旋引進(jìn)經(jīng)典線性模型將其轉(zhuǎn)化為線性問(wèn)題進(jìn)行處理。如圖6所示,“中國(guó)科學(xué)院數(shù)據(jù)云”旗下“時(shí)空三極環(huán)境大數(shù)據(jù)平臺(tái)”[41]的構(gòu)建,利用定位旋對(duì)多源頭、高緯度、多尺度的異構(gòu)科研大數(shù)據(jù)進(jìn)行時(shí)間、空間、參數(shù)上的統(tǒng)一,突破傳統(tǒng)的遙感、觀測(cè)、模型分割的研究方法,進(jìn)行相互關(guān)聯(lián)的南極、北極、第三極的整體研究。聯(lián)動(dòng)數(shù)據(jù)旋搭建北極海冰季節(jié)預(yù)報(bào)統(tǒng)計(jì)回歸模型、GBEHM Model、TESim模型、內(nèi)陸河高寒山區(qū)流域分布式熱耦合模型(DWHC)、WEB-DHM、Community Earth System Model、冰川度日模型、HBV冰川水文模型及經(jīng)濟(jì)評(píng)估模型以解決半結(jié)構(gòu)化的、偽線性的、可計(jì)量的科研大數(shù)據(jù)問(wèn)題并在標(biāo)準(zhǔn)化處理后構(gòu)建三極科學(xué)模型庫(kù)。聯(lián)動(dòng)服務(wù)旋整合“大數(shù)據(jù)與云服務(wù)”、“數(shù)字地球科學(xué)平臺(tái)”,實(shí)現(xiàn)數(shù)據(jù)庫(kù)——模型——方法可互操作的綜合平臺(tái),以規(guī)范的線性模型為大數(shù)據(jù)平臺(tái)提供服務(wù),以科研大數(shù)據(jù)共享減小科研大數(shù)據(jù)質(zhì)量問(wèn)題出現(xiàn)概率。
綜合以上分析,科研大數(shù)據(jù)治理多螺旋聯(lián)動(dòng)模型在數(shù)據(jù)降維場(chǎng)景、對(duì)稱(chēng)引用場(chǎng)景、生態(tài)鞏固場(chǎng)景、數(shù)據(jù)破壁場(chǎng)景均可應(yīng)用,且可有效解決數(shù)據(jù)維度混亂、數(shù)據(jù)不對(duì)稱(chēng)引用、生態(tài)關(guān)系薄弱、國(guó)際數(shù)據(jù)壁壘等問(wèn)題。
本文構(gòu)建了多螺旋聯(lián)動(dòng)模型以應(yīng)對(duì)科研大數(shù)據(jù)治理過(guò)程中數(shù)據(jù)維度混亂、數(shù)據(jù)不對(duì)稱(chēng)引用、生態(tài)關(guān)系薄弱、國(guó)際數(shù)據(jù)壁壘等問(wèn)題,具有較強(qiáng)的適用性與理論價(jià)值。
其適用性表現(xiàn)為:a.主體適用性,科研大數(shù)據(jù)治理需要多主體、多機(jī)構(gòu)協(xié)同。科研大數(shù)據(jù)治理與科研人員想要獲取高質(zhì)量科研數(shù)據(jù)減小實(shí)驗(yàn)誤差的愿望,與科研數(shù)據(jù)監(jiān)管人員維護(hù)科研大數(shù)據(jù)生態(tài)系統(tǒng)穩(wěn)定的愿望,與資助機(jī)構(gòu)獲取高收益的愿望等高度契合,具有較強(qiáng)的主體適用性。b.客體適用性,對(duì)于科研大數(shù)據(jù)的治理,是對(duì)科研大數(shù)據(jù)生態(tài)系統(tǒng)的優(yōu)化,有利于科研大數(shù)據(jù)生態(tài)系統(tǒng)的可持續(xù)發(fā)展。c.功能適用性,現(xiàn)有的數(shù)據(jù)挖掘技術(shù)、數(shù)據(jù)儲(chǔ)存技術(shù)、降維技術(shù)、數(shù)據(jù)分析技術(shù)足以支撐平臺(tái)的運(yùn)行,多螺旋聯(lián)動(dòng)模型與弱化科研壁壘、促進(jìn)數(shù)據(jù)共享、完善數(shù)據(jù)治理機(jī)制的需求高度匹配。
價(jià)值貢獻(xiàn)在于:a.豐富了科研大數(shù)據(jù)相關(guān)理論,使科研大數(shù)據(jù)生態(tài)系統(tǒng)理論體系更加完善。b.構(gòu)建了多螺旋聯(lián)動(dòng)模型,與以往螺旋模型不同的是本文所設(shè)計(jì)的多螺旋聯(lián)動(dòng)模型是在數(shù)據(jù)維度混亂、數(shù)據(jù)不對(duì)稱(chēng)引用、生態(tài)關(guān)系薄弱、國(guó)際數(shù)據(jù)壁壘等問(wèn)題下催生的,以控制科研數(shù)據(jù)質(zhì)量、保護(hù)科研數(shù)據(jù)安全、維護(hù)科研大數(shù)據(jù)生態(tài)系統(tǒng)穩(wěn)定為目標(biāo),以降維旋、定位旋、轉(zhuǎn)化旋為核心,以人員旋、服務(wù)旋、管理旋、數(shù)據(jù)旋、技術(shù)旋、X旋、Y旋、Z旋為輔助,以數(shù)據(jù)降維、快速定位、線性轉(zhuǎn)化為策略的多螺旋聯(lián)動(dòng)的具有較強(qiáng)適用性的科研大數(shù)據(jù)治理模型。