文/鐘國華 胡建敏 倪向東
“十三五”時期,我國經(jīng)濟(jì)發(fā)展進(jìn)入了速度變化、結(jié)構(gòu)優(yōu)化和動力轉(zhuǎn)換的新常態(tài),以科技創(chuàng)新為核心的創(chuàng)新驅(qū)動模式已成為我國經(jīng)濟(jì)可持續(xù)發(fā)展的核心戰(zhàn)略與必然選擇。我國《關(guān)于深化體制機(jī)制改革加快實施創(chuàng)新驅(qū)動發(fā)展戰(zhàn)略的若干意見》《國家創(chuàng)新驅(qū)動發(fā)展戰(zhàn)略綱要》的先后印發(fā),將科技創(chuàng)新擺在了國家發(fā)展全局的核心位置;《關(guān)于加快科技服務(wù)業(yè)發(fā)展的若干意見》指出,科技服務(wù)業(yè)是 實現(xiàn)科技創(chuàng)新引領(lǐng)產(chǎn)業(yè)升級、推動經(jīng)濟(jì)向中高端水平邁進(jìn)的關(guān)鍵一環(huán),對于深入實施創(chuàng)新驅(qū)動發(fā)展戰(zhàn)略、推動經(jīng)濟(jì)提質(zhì)增效升級具有重要意義。
在此背景下,隨著科技服務(wù)業(yè)的發(fā)展,我國涌現(xiàn)了一批科技服務(wù)機(jī)構(gòu)以及科技服務(wù)互聯(lián)網(wǎng)平臺,在科技咨詢、技術(shù)轉(zhuǎn)移、創(chuàng)業(yè)孵化、知識產(chǎn)權(quán)、科技金融等方面推動了線上、線下一體化服務(wù)發(fā)展,可以看到高質(zhì)量服務(wù)背后的底層邏輯是“大數(shù)據(jù)支撐+跨界專業(yè)服務(wù)”,數(shù)據(jù)資源越來越成為科技服務(wù)業(yè)的核心支撐因素。而由于科技服務(wù)的數(shù)據(jù)資源涉及面廣、相對分散,科技服務(wù)的異構(gòu)分布協(xié)同不足、綜合服務(wù)效能不強,各地方雖都建有科技服務(wù)類平臺、成果轉(zhuǎn)化類平臺、技術(shù)市場類平臺并積累了大量的數(shù)據(jù)資源,但各系統(tǒng)平臺缺乏統(tǒng)一標(biāo)準(zhǔn)和規(guī)范、數(shù)據(jù)無法共享互通,存在出現(xiàn)大量“信息孤島”、區(qū)域間信息不對稱、資源閑置浪費等問題。為解決上述眾多問題,本文將基于珠三角城市群綜合科技服務(wù)智能門戶平臺建設(shè)經(jīng)驗,提出基于數(shù)據(jù)融合模型的科技服務(wù)資源池構(gòu)建方法,以期達(dá)到提高科技服務(wù)資源的利用率、數(shù)據(jù)集成能力和智能化應(yīng)用水平,促進(jìn)資源區(qū)域融合,規(guī)范統(tǒng)模型標(biāo)準(zhǔn),實現(xiàn)跨區(qū)域資源調(diào)度利用、擴(kuò)大資源池影響力的輻射范圍的效果。
科技服務(wù)資源池是指以國務(wù)院印發(fā)的《關(guān)于加快科技服務(wù)業(yè)發(fā)展的若干意見》所列舉的八大科技類別為基礎(chǔ),通過數(shù)字化手段對每個服務(wù)類別所涉及的資源要素進(jìn)行采集、描述、存儲、應(yīng)用,形成統(tǒng)一的可用、可視、可聯(lián)的,具備數(shù)據(jù)目錄、數(shù)據(jù)治理及數(shù)據(jù)管理應(yīng)用場景的大數(shù)據(jù)庫體系。從以上定義可以看到,由于不同地方的科技服務(wù)發(fā)展帶有較強的地域?qū)傩裕厝幻總€服務(wù)類別所涉及的資源要素會有一定差異,資源池的類別也會存在差異。
本文以珠三角城市群綜合科技服務(wù)智能門戶平臺構(gòu)建為例,對該平臺所涉及的資源池做了如下分類:一是技術(shù)轉(zhuǎn)移資源,包括科技企業(yè)、人才、高校及科研院所、技術(shù)轉(zhuǎn)移機(jī)構(gòu)、技術(shù)經(jīng)理人、技術(shù)需求、技術(shù)成果。二是檢驗檢測認(rèn)證資源,包括科技企業(yè)、檢驗檢測機(jī)構(gòu)、檢驗檢測產(chǎn)品、檢驗檢測服務(wù)。三是知識產(chǎn)權(quán)資源,包括科技企業(yè)、知識產(chǎn)權(quán)服務(wù)機(jī)構(gòu)、知識產(chǎn)權(quán)服務(wù)產(chǎn)品、知識產(chǎn)權(quán)交易、知識產(chǎn)權(quán)數(shù)據(jù)庫(專利、商標(biāo)、軟件著作權(quán)、集成電路)。四是創(chuàng)業(yè)孵化資源,包括科技企業(yè)、創(chuàng)業(yè)孵化機(jī)構(gòu)、創(chuàng)業(yè)孵化載體、創(chuàng)業(yè)孵化服務(wù)。五是科技金融資源,包括科技企業(yè)、融資機(jī)構(gòu)、融資產(chǎn)品、融資服務(wù)。六是科技咨詢服務(wù)資源,包括科技企業(yè)、科技咨詢機(jī)構(gòu)、科技咨詢產(chǎn)品、科技咨詢服務(wù)、政策、文獻(xiàn)、儀器設(shè)備。
在國家大力促進(jìn)發(fā)展科技服務(wù)業(yè)的背景下,國內(nèi)各省份已集聚了不少科技服務(wù)資源,也曾建立了一些科技服務(wù)資源池。常規(guī)的科技服務(wù)資源池建設(shè)過程如圖1所示。
圖1 常規(guī)科技服務(wù)資源池構(gòu)建過程
常規(guī)的科技服務(wù)資源池構(gòu)建方法普遍以自主查詢?yōu)橹鳎軌蚍?wù)于相對封閉系統(tǒng),但隨著整個科技服務(wù)業(yè)走向生態(tài)化、復(fù)雜化,對資源的要求更加多元、精準(zhǔn)、開放,需要系統(tǒng)更好地集成多源數(shù)據(jù)和支持智能化應(yīng)用,充分發(fā)揮數(shù)據(jù)價值。這對系統(tǒng)也提出了更高的要求,即從信息積累、簡單應(yīng)用往更高的智能匹配、數(shù)據(jù)分析、數(shù)據(jù)決策能力靠攏,通過大數(shù)據(jù)及人工智能技術(shù)在存儲、應(yīng)用、分析、決策、治理、推送等多個層面上規(guī)劃科技服務(wù)資源池的建設(shè)。據(jù)此,提出基于數(shù)據(jù)融合模型的科技服務(wù)資源池構(gòu)建方法(見圖2),對當(dāng)下科技服務(wù)資源池建設(shè)過程提供標(biāo)準(zhǔn)化的建設(shè)參考,以促進(jìn)科技服務(wù)資源池的互通共享、提升科技服務(wù)效率,推動科技服務(wù)業(yè)發(fā)展,助力產(chǎn)業(yè)科技創(chuàng)新。
圖2 基于數(shù)據(jù)融合模型的科技服務(wù)資源池構(gòu)建過程
科技服務(wù)資源池作為信息系統(tǒng)建設(shè)項目,無法脫離基本的數(shù)據(jù)建模過程。數(shù)據(jù)建模主要是實現(xiàn)了把現(xiàn)實物體轉(zhuǎn)換成虛擬數(shù)據(jù)的過程,以物體的常規(guī)屬性及特征為標(biāo)記進(jìn)行多維度的屬性定義,直到能夠滿足業(yè)務(wù)需求而形成的數(shù)據(jù)結(jié)構(gòu)描述。
數(shù)據(jù)建模以業(yè)務(wù)為導(dǎo)向。進(jìn)行數(shù)據(jù)建模,就是通過信息手段從多維度對物體進(jìn)行描述,包括外觀屬性如顏色、大小、形狀等,內(nèi)在屬性如分類、結(jié)構(gòu)等,但業(yè)務(wù)場景只要求實現(xiàn)通過一種方式識別物體的功能,而建模只需要對應(yīng)該屬性即可。以技術(shù)轉(zhuǎn)移資源數(shù)據(jù)建模為例(見圖3)是一個典型的業(yè)務(wù)導(dǎo)向建模例子。先對珠三角城市群綜合科技服務(wù)進(jìn)行提煉,再對交集數(shù)據(jù)進(jìn)行基本信息初定、形成公共屬性,如資源唯一標(biāo)識、資源創(chuàng)建時間、資源相關(guān)人、資源區(qū)塊鏈支持、資源名稱等。公共屬性形成資源基類,資源特征屬性都以子類形式進(jìn)行擴(kuò)展,迭代形成各種資源分析模型,同時對特征屬性進(jìn)行標(biāo)定(如常規(guī)數(shù)值、量化值、文本等)。
圖3 技術(shù)轉(zhuǎn)移資源數(shù)據(jù)建模
元數(shù)據(jù)被定義為描述數(shù)據(jù)的數(shù)據(jù),是對數(shù)據(jù)及信息資源的描述性信息。對應(yīng)科技服務(wù)資源數(shù)據(jù)建模的例子,把元數(shù)據(jù)理解成維度屬性的定義,如外觀屬性中的顏色、大小、形狀,內(nèi)在屬性中的分類、結(jié)構(gòu)等都可以歸結(jié)為建模對象的元數(shù)據(jù)。面對各種各樣的科技服務(wù)資源,元數(shù)據(jù)的管理在數(shù)據(jù)統(tǒng)一層面有著重要意義,通過動態(tài)管理元數(shù)據(jù)有效地把握業(yè)務(wù)方向上的數(shù)據(jù)模型、提高系統(tǒng)靈活性,同時也是數(shù)據(jù)管理與治理的基礎(chǔ)要求。
在科技服務(wù)資源數(shù)據(jù)的四元分類法中,一是基礎(chǔ)類,即科技服務(wù)資源的基本屬性;二是業(yè)務(wù)類,即對科技服務(wù)資源的類別、概況、標(biāo)識等進(jìn)行規(guī)范描述;三是統(tǒng)計類,即科技服務(wù)資源中存在復(fù)合子類的統(tǒng)計情況;四是附加類,即對科技服務(wù)資源的關(guān)聯(lián)、冗余、隱性等屬性進(jìn)行規(guī)范描述。以珠三角城市群綜合科技服務(wù)智能門戶平臺技術(shù)轉(zhuǎn)移資源-技術(shù)需求資源為例,通過四元分類對其進(jìn)行描述,如表1所示。
表1 科技企業(yè)技術(shù)需求的數(shù)據(jù)四元分類表示
經(jīng)過四元分類后構(gòu)建的數(shù)據(jù)模型已能夠滿足大部分針對資源的應(yīng)用場景。在高級應(yīng)用上,如智能匹配等也可直接使用四元分類法建立數(shù)據(jù)模型實現(xiàn)功能,但高級應(yīng)用往往汲及多類科技服務(wù)資源,如果單純地按功能需求建模會出現(xiàn)數(shù)據(jù)屬性重復(fù)、資源數(shù)據(jù)重復(fù)、數(shù)據(jù)信息不一致等風(fēng)險。為了減少多資源信息關(guān)聯(lián)過程重復(fù)建模的風(fēng)險,需要引入數(shù)據(jù)融合模型設(shè)計。
融合模型設(shè)計是指在數(shù)據(jù)建模的基礎(chǔ)上,對已建立模型的元數(shù)據(jù)按業(yè)務(wù)要求進(jìn)行提取或增添,從而產(chǎn)生出更高契合度的業(yè)務(wù)復(fù)合模型。按照此定義,數(shù)據(jù)模型融合后的結(jié)果依然是一個模型,這個模型依然遵守四元分類規(guī)則,只是在對提取而來的元數(shù)據(jù)屬性上增加一條操作規(guī)則標(biāo)識,對非提取屬性則按常規(guī)元數(shù)據(jù)識別。通過引入操作規(guī)則引擎的概念,能較好理解基于模型的數(shù)據(jù)融合操作。數(shù)據(jù)融合模型操作規(guī)則主要分為關(guān)聯(lián)規(guī)則、統(tǒng)計規(guī)則、觸發(fā)規(guī)則。關(guān)聯(lián)規(guī)則指屬性的值來自于被關(guān)聯(lián)模型,采用引用機(jī)制,隨著被關(guān)聯(lián)模型中對應(yīng)屬性值更新而自動更新。統(tǒng)計規(guī)則指屬性的值來自于其他模型的統(tǒng)計結(jié)果。觸發(fā)規(guī)則指屬性的值來自于觸發(fā)規(guī)則觸發(fā)后的結(jié)果。
以珠三角城市群綜合科技服務(wù)智能門戶平臺下的技術(shù)轉(zhuǎn)移資源-專家資源模塊為例,平臺可通過手機(jī)號查詢到專家姓名、專業(yè)、成果數(shù)量、是否高級項目專家,其中配偶姓名屬性下則無操作規(guī)則,屬于常規(guī)元數(shù)據(jù),如果專家模型的姓名更改了,融合模型的查詢結(jié)果自然也就更改了(見圖4)。
圖4 數(shù)據(jù)融合模型設(shè)計示例
科技服務(wù)業(yè)具有跟隨區(qū)域產(chǎn)業(yè)發(fā)展的特點,導(dǎo)致科技服務(wù)資源帶有區(qū)域特性,種類多、結(jié)構(gòu)不統(tǒng)一,因此每種資源在各源系統(tǒng)中的元數(shù)據(jù)不盡相同。為了構(gòu)建區(qū)域統(tǒng)一科技服務(wù)資源的資源池管理系統(tǒng),所有異構(gòu)數(shù)據(jù)結(jié)構(gòu)必須經(jīng)過統(tǒng)一標(biāo)準(zhǔn)的結(jié)構(gòu)化處理才能導(dǎo)入到資源池。為此,引入了異構(gòu)處理引擎與數(shù)據(jù)融合驅(qū)動的規(guī)則引擎,實現(xiàn)系統(tǒng)自驅(qū)的數(shù)據(jù)融合機(jī)制。數(shù)據(jù)融合過程在系統(tǒng)中主要體現(xiàn)在以下兩個方面:
一是異構(gòu)數(shù)據(jù)處理引擎的關(guān)聯(lián)觸發(fā)機(jī)制。數(shù)據(jù)輸入到資源池是有多種方式的,例如數(shù)據(jù)庫連接輸入、應(yīng)用程序編程接口(API)輸入、線下文檔轉(zhuǎn)線上輸入、爬蟲數(shù)據(jù)輸入等,每種輸入的方式都可能有著不一樣的數(shù)據(jù)結(jié)構(gòu),需要有一個標(biāo)準(zhǔn)化的過程轉(zhuǎn)換后數(shù)據(jù)才能真正輸入到資源池。異構(gòu)數(shù)據(jù)處理引擎主要處理數(shù)據(jù)結(jié)構(gòu)轉(zhuǎn)換,轉(zhuǎn)換后的數(shù)據(jù)輸入到資源池會觸發(fā)一系列機(jī)制以更新過往的資源池數(shù)據(jù),達(dá)到數(shù)據(jù)自動融合的效果。
二是數(shù)據(jù)融合模型的操作規(guī)則。數(shù)據(jù)融合模型中自帶操作規(guī)則引擎,通過規(guī)則配置,以主動或被動的方式自動完成關(guān)聯(lián)數(shù)據(jù)的更新,達(dá)到數(shù)據(jù)自動融合的效果。
目前,大部分科技服務(wù)資源池經(jīng)過建模過程后并不考慮關(guān)聯(lián)數(shù)據(jù)的融合,需要另外的操作來維護(hù)數(shù)據(jù)關(guān)聯(lián)更新過程,這就需要投入額外資源進(jìn)行數(shù)據(jù)多維關(guān)聯(lián)清洗處理,提高了系統(tǒng)建設(shè)的人員成本?;诙鄶?shù)據(jù)模型的設(shè)計,引入數(shù)據(jù)融合模型機(jī)制可以降低數(shù)據(jù)維護(hù)成本,同時實現(xiàn)了數(shù)據(jù)維度的靈活擴(kuò)展、增加了系統(tǒng)的靈活性,加快實現(xiàn)數(shù)據(jù)融合、更高維度的統(tǒng)計、分析應(yīng)用,增強了系統(tǒng)的自驅(qū)能力。此外,數(shù)據(jù)融合模型還具有維度隱藏的作用,可以隱藏業(yè)務(wù)中的不必要屬性或受保護(hù)的數(shù)據(jù)屬性。
科技服務(wù)資源池作為區(qū)域的特色數(shù)據(jù)集聚,需要得到充分的挖掘和利用才能更好地發(fā)揮服務(wù)于區(qū)域產(chǎn)業(yè)的作用。對科技服務(wù)資源池建設(shè)進(jìn)行標(biāo)準(zhǔn)化后,將有利于系統(tǒng)提供更快捷、高效服務(wù)。同時,在科技服務(wù)資源池的構(gòu)建過程中,引入數(shù)據(jù)融合模型設(shè)計可以降低開發(fā)成本、提升系統(tǒng)自驅(qū)能力,以及提升數(shù)據(jù)集成能力和智能化應(yīng)用水平。
隨著數(shù)字經(jīng)濟(jì)的到來,數(shù)據(jù)要素將發(fā)揮越來越重要的作用,科技服務(wù)業(yè)也將進(jìn)入產(chǎn)業(yè)數(shù)字化改革進(jìn)程,科技服務(wù)資源池也將在此過程中發(fā)揮著重要作用;基于數(shù)據(jù)融合模型構(gòu)建科技服務(wù)資源池將有助于推動科技服務(wù)資源池的互通共享、提升科技服務(wù)效率,推動科技服務(wù)業(yè)發(fā)展、助力產(chǎn)業(yè)科技創(chuàng)新。