陳 麗,王啟現(xiàn),劉 娟,崔運鵬,王 末
農(nóng)業(yè)科研試驗基地數(shù)據(jù)管理標準體系構(gòu)建
陳 麗1,2,王啟現(xiàn)3,劉 娟1,2※,崔運鵬1,2,王 末1,2
(1. 中國農(nóng)業(yè)科學院農(nóng)業(yè)信息研究所,北京 100081;2. 農(nóng)業(yè)農(nóng)村部農(nóng)業(yè)大數(shù)據(jù)重點實驗室,北京 100081;3. 中國農(nóng)業(yè)科學院成果轉(zhuǎn)化局,北京 100081)
農(nóng)業(yè)科學數(shù)據(jù)作為重要戰(zhàn)略性資源,在推動農(nóng)業(yè)科技創(chuàng)新、增強農(nóng)業(yè)科技競爭力方面發(fā)揮重要作用。農(nóng)業(yè)科研試驗基地是一手科研數(shù)據(jù)的主要來源,其數(shù)據(jù)管理標準體系的建立不僅是試驗基地數(shù)據(jù)規(guī)范化管理的基礎(chǔ),也是規(guī)范化數(shù)據(jù)管理工作的重要一環(huán),對于提高數(shù)據(jù)可復(fù)用性,最大程度發(fā)揮數(shù)據(jù)價值有重要意義。該研究通過國內(nèi)外涉農(nóng)長期觀測網(wǎng)絡(luò)、試驗站數(shù)據(jù)管理標準體系內(nèi)容梳理,以及對中國農(nóng)業(yè)科研試驗基地數(shù)據(jù)特點、數(shù)據(jù)全生命周期管理流程調(diào)研,構(gòu)建了農(nóng)業(yè)科研試驗基地數(shù)據(jù)管理統(tǒng)一工作流;基于“霍爾三維結(jié)構(gòu)”從標準適用數(shù)據(jù)管理階段、標準性質(zhì)、標準專業(yè)領(lǐng)域3個維度構(gòu)建農(nóng)業(yè)科研試驗基地數(shù)據(jù)管理標準體系框架,并編制了農(nóng)業(yè)科研試驗基地數(shù)據(jù)管理標準體系基本構(gòu)成表,梳理出涵蓋數(shù)據(jù)全生命周期管理的標準20項,首期必建標準12項,以期為推進農(nóng)業(yè)科研試驗基地建設(shè)和數(shù)據(jù)管理共享提供支撐。
科學數(shù)據(jù);標準規(guī)范體系;農(nóng)業(yè)科研試驗基地;數(shù)據(jù)管理
隨著新一代信息技術(shù)與科學研究過程的結(jié)合,數(shù)據(jù)密集型科學發(fā)現(xiàn)已成為繼“經(jīng)驗科學(亦稱實驗科學)”、“理論科學”和“計算科學”之后的第四科研范式,推動科學研究由傳統(tǒng)的假設(shè)驅(qū)動向基于科學數(shù)據(jù)進行探索的科學方法轉(zhuǎn)變[1]。科學數(shù)據(jù)不僅是科研活動的產(chǎn)物,還是科研活動開展的基礎(chǔ)。到20世紀90年代,科學數(shù)據(jù)已被提高到科技發(fā)展“牽引力”的高度[2]。同樣,在農(nóng)業(yè)領(lǐng)域,隨著農(nóng)業(yè)信息化、數(shù)字化、智能化發(fā)展,農(nóng)業(yè)科學數(shù)據(jù)面臨著爆發(fā)式的產(chǎn)生、衍變和積累。農(nóng)業(yè)科學數(shù)據(jù)作為重要戰(zhàn)略性資源,在推動農(nóng)業(yè)科技創(chuàng)新、增強農(nóng)業(yè)科技競爭力方面也將發(fā)揮重要作用。
農(nóng)業(yè)生產(chǎn)是自然再生產(chǎn)與經(jīng)濟再生產(chǎn)相互交織的過程。與其他科研領(lǐng)域相比,農(nóng)業(yè)科研具有試驗(或?qū)嶒灒┬赞r(nóng)學研究的特點,必須依靠分布在全國各地的農(nóng)業(yè)科研試驗基地,面向農(nóng)業(yè)一線生產(chǎn)開展研究[3]。據(jù)不完全統(tǒng)計,目前全國各級各類涉農(nóng)科研機構(gòu)、院校建立的以科研用途為主的農(nóng)業(yè)試驗基地1 000余個[4],有效支撐了國家重點研發(fā)計劃、國家自然科學基金、省級及地方、科研單位等的研究項目,成為科技創(chuàng)新、成果轉(zhuǎn)化、科技信息輻射和交流合作的重要平臺[5-8]。同時,隨著信息化和科研手段的提升,基于農(nóng)業(yè)科研試驗基地的觀測、監(jiān)測、實驗,產(chǎn)生并快速積累起一大批有價值的農(nóng)業(yè)科學數(shù)據(jù)資源。然而,由于絕大多數(shù)數(shù)據(jù)的收集都是依靠相關(guān)科研項目的支持,造成數(shù)據(jù)采集不連續(xù)、保存分散、缺乏統(tǒng)一規(guī)范化治理,可關(guān)聯(lián)、可比較和分析價值大打折扣。
因此,本研究通過梳理國內(nèi)外涉農(nóng)長期觀測網(wǎng)絡(luò)、試驗站數(shù)據(jù)管理標準體系,基于中國農(nóng)業(yè)科研試驗基地數(shù)據(jù)特點及全生命周期數(shù)據(jù)管理流程,從3個維度構(gòu)建農(nóng)業(yè)科研試驗基地數(shù)據(jù)管理標準體系框架,以期為推進農(nóng)業(yè)科研試驗基地建設(shè)和數(shù)據(jù)統(tǒng)一規(guī)范治理與共享提供支撐。
目前,國內(nèi)外涉農(nóng)領(lǐng)域的“Experimental Station”、“Experimental Farm”、“Research Station”、“Observation and Research Station”、“野外觀測站”、“野外試驗站”、“試驗基地”、“實驗站”等表述各異的觀測/監(jiān)測/試驗/實驗站點所獲取數(shù)據(jù)的標準化管理,多集中于生態(tài)系統(tǒng)、氣候、環(huán)境等反映自然現(xiàn)象動態(tài)變化的持續(xù)觀測數(shù)據(jù)方面,通過構(gòu)建國家、區(qū)域性或全球性的長期觀測研究網(wǎng)絡(luò)實現(xiàn)統(tǒng)一標準下的數(shù)據(jù)規(guī)范化管理與共享。僅有少數(shù)如英國洛桑試驗站(1843年)這種集作物學、遺傳學、生化與分子生物學、生物統(tǒng)計學、昆蟲學、土壤學、植物營養(yǎng)學和植物保護學等諸多學科為一體的綜合性長期試驗站點,建有專門的數(shù)據(jù)管理分析團隊和企業(yè)、數(shù)據(jù)管理標準體系以及數(shù)據(jù)發(fā)布與共享網(wǎng)站[9]。中國農(nóng)業(yè)科研試驗基地建設(shè)以及數(shù)據(jù)共享管理起步較晚,除部分納入長期觀測研究網(wǎng)絡(luò)中的農(nóng)業(yè)試驗基地數(shù)據(jù)管理有標準可依外,大部分農(nóng)業(yè)科研試驗基地數(shù)據(jù)管理標準體系不健全,處于無序、散亂、可用性差的原始數(shù)據(jù)管理階段。
通過表1梳理,也可以看出,國內(nèi)外觀監(jiān)測網(wǎng)絡(luò)雖然對其網(wǎng)絡(luò)內(nèi)部試驗站數(shù)據(jù)的規(guī)范化管理制定了相關(guān)標準規(guī)范,但主要還是立足于觀監(jiān)測網(wǎng)絡(luò)層級的數(shù)據(jù)統(tǒng)一匯交管理和促進數(shù)據(jù)共享,與試驗基地層級數(shù)據(jù)管理仍有一定區(qū)別[10-16]。各觀監(jiān)測網(wǎng)絡(luò)數(shù)據(jù)管理標準規(guī)范可作為本研究標準體系建設(shè)內(nèi)容的重要參考,若要提高各農(nóng)業(yè)科研試驗基地自身的數(shù)據(jù)管理和利用水平,尚需結(jié)合中國農(nóng)業(yè)科研試驗基地數(shù)據(jù)特點和數(shù)據(jù)管理流程,構(gòu)建科學、有效的標準規(guī)范體系。
表1 國內(nèi)外觀監(jiān)測網(wǎng)絡(luò)數(shù)據(jù)管理標準規(guī)范
注:數(shù)據(jù)管理標準來自7大國內(nèi)外長期監(jiān)測網(wǎng)絡(luò)、數(shù)據(jù)中心的數(shù)據(jù)管理網(wǎng)站,未通過網(wǎng)站對外公布的標準未計入本表。
Note: The data management standards came from the data management websites of 7 major domestic and foreign long-term monitoring networks and data centers. The standards not published through the websites are not included in this table.
農(nóng)業(yè)科研試驗基地是農(nóng)業(yè)科技創(chuàng)新活動重要載體,根據(jù)功能定位不同,各有側(cè)重的從事科學(田間)試驗、科學觀測、技術(shù)集成和工藝優(yōu)化試驗等科研活動及科研成果示范、展示、推廣活動[17],也有一些實力較強的綜合試驗站,承擔了科研實驗、長期科學觀測、監(jiān)測以及技術(shù)集成示范等多項功能。農(nóng)業(yè)科研試驗基地不僅是一手科研數(shù)據(jù)的主要來源,而且集聚了類型各異的海量科研數(shù)據(jù)。
農(nóng)業(yè)科研試驗基地數(shù)據(jù)類型,根據(jù)學科領(lǐng)域[18-19]不同,分為農(nóng)業(yè)氣象、土壤、農(nóng)藝、園藝、植物保護、農(nóng)業(yè)工程、畜牧、水產(chǎn)等方面的科研試驗數(shù)據(jù);根據(jù)數(shù)據(jù)獲取方式[20]不同,分為觀測數(shù)據(jù)、實驗數(shù)據(jù)、試驗數(shù)據(jù)、監(jiān)測數(shù)據(jù)、檢測數(shù)據(jù)以及調(diào)查數(shù)據(jù)等;根據(jù)數(shù)據(jù)類型不同,可以分為數(shù)值型數(shù)據(jù)、文本型數(shù)據(jù)、遙感數(shù)據(jù)、圖像及視頻數(shù)據(jù);根據(jù)數(shù)據(jù)實際保存主體不同,可以分為試驗基地采集保存數(shù)據(jù)(也稱為自有數(shù)據(jù))、科研人員或團隊依托試驗基地采集并保存數(shù)據(jù)(也稱為長尾數(shù)據(jù))。由于長尾數(shù)據(jù)[21]通常由個人或小團隊為特定目的收集,數(shù)據(jù)多源、多尺度、時序性短、高度分散,雖然單個數(shù)據(jù)集體積小但整體數(shù)量龐大,通過科學制定農(nóng)業(yè)科研試驗基地數(shù)據(jù)管理標準體系,疏通數(shù)據(jù)管理路徑,將這部分數(shù)據(jù)納入所依托科研試驗基地的整體數(shù)據(jù)管理體系,對于促進其廣泛利用共享,關(guān)聯(lián)分析、最大化其數(shù)據(jù)價值意義重大。
農(nóng)業(yè)科研試驗基地數(shù)據(jù)特點:1)多源異構(gòu)性。農(nóng)業(yè)科研試驗基地數(shù)據(jù)的多源性,一方面體現(xiàn)在領(lǐng)域上,涉及農(nóng)業(yè)氣象、土壤、作物栽培、種質(zhì)資源、病蟲害測報、有害生物防治等多方面的數(shù)據(jù);另一方面體現(xiàn)在獲取手段上,既包括傳統(tǒng)的觀測、調(diào)查數(shù)據(jù),也包括各類科學儀器設(shè)備的監(jiān)測、檢測、模擬、分析數(shù)據(jù)等。數(shù)據(jù)的涉及面廣而復(fù)雜,數(shù)據(jù)獲取手段的多樣性,也就造成了其異構(gòu)性特點,數(shù)據(jù)類型、結(jié)構(gòu)、存儲格式等各異,對數(shù)據(jù)進行描述的元數(shù)據(jù)標準也差異較大。2)小集中、大分散。數(shù)據(jù)多散落在各農(nóng)業(yè)科研團隊或科研人員中,試驗基地作為一個科研試驗載體,在數(shù)據(jù)管理上沒有發(fā)揮應(yīng)有的數(shù)據(jù)匯聚作用。全國尺度來看,也是如此,沒有形成一個有效的農(nóng)業(yè)科研試驗基地數(shù)據(jù)匯聚管理和共享平臺,數(shù)據(jù)廣泛散落在全國各地、各單位機構(gòu)和個人手中。此外,從數(shù)據(jù)量的角度看,無論是單個農(nóng)業(yè)科研試驗基地還是立足全國,都是處于集中管理的數(shù)據(jù)少,分散管理的數(shù)據(jù)量大。3) 數(shù)據(jù)時序短、連續(xù)性差。除開展長期觀測研究獲取的數(shù)據(jù)外,農(nóng)業(yè)科研試驗基地的大部分數(shù)據(jù)采集具有嚴重的項目跟隨特點,項目結(jié)束,數(shù)據(jù)采集也告結(jié)束。4)標準化程度低,共享不充分?;谵r(nóng)業(yè)科研試驗基地數(shù)據(jù)多源異構(gòu)的特性以及當前數(shù)據(jù)小集中、大分散的現(xiàn)狀,導致農(nóng)業(yè)科學數(shù)據(jù)不完整、質(zhì)量參差不齊等問題非常顯著。除少數(shù)參與到國家某一長期觀測網(wǎng)絡(luò)中或項目有數(shù)據(jù)匯交要求的科研試驗基地采集數(shù)據(jù)有部分共享外,鮮有科研試驗基地建有數(shù)據(jù)庫和數(shù)據(jù)管理標準規(guī)范,支撐數(shù)據(jù)統(tǒng)一治理與共享。
通過對中國農(nóng)業(yè)科學院新鄉(xiāng)綜合試驗基地、中國農(nóng)業(yè)大學曲周試驗站等農(nóng)業(yè)科研單位、高校試驗基地數(shù)據(jù)管理狀況調(diào)研,本研究梳理了當前農(nóng)業(yè)科研試驗基地常規(guī)化數(shù)據(jù)管理的工作流模式(圖1a和圖1b),并基于數(shù)據(jù)的全生命周期管理[22-23],提出統(tǒng)一標準體系框架下農(nóng)業(yè)科研試驗基地規(guī)范化數(shù)據(jù)管理工作流模式(圖 1c)。
目前,中國農(nóng)業(yè)科研試驗基地數(shù)據(jù)基本處于圖1a和圖1b兩種割裂的管理模式下。圖1a模式下,研究人員依托試驗基地開展觀測、試驗、檢測、調(diào)查或監(jiān)測等科研活動采集獲取數(shù)據(jù),數(shù)據(jù)經(jīng)過加工、分析后,一方面形成研究成果隨論文出版或直接數(shù)據(jù)出版;另一方面形成各類數(shù)據(jù)集,被研究人員保存管理。對于已經(jīng)出版的數(shù)據(jù),用戶可以直接通過網(wǎng)絡(luò)獲?。粚τ谘芯咳藛T手中的各數(shù)據(jù)集數(shù)據(jù),無論是外部用戶還是內(nèi)部用戶均需向研究人員提出數(shù)據(jù)需求,并等待研究人員的反饋。由于此數(shù)據(jù)“申請-反饋”途徑非公開化,且研究人員沒有對外提供數(shù)據(jù)服務(wù)的義務(wù),因此,與內(nèi)部用戶相比,外部用戶往往很難通過此途徑獲取到數(shù)據(jù),或只能獲取到很少量的數(shù)據(jù)。圖1b模式下,農(nóng)業(yè)科研試驗基地數(shù)據(jù)采集、加工、分析、存儲、共享的全生命周期數(shù)據(jù)管理與圖1a模式基本完全相同,僅缺少了研究成果形成階段。這是由于絕大部分農(nóng)業(yè)科研試驗基地獨自開展科研能力比較有限,主要還是承擔一些農(nóng)業(yè)及相關(guān)領(lǐng)域的科學觀測、監(jiān)測等任務(wù),或協(xié)助研究人員開展科研試驗、調(diào)研等,幾乎沒有文章出版或數(shù)據(jù)出版環(huán)節(jié)。
在割裂的數(shù)據(jù)管理模式下,無論是研究人員的數(shù)據(jù)管理還是科研試驗基地的數(shù)據(jù)管理,一般都會制定簡單的數(shù)據(jù)管理計劃,數(shù)據(jù)也是掌握在采集者手中,由于缺乏專業(yè)、統(tǒng)一的農(nóng)業(yè)科研試驗基地數(shù)據(jù)管理標準體系,數(shù)據(jù)共享、可復(fù)用率很低,數(shù)據(jù)價值難以得到充分挖掘和實現(xiàn)。而基于統(tǒng)一的數(shù)據(jù)管理標準體系,圖1c模式下可以有效解決數(shù)據(jù)“小集中、大分散”的問題,將研究人員和試驗基地采集數(shù)據(jù)匯交起來,形成規(guī)范的專業(yè)數(shù)據(jù)集和對應(yīng)的統(tǒng)一數(shù)據(jù)治理,幫助用戶更好的發(fā)現(xiàn)數(shù)據(jù)、獲得數(shù)據(jù)、利用數(shù)據(jù)。用戶直接向分離出的專門的數(shù)據(jù)管理部門/組織提出數(shù)據(jù)需求,在統(tǒng)一的數(shù)據(jù)共享開放的原則下,獲得數(shù)據(jù)。相較于直接向數(shù)據(jù)所有者申請數(shù)據(jù),提升了用戶發(fā)現(xiàn)數(shù)據(jù)的概率,而且由于有專門的數(shù)據(jù)匯交治理工具和人員,數(shù)據(jù)質(zhì)量也可得到有效保障。
注:①內(nèi)部用戶:指與數(shù)據(jù)所有者之間有研究項目、任務(wù)等紐帶聯(lián)系的其他研究人員,即同一科研項目或任務(wù)下,數(shù)據(jù)所有者以外的其他參與研究人員或團隊成員;②外部用戶:指與數(shù)據(jù)所有者之間沒有形成研究項目、任務(wù)等紐帶聯(lián)系的其他研究人員。
在國家《科學數(shù)據(jù)管理辦法》的指導下,參照《中華人民共和國國家標準(GB/T 13016—2018):標準體系構(gòu)建原則和要求》中有關(guān)規(guī)定以及相關(guān)研究[24-25],結(jié)合農(nóng)業(yè)科研試驗基地數(shù)據(jù)管理特點,確定標準體系構(gòu)建原則。主要包括以下3個方面:
1)全面覆蓋、層次清晰原則。標準體系應(yīng)覆蓋農(nóng)業(yè)科研試驗基地數(shù)據(jù)全生命周期管理過程,根據(jù)標準性質(zhì)、適用數(shù)據(jù)管理階段和標準之間的共性特點,體現(xiàn)一定的層次性。為便于理解、減少復(fù)雜性,標準體系的層次也不宜太多。
2)結(jié)構(gòu)合理、有效銜接原則。科學數(shù)據(jù)管理不是簡單的數(shù)據(jù)標準化,還涉及從數(shù)據(jù)采集、加工、存儲、共享等工作業(yè)務(wù)流程和數(shù)據(jù)管理工作,標準體系構(gòu)建既要滿足基本建設(shè)需要,又要形成結(jié)構(gòu)合理的系統(tǒng)內(nèi)容,涵蓋技術(shù)、工作、管理等多方面。此外,體系內(nèi)部標準規(guī)范之間應(yīng)相互銜接,避免內(nèi)容重復(fù)或彼此脫節(jié);與國內(nèi)外數(shù)據(jù)監(jiān)測、管理網(wǎng)絡(luò)/平臺數(shù)據(jù)管理系統(tǒng)之間,注重有效銜接,促進數(shù)據(jù)的開放共享。
3)循序漸進、重點突出原則。農(nóng)業(yè)科研試驗基地屬于基礎(chǔ)數(shù)據(jù)采集管理單位,數(shù)據(jù)管理工作經(jīng)驗不足、人員配備有限,標準體系構(gòu)建應(yīng)根據(jù)試驗基地開展數(shù)據(jù)管理工作的階段特點和實際情況,循序漸進、重點突出制定不可或缺的核心標準規(guī)范,以最小資源投入獲得最大的標準化效果。
本研究借鑒美國系統(tǒng)工程專家霍爾(Hall A D)[26]提出的系統(tǒng)工程方法論“霍爾三維結(jié)構(gòu)”,即從時間維、邏輯維和知識維來解釋系統(tǒng)工程的一般過程,從農(nóng)業(yè)科研試驗基地數(shù)據(jù)管理過程流和工作內(nèi)容實際出發(fā),通過建立“霍爾三維結(jié)構(gòu)”下系統(tǒng)工程一般過程到農(nóng)業(yè)科研試驗基地數(shù)據(jù)管理過程映射關(guān)系(表2),構(gòu)建了適用于農(nóng)業(yè)科研試驗基地數(shù)據(jù)管理的標準體系三維結(jié)構(gòu),如圖2所示。從標準適用數(shù)據(jù)管理階段維度看,農(nóng)業(yè)科研試驗基地數(shù)據(jù)管理標準體系構(gòu)建應(yīng)圍繞的從數(shù)據(jù)采集到加工、匯交(存儲)、共享不斷推進的全生命周期管理流程,每個數(shù)據(jù)管理階段都應(yīng)有相應(yīng)的標準規(guī)范作為依據(jù)和指導;從標準性質(zhì)維度看,農(nóng)業(yè)科研試驗基地數(shù)據(jù)管理標準體系應(yīng)包括技術(shù)標準、工作標準和管理標準,不同性質(zhì)標準互為補充,保障數(shù)據(jù)管理工作規(guī)范有序開展;從標準專業(yè)領(lǐng)域維度看,指導類標準是基礎(chǔ),數(shù)據(jù)類標準是核心,管理類標準是保障。
表2 “霍爾三維結(jié)構(gòu)”到農(nóng)業(yè)科研試驗基地數(shù)據(jù)管理三維結(jié)構(gòu)映射關(guān)系
圖2 農(nóng)業(yè)科研試驗基地數(shù)據(jù)管理標準體系三維結(jié)構(gòu)圖
基于圖2,本研究采用主客觀相結(jié)合的方法對農(nóng)業(yè)科研試驗基地數(shù)據(jù)管理標準規(guī)范進行篩選以及必要性的判斷,具體步驟如下:
步驟1:體系表內(nèi)容初選。在農(nóng)業(yè)科研試驗基地數(shù)據(jù)管理標準體系三維架構(gòu)下,以國內(nèi)外觀監(jiān)測網(wǎng)絡(luò)數(shù)據(jù)管理標準規(guī)范和“國家科技基礎(chǔ)條件平臺中心”“國家生態(tài)系統(tǒng)觀測研究共享服務(wù)平臺”“國家地球系統(tǒng)科學數(shù)據(jù)共享平臺”“國家農(nóng)業(yè)科學數(shù)據(jù)共享平臺”等制定的有關(guān)數(shù)據(jù)管理系列標準規(guī)范為參考,結(jié)合農(nóng)業(yè)科研試驗基地數(shù)據(jù)管理標準體系建設(shè)基本情況和需求調(diào)研,進行標準規(guī)范體系表內(nèi)容初步篩選。
步驟2:專家評議。根據(jù)評價目的,將標準規(guī)范的重要程度劃分為4個等級:不重要(建議剔除)、一般(非必建)、重要(必建)、非常重要(必建),分別用1、2、3、4來代表不同等級。評議專家由科學數(shù)據(jù)管理、科研試驗基地管理兩個領(lǐng)域的專家組成,專家可以在初步篩選結(jié)果基礎(chǔ)上新增標準規(guī)范,并進行評級。
本研究共進行了2輪專家評議,第1輪是針對步驟1初步篩選出的24項標準規(guī)范進行專家評議,第2輪是對第一輪新增標準規(guī)范和評議測算結(jié)果進行研討,確定出數(shù)據(jù)全生命周期管理需要建設(shè)的20項標準規(guī)范、標準規(guī)范內(nèi)容描述以及首期必建標準規(guī)范12項,以指導農(nóng)業(yè)科研試驗基地的標準體系建設(shè)工作落實(表3)。各農(nóng)業(yè)科研試驗基地可以根據(jù)自身建設(shè)階段、數(shù)據(jù)管理要求和涉及階段在12項必建標準規(guī)范基礎(chǔ)上,不斷進行充實和完善。
表3 農(nóng)業(yè)科研試驗基地數(shù)據(jù)管理標準體系表
農(nóng)業(yè)科研試驗基地數(shù)據(jù)管理標準體系是一項系統(tǒng)工程,對于推動基層試驗基地數(shù)據(jù)規(guī)范化管理有重要支撐作用。本研究通過對國內(nèi)外涉農(nóng)長期觀測網(wǎng)絡(luò)、試驗站數(shù)據(jù)管理標準體系內(nèi)容梳理,以及對中國農(nóng)業(yè)科研試驗基地數(shù)據(jù)特點、數(shù)據(jù)全生命周期管理流程調(diào)研,構(gòu)建了農(nóng)業(yè)科研試驗基地數(shù)據(jù)管理統(tǒng)一工作流;基于“霍爾三維結(jié)構(gòu)”從標準適用階段、標準性質(zhì)、標準專業(yè)領(lǐng)域3個維度構(gòu)建農(nóng)業(yè)科研試驗基地數(shù)據(jù)管理標準體系框架,并編制了農(nóng)業(yè)科研試驗基地數(shù)據(jù)管理標準體系基本構(gòu)成表,以期為推進農(nóng)業(yè)科研試驗基地建設(shè)和數(shù)據(jù)管理共享提供支撐。
1)通過分析總結(jié),農(nóng)業(yè)科研試驗基地數(shù)據(jù)在涉及學科領(lǐng)域、數(shù)據(jù)獲取方式、數(shù)據(jù)類型以及管理保存主體等方面均展示出了類型的多樣性,并具有:①多源異構(gòu)性;②小集中、大分散;③數(shù)據(jù)時序短、連續(xù)性差;④標準化程度低、共享不充分的數(shù)據(jù)特點。制定科學合理的數(shù)據(jù)管理標準體系,疏通數(shù)據(jù)管理路徑,對于農(nóng)業(yè)科研試驗基地規(guī)范化數(shù)據(jù)管理以及將長尾數(shù)據(jù)納入統(tǒng)一管理,有重要推動和促進作用。
2)在當前農(nóng)業(yè)科研試驗基地自有數(shù)據(jù)與長尾數(shù)據(jù)割裂管理模式下,構(gòu)建了集二者于一體的統(tǒng)一數(shù)據(jù)管理工作流,有效解決了數(shù)據(jù)“小集中、大分散”的問題,同時數(shù)據(jù)典藏共享作為一項專門的服務(wù),從前端采集分析工作中分離出來,直接面向用戶,將大大提升用戶發(fā)現(xiàn)數(shù)據(jù)的概率,保障數(shù)據(jù)質(zhì)量,并有效減輕數(shù)據(jù)所有者管理數(shù)據(jù)的工作量。
3)通過建立“霍爾三維結(jié)構(gòu)”下系統(tǒng)工程一般過程到農(nóng)業(yè)科研試驗基地數(shù)據(jù)管理過程映射關(guān)系,構(gòu)建了適用于農(nóng)業(yè)科研試驗基地數(shù)據(jù)管理的標準體系三維結(jié)構(gòu),并通過多輪專家評議形成了農(nóng)業(yè)科研試驗基地數(shù)據(jù)管理標準體系表。該表以標準體系建立的三項核心原則為主旨,圍繞數(shù)據(jù)全生命周期管理,提出農(nóng)業(yè)科研試驗基地標準體系建設(shè)基本標準規(guī)范20項,核心必建標準規(guī)范12項,用于指導不同農(nóng)業(yè)科研試驗基地的個性化標準體系建設(shè),實現(xiàn)以最小資源投入獲得最大的標準化效果。
本研究為農(nóng)業(yè)科研試驗基地數(shù)據(jù)管理標準規(guī)范編制明確了方向,為農(nóng)業(yè)科研試驗基地數(shù)據(jù)科學、持續(xù)、高效管理奠定了基礎(chǔ),目前雖然尚未開展實例應(yīng)用,無法評估該套標準體系的適用效果,但下一步將以農(nóng)業(yè)科學院“試驗基地項目”為依托,開展部分試驗地基的標準體系落地應(yīng)用和成效評價。
此外,標準體系建設(shè)是農(nóng)業(yè)科研試驗基地數(shù)據(jù)規(guī)范化管理的基礎(chǔ),也是規(guī)范化數(shù)據(jù)管理工作的重要一環(huán),其能否在農(nóng)業(yè)科研試驗基地數(shù)據(jù)管理工作中發(fā)揮良好的效用,還面臨一個巨大挑戰(zhàn),即如何打通試驗基地生產(chǎn)數(shù)據(jù)的各匯集通道,將數(shù)據(jù)(尤其是長尾數(shù)據(jù))集中管理起來,還需要建立一套完整的協(xié)作機制。
[1]鄧仲華,李志芳. 科學研究范式的演化:大數(shù)據(jù)時代的科學研究第四范式[J]. 情報資料工作,2013,34(4):19-23. Deng Zhonghua, Li Zhifang. The evolution of scientific research paradigm: The fourth paradigm of scientific research in the era of big data[J]. Information and Documentation Services, 2013, 34(4): 19-23. (in Chinese with English abstract)
[2]孫鴻烈,劉闖. 國際科學技術(shù)數(shù)據(jù)前沿領(lǐng)域發(fā)展研究[J]. 地球科學進展,2003,18(3):329-333. Sun Honglie, Liu Chuang. Frontier research of international science and technology data[J]. Advances in Earth Science, 2003, 18(3): 329-333. (in Chinese with English abstract)
[3]王啟現(xiàn),潘燕榮,邱國梁,等.農(nóng)業(yè)科研試驗基地在鄉(xiāng)村振興中的地位與作用[J]. 浙江農(nóng)業(yè)科學,2019,60(2):180-183. Wang Qixian, Pan Yanrong, Qiu Guoliang, et al. The position and function of agricultural scientific research and experiment station in rural vitalization[J]. Journal of Zhejiang Agricultural Sciences, 2019, 60(2): 180-183.(in Chinese with English abstract)
[4]王啟現(xiàn),位運糧,吳曉磊,等. 典型發(fā)達國家農(nóng)業(yè)科研試驗基地管理的幾點做法及對我國的啟示[J]. 農(nóng)業(yè)科技管理,2018,37(1):52-55. Wang Qixian, Wei Yunliang, Wu Xiaolei, et al. Experience of management of agricultural scientific research experimental base in typical developed countries and its enlightenment to China[J]. Management of Agricultural Science and Technology, 2018, 37(1): 52-55. (in Chinese with English abstract)
[5]王濤,徐秀娟,佘磊,等. 農(nóng)業(yè)科研試驗基地服務(wù)鄉(xiāng)村振興戰(zhàn)略SWOT分析與路徑探究——以安徽省農(nóng)業(yè)科學院為例[J]. 安徽農(nóng)業(yè)科學,2018,46(36):212-213,224. Wang Tao, Xu Xiujuan, She Lei, et al. SWOT analysis and path exploration of agricultural research experimental base serving rural revitalization strategy—A case study of Anhui academy of agricultural sciences[J]. Journal of Anhui Agricultural Sciences, 2018, 46(36): 212-213, 224. (in Chinese with English abstract)
[6]戰(zhàn)徊旭,張忠鋒,許立峰,等. 農(nóng)業(yè)科研試驗基地在鄉(xiāng)村振興中的引領(lǐng)作用:以中國農(nóng)業(yè)科學院煙草研究所試驗基地為例[J]. 中國農(nóng)業(yè)資源與區(qū)劃,2019,40(2):8-12,39. Zhan Huaixu, Zhang Zhongfeng, Xu Lifeng, et al. The leading role of agricultural scientific research base in rural vitalization: Taking tobacco research institute of case as an example[J]. Chinese Journal of Agricultural Resources and Regional Planning, 2019, 40(2): 8-12, 39. (in Chinese with English abstract)
[7]鮑先巡,徐秀娟,佘磊,等. 農(nóng)業(yè)科研試驗基地管理模式探討:以安徽省農(nóng)業(yè)科學院為例[J]. 農(nóng)學學報,2017,7(12):137-140. Bao Xianxun, Xu Xiujuan, She Lei, et al. Discussions on management model of agricultural scientific research base a case study of Anhui academy of agricultural sciences[J]. Journal of Agriculture, 2017, 7(12): 137-140. (in Chinese with English abstract)
[8]張志剛,馬賓生,李瑞云. 我國農(nóng)業(yè)科研基地運行現(xiàn)狀及發(fā)展對策[J]. 農(nóng)業(yè)科研經(jīng)濟管理,2017(3):32-35. Zhang Zhigang, Ma Binsheng, Li Ruiyun. The current situation and development strategy of agricultural scientific research experimental base in China[J]. Management for Economy in Agricultural Scientific Research, 2017(3): 32-35. (in Chinese with English abstract)
[9]Rothamsted Experimental Station (RES)[EB/OL]. http://www. era.rothamroth.ac.uk/contact/
[10]International Long-term Ecological Research Network (ILER)[EB/OL]. https://www.ilter.network/
[11]UK Environmental Change Network (UK ECN)[EB/OL]. http://www.ecn.ac.uk/
[12]Long Term Ecological Research Network (LTER)[EB/OL]. https://lternet.edu/
[13]National Ecological Observatory Network (NEON)[EB/OL]. https://www.neonscience.org/
[14]Chinese Ecosystem Research Network (CERN)[EB/OL]. http://www.cern.ac.cn/0index/index.asp/
[15]National Soil Fertility and Fertilizer Effects Long-term Monitoring Network[EB/OL]. http://fla.cern. ac. cn/
[16]National Agricultural Data Center (NADC) [EB/OL]. http://www.agridata. cn/rules/regulars. aspx/
[17]王啟現(xiàn),任德芹,邱國梁. 農(nóng)業(yè)科研試驗基地的基本功能與主要分類[J]. 安徽農(nóng)業(yè)科學,2018,46(5):215-217,222. Wang Qixian, Ren Deqin, Qiu Guoliang. Study on function and classification of agricultural scientific research experimental base[J]. Journal of Anhui Agricultural Sciences, 2018, 46(5): 215-217, 222. (in Chinese with English abstract)
[18]李俊清,宋長青,周虎. 大數(shù)據(jù)背景下農(nóng)業(yè)數(shù)據(jù)資源分類及應(yīng)用前景淺析[J]. 農(nóng)業(yè)圖書情報學刊,2018,30(4):23-27. Li Junqing, Song Changqing, Zhou Hu. Analysis of agricultural data resource classification and application prospect under the background of big data[J]. Journal of Library and Information Sciences in Agriculture, 2018, 30(4): 23-27. (in Chinese with English abstract)
[19]中華人民共和國國家治理監(jiān)督檢驗檢疫總局,中國國家標準化管理委員會. GB/T 13745—2009學科分類與代碼[S]. 北京:中國標準出版社,2009.
[20]邢文明. 我國科研數(shù)據(jù)管理與共享政策保障研究[D]. 武漢:武漢大學,2014. Xing Wenming. Research on Policy Guarantee of Scientific Data Management and Sharing in China[J]. Wuhan: Wuhan University, 2014. (in Chinese with English abstract)
[21]彭秀媛. 農(nóng)業(yè)科學數(shù)據(jù)共享模式與技術(shù)系統(tǒng)研究——以遼寧省為例[D]. 北京:中國農(nóng)業(yè)科學院,2018. Peng Xiuyuan. Research on Agriculture Science Data Sharing Mode and Technology System--Taking Liaoning Province as an Example[D]. Beijing: Chinese Academy of Agricultural Sciences, 2018. (in Chinese with English abstract)
[22]Austin C C, Bloom T, Dallmeier-Tiessen S, et al. Key components of data publishing: using current best practices to develop a reference model for data publishing[J]. International Journal on Digital Libraries, 2017, 18: 77-92.
[23]Leslie H, Raleigh L M, Brandon M, et al. Data management, sharing, and reuse in experimental geomorphology: Challenges, strategies, and scientific opportunities[J]. Geomorphology, 2015, 244: 180-189.
[24]中華人民共和國國家治理監(jiān)督檢驗檢疫總局,中國國家標準化管理委員會. GB/T 13016—2018標準體系構(gòu)建原則和要求[S]. 北京:中國標準出版社,2018.
[25]石彥琴,趙躍龍,李笑光,等. 中國農(nóng)業(yè)工程建設(shè)標準體系構(gòu)架研究[J]. 農(nóng)業(yè)工程學報,2012,28(5):1-5. Shi Yanqin, Zhao Yuelong, Li Xiaoguang, et al. Infrastructure of standard system for agricultural engineering construction in China[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2012, 28(5): 1-5. (in Chinese with English abstract)
[26]劉光盛,王紅梅,胡月明,等. 中國土地利用工程標準體系框架構(gòu)建[J]. 農(nóng)業(yè)工程學報,2015,31(13):257-264. Liu Guangsheng, Wang Hongmei, Hu Yueming, et al. Infrastructure of standard system for land use engineering in China[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2015, 31(13): 257-264. (in Chinese with English abstract)
Establishment of data management standard system for agricultural scientific research and experiment station
Chen Li1,2, Wang Qixian3, Liu Juan1,2※, Cui Yunpeng1,2, Wang Mo1,2
(1.,,100081,; 2-,,100081,; 3.,,100081,)
Agricultural science data is an important strategic resource. As first-hand scientific research data producers, agricultural scientific research and experiment station gathers massive scientific research data of different types which are in a loosely managed state. So, the establishment of its data management standard system is not only a basis for standardized data management but also an important part of standardized data management work. And it is of great significance for improving data reusability and fully developing data value. In this research, by investigating the data characteristics and the whole life cycle management process of the agricultural scientific research and experiment station in China, we found that the data had four characteristics: 1) multi-source and isomerism; 2) Small data centralized management, big data decentralized management; 3) short time duration and poor continuity of data; 4) low data standardization and insufficient data sharing. And based on the problem of “small data centralized management, big data decentralized management”, we explored the workflow for routine data management in agricultural scientific research and experiment station, then designed a unified workflow. Under the fragmented data management workflow, it was usually a lack of professional and unified standard system in agricultural scientific research and experiment station, so the data sharing and reusability rate were very low, and the data value was hard to realize. But, based on a unified data management standard system, there were the specialized person responsible for data management and sharing and provided services for users, which effectively guaranteed the data quality, greatly improved the probability of the users to discover the data, and reduced the workload of the data owners to manage the data. Additionally, based on the “Hall three-dimensional structure”, we constructed the standard system framework for data management of agricultural scientific research and experiment station from three dimensions: standard application data management stage, standard features, and standard professional field. From the dimension of standard application data management stage, the data management standard system should focus on the life-cycle management process such as data collection, data processing, data archiving, data storage and sharing, and each data management stage should have corresponding standards as the basis and guidance. From the dimension of the standard features, the data management standard system should include technical standards, work standards, and management standards. And different types of standards complemented each other to ensure the orderly implementation of data management. From the dimension of the standard professional field, guidance standard was the foundation, data standard was the core and management standard was the guarantee. Based on the previous research and two rounds of expert review and discussion, the data management standard system table of agricultural scientific research and experiment station was compiled. It contained 20 standards covering the whole life cycle of data management of data. Among them, 12 standards were mandatory construction standards for the first construction phase. This table could be used to guide the construction of a personalized standard system for different agricultural scientific research and experiment stations, to achieve the maximum standardization effect with minimum resource input. This standard system was the basis of standardized data management of agricultural scientific research and experiment station and was of great significance to promote the construction of agricultural scientific research and experiment station. However, there is still a big challenge: how to get through the data collection channels to centralize the data (especially the long tail data) from different data producers? A complete collaboration mechanism is also needed.
scientific data; standard system; agricultural scientific research and experiment station; data management
陳 麗,王啟現(xiàn),劉 娟,崔運鵬,王 末. 農(nóng)業(yè)科研試驗基地數(shù)據(jù)管理標準體系構(gòu)建[J]. 農(nóng)業(yè)工程學報,2020,36(4):193-201. doi:10.11975/j.issn.1002-6819.2020.04.023 http://www.tcsae.org
Chen Li, Wang Qixian, Liu Juan, Cui Yunpeng, Wang Mo. Establishment of data management standard system for agricultural scientific research and experiment station[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2020, 36(4): 193-201. (in Chinese with English abstract) doi:10.11975/j.issn.1002-6819.2020.04.023 http://www.tcsae.org
2019-11-21
2020-02-05
中國農(nóng)業(yè)科學院基本科研業(yè)務(wù)費專項(Y2019PT27)
陳 麗,助理研究員,博士,主要從事科學數(shù)據(jù)管理、土地規(guī)劃和利用研究。Email:chenli02@caas.cn
劉 娟,副研究員,博士,主要從事農(nóng)科學數(shù)據(jù)管理及農(nóng)業(yè)領(lǐng)域應(yīng)用研究。Email:liujuan@caas.cn
10.11975/j.issn.1002-6819.2020.04.023
F306.3
A
1002-6819(2020)-04-0193-09