亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        科技基礎(chǔ)性工作專項數(shù)據(jù)匯交共享平臺建設

        2017-10-13 01:50:35佳3諸云強3王筱萱李威蓉
        中國科技資源導刊 2017年5期
        關(guān)鍵詞:科技資源用戶

        楊 杰 宋 佳3 諸云強3,4 王筱萱 孫 凱 李威蓉

        (1.中國科學院地理科學與資源研究所資源與環(huán)境信息系統(tǒng)國家重點實驗室,北京 100101;2.中國科學院大學,北京 100049;3.江蘇省地理信息資源開發(fā)與利用協(xié)同創(chuàng)新中心,江蘇南京 210023;4.白洋淀流域生態(tài)保護與京津冀可持續(xù)發(fā)展協(xié)同創(chuàng)新中心,河北保定 071002;5.山東理工大學建筑工程學院,山東淄博 255000)

        科技基礎(chǔ)性工作專項數(shù)據(jù)匯交共享平臺建設

        楊 杰1,2宋 佳1,3諸云強1,3,4王筱萱1孫 凱1,2李威蓉5

        (1.中國科學院地理科學與資源研究所資源與環(huán)境信息系統(tǒng)國家重點實驗室,北京 100101;2.中國科學院大學,北京 100049;3.江蘇省地理信息資源開發(fā)與利用協(xié)同創(chuàng)新中心,江蘇南京 210023;4.白洋淀流域生態(tài)保護與京津冀可持續(xù)發(fā)展協(xié)同創(chuàng)新中心,河北保定 071002;5.山東理工大學建筑工程學院,山東淄博 255000)

        科技基礎(chǔ)性專項工作產(chǎn)生了大量涉及多領(lǐng)域、涵蓋多類型的數(shù)據(jù)資源,只有對這些數(shù)據(jù)資源進行匯交共享,才能實現(xiàn)數(shù)據(jù)資源的增值,更好地支撐科技創(chuàng)新、國家戰(zhàn)略決策和社會經(jīng)濟發(fā)展。在充分分析科技基礎(chǔ)性工作專項數(shù)據(jù)資源跨領(lǐng)域性、類型復雜、分散性、異構(gòu)性等特點的基礎(chǔ)上,設計實現(xiàn)了科技基礎(chǔ)性工作專項數(shù)據(jù)匯交共享平臺。該平臺基于自下而上、逐步集成的數(shù)據(jù)組織框架,可有效實現(xiàn)面向多領(lǐng)域、多類型數(shù)據(jù)資源匯交共享,促進科技基礎(chǔ)性工作專項數(shù)據(jù)資源匯交共享的發(fā)展。

        匯交共享平臺;科技資源;數(shù)據(jù)資源;數(shù)據(jù)匯交;數(shù)據(jù)共享

        1 引言

        科技基礎(chǔ)性工作一般指圍繞國民經(jīng)濟社會發(fā)展和科學研究的需求而開展的獲取自然本底情況和基礎(chǔ)科學數(shù)據(jù)、系統(tǒng)編研或共享科技資料和科學數(shù)據(jù)、采集保存自然科技資源、制定科學標準規(guī)范、研制標準物質(zhì)等科學活動的統(tǒng)稱[1]。作為現(xiàn)代科技“大廈”的地基與基礎(chǔ),科技基礎(chǔ)性工作體現(xiàn)著國家整體科技水平的重要方面,對于科技進步、經(jīng)濟與社會發(fā)展和國家安全具有不可替代的作用[2],具有長期性、穩(wěn)定性、系統(tǒng)性、原始性和公益性的明顯特點。

        自1999年我國啟動科技基礎(chǔ)性工作專項以來,已經(jīng)在氣象、地球科學、生物學、農(nóng)業(yè)、林業(yè)、醫(yī)學、環(huán)境、材料等領(lǐng)域設置了大量項目,并通過這些項目采集產(chǎn)生了一批重要的科學數(shù)據(jù)、文字資料、圖集典籍、科學規(guī)范、標準物質(zhì)、樣本樣品等[3-7]。這些成果屬于科技資源的范疇,高度重視其開放共享有利于科技資源的優(yōu)化配置、高效開發(fā)和利用[8],實現(xiàn)數(shù)據(jù)資源的增值,從而更好地支撐科技創(chuàng)新、國家戰(zhàn)略決策和社會經(jīng)濟發(fā)展。為推動科技資源整合共享,2004年7月,科技部、國家發(fā)改委、財政部、教育部啟動了國家科技基礎(chǔ)條件平臺建設[9],并經(jīng)過多年的建設取得了積極進展和成效[10],相繼在多個領(lǐng)域內(nèi)建成了一批國家科技基礎(chǔ)條件平臺,例如:國家地球系統(tǒng)科學數(shù)據(jù)共享平臺、氣象科學數(shù)據(jù)共享網(wǎng)、國家農(nóng)業(yè)科學數(shù)據(jù)共享中心、林業(yè)科學數(shù)據(jù)平臺、國家人口與健康科學數(shù)據(jù)共享平臺、標本資源共享平臺、國家標準物質(zhì)資源共享平臺、國家標準文獻共享服務平臺等。這些平臺或面向單一學科領(lǐng)域,或服務于單一數(shù)據(jù)資源類型,缺乏數(shù)據(jù)匯交管理功能。雖然其他一些依托各類科學計劃建立的平臺包含了數(shù)據(jù)匯交管理的功能,但僅面向單一領(lǐng)域,例如:“973”計劃資源環(huán)境領(lǐng)域項目數(shù)據(jù)匯交服務網(wǎng)[11]僅面向資源環(huán)境領(lǐng)域的數(shù)據(jù)展開匯交共享。然而,科技基礎(chǔ)性工作專項數(shù)據(jù)資源以項目形式組織匯交,其內(nèi)容涵蓋多個學科領(lǐng)域、數(shù)據(jù)類型復雜,對匯交共享平臺跨領(lǐng)域項目、跨資源類型的數(shù)據(jù)獲取能力以及面向管理人員的項目匯交管理功能都提出了較高的要求。因此,已有平臺并不能直接運用于科技基礎(chǔ)性工作專項數(shù)據(jù)資源的匯交共享。應根據(jù)科技基礎(chǔ)性工作專項數(shù)據(jù)資源特點,研發(fā)一個綜合的系統(tǒng)平臺,力求為用戶提供“一站式”的用戶體驗。鑒于此,本文擬對科技基礎(chǔ)性工作專項數(shù)據(jù)匯交共享平臺進行初步探討。

        2 科技基礎(chǔ)性工作專項數(shù)據(jù)資源的特征

        科技基礎(chǔ)性工作專項產(chǎn)生的數(shù)據(jù)資源包括:數(shù)據(jù)、圖集、志書典籍、標本資源、標準規(guī)范、論文專著、研究報告。數(shù)據(jù)是指在基礎(chǔ)性工作中通過考察、觀測、探測、監(jiān)測、調(diào)查、試驗、試驗以及編撰等方式獲取到的各類科學數(shù)據(jù)。圖集是按照一定規(guī)則編制的圖片的集合。志書是以地區(qū)為主,綜合記錄該地自然和社會方面有關(guān)歷史與現(xiàn)狀的著作,又稱地志或地方志。典籍是古代重要文獻的總稱。標本資源是動物、植物、礦物等實物,經(jīng)過各種處理后可以長久保存,并盡量保持原貌,藉以提供作為展覽、示范、教育、鑒定、考證及其他各種研究之用。標準規(guī)范是領(lǐng)域內(nèi)共同遵守的準則和依據(jù)。論文專著是指對各學術(shù)領(lǐng)域進行研究和描述學術(shù)研究成果的文章。研究報告是指在從事一種重要活動或決策之前,對相關(guān)各種因素進行具體調(diào)查、研究、分析,評估項目可行性、效果效益程度,提出建設性意見、建議、對策等,為決策者和主管機關(guān)審批的上報文件。其中,圖集、志書典籍、標準規(guī)范、論文專著、研究報告的數(shù)據(jù)資源需要將內(nèi)容進行數(shù)字化,以電子格式文件為載體作為項目數(shù)據(jù)匯交的內(nèi)容。標本資源分為8大類:植物種質(zhì)資源、動物種質(zhì)資源、微生物菌種資源、人類遺傳資源、生物標本資源、巖礦化石資源、實驗材料資源以及標準物質(zhì)。實物不在項目數(shù)據(jù)匯交的范圍內(nèi),由項目承擔單位或科技部指定的單位保存,但需要匯交內(nèi)容為實物的基本信息描述,這些基本信息描述通過每類標本資源對應的描述規(guī)范進行約束。

        基礎(chǔ)性工作專項數(shù)據(jù)資源主要具有以下幾個方面特點。

        (1)跨領(lǐng)域性??萍蓟A(chǔ)性工作專項數(shù)據(jù)資源涉及領(lǐng)域眾多,不僅涵蓋自然科學領(lǐng)域,而且包含社會科學領(lǐng)域。即使同一個基礎(chǔ)性專項產(chǎn)生的數(shù)據(jù)資源有時也會跨越多個領(lǐng)域,例如:中國北方及其毗鄰地區(qū)綜合科學考察項目產(chǎn)生了氣候、人口、社會經(jīng)濟等多個領(lǐng)域的數(shù)據(jù)。

        (2)數(shù)據(jù)類型復雜??萍蓟A(chǔ)性工作專項數(shù)據(jù)資源的數(shù)據(jù)類型包括文檔、表格、圖片、數(shù)據(jù)庫、矢量文件等類型,并且同一種數(shù)據(jù)類型又常常包含多種數(shù)據(jù)格式,如圖片數(shù)據(jù)類型包含了jpg、tiff、geotiff、png等數(shù)據(jù)格式。

        (3)分散性??萍蓟A(chǔ)性工作專項數(shù)據(jù)資源以項目的形式組織,不僅具有地域分散性,而且具有內(nèi)容分散性。地域分散性是指數(shù)據(jù)資源具有不同的空間位置屬性,而內(nèi)容分散性是指同一要素內(nèi)容的數(shù)據(jù)資源可能分散在不同的項目中,例如:多個項目中含有降水數(shù)據(jù)。

        (4)異構(gòu)性??萍蓟A(chǔ)性工作專項數(shù)據(jù)資源的異構(gòu)性是指同一要素的數(shù)據(jù)資源采用的描述規(guī)范不一致。例如:采用不同分類體系的土地覆被數(shù)據(jù)。

        3 科技基礎(chǔ)性工作專項匯交數(shù)據(jù)的組織

        目前,常用的一種做法是以元數(shù)據(jù)為核心實現(xiàn)數(shù)據(jù)檢索。該方法通過元數(shù)據(jù)對資源的屬性特征進行描述并將描述結(jié)果進行發(fā)布,使用戶可以通過關(guān)鍵詞與元數(shù)據(jù)進行匹配,進而定位和獲取相應資源[12]。本文從數(shù)據(jù)檢索和資源集成的角度,設計了自下而上、逐步集成的分層數(shù)據(jù)組織框架(圖1)。

        圖1 數(shù)據(jù)組織框架

        從圖1可以看出,核心元數(shù)據(jù)的形成經(jīng)過了兩次集成的過程。第一次集成過程針對的是資源實體本身,包括數(shù)字化和規(guī)范化描述兩種處理方式。數(shù)據(jù)、標準規(guī)范和研究報告數(shù)據(jù)資源的實物是指其包含的內(nèi)容信息,需要經(jīng)過數(shù)字化后以相應的電子格式文件為載體進行保存,這一步通常已經(jīng)在項目實行過程中完成。圖集、志書典籍數(shù)據(jù)資源的實物是指紙質(zhì)版的圖集及紙質(zhì)版的志書典籍,同樣需要經(jīng)過數(shù)字化得到電子版圖集和電子版志書典籍作為專項項目數(shù)據(jù)匯交的內(nèi)容。標本資源實物即為八大類資源實物本身,這類數(shù)據(jù)資源需要匯交采用相關(guān)描述標準得到的規(guī)范化描述信息表,這種信息表實質(zhì)上是一種面向標本資源的元數(shù)據(jù)。第二次集成過程針對的是第一次集成過程的結(jié)果,即數(shù)字化后的數(shù)據(jù)、圖集、志書典籍、標準規(guī)范及標本資源規(guī)范化描述信息表,最終得到科技基礎(chǔ)性工作專項匯交數(shù)據(jù)資源核心元數(shù)據(jù)。核心元數(shù)據(jù)包括各類數(shù)據(jù)資源共性特征的簡要描述和數(shù)據(jù)資源項目來源信息。同時,為了填補核心元數(shù)據(jù)內(nèi)容中有關(guān)于數(shù)據(jù)資源個性特征的缺失,數(shù)據(jù)組織框架采用將數(shù)據(jù)與相關(guān)的數(shù)據(jù)文檔和支撐數(shù)據(jù)進行關(guān)聯(lián)的方式,輔助用戶快速獲取更為詳細的數(shù)據(jù)信息。表1為核心元數(shù)據(jù)的內(nèi)容項,一共包含19項,其中16項必填,3項可選。

        該數(shù)據(jù)組織框架中的核心元數(shù)據(jù)為用戶提供了一個對各類數(shù)據(jù)資源訪問的統(tǒng)一接口。通過統(tǒng)一的接口,用戶首先可以訪問到數(shù)據(jù)的基本描述信息,進而定位到特定類型資源的詳細信息和相關(guān)項目信息,從而為匯交共享平臺實現(xiàn)跨資源類型的數(shù)據(jù)檢索提供了強大的支撐,為實現(xiàn)跨項目的數(shù)據(jù)檢索奠定了基礎(chǔ)。

        4 匯交共享平臺的設計

        科技基礎(chǔ)性工作專項數(shù)據(jù)匯交共享平臺邏輯上可以將平臺劃分為5個層次,自下而上分別是基礎(chǔ)設施層、數(shù)據(jù)層、功能層、服務層和用戶層(圖 2)。

        基礎(chǔ)設施層是匯交共享平臺正常運行的基本保障,主要包括硬件基礎(chǔ)設施和軟件基礎(chǔ)設施。硬件基礎(chǔ)設施首先是網(wǎng)絡、服務器以及大量的存儲。軟件基礎(chǔ)設施是保障共享平臺運行的軟件環(huán)境,包括一切軟件正常運行依賴的操作系統(tǒng)和各類應用服務軟件,例如數(shù)據(jù)庫管理軟件。

        數(shù)據(jù)層是對平臺中所有數(shù)據(jù)的邏輯抽象,包含了原始數(shù)字化文件、規(guī)范化描述數(shù)據(jù)、核心元數(shù)據(jù)以及平臺業(yè)務數(shù)據(jù)。原始數(shù)字化文件是未經(jīng)修改的通過項目匯交得到的原始數(shù)據(jù)。規(guī)范化描述數(shù)據(jù)是通過相關(guān)描述規(guī)范對標本資源數(shù)據(jù)類型描述的結(jié)果。核心元數(shù)據(jù)是對原始文件和規(guī)范化描述數(shù)據(jù)按照圖1的數(shù)據(jù)組織框架進行集成得到的元數(shù)據(jù)。業(yè)務數(shù)據(jù)是平臺在運行過程中產(chǎn)生的各類數(shù)據(jù),如用戶注冊信息、數(shù)據(jù)下載訂單數(shù)據(jù)等。

        功能層是對平臺所有功能等邏輯抽象,可按模塊劃分為檢索、數(shù)據(jù)下載、項目匯交管理、用戶中心和系統(tǒng)管理等部分。每個模塊又包含了若干的功能,功能之間相互配合完成對平臺內(nèi)業(yè)務流程的支撐。平臺的詳細功能設計將在下一小節(jié)進行詳細闡述。

        服務層是對功能層的封裝。將平臺功能按照一定的粒度包裝并發(fā)布成服務,為平臺內(nèi)部其他模塊或平臺外部其他系統(tǒng)進行調(diào)用,可實現(xiàn)平臺功能的重用,降低平臺代碼冗余,提高平臺開發(fā)速度。這些服務包括檢索服務、數(shù)據(jù)服務、匯交管理服務、用戶驗證服務以及資源管理服務等。

        用戶層是對平臺使用者的邏輯抽象?;A(chǔ)性共享平臺將用戶劃分為游客用戶、普通用戶和管理員用戶3類。游客用戶不需要在平臺中完成注冊,只能對項目和數(shù)據(jù)信息進行查詢?yōu)g覽,不能下載數(shù)據(jù)。普通用戶需要在平臺中完成注冊,登錄后不僅可以對數(shù)據(jù)資源進行瀏覽,而且可以下載。管理員用戶是平臺管理者,可以對平臺的資源進行日常管理,例如數(shù)據(jù)的發(fā)布和下架、新聞公告的發(fā)布等。

        科技基礎(chǔ)性工作數(shù)據(jù)匯交共享平臺的功能可以分為五大模塊,即檢索功能模塊、數(shù)據(jù)下載功能模塊、項目匯交管理模塊、用戶中心模塊以及系統(tǒng)管理模塊(圖3)。

        圖3 科技基礎(chǔ)性工作專項匯交共享平臺功能圖

        檢索功能包括項目檢索、數(shù)據(jù)檢索、資料檢索和數(shù)據(jù)訂單檢索。用戶可以通過項目檢索功能根據(jù)輸入的項目名稱、項目時間、項目承擔單位等信息查詢到需要的項目。同時,項目檢索的結(jié)果中包含有項目包括數(shù)據(jù)的鏈接,用戶可以進一步導航至具體數(shù)據(jù)資源,從而下載得到需要的數(shù)據(jù)。數(shù)據(jù)檢索功能允許用戶直接根據(jù)數(shù)據(jù)的名稱、學科名稱、數(shù)據(jù)資源類型等信息對數(shù)據(jù)進行檢索,同時檢索結(jié)果中還含有數(shù)據(jù)所屬項目信息等鏈接,可以方便用戶利用導航查詢相關(guān)項目,并進一步瀏覽或下載同一個項目的相關(guān)數(shù)據(jù)。平臺中的資料是指在基礎(chǔ)性工作數(shù)據(jù)匯交過程中制定的標準規(guī)范、培訓講義等文件,數(shù)據(jù)訂單是用戶在數(shù)據(jù)下載過程中產(chǎn)生的業(yè)務數(shù)據(jù),用戶也可以通過檢索功能對這兩類信息進行檢索。

        數(shù)據(jù)下載功能模塊是科技基礎(chǔ)性工作數(shù)據(jù)匯交共享平臺的核心模塊,是實現(xiàn)數(shù)據(jù)資源共享的關(guān)鍵環(huán)節(jié)。模塊包括數(shù)據(jù)下載、資料下載、軟件下載、論文下載等功能。數(shù)據(jù)下載是指對數(shù)據(jù)、圖集、志書典籍、標本資源規(guī)范化描述信息、標準規(guī)范、論文專著、研究報告的數(shù)字化數(shù)據(jù)資源進行下載,但需要用戶提前在平臺中注冊并登錄。數(shù)據(jù)下載的流程是:用戶先選擇需要的數(shù)據(jù)加入到數(shù)據(jù)推車中,再將數(shù)據(jù)推車中的數(shù)據(jù)生成數(shù)據(jù)訂單,平臺將根據(jù)用戶的訂單內(nèi)容將數(shù)據(jù)進行壓縮打包,用戶可在數(shù)據(jù)訂單列表中查詢到訂單處理信息,待壓縮打包完成后用戶可下載結(jié)果數(shù)據(jù)。軟件和論文是指在基礎(chǔ)性項目中輔助項目進行的軟件工具和產(chǎn)生的論文成果,這兩類數(shù)據(jù)不需要用戶在平臺中進行注冊和登錄,而是用戶通過在項目檢索結(jié)果中含有這兩類數(shù)據(jù)資源的下載鏈接直接進行下載。資料下載也不要求用戶在平臺中注冊和登錄,用戶可在資料下載頁面進行下載。

        用戶中心功能是平臺中跟用戶相關(guān)功能的集合,包括用戶注冊、用戶登錄、用戶信息修改、用戶密碼找回等功能。在注冊過程中,用戶需要填寫用戶名、用戶真實姓名、密碼、電子郵箱、聯(lián)系電話、工作單位等信息,平臺會根據(jù)用戶的輸入實時判斷用戶名和電子郵箱是否已經(jīng)被其他用戶注冊,并提示用戶。注冊完成后,用戶可以根據(jù)用戶名和密碼進行登錄。通過用戶信息修改功能,用戶可以對自己的注冊信息進行更新。利用用戶密碼找回功能,通過官方郵件向用戶注冊的郵箱發(fā)送密碼重置鏈接,用戶通過該重置鏈接可實現(xiàn)密碼重置,從而應對密碼遺忘的情況。

        項目匯交管理模塊面向管理員用戶,是協(xié)助管理員管理項目數(shù)據(jù)資源匯交過程的功能模塊,包括數(shù)據(jù)匯交審核、匯交進度查詢、匯交進度管理。基礎(chǔ)性項目數(shù)據(jù)匯交過程包括匯交方案和元數(shù)據(jù)提交、實體數(shù)據(jù)提交和驗收三大階段,匯交內(nèi)容在每個階段中只有被審核通過后才能進入下一階段。管理員通過數(shù)據(jù)匯交審核功能決定數(shù)據(jù)匯交過程能否進入下一階段。通過匯交進度查詢功能,管理員可查詢指定項目的匯交進度和處于指定匯交階段的所有項目。如匯交內(nèi)容通過審核,則管理員用戶可通過匯交進度管理功能修改項目匯交的狀態(tài)信息,更新項目匯交進度。

        系統(tǒng)管理功能模塊面向管理員用戶,包含數(shù)據(jù)管理、新聞公告發(fā)布和數(shù)據(jù)統(tǒng)計功能。管理員用戶通過數(shù)據(jù)管理功能可以實現(xiàn)數(shù)據(jù)、資料、軟件、論文等資源的發(fā)布和取消發(fā)布。新聞公告發(fā)布功能負責對平臺新聞公告版面內(nèi)容的管理。數(shù)據(jù)統(tǒng)計功能主要對平臺中的項目數(shù)、數(shù)據(jù)量、平臺訪問量等數(shù)據(jù)進行統(tǒng)計展示。

        5 平臺構(gòu)建與關(guān)鍵技術(shù)

        構(gòu)建科技基礎(chǔ)性工作專項數(shù)據(jù)匯交共享平臺采用了B/S(瀏覽器/服務器模式)結(jié)構(gòu),基于Java語言進行功能模塊的開發(fā)。平臺整體采用當前優(yōu)秀的MVC(模型、視圖、控制器)框架SpringMVC,便于其他技術(shù)框架的集成,簡化平臺維護和功能擴展流程。該平臺的前端頁面是直接和用戶交互的接口,美觀大方的頁面設計有利于用戶體驗的提升。平臺在前端頁面的搭建采用美國著名社交網(wǎng)站Tiwtter設計師開發(fā)的Bootstrap框架。該框架的組建不僅功能強大而且在不同瀏覽器上兼容性良好,即減少了平臺開發(fā)的時間也增加了平臺的穩(wěn)定性。數(shù)據(jù)持久化是將內(nèi)存中的數(shù)據(jù)保存到磁盤上加以固化,這一過程大多是通過數(shù)據(jù)庫來完成。平臺采用支持普通SQL查詢、存儲過程和高級映射到優(yōu)秀持久層框架MyBatis完成系統(tǒng)業(yè)務數(shù)據(jù)的持久化。在數(shù)據(jù)庫方面,平臺同時采用了關(guān)系型數(shù)據(jù)庫MySQL和非關(guān)系型數(shù)據(jù)庫MongoDB,兩者相互配合支撐平臺的數(shù)據(jù)存儲。關(guān)系型數(shù)據(jù)庫主要用于存儲結(jié)構(gòu)規(guī)則的規(guī)范化描述數(shù)據(jù)、核心元數(shù)據(jù)和平臺業(yè)務數(shù)據(jù);非關(guān)系數(shù)據(jù)庫用于存儲復雜的原始數(shù)字化文件結(jié)構(gòu)信息,以便于快速的文件瀏覽。

        在構(gòu)建平臺中采用了以下幾項關(guān)鍵技術(shù)。

        (1)支持跨領(lǐng)域項目、跨資源類型、遞進式檢索的數(shù)據(jù)關(guān)聯(lián)方法

        本文根據(jù)科技基礎(chǔ)性工作專項數(shù)據(jù)資源特點,設計了從資源實體到數(shù)字化數(shù)據(jù)資源再到核心元數(shù)據(jù)的自下而上、逐步集成的數(shù)據(jù)組織框架。在該框架中核心元數(shù)據(jù)的結(jié)構(gòu)設計對實現(xiàn)跨領(lǐng)域項目、跨資源類型、遞進式數(shù)據(jù)檢索功能至關(guān)重要。在核心元數(shù)據(jù)內(nèi)容中不僅包含了各種數(shù)據(jù)資源類型的共性特征,而且包含了項目來源信息。其中,數(shù)據(jù)資源共性特征實現(xiàn)了核心元數(shù)據(jù)與數(shù)據(jù)資源的關(guān)聯(lián),項目來源信息是核心元數(shù)據(jù)與項目信息連接的紐帶?;谠摂?shù)據(jù)組織框架,在縱向上,用戶可以先檢索項目信息,再檢索與項目相關(guān)的元數(shù)據(jù)信息,進而檢索到數(shù)據(jù)資源及其相關(guān)信息,從而實現(xiàn)了遞進式數(shù)據(jù)檢索;在橫向上,用戶可以檢索相同項目下的不同數(shù)據(jù)以及不同項目下的相同或相似數(shù)據(jù),實現(xiàn)了跨項目、跨資源類型的數(shù)據(jù)檢索。

        (2)高準確度的數(shù)據(jù)檢索方法

        在數(shù)據(jù)的檢索過程中,用戶通常是在平臺數(shù)據(jù)搜索頁面的搜索框中輸入與目標數(shù)據(jù)資源相關(guān)的關(guān)鍵詞,平臺則通過關(guān)鍵詞與數(shù)據(jù)庫中的核心元數(shù)據(jù)內(nèi)容進行匹配來尋找用戶需要的數(shù)據(jù)。這一做法的弊端是查詢結(jié)果的質(zhì)量高度依賴于關(guān)鍵詞與元數(shù)據(jù)分詞時所基于的詞庫,由于本文所涉及的數(shù)據(jù)資源為科技資源,專業(yè)術(shù)語眾多,致使這個問題尤為突出。因此,本文提出的解決方案是先抽取核心元數(shù)據(jù)庫中所有數(shù)據(jù)的關(guān)鍵詞內(nèi)容,將其加入到IKAnalyzer中文分詞工具的擴展詞庫中,再根據(jù)該詞庫將用戶輸入的關(guān)鍵詞和核心元數(shù)據(jù)內(nèi)容進行分詞,進而進行匹配。除此之外,平臺還對用戶的搜索關(guān)鍵詞進行記錄和統(tǒng)計,并將用戶搜索頻率較高的詞同時加入到詞庫中,從而大大增加了數(shù)據(jù)檢索的準確度,提升了用戶體驗。

        (3)大數(shù)據(jù)量文件信息的流暢展示方法

        基礎(chǔ)性工作專項匯交的原始數(shù)據(jù)組織結(jié)構(gòu)復雜,不僅存在文件夾多層嵌套的情況,而且數(shù)據(jù)文件個數(shù)從幾個到幾萬個不等,浮動很大。在大數(shù)據(jù)量的情況下,首先要在用戶的瀏覽器客戶端一次性展示上萬個文件信息,不僅對系統(tǒng)數(shù)據(jù)讀取是一個巨大的挑戰(zhàn),而且會嚴重降低數(shù)據(jù)瀏覽的用戶體驗。如果采用關(guān)系型數(shù)據(jù)庫對這些文件夾和文件的相對關(guān)系進行保存,再通過數(shù)據(jù)庫的關(guān)聯(lián)查詢實現(xiàn)數(shù)據(jù)組織結(jié)構(gòu)的重組并分頁展示,上萬級別的頻繁關(guān)聯(lián)查詢勢必降低了平臺的服務性能。本文利用這些數(shù)據(jù)資源原始文件的穩(wěn)定性(數(shù)據(jù)組織結(jié)構(gòu)一般不會變動),采用非關(guān)系型數(shù)據(jù)庫MongoDB對這些文件夾和文件的相對關(guān)系以json文件進行存儲,并進行了分頁組織。該方法實質(zhì)上是利用一種靜態(tài)化處理的思想,避免了關(guān)系型數(shù)據(jù)庫的頻繁關(guān)聯(lián)查詢,從而提高了客戶端的數(shù)據(jù)瀏覽速度,保證了平臺的性能。

        本文基于上述技術(shù)選型開發(fā)了科技基礎(chǔ)性工作專項數(shù)據(jù)匯交共享平臺的原型系統(tǒng),如圖4所示。

        圖4 科技基礎(chǔ)性工作專項數(shù)據(jù)匯交共享平臺首頁

        基于匯交共享平臺,項目主管部門可以對專項項目數(shù)據(jù)匯交進展情況進行監(jiān)督管理,項目單位及其他科研人員可以靈活高效地進行跨項目、跨類型的專項項目數(shù)據(jù)檢索和訪問。

        表2內(nèi)容是在平臺中使用“氣溫”檢索的部分結(jié)果對應核心元數(shù)據(jù)記錄的部分屬性。需要補充說明的是,限于文章篇幅,表2并未列出檢索結(jié)果的核心元數(shù)據(jù)“關(guān)鍵詞”屬性,而在表2中的第3條結(jié)果正是由于“關(guān)鍵詞”屬性含有“氣溫”一詞,故被平臺檢索到。根據(jù)檢索結(jié)果,3條檢索結(jié)果雖均為氣溫相關(guān)數(shù)據(jù),但是來源于不同的項目,所屬學科跨越了地理學、大氣科學和海洋科學,資源類型既有數(shù)據(jù)又有圖集,資源格式也各不相同?;跈z索結(jié)果,用戶可進一步獲取對應的數(shù)據(jù)資源。因此,平臺能夠為用戶提供良好的跨項目領(lǐng)域、跨資源類型共享服務。

        表2 平臺中使用“氣溫”關(guān)鍵字檢索的部分結(jié)果

        6 結(jié)語

        本文首先分析了科技基礎(chǔ)性工作專項數(shù)據(jù)資源的特點,然后結(jié)合相關(guān)數(shù)據(jù)資源描述規(guī)范,闡述了平臺數(shù)據(jù)層的組織框架,進而從平臺的邏輯層次和功能模塊角度詳述了平臺的設計過程,接著從技術(shù)選型和關(guān)鍵技術(shù)方面對平臺的實現(xiàn)過程進行了剖析,最終對平臺的不足進行了總結(jié)和展望。

        (1)在分析科技基礎(chǔ)性工作數(shù)據(jù)匯交共享平臺各類數(shù)據(jù)資源特點的基礎(chǔ)上,通過分層數(shù)據(jù)組織框架實現(xiàn)不同領(lǐng)域項目、不同類型數(shù)據(jù)資源的集成,為用戶提供“一站式”的服務體驗。

        (2)實踐證明,平臺可有效實現(xiàn)多領(lǐng)域、多資源類型的數(shù)據(jù)資源匯交共享,突破單一領(lǐng)域、單一類型數(shù)據(jù)資源共享平臺的局限性,促進科技基礎(chǔ)性工作專項數(shù)據(jù)匯交共享的發(fā)展。

        (3)平臺使用傳統(tǒng)的數(shù)據(jù)關(guān)聯(lián)方法,沒有實現(xiàn)數(shù)據(jù)資源間的語義關(guān)聯(lián),無法向用戶提供智能檢索體驗,也未能展開深度的數(shù)據(jù)挖掘并向用戶提供潛在的信息,有待今后進一步改進和完善。

        [1]中華人民共和國科學技術(shù)部.國家科技基礎(chǔ)性工作專項“十二五”專項規(guī)劃[Z].2012.

        [2]中華人民共和國科學技術(shù)部.國家“十五”科技基礎(chǔ)性工作專項實施意見[J].中國基礎(chǔ)科學, 2001(8): 31-34.

        [3]胡光曉.提升我國地層研究知名度展現(xiàn)我國地層工作最新成果: 《中國巖石地層名稱辭典》[J].科技成果管理與研究, 2015(8): 79-80.DOI: 10.3772/j.issn. 1673-6516.2015.08.029.

        [4]王訓練, 徐均濤.古生物學研究的新成果: 中國古生物志與中國各門類化石編研[J].中國基礎(chǔ)科學, 2002(5):18-23.DOI: 10.3969/j.issn.1009-2412.2002.05.004.

        [5]吳小紅.京族醫(yī)藥調(diào)查報告[J].中國民族醫(yī)藥雜志,2016, 22(3): 57-59.DOI: 10.16041/j.cnki.cn15-1175.2016.03.037.

        [6]徐福榮, 戴陸園, 韓龍植.21世紀初云南稻作地方品種圖志[M].北京: 科學出版社, 2016.

        [7]張芳, 王思.中國農(nóng)業(yè)古籍目錄[M].北京: 北京圖書館出版社, 2003.

        [8]徐冠華.加強科技資源研究促進科技資源共享[J].中國科技資源導刊, 2008, 40(3): 3-5.DOI: 10.3772/j.issn.1674-1544.2008.03.001.

        [9]葉玉江.加強科技平臺工作推進科技資源管理[J].中國科技資源導刊, 2015, 47(2): 1-6.DOI: 10.3772/j.issn. 1674-1544.2015.02.001.

        [10]國家科技基礎(chǔ)條件平臺中心.國家科技基礎(chǔ)條件平臺發(fā)展報告: 2011-2012[M].北京: 科學技術(shù)文獻出版社, 2013.

        [11]王卷樂, 楊雅萍, 諸云強, 等.“973”計劃資源環(huán)境領(lǐng)域數(shù)據(jù)匯交進展與數(shù)據(jù)分析[J].地球科學進展,2009, 24(8): 947-953.DOI: 10.3321/j.issn: 1001-8166.2009.08.013.

        [12]王建濤, 朱龍文.基于XML元數(shù)據(jù)描述的空間數(shù)據(jù)共享管理平臺的實現(xiàn)與應用[J].測繪工程, 2007, 16(1):12-15.DOI: 10.19349/j.cnki.issn1006-7949. 2007. 01. 003.

        Construction of Special Data Archiving and Sharing Platform for the Science and Technology Basic Work

        YANG Jie1,2, SONG Jia1,3, ZHU Yunqiang1,3,4, WANG Xiaoxuan1, SUN Kai1,2, LI Weirong5
        (1.State Key Laboratory of Resources and Environmental Information System, Institute of Geographic Sciences and Natural Resources Research, CAS, Beijing 100101;2.University of Chinese Academy of Sciences, Beijing100049; 3.Jangsu Center for Collaborative Innovation in Geographical Information Resource Development and Application, Nanjing 210023; 4.Center for Collaborative Innovation in Baiyangdian Basin Ecological Protection and Sustainable Development of Beijing-Tianjin-Hebei, Baoding 071002;5.School of Architecture Engineering, Shandong University of Technology, Zibo 255000)

        A large amount of data resources is produced from research projects funded by National Special Program on Basic Works for Science and Technology of China(NSPBWSTC). The content of these data resources covers multiple fi elds and data types. Sharing these data is good to make the data value-added and thereby foster the innovation in science and technology, national strategy, social and economic development.The study analyzes the characteristics of the cross-domain, complexity, dispersion and heterogeneity of thesedata resources, and designs and implements data archiving and sharing platform. The platform is based on the framework of bottom-up and step-by-step integration method. The data sharing towards multiple fi elds and data types is implemented in this platform, and also promotes the development of data archiving and sharing of NSPBWSTC.

        archiving and sharing platform, scientific and technical resources, data resources, data archiving,data sharing

        G203

        A

        10.3772/j.issn.1674-1544.2017.05.007

        楊杰(1990—),男,中國科學院地理科學與資源研究所碩士研究生,研究方向:地學模型數(shù)據(jù)匹配方法;宋佳(1980—),男,中國科學院地理科學與資源研究所助理研究員,博士,研究方向:地球信息科學(通訊作者);諸云強(1977—),男,中國科學院地理科學與資源研究所研究員,博士,研究方向:地學數(shù)據(jù)本體與共享、資源環(huán)境信息系統(tǒng);王筱萱(1983—),女,中國科學院地理科學與資源研究所工程師,碩士,研究方向:科學數(shù)據(jù)共享與集成;孫凱(1990—),男,中國科學院地理科學與資源研究所博士研究生,研究方向:地學本體及數(shù)據(jù)關(guān)聯(lián);李威蓉(1991—),男,山東理工大學建筑工程學院碩士研究生,研究方向:地學數(shù)據(jù)來源及數(shù)據(jù)關(guān)聯(lián)。

        科技基礎(chǔ)性工作專項重點項目“科技基礎(chǔ)性工作數(shù)據(jù)資料集成與規(guī)范化整編”(2013FY110900)。

        2017年7月31日。

        猜你喜歡
        科技資源用戶
        基礎(chǔ)教育資源展示
        一樣的資源,不一樣的收獲
        資源回收
        科技助我來看云
        科技在線
        資源再生 歡迎訂閱
        資源再生(2017年3期)2017-06-01 12:20:59
        關(guān)注用戶
        商用汽車(2016年11期)2016-12-19 01:20:16
        科技在線
        關(guān)注用戶
        商用汽車(2016年6期)2016-06-29 09:18:54
        關(guān)注用戶
        商用汽車(2016年4期)2016-05-09 01:23:12
        日本香蕉久久一区二区视频| 国自产拍偷拍精品啪啪一区二区| 亚洲国产精品久久人人爱| 色一情一乱一伦一区二区三欧美| 国产传媒在线视频| 隔壁人妻欲求不满中文字幕| 欧美巨鞭大战丰满少妇| 蜜臀av 国内精品久久久| 99久久人妻无码精品系列蜜桃| 亚洲国产精品色一区二区 | 老熟女老女人国产老太| 国产av无码专区亚洲av毛网站| 国产精品一区二区暴白浆| 国产三级黄色片子看曰逼大片| 91久久精品一区二区| 无码中文字幕日韩专区| 国产一区二区视频在线看| 手机在线看片| 无码手机线免费观看| www.91久久| 日本免费视频一区二区三区| 国产精品爽爽久久久久久竹菊| 国产精品 视频一区 二区三区| 蜜桃一区二区免费视频观看| 午夜国产视频一区二区三区| 久久er99热精品一区二区| 日本中文字幕不卡在线一区二区| 国产av一区二区三区狼人香蕉| 久久精品成人一区二区三区| 疯狂做受xxxx高潮欧美日本| 国产不卡视频一区二区在线观看| 一区二区三区蜜桃av| 久久精品欧美日韩精品| 国产精品一区二区在线观看完整版 | 中文字幕精品无码一区二区 | 最近高清中文在线字幕观看| 黄色三级视频中文字幕| 亚洲成人中文字幕在线视频| 军人粗大的内捧猛烈进出视频| 青春草在线视频精品| 91盗摄偷拍一区二区三区|