亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        科研數(shù)字資源平臺設(shè)計與實現(xiàn)分析

        2018-06-14 07:15:18梁家林
        軟件 2018年5期
        關(guān)鍵詞:數(shù)字資源

        王 月,閻 慧,梁家林,龍 杰

        (1. 航天工程大學(xué) 航天信息學(xué)院,北京 101416;2. 航天工程大學(xué) 研究生院,北京 101416)

        0 引言

        隨著大數(shù)據(jù)時代的來臨,數(shù)字資源基礎(chǔ)平臺的建設(shè)成為相關(guān)領(lǐng)域的重要課題之一,關(guān)于數(shù)字資源,是指經(jīng)過一定程度加工整序過的、不同類型不同學(xué)科且相對獨立的數(shù)字資源系統(tǒng),不包括網(wǎng)上無序的以及自身沒有控制的數(shù)字信息資源。數(shù)字資源是在信息技術(shù)發(fā)展下促成的文獻信息的新型表現(xiàn)形式,是將計算機技術(shù)、通信技術(shù)及多媒體技術(shù)以數(shù)字形式發(fā)布、存取、利用的信息資源的總和[1]。

        而科研數(shù)字資源泛指科研活動中產(chǎn)生的各類文本、圖像、音視頻、模型和實驗數(shù)據(jù)等,既包括各類電子儀表、傳感器、數(shù)據(jù)采集器等產(chǎn)生的直接數(shù)據(jù),也包括經(jīng)過學(xué)者處理或分析后的各種可靠的研究成果。根據(jù)互聯(lián)網(wǎng)數(shù)據(jù)中心(IDC)監(jiān)測,全球產(chǎn)生的各類數(shù)字資源量大約每兩年翻一番[2]。通過有效的采集、整理、分析和挖掘,可以從這些數(shù)字資源中挖掘重要的知識和規(guī)律。中央深改組2018年1月 23日審議通過《科學(xué)數(shù)據(jù)管理辦法》,積極推進科學(xué)數(shù)據(jù)資源開發(fā)利用和開放共享。建立開放、共享、高效的智慧數(shù)據(jù)平臺成為國內(nèi)外加強數(shù)字資源應(yīng)用效率和提高科研能力的重要課題之一。

        1 科研數(shù)字資源平臺建設(shè)的現(xiàn)狀

        目前科研數(shù)字資源平臺的建設(shè)主要體現(xiàn)在以下兩個方面:

        首先是數(shù)字圖書館,新時期數(shù)字圖書館的建設(shè)多是以知識管理為核心的智慧圖書館。在這一方面國內(nèi)外高校圖書館和期刊數(shù)據(jù)庫最具代表性,數(shù)字圖書館中所涉及的科研數(shù)字資源以學(xué)術(shù)論文為主,包括碩博士論文及期刊文獻等。

        另外則是科技信息服務(wù)平臺,此類平臺涉及的科研數(shù)字資源以科技項目、單位、專家等資料為主,也包括各行業(yè)標(biāo)準(zhǔn)、行業(yè)數(shù)據(jù)庫等,世界各國均有不同領(lǐng)域的科技信息服務(wù)平臺。如由美國國家虛擬天文臺、歐洲天體物理虛擬天文臺、英國虛擬天文臺 AstroGrid計劃共同發(fā)起成立了國際虛擬天文臺聯(lián)盟(Iternational Virtual Observatory Alliance,IVOA),將積累的全球基于地面和空間望遠鏡的天文數(shù)據(jù)建成數(shù)據(jù)集合,使天文學(xué)研究者能夠發(fā)現(xiàn)和分析這些數(shù)據(jù)[3]。美國國家地理數(shù)據(jù)中心與研究人員緊密合作,建立文件和可靠數(shù)據(jù)集,并與政府機構(gòu)、非贏利機構(gòu)、高校積極開展合作項目,鼓勵數(shù)據(jù)交換。日本社會科學(xué)數(shù)據(jù)存檔中心(SSJDA)從無法自己單獨分發(fā)數(shù)據(jù)但又愿將數(shù)據(jù)存放在SSJDA的組織和研究人員那里收集數(shù)據(jù),同時鼓勵有能力分發(fā)數(shù)據(jù)的組織和研究人員將數(shù)據(jù)進行共享[4]。我國科學(xué)技術(shù)信息研究所也正在建設(shè)國家科技管理信息系統(tǒng)公共服務(wù)平臺[5]。這些科技信息服務(wù)平臺大多由國家政府牽引,科研機構(gòu)參與建設(shè)。

        推動科研數(shù)字資源平臺建設(shè)的動力來自于各個方面,各類文獻主要從推動科學(xué)研究的發(fā)展、避免重復(fù)浪費、促進科學(xué)研究合作等方面進行探討。

        (1)支持科學(xué)質(zhì)詢,方便證實科研成果的正確性和有效性。相關(guān)學(xué)者科研通過對他人科研成果相關(guān)的支撐數(shù)據(jù)或研究結(jié)果數(shù)據(jù)等進行驗證, 從而為證實科學(xué)研究是否存在錯誤和偏差提供驗證途徑,減少科研錯誤的出現(xiàn);

        (2)為后續(xù)研究提供數(shù)據(jù)基礎(chǔ)。目前絕大多數(shù)學(xué)者都是在前人的研究基礎(chǔ)上進行深入探索,人類基因項目(Human Genome Project)的科學(xué)數(shù)據(jù)共享實踐已經(jīng)證明, 快速的數(shù)據(jù)共享為后續(xù)研究提供了便利;

        (3)建立開放共享的科研數(shù)字資源平臺可以有效打破科研壁壘,對研究機構(gòu)而言可有效利用有限的資金, 避免重復(fù)研究帶來的資源浪費[6];

        (4)有利于宏觀調(diào)控,從國家決策者和領(lǐng)域?qū)<业慕嵌?,通過科研數(shù)字資源平臺對已有資源進行分析挖掘,便于了解當(dāng)前的領(lǐng)域研究現(xiàn)狀,有利于科學(xué)有效的把握科研方向;

        (5)促進稀有數(shù)據(jù)的長期有效保存,為孤立數(shù)據(jù)(orphan data)提供存儲空間;

        (6)提高與其他科學(xué)研究者和研究機構(gòu)的合作機率。

        2 目前科研數(shù)字資源平臺建設(shè)面臨的問題

        隨著國內(nèi)外多種數(shù)字資源平臺的建設(shè),國內(nèi)諸多學(xué)者都做了相關(guān)的調(diào)研工作,結(jié)合其結(jié)論,提出幾點目前科研數(shù)字資源平臺建設(shè)需要解決的問題。

        2.1 管理系統(tǒng)陳舊,浪費資源潛力

        目前科研數(shù)字資源管理并未順應(yīng)時代的發(fā)展,在知識應(yīng)用和智慧應(yīng)用方面尚未加以研究,依然停留在老舊的一般數(shù)據(jù)管理信息系統(tǒng)中,雖然這些技術(shù)較為成熟,但難以滿足當(dāng)前科學(xué)研究中對于知識、創(chuàng)新性等需求。其次在數(shù)字資源管理方面,科研活動中所產(chǎn)生的絕大部分科研數(shù)據(jù)并未真正錄入到科研數(shù)字資源管理中,尤其是在小范圍科研活動中依然采用人工管理的方式,其所具有的挖掘潛力被浪費,給科研數(shù)字資源的利用造成了極大的不便。

        2.2 數(shù)字資源單薄,技術(shù)應(yīng)用不足

        另一方面在面對越來越多的非結(jié)構(gòu)化、半結(jié)構(gòu)化等異構(gòu)數(shù)據(jù),這些傳統(tǒng)的數(shù)據(jù)管理信息系統(tǒng)往往束手無策。目前針對數(shù)字資源管理的相關(guān)技術(shù)數(shù)量多、應(yīng)用廣,不同技術(shù)之間相互聯(lián)系、互相摻雜,在相關(guān)信息系統(tǒng)開發(fā)過程中需要數(shù)據(jù)專家針對具體環(huán)境給出具體解決方案,耗費資源巨大。而無論應(yīng)用何種技術(shù)進行數(shù)字資源管理都離不開數(shù)據(jù)的建 模過程,但數(shù)字資源的建模方法尚未形成標(biāo)準(zhǔn),沒有規(guī)范的、完整的解決途徑,從理論到方法依然不完善。

        2.3 服務(wù)功能單一,拓展能力較弱

        服務(wù)功能需要增強,目前在應(yīng)用階段,大多停留于資源檢索,對于科研數(shù)字資源的智慧應(yīng)用可以說是處于空白階段,與此相似的智慧城市、智慧校園數(shù)字資源智慧服務(wù)功能的相關(guān)研究已有受到大家認可的研究成果,因此應(yīng)當(dāng)充分考慮科研數(shù)字資源平臺的需求,借鑒智慧應(yīng)用的研究,構(gòu)建面向科研數(shù)字資源平臺的知識應(yīng)用架構(gòu),為之后建立智能應(yīng)用建立結(jié)構(gòu)基礎(chǔ)。

        3 科研數(shù)字資源平臺基礎(chǔ)架構(gòu)設(shè)計

        3.1 設(shè)計原則

        (1)打破資源壁壘。面向智慧應(yīng)用的科研數(shù)字資源平臺應(yīng)匯集相關(guān)各類數(shù)據(jù),既包括紙質(zhì)、光盤等傳統(tǒng)媒介,也包括已有科研管理系統(tǒng)中的數(shù)字資源,從結(jié)構(gòu)化的文本、數(shù)據(jù)庫資源到非結(jié)構(gòu)化的音視頻、仿真模型、實驗數(shù)據(jù)、科研成果等,都通過相應(yīng)技術(shù)手段,匯入科研數(shù)字資源平臺中。

        (2)以標(biāo)準(zhǔn)化的數(shù)據(jù)建模為核心。為提高平臺的擴展性,應(yīng)以最根本的數(shù)據(jù)管理為支撐,通過標(biāo)準(zhǔn)化的建模手段建立具有一致性的集中式或分布式數(shù)據(jù)管理平臺,為后續(xù)擴展性功能研發(fā)提供基礎(chǔ)保障。

        (3)個性化服務(wù)滿足用戶需求。針對不同用戶群體提供分級服務(wù),同時通過不同功能模塊提供個性化服務(wù),在線分析、個性化知識管理、個性化推送等,有效滿足不同用戶的不用使用需求[7]。

        3.2 總體架構(gòu)

        我國的科研數(shù)字資源平臺實踐尚處于建設(shè)的初步階段,尚未形成一定的規(guī)模,結(jié)合近幾年的大數(shù)據(jù)與云計算相關(guān)技術(shù)的發(fā)展,筆者就科研數(shù)字資源平臺的構(gòu)建提供思路如圖1所示。

        圖1 科研數(shù)字資源平臺整體架構(gòu)Fig.1 Scientific research digital resource platform

        從宏觀來看,科研數(shù)字資源平臺的總體架構(gòu)可分四層:源數(shù)據(jù)層、數(shù)據(jù)管理層、系統(tǒng)支撐層和應(yīng)用窗口層。

        (1)源數(shù)據(jù)層:通過自動或手動的方式,將歷史資源、自動識別、物聯(lián)網(wǎng)、互聯(lián)網(wǎng)等方面的科研數(shù)字資源進行采集,提供給數(shù)據(jù)管理層。

        (2)數(shù)據(jù)管理層:是整個科研數(shù)字資源平臺的核心與難點,以大數(shù)據(jù)與云計算基礎(chǔ)平臺為紐帶,綜合各種數(shù)據(jù)處理手段,系統(tǒng)支撐層提供數(shù)據(jù)支撐,通過將來自源數(shù)據(jù)層的初始數(shù)據(jù)進行過濾、整合、存儲,這一層是整個平臺的基礎(chǔ)。

        (3)系統(tǒng)支撐層:根據(jù)提出的功能需求,分別開發(fā)相應(yīng)的采集系統(tǒng)、檢索系統(tǒng)、存儲系統(tǒng)、挖掘系統(tǒng)和用戶管理系統(tǒng),通過接口與應(yīng)用窗口相連,以實現(xiàn)相關(guān)功能。

        (4)應(yīng)用窗口層:首先從需求角度出發(fā),面對可能使用該平臺的科技人員、領(lǐng)域?qū)<摇⒐芾砣藛T等分別提供公眾訪問平臺和綜合管理平臺兩個應(yīng)用窗口,前臺應(yīng)用實現(xiàn)科研數(shù)字資源的檢索、瀏覽、分析與挖掘、下載和上傳等操作,后臺應(yīng)用實現(xiàn)科研數(shù)字資源的審核、數(shù)據(jù)管理、用戶管理等工作。為適應(yīng)時代發(fā)展,其應(yīng)適用于多種不同的設(shè)備端,故應(yīng)支持異構(gòu)與分布的運行環(huán)境。

        針對目前已有或在建的數(shù)字資源平臺,提出以數(shù)據(jù)管理層為系統(tǒng)的核心,避免以往僅從用戶角度出發(fā)產(chǎn)生的功能不足的缺陷,通過建立完善的基于大數(shù)據(jù)與云計算的數(shù)據(jù)管理分析基礎(chǔ)平臺綜合管理各種數(shù)據(jù)源為系統(tǒng)提供全面的數(shù)據(jù)支撐,再通過應(yīng)用與功能層的建設(shè)滿足不同用戶的不同需求。

        4 基本實現(xiàn)技術(shù)路線

        科研數(shù)字資源平臺構(gòu)建是一個大型的系統(tǒng)工程,其中涉及的相關(guān)領(lǐng)域和學(xué)科眾多,筆者認為應(yīng)當(dāng)進行自主開發(fā),采用 java、php等開發(fā)語言,結(jié)合MySQL、Oracle等專業(yè)數(shù)據(jù)庫進行開發(fā),此方式具有較強的自主性和可適性,為避免從前期調(diào)研、開發(fā)到后期實施、應(yīng)用周期過長,應(yīng)選擇適當(dāng)?shù)墓こ涕_發(fā)方式。筆者根據(jù)提出的科研數(shù)字資源平臺基礎(chǔ)架構(gòu),提出幾點技術(shù)問題的建議。

        4.1 源數(shù)據(jù)層開發(fā)

        由于目前已有的傳統(tǒng)數(shù)字資源管理、存儲系統(tǒng)數(shù)量眾多應(yīng)用較深,盡管這些項目管理信息系統(tǒng)對應(yīng)傳統(tǒng)的項目管理特點與模式上都比較成熟,但由于智慧應(yīng)用的發(fā)展,這些傳統(tǒng)的科研管理信息系統(tǒng)并不能直接用于智慧應(yīng)用,在數(shù)據(jù)結(jié)構(gòu)、系統(tǒng)框架上都存在諸多不足,并不能直接加以利用。傳統(tǒng)科研管理系統(tǒng)中流轉(zhuǎn)的數(shù)據(jù)資源因其大多為數(shù)據(jù)庫資源或文本資源,也包括少量非結(jié)構(gòu)化的圖片、數(shù)據(jù)表等,筆者提出應(yīng)當(dāng)基于此類系統(tǒng)進行二次開發(fā),從已有數(shù)據(jù)庫、數(shù)據(jù)倉庫展開工作,結(jié)合新興的自動識別[8]、物聯(lián)網(wǎng)[9]、互聯(lián)網(wǎng)技術(shù)。嘗試將兩者結(jié)合,應(yīng)用到科研數(shù)字資源平臺的源數(shù)據(jù)層中,以滿足智慧應(yīng)用的要求,順應(yīng)數(shù)據(jù)時代的發(fā)展。

        4.2 數(shù)據(jù)管理層開發(fā)

        從現(xiàn)有的研究成果來看,數(shù)字資源的過濾、整合、存儲都需要進行數(shù)據(jù)建模,離不開元數(shù)據(jù)。元數(shù)據(jù)被稱為“關(guān)于數(shù)據(jù)的數(shù)據(jù)”,是對數(shù)字資源的規(guī)范化描述,不僅能起到描述數(shù)據(jù)的作用,而且起到管理數(shù)據(jù)的作用。建立科學(xué)完整的元數(shù)據(jù)也是數(shù)據(jù)標(biāo)準(zhǔn)化的重要內(nèi)容。我國在元數(shù)據(jù)研究中已經(jīng)取得一定的進展與成果,隨著科技部 2002年正式啟動的國家科學(xué)數(shù)據(jù)共享工程的推進,國內(nèi)各行業(yè)都制定了相應(yīng)的元數(shù)據(jù)標(biāo)準(zhǔn),為數(shù)據(jù)管理提供了巨大便利[10]。黃文碧[11]在詳細闡述利用元數(shù)據(jù)實現(xiàn)館藏資源聚合的可行性的基礎(chǔ)上,提出經(jīng)過元數(shù)據(jù)倉庫構(gòu)建、元數(shù)據(jù)映射和元數(shù)據(jù)關(guān)聯(lián)等過程實現(xiàn)館藏資源對象的分面語義關(guān)聯(lián)。本體作為”共享概念模型的明確的形式化規(guī)范說明”[12]。能夠捕獲相關(guān)領(lǐng)域的知識,提供對該領(lǐng)域知識的共同理解,確定該領(lǐng)域內(nèi)共同認可的詞匯,并從不同層次的形式化模式上給出這些詞匯術(shù)語和詞匯間相互關(guān)系的明確定義。本體的這一作用可以實現(xiàn)異構(gòu)數(shù)據(jù)的集成[13-15]以及知識建模[16-17]和語義建模[18-20],為系統(tǒng)支撐層中的知識挖掘提供便利。

        4.3 系統(tǒng)支撐層和應(yīng)用窗口層開發(fā)

        既要充分考慮一個實用的數(shù)字資源平臺所必需的上傳、下載、索引、瀏覽、數(shù)據(jù)管理和用戶管理的基本功能外,應(yīng)當(dāng)緊密結(jié)合用戶需求,引入大數(shù)據(jù)與云計算的相關(guān)技術(shù),提供個性化服務(wù)、分級服務(wù),對某些不能開放、共享的資源實現(xiàn)分級對待。同時提高對用戶的使用權(quán)限管理,從而提高數(shù)據(jù)安全性和系統(tǒng)可靠性。此外也應(yīng)考慮平臺今后的交互性和可擴展性等功能。

        5 結(jié)語

        大數(shù)據(jù)時代,構(gòu)建科研數(shù)字資源平臺,推動科學(xué)技術(shù)的發(fā)展,是一項重要的歷史使命。本文分析了構(gòu)建科研數(shù)字資源平臺的重要意義,說明現(xiàn)有數(shù)據(jù)平臺存在的問題,在此基礎(chǔ)上提出了面向智慧應(yīng)用的數(shù)字資源平臺基礎(chǔ)架構(gòu),詳細說明了其相關(guān)技術(shù)路線。

        [1] Ohio LINK Resources[OL]. [2018-4-12]. https://www. ohiolink.edu.

        [2] 陳如明. 大數(shù)據(jù)時代的挑戰(zhàn)、價值與應(yīng)對策略[J]. 移動通信, 2012(17): 14-15.

        [3] The International Virtual Observatory Alliance[OL]. [2018-4-12]. http://www.ivoa.net/.

        [4] Information from SSJDA[OL]. [2018-4-12]. http://csrda.iss.u-tokyo.ac.jp/en/。

        [5] 國家科技管理信息系統(tǒng)公共服務(wù)平臺[OL]. [2018-4-12].http://service.most.cn/index/.

        [6] 黃如花, 邱春艷. 國外科學(xué)數(shù)據(jù)共享研究綜述[J]. 情報資料工作, 2013(4): 25-31.

        [7] 李瑾, 顧戈琦. 基于“互聯(lián)網(wǎng)+”的農(nóng)業(yè)大數(shù)據(jù)平臺構(gòu)建[J].湖北農(nóng)業(yè)科學(xué), 2017, 56(10): 1947-1952.

        [8] 姚楠, 耿奇. 基于MATLAB GUI的車牌自動識別系統(tǒng)設(shè)計[J].軟件, 2016, 37.

        [9] 曾慶勇, 劉遠仲. 淺談物聯(lián)網(wǎng)技術(shù)發(fā)展方向與產(chǎn)業(yè)前景[J].軟件, 2018, 39(3): 37-40.

        [10] 戴劍偉, 吳照林, 朱明東, 等. 數(shù)據(jù)工程理論與技術(shù)[M].國防工業(yè)出版社, 2010.

        [11] 黃文碧. 基于元數(shù)據(jù)關(guān)聯(lián)的館藏資源聚合研究[J]. 情報理論與實踐, 2015, 38(4): 74-79.

        [12] Studer R, Benjamins V R, Fensel D. Knowledge engineering:principles and methods[J]. Data & Knowledge Engineering,1998, 25(1–2): 161-197.

        [13] 高文浩. 基于本體的異構(gòu)數(shù)據(jù)庫集成技術(shù)研究及應(yīng)用[D].江蘇大學(xué), 2009.

        [14] 陽其凱, 王堅, 凌衛(wèi)青. 基于本體和云服務(wù)的交通異構(gòu)數(shù)據(jù)集成方法研究[J]. 高技術(shù)通訊, 2015, 25(7): 694-702.

        [15] 吳佑波, 陶熠. 基于本體的異構(gòu)系統(tǒng)語義互操作研究[J].重慶工商大學(xué)學(xué)報(自然科學(xué)版), 2017, 34(2): 65-70.

        [16] 李培培. 基于本體的知識建??蚣芗皩嵗芯縖D]. 西南大學(xué), 2008.

        [17] 王威. 基于本體的信息系統(tǒng)知識建模與表示框架的研究與應(yīng)用[D]. 浙江大學(xué), 2015.

        [18] 唐曉波, 翟夏普. 基于本體知識集合的知識檢索研究[J].圖書館學(xué)研究, 2018(1).

        [19] 閆東. 基于本體的石油地質(zhì)領(lǐng)域知識服務(wù)系統(tǒng)研究[J]. 軟件, 2017, 38(11): 101-106.

        [20] 張力生, 年歡, 宋輝, 等. 領(lǐng)域模型中關(guān)聯(lián)語義的描述邏輯表示與應(yīng)用[J]. 軟件, 2015, 36(6): 66-74.

        猜你喜歡
        數(shù)字資源
        讓有限的“資源”更有效
        基礎(chǔ)教育資源展示
        一樣的資源,不一樣的收獲
        資源回收
        數(shù)字
        小太陽畫報(2018年1期)2018-05-14 17:19:25
        答數(shù)字
        資源再生 歡迎訂閱
        資源再生(2017年3期)2017-06-01 12:20:59
        數(shù)字看G20
        成雙成對
        激活村莊內(nèi)部治理資源
        決策(2015年9期)2015-09-10 07:22:44
        亚洲一区二区观看网站| 中文字幕在线亚洲三区| 无码gogo大胆啪啪艺术| 最近中文字幕mv在线资源| 91精品91| 国产精品涩涩涩一区二区三区免费 | 精品欧洲av无码一区二区三区| 日韩中文在线视频| 青青草视频在线观看9| 欧美精品色婷婷五月综合| 女人下面毛多水多视频| 五月丁香六月综合激情在线观看| 亚洲av男人免费久久| 亚洲精品国产精品乱码在线观看| 人妻丝袜无码国产一区| 三级国产女主播在线观看| 大香蕉视频在线青青草| 97久久久久人妻精品区一| 国产精品国产三级国av| 亚洲乱精品中文字字幕| 久久婷婷综合激情五月| 水蜜桃精品一二三| 日韩一区二区超清视频| 亚洲av无吗国产精品| 国产变态av一区二区三区调教| 日本黄网站三级三级三级| 国产美女在线精品亚洲二区| 久久精品国语对白黄色| 国产成人精品优优av| 国产精品福利自产拍久久| 中文一区二区三区无码视频| 青青草成人免费在线观看视频| 国产成人无码a区在线观看导航 | 亚洲精品92内射| 婷婷一区二区三区在线| 永久中文字幕av在线免费| 男女猛烈xx00免费视频试看| 欧美成人三级网站在线观看| 国产精品美女久久久久浪潮AVⅤ | 西西人体444www大胆无码视频| 麻豆国产乱人伦精品一区二区|