亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        E-Science環(huán)境下科學(xué)數(shù)據(jù)的整合與共享

        2009-07-10 09:03:24姚松濤
        現(xiàn)代情報 2009年5期

        姚松濤

        〔摘 要〕E-Science環(huán)境下科學(xué)數(shù)據(jù)實現(xiàn)共享的關(guān)鍵在于標(biāo)準(zhǔn)化,共享的前提是制定標(biāo)準(zhǔn)的規(guī)范;實現(xiàn)有效的科學(xué)數(shù)據(jù)整合,使地理分布無關(guān)的計算資源、數(shù)據(jù)資源、存貯資源的全球自動配置和共享。

        〔關(guān)鍵詞〕E-Science;科學(xué)數(shù)據(jù);整合與共享

        〔中圖分類號〕G255 〔文獻標(biāo)識碼〕B 〔文章編號〕1008-0821(2009)05-0128-03

        Integration and Resource Sharing of Scientific

        Data under E-science EnvironmentYao Songtao

        (Library,Henan University,Kaifeng 475000,China)

        〔Abstract〕The key of implementing scientific data sharing under e-science environment is standardization;scientific data should be integrated efficiently,so as to automatically allocate and share the computing resources,data resources,storage resource in the global range.

        〔Keywords〕e-science;scientific data;integration and sharing

        1 E-Science及其特點

        現(xiàn)代科學(xué)研究的問題空前復(fù)雜化,20世紀(jì)末產(chǎn)生了一種嶄新的科研協(xié)作模式和大科學(xué)工程——E-Science。E-Science中文譯法有“數(shù)字科研”、“電子科研”、“電子科學(xué)”、“科學(xué)研究信息化”,它是一種以網(wǎng)格為基礎(chǔ)的新的科學(xué)研究環(huán)境。

        “E-Science”的概念是英國人先提出來的,它是建立在新一代網(wǎng)絡(luò)技術(shù)(Internet)和廣域分布式高性能計算環(huán)境(Grid)基礎(chǔ)上的全新科學(xué)研究模式,以互聯(lián)網(wǎng)技術(shù)和網(wǎng)格計算技術(shù)為基礎(chǔ),實現(xiàn)跨越地理界限的全球大規(guī)模數(shù)據(jù)采集、T級高速計算和高性能可視化,并以此為基礎(chǔ)將互聯(lián)網(wǎng)的應(yīng)用、高性能科學(xué)計算及資源共享提高到一個全新的層次。在這種環(huán)境中,地理位置、分散的各種儀器設(shè)備、計算資源、數(shù)據(jù)資源等被虛擬的集成到一起,科研人員可以自由的使用各種資源,無需考慮資源的存儲地和提供者,這種使用突破了時間、物理空間、邏輯空間上的障礙。

        E-Science具有如下特點:首先,E-Science是一種信息化的基礎(chǔ)設(shè)施,它提供了一種信息化的科學(xué)研究環(huán)境和平臺,使得不同學(xué)科領(lǐng)域的科研活動能夠有針對地開發(fā)特定的科學(xué)研究與應(yīng)用;其次,E-Science的建立應(yīng)以應(yīng)用需求為導(dǎo)向;另外,E-Science的實現(xiàn)需要大量的新技術(shù),事實上E-Science正是20世紀(jì)后半期IP技術(shù)尤其是20世紀(jì)后10年IP技術(shù)的產(chǎn)物[1]。它所需要的最具代表性的是網(wǎng)格技術(shù),正是通過網(wǎng)格才有可能將E-Science所需的眾多技術(shù)與資源,如分布式計算技術(shù)、網(wǎng)絡(luò)安全技術(shù)、協(xié)同工作技術(shù)、資源管理技術(shù)等等集成一體,構(gòu)成并實現(xiàn)了E-Science。

        2 中外科學(xué)數(shù)據(jù)共享的現(xiàn)狀

        2.1 國外科學(xué)數(shù)據(jù)共享的現(xiàn)狀

        隨著經(jīng)濟發(fā)展的全球化和全球性科技活動的不斷增強,導(dǎo)致全球范圍內(nèi)的科技人員對科學(xué)數(shù)據(jù)信息資源的交流、互通和深度使用有強烈需求和高度依賴。近20年來,美國、俄羅斯、英國、法國、加拿大、日本和新加坡等發(fā)達(dá)國家相繼頒布了有關(guān)科學(xué)數(shù)據(jù)信息共享的政策法規(guī),開始實施科學(xué)數(shù)據(jù)共享工程。目前國際上實施科學(xué)數(shù)據(jù)共享主要體現(xiàn)在3個方面:第一,政府投入大量資金支持科學(xué)數(shù)據(jù)的長期積累、高效流動和低成本使用;第二,從法律、政策等多方面保障科學(xué)數(shù)據(jù)的管理與共享服務(wù);第三,科學(xué)數(shù)據(jù)共享主要采用國家調(diào)控下的事業(yè)性運行模式。

        2.2 我國科學(xué)數(shù)據(jù)共享現(xiàn)狀

        科學(xué)數(shù)據(jù)是科技活動的結(jié)晶,是科技發(fā)展與創(chuàng)新的基石,是國家安全和社會經(jīng)濟發(fā)展的重要保障。但科學(xué)數(shù)據(jù)共享卻在我國長期以來沒有得到應(yīng)有的重視。

        具體說,我國科學(xué)數(shù)據(jù)的共享現(xiàn)狀是:①目的單一,以自用、完成任務(wù)為主,只能為少數(shù)人使用,得不到及時的更新。②分散在各個單位、數(shù)據(jù)觀測點、科學(xué)家個人手中,許多珍貴數(shù)據(jù)記錄已因年久而損毀或散失。③無統(tǒng)一的數(shù)據(jù)規(guī)范標(biāo)準(zhǔn),標(biāo)準(zhǔn)化程度很低,從根本上降低了數(shù)據(jù)共享的可能。④重復(fù)建設(shè),浪費大量人力、物力和經(jīng)費。

        國內(nèi)雖然在科學(xué)數(shù)據(jù)共享方面的工作起步較晚,但是在國家科技部的領(lǐng)導(dǎo)下,近年來,在整合已有科學(xué)數(shù)據(jù)資源、推動科學(xué)數(shù)據(jù)共享方面作了大量卓有成效的奠基性工作,1999年,國家科技部基礎(chǔ)司組織了“科學(xué)數(shù)據(jù)共享調(diào)研組”,并于2001年11月完成了“實施科學(xué)數(shù)據(jù)共享工程,增強國家科技創(chuàng)新能力”的調(diào)研報告。該報告在深入分析我國科學(xué)數(shù)據(jù)管理存在的問題和國際科學(xué)數(shù)據(jù)管理的經(jīng)驗基礎(chǔ)上,提出了實施國有科學(xué)數(shù)據(jù)公益性共享的戰(zhàn)略國策和10年建成科學(xué)數(shù)據(jù)共享保障體系的總體思路?,F(xiàn)已開展國家科學(xué)數(shù)據(jù)共享工程的試點建設(shè),這不僅為國家科學(xué)數(shù)據(jù)共享工程實施標(biāo)準(zhǔn)的制定和具體實施提供了技術(shù)基礎(chǔ),也為科學(xué)數(shù)據(jù)共享工程向其它領(lǐng)域延伸,向地方區(qū)域推廣提供了寶貴經(jīng)驗。隨著我國計算機網(wǎng)絡(luò)技術(shù)的高速發(fā)展,網(wǎng)絡(luò)帶寬迅速擴大,信息技術(shù)開發(fā)能力的不斷增強,必將促進我國科學(xué)數(shù)據(jù)共享的跨越式發(fā)展。

        3 E-Science環(huán)境下科學(xué)數(shù)據(jù)的整合與共享

        3.1 制定標(biāo)準(zhǔn)規(guī)范

        E-Science環(huán)境下從“全球數(shù)字圖書館”的角度來說,需要將眾多的力量協(xié)調(diào)組織起來,實現(xiàn)網(wǎng)絡(luò)的互聯(lián)互通、資源的共建共享、管理的井然有序,來滿足各個不同的科研團隊的科研需要。實現(xiàn)共享的關(guān)鍵就在于標(biāo)準(zhǔn)化,共享的前提是制定標(biāo)準(zhǔn)的規(guī)范,統(tǒng)一的元數(shù)據(jù)標(biāo)準(zhǔn)能實現(xiàn)資源的互操作性,統(tǒng)一的標(biāo)準(zhǔn)化協(xié)議能使異構(gòu)信息變同構(gòu)信息。

        元數(shù)據(jù)是數(shù)字圖書館的語義基礎(chǔ),為數(shù)字圖書館提供完整的數(shù)據(jù)描述形式,為分布的、由多種數(shù)字化資源有機構(gòu)成的信息體系提供規(guī)范、普遍的描述方法、整合工具和紐帶,使廣泛分布的數(shù)字圖書館資源站點具有充分的互操作性和可擴展性,提供數(shù)字圖書館中的資源描述、資源發(fā)現(xiàn)、資源處理、資源評價與排序以及資源的人際交互和理解的基本準(zhǔn)則,它還承擔(dān)向數(shù)字圖書館中高層協(xié)議中間件提供標(biāo)準(zhǔn)數(shù)據(jù)訪問接口的功能。完整、全面的標(biāo)準(zhǔn)規(guī)范對于數(shù)字圖書館的建設(shè)是非常重要的。2007年度都柏林核心(DC)與元數(shù)據(jù)應(yīng)用國際研討會在新加坡舉行,在元數(shù)據(jù)的標(biāo)準(zhǔn)規(guī)范方面提出被稱為“新加坡框架”的元數(shù)據(jù)應(yīng)用規(guī)范,其規(guī)定了一整套元數(shù)據(jù)方案需要包含五類文檔,其中必備的“領(lǐng)域模型”和“元數(shù)據(jù)集描述”并要求以較為嚴(yán)格的機讀形式編碼(UML和XML/RDF),保證元數(shù)據(jù)應(yīng)用的各項形式化約束具有一致性和延續(xù)性[2]

        系統(tǒng)的異構(gòu)性是構(gòu)建數(shù)字圖書館、實現(xiàn)信息資源全面整合的突出問題,異構(gòu)資源互操作問題主要解決平臺異構(gòu)、操作系統(tǒng)異構(gòu)、數(shù)據(jù)庫異構(gòu)問題,可采用CORBA、Z39.50等技術(shù)手段來解決異構(gòu)系統(tǒng)的互連互通。目前,比較典型的解決方案是利用XML作為數(shù)據(jù)的傳送格式,允許服務(wù)提供者和服務(wù)客戶經(jīng)過防火墻Internet上進行通信,基于HTTP、XML、RPC的SOAP實現(xiàn)平臺與環(huán)境的無關(guān)性和獨立性。提供開放式鏈接,以實現(xiàn)系統(tǒng)間的互操作:開放式鏈接基于正在出現(xiàn)的、OpenURL、CrossRef標(biāo)準(zhǔn),能夠無縫地鏈接所有數(shù)字圖書館資源,而不論這些資源使用什么樣的軟件系統(tǒng)[3]。

        基于Web的服務(wù)在不同的系統(tǒng)之間實現(xiàn)“軟件——軟件調(diào)用”,存儲設(shè)備等軟硬件資源,在作為操作系統(tǒng)的網(wǎng)格中間件的作用下,形成虛擬計算組織,使用戶可以在全球任何地方訪問所需的資源,從而使計算資源得到充分的共享,這種Web服務(wù)是基于網(wǎng)格之上的,同時網(wǎng)格為Web服務(wù)提供了一個與硬件無關(guān)的虛擬計算機,Web服務(wù)構(gòu)架在虛擬計算機平臺之上,與平臺/語言無關(guān)的應(yīng)用交互集成平臺。同時要遵循WebService中的幾個重要協(xié)議標(biāo)準(zhǔn):XML/SOAP/WSDL/UDDI等,這些協(xié)議提供了標(biāo)準(zhǔn)化、透明的機制和完善的信息源標(biāo)識功能。所謂標(biāo)準(zhǔn)化協(xié)議是指此協(xié)議定義了與檢索相關(guān)的標(biāo)準(zhǔn)檢索語法、檢索結(jié)果的表示以及對信息源接口和基本特征的描述?;谶@個標(biāo)準(zhǔn)檢索服務(wù)框架,各個數(shù)據(jù)庫可以通過轉(zhuǎn)換封裝成標(biāo)準(zhǔn)檢索服務(wù)。所謂透明性機制是指網(wǎng)格系統(tǒng)支持對異構(gòu)數(shù)據(jù)資源的訪問,為用戶提供統(tǒng)一的訪問接口,并自動選擇適當(dāng)?shù)脑L問協(xié)議來實現(xiàn)用戶提出的數(shù)據(jù)訪問請求。所謂完善的信息源標(biāo)識功能是指在數(shù)據(jù)源很多,統(tǒng)一檢索系統(tǒng)一次只能向有限個數(shù)據(jù)源提交檢索請求情況下,網(wǎng)格系統(tǒng)能通過檢索服務(wù)發(fā)現(xiàn)和描述協(xié)議并精確定位用戶所需的數(shù)據(jù)集,并對各個數(shù)據(jù)庫返回數(shù)據(jù)進行統(tǒng)一處理的一種快速反應(yīng)機制[4]。

        3.2 整合分布式數(shù)據(jù)

        E-Science環(huán)境下實現(xiàn)有效的科學(xué)數(shù)據(jù)整合,要以用戶需求為導(dǎo)向進行數(shù)字信息資源開發(fā),根據(jù)科研人員的需要自動地提供所需要的知識,并把所有的信息動態(tài)的集成到一起,最終形成以科研人員信息活動為基礎(chǔ)的數(shù)字信息環(huán)境,并進行日常的知識管理工作,實現(xiàn)外部知識系統(tǒng)與用戶的個體知識系統(tǒng)、團隊知識系統(tǒng)的融合,以達(dá)到更高效的利用知識和創(chuàng)造知識的目的。

        E-Science環(huán)境下全球數(shù)字圖書館對數(shù)據(jù)的收集分為兩種:物理上的集中,即建立數(shù)據(jù)存儲和處理中心,如數(shù)據(jù)庫、機構(gòu)庫等;邏輯上的集成,即建立一種鏈接機制,把由相關(guān)聯(lián)的數(shù)據(jù)進行整合、集成和鏈接,針對不同的用戶需求實現(xiàn)不同個性化信息推送。

        E-Science環(huán)境下用戶面對多介質(zhì)、多格式、多類型、多傳輸渠道的數(shù)據(jù)資源,用戶希望以更快更好的方式得到自己需要的數(shù)據(jù)。數(shù)字圖書館作為E-Science環(huán)境下支持研究的平臺,是用戶獲取數(shù)據(jù)的主要來源,從用戶的角度來說,不論圖書館收集了多少資源、收集了什么樣的資源,對用戶而言都是屏蔽的。用戶只關(guān)心他能否在數(shù)字圖書館這個平臺上獲得其所需要的信息。所以數(shù)字圖書館必須把分布式的數(shù)據(jù)建設(shè)朝著整合化的方向發(fā)展。整合的數(shù)據(jù)對象包括:不同載體、不同類型的數(shù)據(jù)之間的整合;異質(zhì)信息資源的整合;本地資源和遠(yuǎn)程資源的整合等。通過整合滿足用戶全方位、多渠道地獲取要求,并提供更加豐富的信息資源,建立分布式信息資源保障體系,實現(xiàn)信息的無縫鏈接和集成,從而實現(xiàn)更大范圍、更有深度的資源共享,提高為用戶服務(wù)的能力,促進形成以用戶為中心,以資源為基礎(chǔ)學(xué)習(xí)環(huán)境和研究環(huán)境。

        E-Science環(huán)境下數(shù)字圖書館的鏈接是在E-Science環(huán)境下全球數(shù)字圖書館的范圍內(nèi)進行的,鏈接的技術(shù)基礎(chǔ)是知識網(wǎng)格。通過知識網(wǎng)格使數(shù)字圖書館由信息服務(wù)轉(zhuǎn)變成知識服務(wù),利用節(jié)點豐富、交織縱橫的知識網(wǎng)絡(luò)系統(tǒng)實現(xiàn)了數(shù)據(jù)庫的全息關(guān)聯(lián),把數(shù)據(jù)庫信息資源的整合深度推進到知識元層次,根據(jù)不同的用戶和用戶群的需求提供不同的知識鏈接方式,使數(shù)字圖書館所擁有的數(shù)據(jù)庫資源組織成一張循環(huán)互動的知識網(wǎng)絡(luò),并與外界的信息資源有機鏈接起來,使用戶有效的收集到自己所需要的數(shù)據(jù)。

        科學(xué)數(shù)據(jù)中蘊涵著大量的事實和規(guī)律,而這種事實和規(guī)律的揭示是通過對大量數(shù)據(jù)的分析和處理實現(xiàn)的。E-Science環(huán)境下數(shù)字圖書館對科學(xué)數(shù)據(jù)整合的基礎(chǔ)上進行分析和處理,能夠從不同的需要出發(fā)對數(shù)據(jù)集進行各種角度的統(tǒng)計、計算、分析和處理,幫助科研人員進行數(shù)據(jù)的預(yù)處理和后處理工作。

        3.3 共享科學(xué)數(shù)據(jù)

        E-Science環(huán)境下科學(xué)數(shù)據(jù)的共享難度加大,數(shù)字圖書館能夠?qū)?shù)據(jù)的共享起重要的作用,共享的對象包括顯性知識和隱性知識。

        E-Science環(huán)境下知識共享的難度加大的主要原因是:①非正式交流增多,且方式多樣,電子郵件、BBS、討論組、網(wǎng)絡(luò)會議、信息共享室、個人主頁……,這就產(chǎn)生了大量形態(tài)各異、質(zhì)量參差不齊的資源,良莠混雜使得對這些資源的篩選和甄別變得異常困難,如何有效存儲和利用這些資源的問題將日趨尖銳;②交流的隨意性強,用戶可以自由的發(fā)布信息,缺少嚴(yán)格的審核機制,缺乏有效的控制機制,其質(zhì)量、時效、穩(wěn)定性難以得到有效保證;③非正式交流的組織性差,許多非正式交流是科研人員自發(fā)形成的,這使得交流的過程和結(jié)果極不規(guī)范,不易記錄和保存。

        E-Science環(huán)境下數(shù)字圖書館為顯性數(shù)據(jù)的有效共享提供條件,E-Science環(huán)境下,數(shù)字化的數(shù)據(jù)生產(chǎn)和傳遞將有利于它的存儲和轉(zhuǎn)換,也使得對它的保存和重用成為可能。例如,在動物和微生物基因組研究方面,美國科學(xué)家首次繪制出了黑猩猩的基因組序列草圖,所獲得的全部數(shù)據(jù)存入公共數(shù)據(jù)庫,免費供各國科學(xué)家調(diào)用??茖W(xué)家們通過比較分析發(fā)現(xiàn),黑猩猩與人類的基因組之間存在著關(guān)鍵性差異,說明二者的共同祖先在500萬年前分開之后,自然選擇壓力的差異導(dǎo)致了兩種生物進化過程的不同。正是這種對數(shù)據(jù)的重用推進了科學(xué)研究的進程。

        E-Science為隱性知識的顯性化提供了更強大、更方便的工具,模擬和仿真技術(shù)能夠更真實、更準(zhǔn)確、更直觀的重現(xiàn)科研人員頭腦中的景象,在一定程度上解決了隱性知識難以用語言描述的問題。例如,利用多媒體、超媒體等多種形式的載體,可以更形象的表達(dá)隱性知識[5]

        3.4 長期保存數(shù)據(jù)

        E-Science環(huán)境下數(shù)字圖書館利用先進的技術(shù),使信息的長期保存成為可能,基于數(shù)字對象識別符DOI(Digital Object Identifier)的永久性保存與利用機制為確保網(wǎng)絡(luò)學(xué)術(shù)資源的穩(wěn)定鏈接提供了一個強大的工具。針對不同類型的數(shù)據(jù)進行長期保存的研究,制定數(shù)據(jù)資源長期保存的策略,制定相應(yīng)得措施。支持開放獲取形式下的長期保存機制和網(wǎng)絡(luò)信息資源的長期保存機制。充分利用合作、聯(lián)合和公共的長期保存機制,在精細(xì)研究相應(yīng)的保存可靠性、服務(wù)可靠性、法律可靠性、經(jīng)濟效率的基礎(chǔ)上,更加經(jīng)濟地實現(xiàn)數(shù)字資源的長期保存,并對委托長期保存過程進行管理。

        參考文獻

        [1]徐冠華.實施科學(xué)數(shù)據(jù)共享 增強國家科技競爭力[J].中國基礎(chǔ)科學(xué),2003,(1):5-9.

        [2]劉煒.DC元數(shù)據(jù)年度進展(2007)[J].?dāng)?shù)字圖書館論壇,2007,(11):19-22.

        [3]初景利.國際一流圖書館的若干特征[J].圖書情報工作動態(tài),2003,(3):2-6.

        [4]李彥坤,于忠,李惠安,等.網(wǎng)格計算在數(shù)字圖書館中的應(yīng)用[J].中國信息導(dǎo)報,2005,(8):19-22.

        [5]張曉林.開放數(shù)字圖書館的設(shè)計和實現(xiàn):CSDL的實踐[J].情報學(xué)報,2003,(10):520-525.

        插b内射18免费视频| 特黄aa级毛片免费视频播放| 免费二级毛片在线播放| 一本大道加勒比东京热| 国产人妖av在线观看| 国产精品无码制服丝袜| 老师开裆丝袜喷水视频| av一区二区三区人妻少妇 | 无人区一码二码三码四码区| 国产精品爽爽va在线观看无码| 狠狠色欧美亚洲综合色黑a | 亚洲捆绑女优一区二区三区| 无码色av一二区在线播放| 少妇人妻真实偷人精品视频| 在线观看精品国产福利片87| 午夜桃色视频在线观看| 欧美老肥妇做爰bbww| 又黄又爽又色又刺激的视频| 草莓视频在线观看无码免费| 人妻中文字幕一区二区视频| 中文字幕人妻无码视频| 女人高潮被爽到呻吟在线观看| 91制服丝袜| 亚洲中文字幕不卡一区二区三区| 丝袜美腿国产一区精品| 乱色熟女综合一区二区三区| 亚洲乱码一区二区三区成人小说| 国内精品女同一区二区三区| 亚洲熟妇无码久久精品| 日日碰狠狠丁香久燥| 韩国无码精品人妻一区二| av成人一区二区三区| 久久久亚洲欧洲日产国码αv| 久久天天爽夜夜摸| 国产在线播放免费人成视频播放| 色综合久久久久综合体桃花网| 亚洲av伊人久久综合密臀性色| 无码一区二区三区人| 在线观看麻豆精品视频| 日韩亚洲欧美中文在线| 一本大道在线一久道一区二区|