李啟沅 王博 吳靜靜
摘 要:本文首先論述了海洋生物樣本及其信息重要的科學(xué)意義,并對國內(nèi)外海洋生物產(chǎn)業(yè)發(fā)展趨勢進行闡述,通過對比目前國內(nèi)外海洋生物樣本保藏數(shù)據(jù)標準化情況,提出了海洋生物樣本的信息化管理,明確保藏核心元數(shù)據(jù)是整個信息化管理的重要基礎(chǔ),并在此基礎(chǔ)上初步搭建了標準框架。
關(guān)鍵詞:海洋,生物樣本,保藏,信息,核心元數(shù)據(jù),標準化
DOI編碼:10.3969/j.issn.1002-5944.2022.20.008
生命大健康產(chǎn)業(yè)是全球發(fā)展速度最快的產(chǎn)業(yè)之一,是各國推動經(jīng)濟增長和優(yōu)化經(jīng)濟結(jié)構(gòu)的重要力量。近年來,海洋生物資源已經(jīng)成為世界各國競相開拓的新的健康產(chǎn)業(yè)資源,尤其在海洋藥物與生物制品方面,英國、美國、西班牙等國家將其提至戰(zhàn)略發(fā)展層面,持續(xù)加大在海洋生物醫(yī)藥領(lǐng)域的研發(fā)投資力度。海洋健康產(chǎn)業(yè)已經(jīng)成為大健康產(chǎn)業(yè)發(fā)展的新趨勢[1]。海洋生物產(chǎn)業(yè)的發(fā)展與海洋生物技術(shù)的發(fā)展息息相關(guān)。海洋特殊的生態(tài)環(huán)境造就了海洋生物特殊化學(xué)結(jié)構(gòu)和生物活性。以海洋生物為原料或從中提取有效成分,利用現(xiàn)代生物技術(shù)生產(chǎn)海洋生物化學(xué)藥品、保健品和基因工程藥物等產(chǎn)業(yè)發(fā)展迅速。而海洋生物樣本則是所有活動的前提,也是基礎(chǔ)研究的源頭和關(guān)鍵環(huán)節(jié),具有重大的科學(xué)、社會與經(jīng)濟價值。海洋生物樣本研究數(shù)據(jù)不但含有時間信息,并且含有海洋深度、定位等信息。相對于陸地生物樣本,要準確合理地長期保存海洋物種數(shù)據(jù)相對比較復(fù)雜。隨著數(shù)據(jù)采集手段的不斷進步,數(shù)據(jù)存儲趨于海量化。大量數(shù)據(jù)資源沒有統(tǒng)一的格式,缺少對原始數(shù)據(jù)有效記錄和說明,使用者很難正確理解并利用數(shù)據(jù)。因此,對海洋生物樣本元數(shù)據(jù)標準進行深入研究顯得尤為重要,以期為使用方提供可以識別的、有價值的數(shù)據(jù),實現(xiàn)互通互聯(lián)。
1 海洋生物產(chǎn)業(yè)發(fā)展趨勢
根據(jù)2022年10月Markets and Markets發(fā)布的《海洋生物技術(shù)- 全球市場趨勢與分析》顯示,2020年全球海洋生物技術(shù)市場大約為57億美元,預(yù)計到2027年將增至92億美元[2]。醫(yī)藥、食品、農(nóng)業(yè)和化妝品行業(yè)對海洋生物原料的需求促進了市場的增長。美國對海洋生物技術(shù)日益重視,對專門從事海洋生物技術(shù)的海洋研究中心進行巨額投資,根據(jù)統(tǒng)計,在2021年美國海洋生物技術(shù)市場已經(jīng)達到了11億美元。
自1978年全國科學(xué)大會提出“向海洋問藥”后,我國海洋藥物開發(fā)研究不斷得到國家重視。近年來,海洋生物醫(yī)藥產(chǎn)業(yè)的發(fā)展已經(jīng)上升至國家戰(zhàn)略高度?!秶窠?jīng)濟和社會發(fā)展第十四個五年規(guī)劃和2035年遠景目標綱要》提出“積極拓展海洋經(jīng)濟發(fā)展空間”的戰(zhàn)略部署;《“十四五”海洋經(jīng)濟發(fā)展規(guī)劃》以深化供給側(cè)結(jié)構(gòu)性改革為主線,以改革創(chuàng)新為根本動力,加快構(gòu)建我國海洋生物醫(yī)療產(chǎn)業(yè)快速發(fā)展。隨著國家政策的支持和研發(fā)力度的不斷加大,海洋生物醫(yī)藥產(chǎn)業(yè)市場規(guī)模逐漸增大,產(chǎn)業(yè)增加值從2016年的336億元增長至2021年的492億元[3]。這為我國海洋生物技術(shù)行業(yè)的發(fā)展帶來了政策上的保證。遼闊的海域面積和豐富的海洋生物資源也是我國發(fā)展海洋生物技術(shù)產(chǎn)業(yè)的巨大優(yōu)勢。根據(jù)Reportlinker 發(fā)布的關(guān)于全球海洋生物技術(shù)產(chǎn)業(yè)的報告顯示,美國、加拿大、日本、中國和歐洲將推動該領(lǐng)域5.2%的年復(fù)合增長率。中國是這一領(lǐng)域中增長最快的國家之一。在澳大利亞、印度和韓國等國家的引領(lǐng)下,亞太地區(qū)的市場預(yù)計到2026年將達到2.026億美元[4]。
2 國內(nèi)外標準化現(xiàn)狀
2.1 國外海洋生物樣本保藏信息標準化概述
海洋生物為近年來迅速發(fā)展的新興產(chǎn)業(yè),海洋樣本保藏數(shù)據(jù)相關(guān)的標準或技術(shù)操作規(guī)范還是在各個相關(guān)的產(chǎn)業(yè)組織或研究組織中自行制定并使用。然而,不同組織對于生物樣本保藏的信息側(cè)重點有所不同,導(dǎo)致系統(tǒng)中的數(shù)據(jù)結(jié)構(gòu)、格式方式均存在差異,對數(shù)據(jù)共享造成了阻礙。元數(shù)據(jù)是按照一定標準,對信息資源進行規(guī)范化描述,是特征元素的集合。規(guī)范化的描述可以準確且完備地說明信息資源的各項特征。
在海洋領(lǐng)域關(guān)于元數(shù)據(jù)標準研究主要有:國際海洋資料和信息交換IODE的MEDI(海洋環(huán)境數(shù)據(jù)目錄),歐洲的EDIOS(歐洲海洋觀測系統(tǒng)數(shù)據(jù)目錄)以及ODAS(海洋數(shù)據(jù)獲取系統(tǒng))等[5]。但在生物樣本保藏領(lǐng)域,國際標準化組織并未在信息數(shù)據(jù)方面開展相關(guān)的標準化活動[6]。目前,國際標準化組織僅集中在海洋技術(shù)領(lǐng)域,如在海洋和海域觀測、開發(fā)和保護用設(shè)備、系統(tǒng)、基礎(chǔ)設(shè)施和技術(shù)的試驗方法、操作、設(shè)計、建造和后勤方面設(shè)立標準化組織,設(shè)立的技術(shù)委員會分會為ISO/TC 8/SC 13 Marinetechnology(海洋技術(shù))。 但無論是在與生物技術(shù)相關(guān)的技術(shù)委員會(如 ISO/TC 276、ISO/TC 215和ISO/TC 212),還是海洋領(lǐng)域的技術(shù)委員會,均沒有海洋生物技術(shù)領(lǐng)域相關(guān)的標準。
2.2 我國海洋生物樣本保藏信息標準化過程及現(xiàn)狀
海洋生物相關(guān)的標準主要是集中在海洋生物調(diào)查、生物質(zhì)量和術(shù)語類的方面;行業(yè)和地方標準主要是集中在海洋生物樣本的技術(shù)檢測方法方面,對于樣本保藏信息數(shù)據(jù)方向目前尚未有相關(guān)標準。
而我國海洋生物技術(shù)領(lǐng)域研究隨著“十四五”期間國家的政策支持和研發(fā)力度不斷加大,產(chǎn)業(yè)發(fā)展正處于加速期。而與我國海洋生物技術(shù)的加速發(fā)展相比,海洋生物樣本保藏信息標準化的發(fā)展明顯呈現(xiàn)滯后狀態(tài),主要表現(xiàn)在對于各個樣本采集、儲存,研發(fā)機構(gòu)之間在數(shù)據(jù)表達和結(jié)構(gòu)方面存在差異性,缺乏統(tǒng)一性。
我國與國際存在相同的問題,即更多在海洋勘測、海洋漁業(yè)、海洋生態(tài)等領(lǐng)域進行標準化規(guī)范。海洋生物樣本保藏信息在國家標準層面還處于空白,未建立成體系的標準規(guī)范。
3 海洋生物樣本保藏信息標準化的建設(shè)構(gòu)想
3.1 設(shè)計路線
海洋生物技術(shù)是海洋大數(shù)據(jù)產(chǎn)生和應(yīng)用的重要領(lǐng)域之一,加強大數(shù)據(jù)建設(shè)是海洋生物技術(shù)發(fā)展的必然要求。生物樣本是發(fā)現(xiàn)疾病成因和表征疾病發(fā)展不可缺少的資源,是開發(fā)新藥、診斷和治療方法的重要依據(jù),是預(yù)測和治療人類疾病以及作物改良和創(chuàng)新的基本平臺。海洋生物更是因為其生物多樣性和龐大的物種數(shù)量而被為海洋生物產(chǎn)品的來源,樣本的保藏顯得尤為重要。海洋生物樣本保藏包括樣本采集、處理、保存、檢索和分發(fā),樣本保藏信息技術(shù)路線如圖1所示。
3.2 標準項目建設(shè)構(gòu)想
(1)標準框架構(gòu)建
海洋生物樣本保藏核心元數(shù)據(jù)主要由數(shù)據(jù)標識信息、數(shù)據(jù)內(nèi)容信息、數(shù)據(jù)質(zhì)量信息和元數(shù)據(jù)信息等4個元數(shù)據(jù)子集組成,圖2為海洋生物樣本保藏核心元數(shù)據(jù)標準結(jié)構(gòu)框架。
(2)數(shù)據(jù)標識信息
數(shù)據(jù)標識信息描述了數(shù)據(jù)集的基本信息,包含唯一標識數(shù)據(jù)的信息,是元數(shù)據(jù)的重要組成部分,其中包括數(shù)據(jù)集引用、摘要、關(guān)鍵字或詞、數(shù)據(jù)分類等元素。通過對格式、樣本瀏覽圖、限制、關(guān)鍵字、項目信息等標識信息作出明確定義,可以讓不同領(lǐng)域的用戶對數(shù)據(jù)有一致性的理解。
(3)數(shù)據(jù)內(nèi)容信息
數(shù)據(jù)內(nèi)容信息是關(guān)于數(shù)據(jù)要素的說明,提供數(shù)據(jù)集內(nèi)容特征的描述信息。數(shù)據(jù)集包含海洋樣本采集要素的類型以及相應(yīng)的要素名稱、數(shù)量級單位等相關(guān)內(nèi)容特征信息。對其所派生的子類分別定義兩個描述子類:數(shù)據(jù)要素說明和數(shù)據(jù)覆蓋層說明[5]。數(shù)據(jù)要素說明用于數(shù)值型數(shù)據(jù)以及圖層數(shù)據(jù)的內(nèi)容描述;內(nèi)容信息的“資源域”屬性是必備的元數(shù)據(jù)元素,用以描述數(shù)據(jù)集所在的資源范圍。
(4)數(shù)據(jù)質(zhì)量信息
數(shù)據(jù)質(zhì)量信息包括數(shù)據(jù)覆蓋范圍、數(shù)據(jù)質(zhì)控方法、數(shù)據(jù)質(zhì)控標識等,其擁有統(tǒng)一的檢查規(guī)則管理、檢查規(guī)則的審批流程定義,是對數(shù)據(jù)集質(zhì)量的總體評價。數(shù)據(jù)覆蓋范圍是對數(shù)據(jù)集的時間范圍和空間范圍的描述,需要明確數(shù)據(jù)集的時間序列和采樣頻率等;考慮到海洋生物樣本的地理空間分布性,空間范圍用于描述采樣數(shù)據(jù)的地理位置、采樣深度等。規(guī)范化數(shù)據(jù)質(zhì)控方法是為了甄別異常數(shù)據(jù)所采用的數(shù)據(jù)質(zhì)量控制方法。數(shù)據(jù)質(zhì)控標識主要提供有關(guān)資料的質(zhì)量信息(包括反映數(shù)據(jù)的質(zhì)量水平、質(zhì)量控制方法、可疑或者錯誤的類型和是否訂正的信息等),同時在對數(shù)據(jù)進行質(zhì)量控制過程中應(yīng)詳細標識數(shù)據(jù)的質(zhì)量情況,并最終給出簡單明了的質(zhì)量標識。
(5)元數(shù)據(jù)信息
元數(shù)據(jù)通常被定義為關(guān)于描述數(shù)據(jù)的數(shù)據(jù)或數(shù)據(jù)的數(shù)據(jù),對數(shù)據(jù)及信息資源的描述性信息。目的是在不同人或系統(tǒng)之間共享有關(guān)信息資源,實現(xiàn)對信息資源互操和管理。元數(shù)據(jù)信息主要用于描述元數(shù)據(jù)使用的語種、字符集、圖像等關(guān)于元數(shù)據(jù)的重要信息。通過對元數(shù)據(jù)信息的規(guī)范,有助于數(shù)據(jù)的整合、匯總和分析,實現(xiàn)信息的管理、利用和共享。
4 結(jié) 語
標準作為支撐產(chǎn)業(yè)發(fā)展的技術(shù)力量,對推進海洋生物技術(shù)高質(zhì)量發(fā)展具有重大意義。本文綜合國內(nèi)外對海洋生物樣本保藏數(shù)據(jù)的現(xiàn)狀,提出了建立海洋生物樣本保藏信息核心元數(shù)據(jù)標準化構(gòu)想。海洋生物樣本保藏信息核心元數(shù)據(jù)標準是實現(xiàn)互操和互換的支撐,可以促進跨領(lǐng)域的共享和應(yīng)用。
參考文獻
陳力,吳黃銘,湯熙翔.我國海洋生物資源在大健康領(lǐng)域的應(yīng)用現(xiàn)狀分析[J].海洋開發(fā)與管理,2022,39(8):17-21.
Resea rch a nd ma rkets. Ma r ine Biotech nolog y - Globa lMarket Trajectory & Analytics[EB/OL].[2023-01-11]. https://w w w.resea rcha ndma rkets.com /repor ts/4911755/ma r inebiotechnology-global-market-trajectory.
火石創(chuàng)造.海洋生物醫(yī)藥產(chǎn)業(yè)發(fā)展要素與趨勢分析[ E B /OL].(2022-06-30)[2023-01-11]. https://www.hsmap.com/detail/1/956.
GlobeNewswire. Global Marine Biotechnology Market to reach$5 billion by 2026[EB/OL].(2022-03-11)[2023-01-11]. https://www.globenewswire.com/news-release/2022/03/11/2401843/0/en/Global-Marine-Biotechnology-Market-to-Reach-5-Billionby-2026.html.
宋坤,周雪.元數(shù)據(jù)技術(shù)在海洋觀測數(shù)據(jù)集成中的應(yīng)用研究[J].海洋開發(fā)與管理,2014,31(6):14-17.
陳喆民,王曉鋒.海洋核心元數(shù)據(jù)標準初探[J].現(xiàn)代計算機(專業(yè)版),2007(6):120-122.
作者簡介
李啟沅,高級工程師,主要從事生物技術(shù)標準化研究。
王博,副研究員,主要從事生物技術(shù)研究。
吳靜靜,通信作者,主要從事生物技術(shù)標準化研究。
(責(zé)任編輯:張佩玉)