田虹 田侃
(南京中醫(yī)藥大學,江蘇南京210023)
中藥資源在生長種植和學科研究中產(chǎn)生了大量的數(shù)據(jù),整合挖掘、合理應用這些數(shù)據(jù),對于科學管理中藥資源有著極其重要的作用,對中藥產(chǎn)業(yè)的發(fā)展和臨床用藥安全有深遠的影響[1]。維克托·邁爾-舍恩伯格、肯尼斯·庫克耶在其編著的 《大數(shù)據(jù)時代》中提出通過搜集、分析海量數(shù)據(jù)信息,開發(fā)針對性應用的新思路。在當前海量數(shù)據(jù)和信息爆炸的背景下,大數(shù)據(jù)的思維模式和行動方式已逐漸滲透到各個行業(yè)和業(yè)務職能領(lǐng)域。將大數(shù)據(jù)技術(shù)應用于中藥資源領(lǐng)域,有助于開啟中藥資源全新的局面。但同時也應警惕過于依賴大數(shù)據(jù)。大數(shù)據(jù)自身不可能告知如何從眾多數(shù)據(jù)中提取對中藥資源發(fā)展有價值的信息,而是依賴于人的判斷和決定。如果不能清晰地界定問題,海量數(shù)據(jù)也可能成為沒有價值的信息垃圾,與中藥資源發(fā)展的追求背道而馳。
1.1 大數(shù)據(jù)的定義 目前學界對于大數(shù)據(jù)的定義,沒有統(tǒng)一的定論。根據(jù)維克托·邁爾-舍恩伯格、肯尼斯·庫克耶的觀點,從數(shù)據(jù)利用價值的角度定義大數(shù)據(jù)是人們在大規(guī)模數(shù)據(jù)的基礎上可以做到的事情,且這些事情在小規(guī)模數(shù)據(jù)的基礎上是無法完成的[2]。大數(shù)據(jù)的概念,首要特點是“大”,主要體現(xiàn)在數(shù)據(jù)規(guī)模大、數(shù)據(jù)類型多、價值密度低和處理速度快四個方面。但是大數(shù)據(jù)不只是數(shù)據(jù)大,還包括采集數(shù)據(jù)的工具、平臺和數(shù)據(jù)分析系統(tǒng)。大數(shù)據(jù)的本質(zhì)是在大量的、復雜的數(shù)據(jù)集合中獲取知識和洞見。其用途可概括為:利用硬件設備、信息技術(shù)和計算方法的進步,將不同格式、不同領(lǐng)域的大數(shù)據(jù)整合成標準統(tǒng)一的數(shù)據(jù)源,研究分析挖掘后繼而產(chǎn)生巨大的經(jīng)濟社會價值;預測未來某一事件發(fā)生的可能性,并據(jù)此進行人為干預,使其向著預期的方向發(fā)展[3]。大數(shù)據(jù)時代帶來的變化不僅體現(xiàn)在如何處理海量數(shù)據(jù)并從中獲取有價值的信息,也體現(xiàn)在如何加強大數(shù)據(jù)技術(shù)研發(fā),準確把握未知的趨勢,搶占時代發(fā)展的前沿。
1.2 大數(shù)據(jù)對于中藥資源數(shù)據(jù)的意義 中醫(yī)藥秉持“天人合一”的整體性思維,以其整體、宏觀、粗放的醫(yī)學認知實現(xiàn)在宏觀整體基礎上認知世界、維護人體健康和調(diào)整疾病狀態(tài),這與大數(shù)據(jù)的思維具有很高的契合性。中藥資源數(shù)據(jù)主要包括我國中藥資源種類、分布、蘊藏量、資源變化趨勢、栽培與野生情況、收購量、需要量、質(zhì)量等[4]。利用大數(shù)據(jù)能夠創(chuàng)新數(shù)據(jù)采集方式,改進抽樣技術(shù),提高中藥資源統(tǒng)計調(diào)查的科學性、準確性和實效性。通過數(shù)據(jù)化整合與共享中藥資源數(shù)量和質(zhì)量,可以縮短中藥資源調(diào)查周期,提高調(diào)查效率,節(jié)約人力、物力、財力,可以為中藥規(guī)范化種植、藥材提取與深加工等提供技術(shù)支撐和保障,并將為科學規(guī)劃發(fā)展中藥材產(chǎn)業(yè)提供重要參考依據(jù)。
1.3 對中藥資源數(shù)據(jù)認識的誤區(qū) 我國中藥資源品種眾多,與之相關(guān)的生長、種植、流通、利用等環(huán)節(jié)因素龐雜,由此產(chǎn)生的數(shù)據(jù)量之多可想而知。事實上,我國當前中藥資源信息統(tǒng)計工作面臨的問題有:水平總體不高,發(fā)展不平衡,統(tǒng)計信息范圍較窄,信息仍顯粗糙、含混,利用率低等。對數(shù)據(jù)采集、存儲和分析等核心技術(shù)關(guān)注較少,相比之下更加看重應用領(lǐng)域,甚至出現(xiàn)神化大數(shù)據(jù)的誤區(qū),認為掌握數(shù)據(jù)和相應的硬件設備就可以分析數(shù)據(jù)。相比于大數(shù)據(jù)對各項技術(shù)提出的更高、更新的要求,傳統(tǒng)的數(shù)據(jù)采集、收集方式相對套路清楚,簡便易學。而現(xiàn)在面對海量數(shù)據(jù),如何選擇數(shù)據(jù),如何判斷相關(guān)性大的因素,如何建模型等問題尚沒有形成完備的技術(shù)和方法[5]。
由于我國尚無采納數(shù)據(jù)格式的國家標準,政府職能部門限制使用者獲取官方統(tǒng)計數(shù)據(jù),導致信息不完整或重復投資。但實際上,有些行業(yè)的數(shù)據(jù)涉及上百個參數(shù),其復雜性不僅體現(xiàn)在數(shù)據(jù)樣本本身,更體現(xiàn)在多源異構(gòu)、多實體和多空間之間的交互動態(tài)性[5]。以谷歌2008年前推出“流感趨勢”服務為例,通過分析關(guān)鍵詞,準確預測了美國各地流感爆發(fā)情況。谷歌綜合分析大量實時數(shù)據(jù)和歷史數(shù)據(jù),了解不同歷史階段流感爆發(fā)情況,以及對應時期的關(guān)鍵詞、頻率,判斷哪些因素的相關(guān)性大,反復試錯、調(diào)整,才能建立可靠模型。
2.1 大數(shù)據(jù)在中藥資源數(shù)據(jù)整合中的應用現(xiàn)狀 近年來,運用掌上電腦(PDA),采用遙感(RS)、地理信息系統(tǒng)(GPS)、全球定位系統(tǒng)(GIS)三者集成的“3S”技術(shù)手段已逐步顯示出良好的應用前景,可以提升和豐富中藥資源調(diào)研的手段與方法。以正在進行的第四次全國中藥資源普查為例,主要通過計算機輔助和專家經(jīng)驗相結(jié)合的方式組織實施中藥資源普查的數(shù)據(jù)填報、匯總分析等主要過程。利用計算機實現(xiàn)實施方案能在智能模板填寫,通過加入專家的在線審核,可以將信息及時反饋給各級管理部門;計算后臺自動實現(xiàn)普查數(shù)據(jù)完整性、有效性校驗以及成果的匯總分析,而通過加入專家設置詳細的統(tǒng)計參數(shù),則提高了匯總結(jié)果的準確性[4]。
但由于中藥資源的研究過程綜合分類學、生態(tài)學、地理學、生物化學、天然產(chǎn)物化學和中藥學等學科[6],具有特定的交叉性、集成性和廣泛的帶動性,決定了這是一項復雜的系統(tǒng)工程,面臨著不可規(guī)避的瓶頸問題。
中藥資源的遙感數(shù)據(jù)、氣象數(shù)據(jù)、生態(tài)系統(tǒng)及地方植物志的植被信息資料、行政區(qū)劃和土地利用的地理數(shù)據(jù)等一系列應用系統(tǒng)呈“碎片化”。數(shù)據(jù)標準不統(tǒng)一,相關(guān)知識表達方法不規(guī)范,導致這些數(shù)據(jù)與知識既無法相互兼容,也無法共享,嚴重制約了我國中藥資源研究的深入建設。
當前我國中藥材的種植(養(yǎng)殖)多與農(nóng)業(yè)聯(lián)系在一起,是增加部分地區(qū)農(nóng)民收入的有效途徑。隨著中藥發(fā)展的產(chǎn)業(yè)化,藥農(nóng)種植(養(yǎng)殖)過程的組織化、集約化,對中藥材種植(養(yǎng)殖)的量化決策提出更高的要求,如何進行科學種植(養(yǎng)殖)、精準施藥調(diào)控、優(yōu)化品種選擇,與更加專業(yè)化的決策有密切聯(lián)系。受成本和技術(shù)水平的限制,這些問題都暫時難以解決。
2.2 大數(shù)據(jù)對中藥資源數(shù)據(jù)整合的機遇 中藥資源是中醫(yī)藥產(chǎn)業(yè)發(fā)展的源頭,其數(shù)量和質(zhì)量一直是制約中醫(yī)藥發(fā)展的關(guān)鍵因素。引入大數(shù)據(jù)的新思維和新思路,不僅有助于促進中藥資源研究領(lǐng)域發(fā)展,也有利于探索中藥資源發(fā)展的新方向和新方法。
2.2.1 中藥資源的自然生態(tài)研究 自然生態(tài)環(huán)境與中藥資源的質(zhì)量、數(shù)量密切相關(guān),是其生態(tài)適宜性評價的客觀基礎。當前我國以“3S”技術(shù)為核心的新型監(jiān)測技術(shù)在植物信息提取及植被分類、土壤水分監(jiān)測、土壤養(yǎng)分監(jiān)測、病蟲害監(jiān)測等方面具有快捷方便、經(jīng)濟實用的特點[7]。大數(shù)據(jù)通過建立一套完善的中藥資源地理信息系統(tǒng),以不同系統(tǒng)采集的海量信息為基礎,通過比對識別模型和當前氣候條件,進行預測性分析,以用于評估土壤肥力、監(jiān)測農(nóng)田邊界圖管理、預測產(chǎn)量分布、定位蟲害情況,并分析控制方法和相關(guān)決策,為中藥資源的自然生態(tài)研究及發(fā)展提供有價值的信息。
2.2.2 中藥種植規(guī)范體系 基于現(xiàn)在多數(shù)中藥資源明顯減少,品質(zhì)也明顯下降的現(xiàn)狀,很多地區(qū)開始嘗試種植中藥材以滿足日益上漲的市場需要[8]。然而中藥材種植與其他農(nóng)作物種植相比不僅有產(chǎn)量的要求,也受藥效的限制。目前中藥材種植缺乏科學化、規(guī)范化,藥農(nóng)每年的播種大多是使用自留種子或從其他農(nóng)戶購買種苗,或者到別的產(chǎn)區(qū)購買種子種苗,或由自己參加的合作社提供。藥材種植管理也較為簡單粗放,無法得到專業(yè)中藥材種植技術(shù)指導。大數(shù)據(jù)可以將中藥材種植地的各種信息進行數(shù)字化,錄入到各類數(shù)據(jù)庫中,自動生成優(yōu)化的耕作、施肥、灌溉和噴藥等指令,結(jié)合設計的專家建議系統(tǒng),進行綜合分析,實現(xiàn)科研、科普、引種、栽培、生產(chǎn)等業(yè)務工作的信息管理,建立一個權(quán)威的網(wǎng)絡信息管理系統(tǒng)。
2.2.3 中藥材市場流通體系 由于我國尚沒有一套權(quán)威的中藥材行業(yè)基礎信息,藥材收購量、需要量、蘊藏量等基本情況不明確,造成中藥材種植戶和經(jīng)營者之間的信息嚴重不對稱,供求信息不暢,市場無法根據(jù)供求合理調(diào)節(jié)價格,讓投機分子趁機囤積居奇,炒高中藥材價格,制造中藥材市場的虛假繁榮[9]。例如沉香是中醫(yī)治胃病常用的一味藥材,取自瑞香科植物白木香含有樹脂的木材,但無序采伐使得野生沉香數(shù)量急劇減少,加之資本炒作,使得沉香飲片統(tǒng)貨價格從百來元每千克上漲到數(shù)千元每千克[10]。大數(shù)據(jù)則可以依據(jù)生態(tài)自然環(huán)境因素和政策社會因素,整合預測農(nóng)產(chǎn)品價格走勢、消費需求等相關(guān)數(shù)據(jù),對及時調(diào)整中藥數(shù)量、質(zhì)量給予基于數(shù)據(jù)解讀的對策和建議。
2.3 潛在的挑戰(zhàn) 目前大數(shù)據(jù)應用還處于探索階段,它與中藥資源現(xiàn)有的創(chuàng)新方法既相互聯(lián)系,又相互區(qū)別。加之其理論框架尚不完備,基礎設施、相關(guān)制度法律還不成熟,大數(shù)據(jù)到底能為中藥資源研究帶來什么變化還令人困惑。
2.3.1 各地中藥資源管理主體存在差別 當前各省主管中藥資源的部門不同,有的由省衛(wèi)生廳主管,有的由省中醫(yī)藥管理局管理,也有由省林業(yè)廳管理的,而部分省則沒有具體管理部門。在有管理部門的省中,分為組織機構(gòu)職能健全和職能欠缺兩類,存在較大的區(qū)域差異。在此基礎上,要使分散在不同部門的數(shù)據(jù)得到合理有效應用,明確可用數(shù)據(jù)、不公開數(shù)據(jù)都需要政府統(tǒng)籌協(xié)調(diào),明確的主管部門履行監(jiān)管中藥資源的職能。
2.3.2 中藥資源人才缺乏 我國剛剛引入大數(shù)據(jù)概念,培養(yǎng)大量掌握大數(shù)據(jù)挖掘技術(shù)和中藥資源專業(yè)知識的人才是不可避免的發(fā)展方向。發(fā)達國家的部分IT企業(yè)已經(jīng)初步掌握了一些數(shù)據(jù)分析預測的關(guān)鍵技術(shù),我國相關(guān)企業(yè)的技術(shù)能力還比較落后。另外,雖然中醫(yī)藥高等院校包括綜合性大學的藥學專業(yè)已累計超過300家,每年培育的專業(yè)技術(shù)人才已逾萬人,但是中藥資源相關(guān)專業(yè)在培養(yǎng)人才方面缺乏系統(tǒng)性、整體性,人員流失嚴重。目前只有23個開設“中藥資源與開發(fā)”本科專業(yè)的院校,一批開設“中藥資源”相關(guān)專業(yè)、方向碩士點、博士點的院校[11]。
2.3.3 潛在的安全威脅 中藥資源不僅包含對其生長環(huán)境的種種要求,還包含中藥材種植基地選定、品種栽培、采收加工、質(zhì)量標準等一系列知識信息。雖然現(xiàn)有的保護傳統(tǒng)知識信息的法律法規(guī)及技術(shù)手段能起到一定保護作用,但是大數(shù)據(jù)的價值并不只是收集海量信息以改變現(xiàn)狀,更多用于對收集到的信息進行二次利用,預測和判斷未知的行為。因此未來在采集數(shù)據(jù)前無法窮盡其用途,充分獲得信息使用許可,因此對于數(shù)據(jù)提供者的告知與許可便也失去實質(zhì)意義,加深對數(shù)據(jù)隱私、公共機構(gòu)信息保密的威脅。近年來珍貴藥用資源遭到國外醫(yī)藥機構(gòu)地毯式篩選的事件常有發(fā)生,導致我國自主開發(fā)中藥或天然藥物的源泉日益枯竭,同時也威脅了我國生態(tài)安全甚至國家安全。在新形勢的挑戰(zhàn)下,客觀冷靜面對大數(shù)據(jù),使其在合理的規(guī)制下發(fā)揮作用顯得尤為重要。
中藥資源信息的利用不僅具有生態(tài)學意義,更具有國家戰(zhàn)略意義。中藥資源的開發(fā)利用是中藥產(chǎn)業(yè)的根基,關(guān)乎民生和社會穩(wěn)定,關(guān)乎生態(tài)環(huán)境保護和新興戰(zhàn)略產(chǎn)業(yè)發(fā)展,是全球競爭中國家優(yōu)勢的體現(xiàn)。將大數(shù)據(jù)應用于中藥資源中意味著很多機遇,但要真正利用好大數(shù)據(jù)技術(shù),還有許多亟待完善的問題。
3.1 轉(zhuǎn)變思想觀念 面對不斷升溫的大數(shù)據(jù)熱潮,先知、先覺、先行既可能率先受益,也可能首當其沖,關(guān)鍵在于是否能理性分析、冷靜觀察,找到核心技術(shù)、應用模式。大數(shù)據(jù)要求扎實的基礎性工作,這些工作可能是長期性、前瞻性的,需要逐步推進,很難立竿見影、一蹴而就。因此對當前的大數(shù)據(jù)潮,既要有積極迎接的準備,也要有警惕過熱的思想。通過探索突破傳統(tǒng)數(shù)據(jù)管理的局限,結(jié)合中藥資源信息管理的特點,在相關(guān)法律制度的規(guī)范下,促進中藥資源學科的發(fā)展。
3.2 提高技術(shù)水平 有效運用大數(shù)據(jù),需要提高計算機和數(shù)據(jù)管理硬件,增強相應計算系統(tǒng)的功能,培養(yǎng)一批大數(shù)據(jù)分析運用的服務企業(yè)和專業(yè)人才。通過建設計算機管理系統(tǒng),克服中藥資源普查項目因經(jīng)費和人員等原因的非常態(tài)化,建立長期固定的資源監(jiān)控機制,實時把握中藥資源的分布及生長狀況。
政府可以在構(gòu)建數(shù)據(jù)質(zhì)量分析平臺,構(gòu)架藥農(nóng)、企業(yè)和市場間的溝通橋梁方面予以支持。鼓勵民間設立專項基金,提高中藥行業(yè)的技術(shù)水平,鼓勵將中藥資源普查及相關(guān)科技成果的轉(zhuǎn)化、應用和推廣,為行業(yè)提供技術(shù)支撐和技術(shù)服務[12]。另一方面,在現(xiàn)有的藥用植物園體系的基礎上,建設信息共享平臺[13],充分利用數(shù)據(jù)資源,以收集藥典上常用中藥、瀕危中藥為重點,集種質(zhì)保存、科研、種植培育、科普宣傳、旅游五位一體,全面發(fā)展。
政府還可以在抽樣調(diào)查、網(wǎng)絡信息技術(shù)應用等方面應用大數(shù)據(jù)的思維和方法,有所突破??臻g數(shù)據(jù)的應用實際上要先于大數(shù)據(jù)概念的提出,由于空間數(shù)據(jù)具備大數(shù)據(jù)的特性,故其本身就是“大數(shù)據(jù)”[14]。中藥資源的種植(養(yǎng)殖)具有明顯的空間特性,是利用空間數(shù)據(jù)的主要領(lǐng)域。嘗試利用航拍技術(shù)獲取具有空間特征的中藥材種植(養(yǎng)殖)區(qū)域、居住區(qū)域等對象的高清影像,結(jié)合已知的普查信息,構(gòu)建空間抽樣框。并通過“3S”技術(shù)對樣本實行遙感和觀測,使調(diào)查對象實現(xiàn)可視、可測、可追溯。在網(wǎng)絡信息技術(shù)方面,可以逐步對中藥材價格調(diào)查進行現(xiàn)場數(shù)據(jù)采集,通過基層統(tǒng)計報表傳送終端設備,基層統(tǒng)計人員手持設備到現(xiàn)場,直接將采集的信息上傳。
3.3 完善法律制度 大數(shù)據(jù)為監(jiān)測中藥資源提供了便利,但同時對保護中藥資源相關(guān)傳統(tǒng)知識的手段提出新的挑戰(zhàn)。原有的數(shù)據(jù)隱私保護模式不能再起到良好的作用,因此需要完善數(shù)據(jù)隱私保護,建立健全公共機構(gòu)信息公開等立法修法工作。我國于2012年出臺的 《關(guān)于加強網(wǎng)絡信息保護的決定》、《信息安全技術(shù)公共及商用服務信息系統(tǒng)個人信息保護指南》都對大數(shù)據(jù)時代的個人數(shù)據(jù)信息管理進行了原則性的規(guī)定[15]。在未來的數(shù)據(jù)隱私保護規(guī)制中,應進一步明確數(shù)據(jù)用途,包括數(shù)據(jù)可以進行商業(yè)化應用的范圍、應用范圍界定標準、數(shù)據(jù)濫用承擔的責任等。對于一些危險性較大的項目,應設立專門規(guī)章,規(guī)范數(shù)據(jù)使用者評估風險,降低潛在傷害。
[1] 潘文,程濤,牛崇信,等.大數(shù)據(jù)時代中醫(yī)藥信息的應用.中國中醫(yī)藥圖書情報雜志,2014,38(1):2
[2] 維克托·邁爾-舍恩伯格,肯尼斯·庫克耶.大數(shù)據(jù)時代.杭州:浙江人民出版社,2013:228
[3] 蔡書凱.大數(shù)據(jù)與農(nóng)業(yè):現(xiàn)實挑戰(zhàn)與對策.電子商務,2014(1):3
[4] 郭蘭萍,陸建偉,張小波,等.全國中藥資源普查技術(shù)規(guī)范制定.中國中藥雜志,2013,38(7):937
[5] 鄔賀銓.大數(shù)據(jù)時代的機遇與挑戰(zhàn).求是,2013(4):47
[6] 周榮漢.中藥資源學.北京:中國醫(yī)藥科技出版社,1993:3
[7] 郭蘭萍,黃璐琦,蔣有緒.“3S”技術(shù)在中藥資源可持續(xù)利用中的應用.中國中藥雜志,2005,30(18):1397
[8] 趙文吉,李敏,黃博.中藥材種子種苗市場現(xiàn)狀及對策探討.中國現(xiàn)代中藥,2012,14(3):5
[9] 于志斌.中藥材市場調(diào)研分析報告.中國現(xiàn)代中藥,2012,14(1):51
[10] 李瑤.中藥材源頭之憂.醫(yī)藥經(jīng)濟報,2014-7-28(5)
[11] 段金廒,周榮漢,宿樹蘭,等.我國中藥資源科學發(fā)展現(xiàn)狀及展望.自然資源學報,2009,24(3):378
[12] 陳士林,肖培根.中藥資源可持續(xù)利用導論.北京:中國醫(yī)藥科技出版社,2006:56
[13] 李標,魏建和,王文全,等.推進國家藥用植物園體系建設的思考.中國現(xiàn)代中藥,2013,15(9):721
[14] 馬建堂.大數(shù)據(jù)在政府統(tǒng)計中的探索與應用.北京:中國統(tǒng)計出版社,2013:147
[15] 馬曉亭.大數(shù)據(jù)時代基于服務等級協(xié)議的圖書館讀者隱私感知與保護研究.情報理論與實踐,2014,37(4):57