王弋波
(中國科學(xué)技術(shù)信息研究所,北京 100038)
精準(zhǔn)醫(yī)療背景下生物樣本信息的價值初探
王弋波
(中國科學(xué)技術(shù)信息研究所,北京 100038)
精準(zhǔn)醫(yī)療的產(chǎn)業(yè)化進(jìn)程賦予生物樣本信息新的價值,同時使生物樣本信息的管理面臨全新局面?;趪鴥?nèi)外政策制度歸納生物樣本信息的定義,通過對精準(zhǔn)醫(yī)療背景下生物樣本生命周期各環(huán)節(jié)信息活動的解析,梳理生物樣本信息的具體內(nèi)容,構(gòu)建生命周期中的信息流,結(jié)合信息活動主體在信息流中的關(guān)系,說明生物樣本信息管理的需求與實現(xiàn),揭示生物樣本信息的價值定位,提出制訂數(shù)據(jù)標(biāo)準(zhǔn)、建立云平臺、深化理論研究等建議。
生物樣本;信息管理;精準(zhǔn)醫(yī)療;價值定位
2015年,美國率先提出“精準(zhǔn)醫(yī)療”發(fā)展計劃[1],2016年我國頒布的《“十三五”國家科技創(chuàng)新規(guī)劃》將“精準(zhǔn)醫(yī)療”以及“精準(zhǔn)醫(yī)療關(guān)鍵技術(shù)”納人國家重點部署工作[2]。中美兩國都對“精準(zhǔn)醫(yī)療”的關(guān)注預(yù)示其即將到來的產(chǎn)業(yè)化進(jìn)程。分子生物學(xué)、遺傳學(xué)、轉(zhuǎn)化醫(yī)學(xué)等相關(guān)學(xué)科的理論發(fā)展和技術(shù)突破為精準(zhǔn)醫(yī)療產(chǎn)業(yè)提供了技術(shù)前景[3],然而在后互聯(lián)網(wǎng)時代的浪潮中,與大數(shù)據(jù)、云計算、人工智能等信息技術(shù)的充分結(jié)合將為精準(zhǔn)醫(yī)療產(chǎn)業(yè)發(fā)展提供必要條件[4]。
精準(zhǔn)醫(yī)療技術(shù)研發(fā)和臨床治療的核心工作是“通過組學(xué)技術(shù),對大樣本人群與特定疾病類型進(jìn)行生物標(biāo)記物的分析與鑒定、驗證與應(yīng)用”和“通過精確尋找靶點、精確亞分類等方式實施個性化精準(zhǔn)治療”[5]。無論是分析生物標(biāo)記物還是研發(fā)靶向藥物,都必須完成生物樣本的采集、制備、儲存等環(huán)節(jié),最終依靠基因測序等技術(shù)手段獲取相關(guān)的組學(xué)數(shù)據(jù)。但僅憑組學(xué)數(shù)據(jù)并不足以發(fā)現(xiàn)基因、環(huán)境和疾病之間錯綜復(fù)雜的關(guān)聯(lián)。這種關(guān)聯(lián)必須通過組學(xué)數(shù)據(jù)和生物樣本信息的對照分析來建立。因此,生物樣本是精準(zhǔn)醫(yī)療產(chǎn)業(yè)運行的物質(zhì)基礎(chǔ),生物樣本信息則貫穿整個產(chǎn)業(yè)鏈,發(fā)揮著十分關(guān)鍵且無法替代的作用。
生物樣本信息的建設(shè)水平?jīng)Q定了精準(zhǔn)醫(yī)療產(chǎn)業(yè)的信息化和智能化程度,也決定了產(chǎn)業(yè)的發(fā)展速度和未來可能承擔(dān)的風(fēng)險[6]。目前,國內(nèi)外有關(guān)生物樣本信息的學(xué)術(shù)研究和管理探索并不鮮見[7-10],但大多局限于生物樣本管理信息系統(tǒng)或相關(guān)數(shù)據(jù)庫建設(shè)層面。尤其是國內(nèi)研究多關(guān)注于樣本庫管理制度、樣本制備和保存測試等問題[11],對生物樣本信息的供需關(guān)系、產(chǎn)業(yè)應(yīng)用、內(nèi)容分化及其關(guān)聯(lián)結(jié)構(gòu)等問題缺乏關(guān)注。隨著生物樣本信息的重要性日漸突出,相關(guān)行業(yè)標(biāo)準(zhǔn)和技術(shù)規(guī)范已經(jīng)在國際科技競爭中呈現(xiàn)出較高的戰(zhàn)略意義[12-14]。為此,本文對精準(zhǔn)醫(yī)療背景下生物樣本信息的價值進(jìn)行初步探討。
在學(xué)術(shù)界和產(chǎn)業(yè)界,生物樣本的基本定義已經(jīng)形成基本共識。但由于基因組、蛋白質(zhì)組、代謝組等組學(xué)技術(shù)長期處于精準(zhǔn)醫(yī)療相關(guān)研究的核心地位,生物樣本信息的定義隨研究內(nèi)容變化呈現(xiàn)較大差異,例如過于寬泛的“生物信息”[3]或過于局限的“臨床信息”[15]等,相對尚存爭議?,F(xiàn)從政府的政策和管理來看生物樣本信息的定義則更加清晰。
目前,國內(nèi)外對生物樣本通常從“人類遺傳資源”和“醫(yī)學(xué)研究樣本”兩方面實施,前者強(qiáng)調(diào)人類生物樣本的遺傳價值和長期保存,后者注重醫(yī)學(xué)倫理相關(guān)制度。例如,經(jīng)濟(jì)合作與發(fā)展組織(OECD)于2009年發(fā)布的《人體生物銀行和遺傳研究數(shù)據(jù)庫指南》中,對生物樣本庫管理對象的界定為“用于遺傳研究的結(jié)構(gòu)化資源包括:(a)人類遺傳材料和/或?qū)@些遺傳材料進(jìn)行分析生成的信息;(b)相關(guān)聯(lián)的信息”[16]。此處尤其突出“人類遺傳材料”,以區(qū)別于OECD對包括動植物、細(xì)菌病毒等更廣泛“生物遺傳資源”的管理。類似地,美國癌癥研究院(NCI)對生物銀行界定為“生物銀行是指用于研究的人類生物樣本、相關(guān)數(shù)據(jù)、數(shù)據(jù)存儲的實體以及相關(guān)流程和政策的集合”[17]。雖然兩者表述的對象相同,但OECD更關(guān)注實體的“遺傳材料”,并突出生物樣本與其關(guān)聯(lián)信息的關(guān)系,即按照信息來源將其關(guān)聯(lián)信息區(qū)分為“分析生成的”和“相關(guān)聯(lián)的”兩類;NCI主要強(qiáng)調(diào)樣本信息的數(shù)據(jù)形態(tài)、管理流程和政策環(huán)境,突出醫(yī)學(xué)研究對生物樣本管理的需求,即對樣本實體、關(guān)聯(lián)數(shù)據(jù)和倫理法規(guī)認(rèn)可的需求。
在國內(nèi)政策法規(guī)中,國務(wù)院于1998年頒布的《人類遺傳資源管理暫行辦法》是我國目前唯一全面管理人類遺傳資源的法規(guī)文件,將人類遺傳資源界定為“人類遺傳資源是指含有人體基因組、基因及其產(chǎn)物的器官、組織、細(xì)胞、血液、制備物、重組脫氧核糖核酸(DNA)構(gòu)建體等遺傳材料及相關(guān)的信息資料”[18]。此處主要明確“遺傳材料”的范疇,但并未展開闡述“相關(guān)信息資料”的內(nèi)涵。在醫(yī)療行業(yè)層面,中國醫(yī)藥生物技術(shù)協(xié)會將生物樣本庫的管理對象界定為“包含任何包含人體生物信息的生物物質(zhì),包括人體組織、血液、分泌物、排泄物及其衍生物”[19]。此處并未涉及生物樣本的信息,可見國內(nèi)醫(yī)療行業(yè)對相關(guān)領(lǐng)域的認(rèn)識尚有不足。
基于管理目的和行業(yè)背景的因素,雖然各政策主體對生物樣本信息的描述方式或有差異,但表達(dá)的判斷依據(jù)基本一致。綜合兩種管理口徑可以看到,生物樣本是指以實物形式存在的“遺傳材料”或“生物物質(zhì)”,而與生物樣本相關(guān)聯(lián)的信息均可納人生物樣本信息的范疇。但生物樣本只是轉(zhuǎn)化醫(yī)學(xué)研究中承載人體生物信息的載體,在樣本采集和制備中產(chǎn)生,在樣本使用中被消耗。生物樣本信息的描述對象可以是生物樣本實體,也可以是生物樣本在生命周期各環(huán)節(jié)中的活動。因此,考慮到生物樣本信息描述對象的差異,歸納相關(guān)政策規(guī)范可以得到生物樣本信息的如下定義:狹義的生物樣本信息是指生物樣本的實物形態(tài)及其保存狀態(tài)相關(guān)的信息;廣義的生物樣本信息是指在生物樣本的采集、處理、存儲、利用等過程中所生產(chǎn)和記錄的相關(guān)信息。
下面再以生物樣本的生命周期來看生物樣本信息的內(nèi)涵。生物樣本的生命周期及其相關(guān)信息內(nèi)容如圖1所示。其中,圍繞生物樣本實體的產(chǎn)生和消耗,可以概略地將生物樣本生命周期分解為采集、儲存、使用3個主要環(huán)節(jié);考慮對生物樣本的組織管理,還可以將其生命周期向上追溯到科研課題管理環(huán)節(jié);考慮生物樣本所承載生物信息的分析研究,還可以將生物樣本生命周期向下延伸至生物醫(yī)藥研發(fā)環(huán)節(jié)。
據(jù)此可以看到,狹義的生物樣本信息僅包括生物樣本儲存環(huán)節(jié)所產(chǎn)生的信息,廣義的生物樣本信息應(yīng)當(dāng)涵蓋其整個生命周期。雖然生物樣本生命周期各環(huán)節(jié)的最終目標(biāo)均是實現(xiàn)轉(zhuǎn)化醫(yī)學(xué)研究或臨床治療,但工作內(nèi)容和專業(yè)技術(shù)差異較大,各環(huán)節(jié)產(chǎn)生信息的內(nèi)容也各不相同。
(1)科研課題管理環(huán)節(jié)是指相關(guān)領(lǐng)域研究人員在設(shè)計研究方案、組織課題實施的過程中所實施的管理工作,例如研究機(jī)構(gòu)的科技項目管理或企業(yè)的產(chǎn)品(技術(shù))研發(fā)管理。科研課題管理環(huán)節(jié)產(chǎn)生的信息主要涉及兩個方面:一是資助機(jī)構(gòu)信息,這決定了后續(xù)環(huán)節(jié)產(chǎn)生的大部分信息的權(quán)屬關(guān)系;二是研究內(nèi)容信息,這部分信息是對課題所生成生物樣本的整體描述,并為生物樣本的采集、處理、儲存、使用、分析以及質(zhì)量控制等后續(xù)環(huán)節(jié)提供依據(jù)。
圖1 生物樣本生命周期及信息內(nèi)容
(2)生物樣本采集環(huán)節(jié)是指研究人員通過臨床檢驗或人群調(diào)查等方式,采集捐獻(xiàn)人的生物物質(zhì),并記錄相關(guān)信息的活動。采集環(huán)節(jié)不僅為生物樣本的生產(chǎn)提供了原始材料,而且是收集捐獻(xiàn)人表型信息和環(huán)境信息的重要過程。僅從信息傳播層面看,在采集環(huán)節(jié)將捐獻(xiàn)人的全部動態(tài)活動轉(zhuǎn)變?yōu)殪o態(tài)的生物樣本實體和數(shù)據(jù)記錄。從而轉(zhuǎn)化為醫(yī)學(xué)研究所關(guān)注的基因、表型和環(huán)境等信息。因此,采集環(huán)節(jié)產(chǎn)生的信息包括對兩個主體的描述:一是對捐獻(xiàn)人的描述,具體包括人口學(xué)信息和表型信息,其中表型信息又因臨床研究和遺傳學(xué)研究的差異,分別以病歷信息和樣本采集調(diào)查表的形式體現(xiàn)(精準(zhǔn)醫(yī)療領(lǐng)域通常為病歷信息);二是對采集人和采集過程的描述,即采集機(jī)構(gòu)、采集時間、采集方式、捐獻(xiàn)者采前狀態(tài)等。
(3)生物樣本儲存環(huán)節(jié)是指研究人員將采集到的原始材料處理成為可長期保存的形態(tài),并為生物樣本保存提供妥善環(huán)境和相應(yīng)管理的活動。原始材料的處理過程對生物樣本所保留生物信息的影響較大,且不同研究內(nèi)容均有其嚴(yán)格對應(yīng)的處理方式和保存方式。此外,隨著生物樣本集中保存機(jī)制的廣泛應(yīng)用,專業(yè)化的管理部門還需要明確生物樣本的權(quán)屬信息。因此,儲存環(huán)節(jié)產(chǎn)生的信息包括3個部分:一是生物樣本的權(quán)屬信息,即儲存機(jī)構(gòu)、樣本所有人、捐獻(xiàn)人知情同意書、使用條件等;二是處理過程信息,即樣本內(nèi)容物的類型標(biāo)注、標(biāo)準(zhǔn)操作流程(SOP)及制備過程記錄、人庫時間、使用的試劑和容器等;三是保存狀態(tài)信息,即生物樣本的物理位置、儲存溫度、凍融記錄等。
(4)生物樣本使用環(huán)節(jié)通常是指研究人員將保存的生物樣本用于基因測序、蛋白質(zhì)檢測及生物標(biāo)志物篩查等檢驗檢測活動。而在精準(zhǔn)醫(yī)療的部分特殊場景下,生物樣本使用環(huán)節(jié)也可以是醫(yī)療人員將其直接用于臨床治療活動中,例如干細(xì)胞移植治療。檢驗檢測活動會消耗生物樣本,使其失去實體形態(tài),但產(chǎn)生的各類組學(xué)數(shù)據(jù)則是相關(guān)研究的核心信息。因此,按照組學(xué)信息描述對象的差異,使用環(huán)節(jié)產(chǎn)生的數(shù)據(jù)分別對應(yīng)DNA、RNA和蛋白質(zhì)三大類,各類下細(xì)分的檢驗項目所包含的參數(shù)又存在一些差異。
(5)生物醫(yī)藥研發(fā)(醫(yī)學(xué)研究)環(huán)節(jié)是指科研人員綜合組學(xué)、表型和環(huán)境等信息開展研究,最終產(chǎn)生科技文獻(xiàn)、科學(xué)數(shù)據(jù)、技術(shù)專利、新產(chǎn)品和新療法等各類成果。無論其商業(yè)價值如何,研究成果與生物樣本之間的關(guān)聯(lián)關(guān)系都具有重要的科研參考價值,所以記錄這種關(guān)系的信息則需要在生物樣本管理中妥善保存。
雖然生物樣本生命周期各環(huán)節(jié)的工作內(nèi)容不同,專業(yè)技術(shù)存在很大差異,但各環(huán)節(jié)產(chǎn)生的生物樣本信息并非孤立存在。僅從各環(huán)節(jié)信息內(nèi)容的描述對象區(qū)分,可以將生物樣本信息內(nèi)容區(qū)分為“實體信息管理”“權(quán)屬信息管理”和“科研信息管理”3個層面。各環(huán)節(jié)具體工作所處層面以及相應(yīng)信息流如圖2所示。
圖2 生物樣本生命周期中的信息流
(1)實體信息管理是對生物樣本從原始材料的采集到處理為可長期保存的形態(tài)后人庫保藏直至在檢驗檢測中被消耗的過程描述,主要強(qiáng)調(diào)生物樣本實體形態(tài)的準(zhǔn)確描述和活動留痕。實體層中的各項活動按照先后次序逐一發(fā)生,每一項活動都必須建立在前一項產(chǎn)生的信息基礎(chǔ)上。
(2)權(quán)屬信息管理是對參與生物樣本采集和保存活動中的捐獻(xiàn)人、資助機(jī)構(gòu)、保存機(jī)構(gòu)、科研機(jī)構(gòu)等主體權(quán)責(zé)的說明和相關(guān)文件的記錄,主要強(qiáng)調(diào)各類主體權(quán)責(zé)范圍的明確闡述和相關(guān)證明文件的完備性。權(quán)屬層的各項活動是以嚴(yán)格保障各類主體的權(quán)益為目的,必須通過實體層和科研層的部分活動獲取信息,并最終體現(xiàn)在醫(yī)學(xué)研究的成果管理上。
(3)科研信息管理包括研究方案、臨床醫(yī)學(xué)信息與人口學(xué)信息的保存和傳遞,并對研究方案的實現(xiàn)過程和相應(yīng)數(shù)據(jù)分析的結(jié)果給予完整記錄,主要強(qiáng)調(diào)多源信息集成和信息質(zhì)量控制。科研層存在大量并行發(fā)生的信息活動,例如:“研究內(nèi)容”雖然指導(dǎo)整個科研項目的進(jìn)程,但并不直接決定其他信息活動的結(jié)果;“人口學(xué)信息”和“臨床醫(yī)學(xué)信息”的采集通常并行發(fā)生,最終共同服務(wù)于“醫(yī)學(xué)研究”。
綜合3個層面的信息流可以看到:(1)“醫(yī)學(xué)研究”是生物樣本相關(guān)所有信息活動的最終服務(wù)對象,是生物樣本信息管理的核心需求;(2)實體層的信息活動相對獨立,生物樣本的實體信息很容易形成獨立的數(shù)據(jù)集,但依靠實體層內(nèi)部管理難以保障相關(guān)聯(lián)信息的完整;(3)權(quán)屬層的信息涉及科研機(jī)構(gòu)和捐獻(xiàn)人兩方面,項目管理方需要對倫理審查、樣本管理規(guī)范和相關(guān)信息安全機(jī)制提供保障;(4)科研層的信息活動是提供生物樣本表型信息和環(huán)境信息的主要來源。這些信息是“樣本權(quán)屬”的部分信息來源,而與組學(xué)信息(如“測序數(shù)據(jù)”)之間的關(guān)聯(lián)關(guān)系是開展“醫(yī)學(xué)研究”的必要條件。
生物樣本在其生命周期中經(jīng)歷眾多主體的管理,在精準(zhǔn)醫(yī)療背景下各信息活動相應(yīng)的主體如圖3所示。
由于“醫(yī)學(xué)研究”在信息流中的核心地位,轉(zhuǎn)化醫(yī)學(xué)研究部門的需求成為生物樣本信息價值主張的主要依據(jù)。對于轉(zhuǎn)化醫(yī)學(xué)研究部門,其獲取生物樣本信息的目的是開展高質(zhì)量的研究并確保研究的可持續(xù)性。因此,其需求可以歸納為4個主要目標(biāo),即充分獲取信息、保障信息質(zhì)量、符合倫理法規(guī)、提升可拓展性。
對照生物樣本生命周期各環(huán)節(jié),其他參與主體對以上4個目標(biāo)的實現(xiàn)如圖4所示。
圖3 生物樣本信息生產(chǎn)加工各環(huán)節(jié)對應(yīng)主體
圖4 參與主體對核心目標(biāo)的實現(xiàn)
“充分獲取信息”目標(biāo)主要依靠組學(xué)實驗室、醫(yī)院信息中心和樣本采集部門實現(xiàn)。組學(xué)實驗室提供組學(xué)信息;醫(yī)院信息中心提供表型信息;醫(yī)院信息中心和樣本采集部門共同提供環(huán)境信息。
“保障信息質(zhì)量”目標(biāo)的實現(xiàn)涉及生物樣本庫、生化實驗室、組學(xué)實驗室和樣本采集部門,需要所有涉及樣本實體活動的主體制定合理的操作規(guī)范并嚴(yán)格實行,同時詳細(xì)記錄生物樣本的采集加工過程。
“符合倫理法規(guī)”目標(biāo)主要依靠樣本捐獻(xiàn)者和項目管理部門實現(xiàn)。樣本捐獻(xiàn)者和項目管理部門共同提供知情同意信息;項目管理部門還需要預(yù)先了解項目開展地域的相關(guān)倫理和法律,并監(jiān)督其實施過程的合法性。此外,項目管理部門還要明確項目實施中各參與主體的相關(guān)權(quán)益,避免任何主體的權(quán)益受到侵害。
“提升可拓展性”目標(biāo)主要依靠項目管理部門實現(xiàn),項目管理部門為生物樣本管理所制定數(shù)據(jù)標(biāo)準(zhǔn)體系的系統(tǒng)性和科學(xué)性決定其科研成果的可讀性、可信度和應(yīng)用范圍等。
從精準(zhǔn)醫(yī)療背景下生物樣本信息管理的需求分析可以看到,參與生物樣本生命周期的各類主體通過復(fù)雜的信息生產(chǎn)和傳遞路徑為轉(zhuǎn)化醫(yī)學(xué)研究提供所需信息資源。生物樣本信息在采集加工的過程中呈現(xiàn)出多種形態(tài),為精準(zhǔn)醫(yī)療運行提供重要支撐。
(1)生物樣本信息是精準(zhǔn)醫(yī)療產(chǎn)業(yè)數(shù)據(jù)資源的核心集成體。如前所述,生物樣本信息包括組學(xué)信息、表型信息、環(huán)境信息、采集加工過程記錄、操作規(guī)范、知情同意書、倫理法規(guī)、利益相關(guān)方、數(shù)據(jù)標(biāo)準(zhǔn)等眾多信息,是多維數(shù)據(jù)的集成體。不同于單純的醫(yī)學(xué)研究,在精準(zhǔn)醫(yī)療產(chǎn)業(yè)化進(jìn)程中,出于項目管理、資產(chǎn)管理和產(chǎn)品工程化等目的,這些信息已經(jīng)成為支撐精準(zhǔn)醫(yī)療產(chǎn)業(yè)發(fā)展的必要數(shù)據(jù)資源。因此,以信息集成體的形式系統(tǒng)地整合和管理生物樣本信息是精準(zhǔn)醫(yī)療產(chǎn)業(yè)應(yīng)當(dāng)廣泛普及的基本認(rèn)識。
(2)生物樣本信息是精準(zhǔn)醫(yī)療產(chǎn)業(yè)深度信息化的數(shù)據(jù)資源保障。生物樣本的采集加工過程記錄、操作規(guī)范和數(shù)據(jù)標(biāo)準(zhǔn)是評估生物樣本信息質(zhì)量的主要依據(jù),也是借助“互聯(lián)網(wǎng)+”和大數(shù)據(jù)技術(shù)推動相關(guān)科研成果廣泛應(yīng)用的必要條件。精準(zhǔn)醫(yī)療產(chǎn)業(yè)的深度信息化必須建立在完善的生物樣本信息資源基礎(chǔ)上,通過對生物樣本信息的深人挖掘和增值利用實現(xiàn)。因此,完善相關(guān)行業(yè)規(guī)范、提升生物樣本信息管理系統(tǒng)建設(shè)水平是精準(zhǔn)醫(yī)療產(chǎn)業(yè)信息化的必要工作。
(3)生物樣本信息是轉(zhuǎn)化醫(yī)學(xué)研究過程的主要信息組織形式。即使暫不考慮知識產(chǎn)權(quán)、倫理法規(guī)等問題,生物樣本信息中用于轉(zhuǎn)化醫(yī)學(xué)研究的組學(xué)信息、表型信息、環(huán)境信息、實驗過程記錄以及相應(yīng)操作規(guī)范和數(shù)據(jù)標(biāo)準(zhǔn)等信息分別來自不同參與主體,其技術(shù)領(lǐng)域和管理口徑均有較大差異。為避免多源數(shù)據(jù)關(guān)聯(lián)性的缺失或損壞,以生物樣本為紐帶組織相關(guān)信息已成為轉(zhuǎn)化醫(yī)學(xué)研究的普遍工作方式。因此,進(jìn)一步深化生物樣本信息管理的理論與實踐研究將對轉(zhuǎn)化醫(yī)學(xué)發(fā)展將產(chǎn)生深遠(yuǎn)的影響。
(4)生物樣本信息是產(chǎn)業(yè)化需求與醫(yī)學(xué)研究的數(shù)據(jù)接口。精準(zhǔn)醫(yī)療產(chǎn)業(yè)是醫(yī)藥產(chǎn)業(yè)、臨床醫(yī)學(xué)與基礎(chǔ)醫(yī)學(xué)研究的結(jié)合,是諸多技術(shù)領(lǐng)域和學(xué)科方向的融合發(fā)展。生物樣本信息作為貫穿其業(yè)務(wù)主線的信息資源,在多領(lǐng)域數(shù)據(jù)間建立起緊密的關(guān)聯(lián)關(guān)系,將醫(yī)學(xué)研究成果與其產(chǎn)品之間的聯(lián)系清晰呈現(xiàn)。因此,規(guī)范化的生物樣本信息將使產(chǎn)業(yè)化需求與醫(yī)學(xué)研究的對應(yīng)關(guān)系更加明朗,不僅為醫(yī)學(xué)研究成果的快速產(chǎn)業(yè)化提供便利,也為精準(zhǔn)醫(yī)療產(chǎn)業(yè)的發(fā)展方向提供參考和指導(dǎo)。
本文從精準(zhǔn)醫(yī)療產(chǎn)業(yè)發(fā)展的信息化需求人手,厘清樣本信息的概念范疇和價值定位。轉(zhuǎn)化醫(yī)學(xué)研究發(fā)展快速提升了組學(xué)數(shù)據(jù)的商業(yè)價值,而精準(zhǔn)醫(yī)療的產(chǎn)業(yè)化進(jìn)程則將生物樣本信息的資源價值提升到新的水平。由于產(chǎn)業(yè)化和信息化帶來對信息規(guī)模和信息質(zhì)量的需求,生物樣本信息從“遺傳資源保藏”背景下的檔案形態(tài)轉(zhuǎn)化為精準(zhǔn)醫(yī)療背景下的資源形態(tài),成為精準(zhǔn)醫(yī)療產(chǎn)業(yè)的重要資源和資產(chǎn)。相對地,面對產(chǎn)業(yè)化需求在可讀性、可靠性、可拓展性的更高要求,現(xiàn)有管理體系下高水平生物樣本信息的稀缺現(xiàn)狀也被凸顯出來。依據(jù)對生物樣本信息的信息流和需求分析,提出如下建議。
(1)研究并制訂生物樣本信息數(shù)據(jù)標(biāo)準(zhǔn)和技術(shù)標(biāo)準(zhǔn),降低多維數(shù)據(jù)集成管理成本,提升數(shù)據(jù)可拓展性。雖然生物樣本信息管理可以實現(xiàn)多維數(shù)據(jù)集成、組織多源數(shù)據(jù)并管控數(shù)據(jù)質(zhì)量,但以項目或機(jī)構(gòu)為主導(dǎo)的信息管理難以形成穩(wěn)定的管理機(jī)制,并且數(shù)據(jù)標(biāo)準(zhǔn)和管理信息系統(tǒng)的重復(fù)建設(shè),跨機(jī)構(gòu)、跨學(xué)科數(shù)據(jù)標(biāo)準(zhǔn)的兼容問題等都會增加生物樣本信息的管理成本。而在行業(yè)層面研究并制訂相關(guān)數(shù)據(jù)標(biāo)準(zhǔn)和技術(shù)標(biāo)準(zhǔn)不僅能有效降低信息管理成本,同時對提升生物樣本信息可讀性、可靠性和可拓展性具有良好的促進(jìn)作用。
(2)建立開放式的生物樣本信息管理云平臺及其數(shù)據(jù)安全保障機(jī)制,快速提升產(chǎn)業(yè)信息化水平。生物樣本的采集加工需要多主體的共同參與,而生物樣本管理信息系統(tǒng)的重復(fù)建設(shè)不僅為相關(guān)研究帶來巨大的經(jīng)費壓力,攤薄的建設(shè)經(jīng)費也限制了各主體的管理信息化水平。因此,建立開放式的生物樣本信息管理云平臺,為醫(yī)院、企業(yè)、研究所提供便捷和相對廉價的信息管理服務(wù),是快速提升產(chǎn)業(yè)信息化水平的有效方式。但由于醫(yī)療信息的敏感性,其云平臺必須具有完善的數(shù)據(jù)安全保障機(jī)制,并兼顧安全性和數(shù)據(jù)有效性。
(3)深化生物樣本信息管理研究,為專業(yè)化管理提供理論支撐。生物樣本信息管理正在進(jìn)人一個新的階段,相比以“遺傳資源保藏”為目標(biāo)的時代,其面向的用戶群體、業(yè)務(wù)架構(gòu)和制度環(huán)境等均發(fā)生了較大變化。同時,精準(zhǔn)醫(yī)療的產(chǎn)業(yè)化方興未艾,新的變化還在不斷發(fā)生。目前,國內(nèi)外生物樣本庫、生物銀行、相關(guān)研究機(jī)構(gòu)等對生物樣本信息的管理仍處于探索階段,對生物樣本信息的認(rèn)識仍不全面。
(4)為適應(yīng)新的用戶需求和制度環(huán)境,有必要不斷推進(jìn)生物樣本信息管理研究,提出支撐專業(yè)化管理的系統(tǒng)性管理理論。
[1]COLLINS F S, VARMUS H. A new initiative on precision medicine[J]. New England Journal of Medicine,2015, 372(9): 793.
[2]中華人民共和國國務(wù)院. 國務(wù)院關(guān)于印發(fā)“十三五”國家科技創(chuàng)新規(guī)劃的通知[EB/OL]. [2017-07-03].http: //www.most.gov.cn/mostinfo/xinxifenlei/gjkjgh/201608/t20160810_127174.htm.
[3]張雷, 李海燕, 范可方, 等. 生物樣本庫與轉(zhuǎn)化醫(yī)學(xué)研究[J]. 轉(zhuǎn)化醫(yī)學(xué)研究(電子版), 2011, 1(2): 44-55.
[4]LEFF D R, YANG G Z. Big data for precision medicine[J]. Engineering, 2015, 1 (3): 277-279.
[5]中國醫(yī)藥生物技術(shù)協(xié)會生物樣本庫標(biāo)準(zhǔn)(試行)
[6]張佳星. 推進(jìn)精準(zhǔn)醫(yī)療發(fā)展助力健康中國建設(shè): 訪中國工程院院士、中國醫(yī)學(xué)科學(xué)院院長曹雪濤委員[N]. 科技日報, 2015-03-10(2).
[7]王曉民, 張雷. 生物信息資源庫建設(shè)的現(xiàn)狀與未來[J].中華腎病研究電子雜志, 2012, 1(1): 16-21.
[8]GLIGORIJEVI? V, MALODDOGNIN N, PR?ULJ N.Integrative methods for analyzing big data in precision medicine[J].Proteomics, 2016, 16(5): 741.
[9]吳曼麗, 王柱清, 羅凱, 等. 臨床生物樣本庫血液樣本的可控性采集和質(zhì)量管理[J]. 轉(zhuǎn)化醫(yī)學(xué)雜志, 2016,5(6): 327-332.
[10]劉克新, 鄭琳, 劉晶, 等. 生物樣本庫臨床信息數(shù)據(jù)采集系統(tǒng)的需求與設(shè)計[J]. 中國病案, 2015(8): 31-33.
[11]李海燕, 張雷, 張雪嬌, 等. 北京重大疾病臨床數(shù)據(jù)和樣本資源庫建設(shè)成果初探[J]. 中華醫(yī)院管理雜志,2013, 29(11): 863-865.
[12]徐世俠, 張在文, 馮博, 等. 我國生物樣本庫的文獻(xiàn)計量分析[J]. 轉(zhuǎn)化醫(yī)學(xué)雜志, 2014, 3(6): 359-363.
[13]CHAUSSABEL D, PULENDRAN B. A vision and a prescription for big data-enabled medicine[J]. Nature Immunology, 2015, 16(5): 435.
[14]李怡, 張換敬, 劉國彥, 等. 生物樣本信息資源庫的國內(nèi)外研究進(jìn)展[J]. 中國醫(yī)藥生物技術(shù), 2012, 7(5):369-372.
[15]GAINER V S, CAGAN A, CASTRO V M, et al. The biobank portal for partners personalized medicine: a query tool for working with consented biobank samples,genotypes, and phenotypes using i2b2[J]. Journal of Personalized Medicine, 2016, 6(1): ???-???.
[16]KARLSON E W, BOUTIN N T, HOFFNAGLE A G,et al. Building the partners healthcare biobank at partners personalized medicine: informed consent, return of research results, recruitment lessons and operational considerations[J]. Journal of Personalized Medicine,2016, 6(1): 2.
[17]OOFE COOPERATION DEVELOPMENT. OECD guidelines on human biobanks and genetic research databases[J]. European Journal of Health Law, 2010,17(2): 191.
[18]中華人民共和國科學(xué)技術(shù)部. 人類遺傳資源管理暫行辦法[EB/OL]. [2017-07-03]. http: //www.most.gov.cn/bszn/new/rlyc/wjxz/200512/t20051226_55327.htm.
[19]中國醫(yī)藥生物技術(shù)協(xié)會. 中國醫(yī)藥生物技術(shù)協(xié)會生物樣本庫標(biāo)準(zhǔn)(試行)[J]. 中國醫(yī)藥生物技術(shù), 2011(1):71-79.
Value Proposition of Bio Specimen Information Under Precise Medical Background
WANG Yibo
(Institute of Scienti fi c & Technical Information of China, Beijing 100038)
Bio specimen information had been given new value by the industrialization process of precision medical, and the information management of Bio specimen is facing a new situation. By inducing the domestic and foreign policies, the de fi nition of Bio specimen information had been clear. A lifecycle of Bio specimen under Precise Medical background was described to analysis the information active and content in its stages.Through the construction of information fl ow and subjects relationship, the demand of active subjects and its realization in the lifecycle was revealed, and 4 features was proposed to indicate the value proposition of Bio specimen information. 3 proposals was given, involving data standards, cloud platform and theoretical research.
bio specimen, information management, precise medical, value proposition
G203
A
10.3772/j.issn.1674-1544.2017.04.003
王弋波(1985—),男,中國科學(xué)技術(shù)信息研究所助理研究員,研究方向:科技信息管理。
國家重點研發(fā)計劃項目“中國人類遺傳資源樣本庫建設(shè)”之課題“中國人類遺傳資源樣本庫信息管理平臺建設(shè)”(2016YFC1201702)。
2017年6月25日。