蔣兆強(qiáng) 靳明英 謝小萍 張玲希 陳俊斐 何曉波
生物樣本庫(kù)(biobank)主要用于長(zhǎng)期儲(chǔ)存臨床或科研使用的生物樣本[1]?!稌r(shí)代》雜志 2009年3月的特刊將生物樣本庫(kù)列入“改變世界的10個(gè)思想”之一[2]。建立專門的生物樣本庫(kù),大規(guī)模、高效地搜集和利用生物樣本、生物信息和數(shù)據(jù),可以極大地提高科研效率,也是眾多重要科研成果快速產(chǎn)業(yè)化、應(yīng)用到臨床的重要保證。美國(guó)、歐洲以及國(guó)際衛(wèi)生組織都投入了幾億到幾百億美元建立大型生物樣本庫(kù)。近年來,生物樣本庫(kù)的規(guī)模在一步步地?cái)U(kuò)大,隨之而來的是生物樣本庫(kù)的大數(shù)據(jù)倫理管理問題越來越突出并亟待解決,這包括知情同意、隱私保密、樣本和數(shù)據(jù)共享、商業(yè)化等倫理問題[3]。因此,本文對(duì)國(guó)外生物樣本庫(kù)的大數(shù)據(jù)倫理管理現(xiàn)狀進(jìn)行介紹,并探討相應(yīng)的對(duì)策。
世界上第一個(gè)生物樣本庫(kù)是1982年美國(guó)國(guó)立衛(wèi)生研究院、美國(guó)國(guó)家醫(yī)學(xué)圖書館、美國(guó)國(guó)家生物技術(shù)信息中心等機(jī)構(gòu)建立的基因數(shù)據(jù)庫(kù)。20世紀(jì)90年代末之前的生物樣本庫(kù)為第一代生物樣本庫(kù),通常為了滿足某個(gè)研究的需求而開展并保存生物樣本。20世紀(jì)90年代以前,人類遺傳樣本的采集是零散的,科研的目的是單一的。
美國(guó)科學(xué)家于1985年率先提出人類基因組計(jì)劃,并于1990年正式啟動(dòng)。近20年來,隨著生命科學(xué)的發(fā)展、計(jì)算機(jī)數(shù)據(jù)分析和處理能力的快速提高,各類生物樣本庫(kù)紛紛登場(chǎng),被稱之為第二代生物樣本庫(kù),這引起了人們的廣泛關(guān)注[4]。這包括1987年的美國(guó)國(guó)家癌癥研究所(National Cancer Institute,NCI)、1999年英國(guó)生物樣本庫(kù)(UK Biobank)等,以及基于科研性質(zhì)的1990年歐洲癌癥與營(yíng)養(yǎng)前瞻性調(diào)查(European Prospective Investigation into Cancer and Nutrition,EPIC)、1998年韓國(guó)國(guó)家健康和營(yíng)養(yǎng)檢查調(diào)查(the Korean National Health and Nutrition Examination Survey,KNHANES)建立的樣本庫(kù)。我國(guó)1994年建立的中華民族永生細(xì)胞庫(kù),也是第二代生物樣本庫(kù)的一個(gè)代表。
近幾年,有學(xué)者將以數(shù)據(jù)為中心的現(xiàn)代生物樣本庫(kù)的發(fā)展戰(zhàn)略稱為生物樣本庫(kù)3.0[5]。根據(jù)歐洲研究中心和前沿技術(shù)研究所的調(diào)查,歐洲有超過170個(gè)生物樣本庫(kù)或組織,其中36%以公共研究為主要研究模式,24%兼顧公共研究和臨床研究;17%的信息在歐盟內(nèi)分享,33%在全球范圍內(nèi)共享,20%為數(shù)據(jù)研究者享有,10%為本單位共享。目前,美國(guó)的生物樣本庫(kù)已超過600個(gè),儲(chǔ)存的組織樣本總量已超過3億份,每年以2 000萬份的數(shù)量快速增加[6]。1992年,聯(lián)合國(guó)環(huán)境規(guī)劃署組織簽署《生物多樣性公約》,強(qiáng)調(diào)了人類遺傳資源的保護(hù)。國(guó)際人力基因組研究倫理委員會(huì)從1996年開始,每2年左右就會(huì)發(fā)布一項(xiàng)關(guān)于生物樣本使用的倫理規(guī)則。這些規(guī)則形成了生物樣本庫(kù)資源共享的倫理框架,主要包括數(shù)據(jù)共享、成本補(bǔ)償、樣本庫(kù)管理等方面。為了規(guī)范生物樣本庫(kù)的標(biāo)準(zhǔn)化建設(shè),國(guó)際生物和環(huán)境樣本庫(kù)協(xié)會(huì)(International Society for Biological and Environmental Repositories,ISBER)等組織進(jìn)行了一系列統(tǒng)一標(biāo)準(zhǔn)的規(guī)劃和制定。ISBER 制定的《生物樣本庫(kù)最佳實(shí)踐》是目前國(guó)際上公認(rèn)并且影響最廣泛的產(chǎn)業(yè)化標(biāo)準(zhǔn),2012年已出版第三版[7]。
國(guó)外生物樣本庫(kù)大致可以分為三類: 一是以單個(gè)科研項(xiàng)目運(yùn)營(yíng)為主導(dǎo)的樣本庫(kù);二是以機(jī)構(gòu)運(yùn)營(yíng)為主的樣本庫(kù),主要以大型三甲醫(yī)院、高校為主;三是以第三方機(jī)構(gòu)運(yùn)營(yíng),由政府或基金會(huì)出資,形成集約化的生物樣本庫(kù)。本文僅列出具有代表性的幾個(gè)生物樣本庫(kù),見表1。
表1 各國(guó)生物樣本庫(kù)的主要類型及其特點(diǎn)
知情同意是采集人體生物樣本的倫理基本要求,是醫(yī)學(xué)倫理學(xué)最基本的體現(xiàn)。所有生物樣本庫(kù)樣本的采集需要在受試者簽署“樣本采集和保存知情同意書”之后進(jìn)行,現(xiàn)在較為接受的一種知情同意模式為“廣泛知情同意”,即授權(quán)生物樣本和數(shù)據(jù)可以在廣泛指定的領(lǐng)域內(nèi)用于未來的研究[8]?,F(xiàn)代生物樣本庫(kù)還提出了“泛知情同意”之外的知情同意模式:如特定的知情同意、部分限制的知情同意以及多層知情同意?,F(xiàn)將幾個(gè)有代表性的生物樣本庫(kù)獲取知情同意權(quán)的方式總結(jié)成表2。
表2 各國(guó)生物樣本庫(kù)的知情同意獲取方式
生物樣本庫(kù)的實(shí)踐,已在多個(gè)基礎(chǔ)研究領(lǐng)域產(chǎn)生了革命性的突破,創(chuàng)造了很多可產(chǎn)業(yè)化的成果。但是研究成果對(duì)個(gè)人的返還卻很難實(shí)現(xiàn)。一方面,是因?yàn)檠芯康牟淮_定性,返還結(jié)果的可操作性差;另一方面,則是由于基因和分子生物學(xué)的復(fù)雜性所致[9]。英國(guó)生物樣本庫(kù)已明確表示不將研究結(jié)果返還給樣本捐贈(zèng)者。此外,關(guān)于樣本捐贈(zèng)者的隱私保護(hù)以及研究結(jié)果的所有權(quán)問題[10-11],一直還存在較大的爭(zhēng)議。
應(yīng)用生物樣本或信息的基礎(chǔ)條件是生物樣本的唯一化標(biāo)識(shí)和信息化管理。根據(jù)生物樣本管理模式的差異,可以將生物樣本庫(kù)分為兩類:一類是實(shí)物集中管理模式,也就是所有的生物樣本都在生物樣本庫(kù)組織中進(jìn)行統(tǒng)一的管理和維護(hù);另一類是虛擬集中管理模式,只有樣本有關(guān)的信息被集成在一起形成中央數(shù)據(jù)庫(kù)[12],生物樣本依然被放置于每個(gè)樣本采集點(diǎn)。數(shù)據(jù)庫(kù)信息管理的數(shù)據(jù)可以有多個(gè)系統(tǒng)來源,可手工導(dǎo)入、可文本導(dǎo)入,也可定時(shí)獲取[13]。生物樣本的利用需要由生物樣本應(yīng)用人員如實(shí)填寫并提交生物樣本使用申請(qǐng)。審核生物樣本的利用,需要倫理評(píng)審委員根據(jù)樣本的獲取難易程度、樣本剩余量、是否符合研究規(guī)定等方面審核,見表3。
表3 各國(guó)生物樣本庫(kù)的生物樣本或信息的管理和應(yīng)用
根據(jù)生物樣本庫(kù)的建庫(kù)目的不同,各國(guó)的生物樣本庫(kù)研究的開放和共享策略有所不同,見表4。但無論何種形式,為了保證共享的實(shí)現(xiàn),建立統(tǒng)一標(biāo)準(zhǔn)的生物樣本庫(kù),構(gòu)建便于公開獲取共享的公共信息平臺(tái)、規(guī)范共享內(nèi)容與流程、形成各方認(rèn)可的共享利益分配方式等都是實(shí)現(xiàn)網(wǎng)絡(luò)共享的基礎(chǔ)和必要條件[14]。在獲益方面,不僅要控制機(jī)構(gòu)商業(yè)用途的過度,還應(yīng)考慮回饋個(gè)人、貢獻(xiàn)社會(huì)[15]。
表4 各國(guó)生物樣本庫(kù)研究的開放、共享、交易
生物樣本庫(kù)建設(shè)最主要的目的是整合和共享生物資源[16]。但是現(xiàn)階段,我國(guó)國(guó)內(nèi)各個(gè)生物樣本庫(kù)建設(shè)標(biāo)準(zhǔn)不一,收集樣本的方式和內(nèi)容各異,各項(xiàng)數(shù)據(jù)庫(kù)之間的關(guān)聯(lián)并沒有打通,生物樣本資源共享難度很大[17]。為了整合資源,提高樣本利用率,需要進(jìn)一步制定倫理相關(guān)的法律法規(guī),以完善樣本庫(kù)的標(biāo)準(zhǔn)化建設(shè),構(gòu)建資源開放共享網(wǎng)絡(luò)。我國(guó)與生物樣本庫(kù)規(guī)范化管理有關(guān)的法律法規(guī)有《個(gè)人信息保護(hù)法》《生物安全法》《涉及人的生物醫(yī)學(xué)研究倫理審查辦法(試行)》和《人類遺傳資源管理暫行辦法》,在此基礎(chǔ)上還需要進(jìn)一步完善利益主體、資源的歸屬權(quán)、更新倫理管理制度等事宜,積極推動(dòng)具體倫理規(guī)章制度的落實(shí)。
設(shè)立專門的生物樣本庫(kù)管理辦公室,專職人員以審核小組的形式,負(fù)責(zé)樣本庫(kù)的管理、注冊(cè)和審查[18]。設(shè)立生物樣本庫(kù)審查的倫理委員會(huì),發(fā)揮倫理委員會(huì)在生物樣本庫(kù)的建設(shè)和發(fā)展中的作用。定期對(duì)生物樣本庫(kù)的實(shí)施情況進(jìn)行評(píng)估,檢查倫理審查的內(nèi)容和程序是否符合要求。檢查電子設(shè)備等軟硬件是否存在安全隱患。
在生物樣本庫(kù)的大數(shù)據(jù)應(yīng)用條件下,傳統(tǒng)的知情同意書已不能滿足數(shù)據(jù)反復(fù)使用的特點(diǎn),泛知情同意書的使用是大勢(shì)所趨。需要明確單個(gè)科研項(xiàng)目和生物樣本庫(kù)使用的知情同意書的區(qū)別,充分考慮重新獲得知情同意書的難度及樣本庫(kù)資源預(yù)期的使用目的,深入探討泛知情同意書的優(yōu)缺點(diǎn),研究泛知情同意書的使用條件及范圍。
國(guó)外生物樣本庫(kù)多由專人負(fù)責(zé)管理,既有醫(yī)學(xué)背景專業(yè)人員,也有倫理、哲學(xué)或法學(xué)背景人員。目前,我國(guó)專業(yè)的生物樣本庫(kù)管理人員還有所缺乏,大多數(shù)人是醫(yī)學(xué)背景,而非倫理或哲學(xué)背景。應(yīng)增加熟悉生物樣本倫理管理制度的專業(yè)技術(shù)人員,加大人才隊(duì)伍的儲(chǔ)備。研究生物樣本庫(kù)管理人員績(jī)效評(píng)估及職稱評(píng)定的政策,以穩(wěn)定人才隊(duì)伍。
隱私保護(hù)是生物樣本庫(kù)倫理管理中最重要的環(huán)節(jié)之一。生物樣本庫(kù)內(nèi)的樣本所包含的信息眾多,包括個(gè)人基本信息及遺傳數(shù)據(jù)。這些信息一旦被公開披露,幾乎不可能再次取回使其私人化,并且這一過程中獲取此信息的具體人員和數(shù)據(jù)的具體用途等無法知曉,這種風(fēng)險(xiǎn)在涉及推理與識(shí)別綜合的數(shù)據(jù)中特別明顯[19]。所以一旦生物樣本庫(kù)的信息泄露,就可能會(huì)引起大型社會(huì)性問題。從倫理審查的角度來看,當(dāng)隱私泄露的風(fēng)險(xiǎn)超出受試者個(gè)人或所在群體的最小風(fēng)險(xiǎn)值,使風(fēng)險(xiǎn)受益比升高,則不能獲得倫理的辯護(hù)。具體而言,國(guó)外生物樣本庫(kù)的應(yīng)用對(duì)我國(guó)有如下啟示。
4.5.1 優(yōu)化數(shù)據(jù)使用的倫理管理流程
大數(shù)據(jù)時(shí)代,個(gè)人信息的價(jià)值日益得到市場(chǎng)及各個(gè)行業(yè)領(lǐng)域的認(rèn)可,大數(shù)據(jù)應(yīng)用正在向“市場(chǎng)化”和“產(chǎn)業(yè)化”的方向邁進(jìn)[20]。如何將生物信息、醫(yī)療信息等各種資源高效整合并共享,且確保數(shù)據(jù)的安全,這一關(guān)鍵技術(shù)還有待于政策層面和技術(shù)層面的突破。建立規(guī)范化和統(tǒng)一管理的生物樣本庫(kù)大數(shù)據(jù)基礎(chǔ)設(shè)施和電子設(shè)備,做好數(shù)據(jù)長(zhǎng)期安全存儲(chǔ)、高效檢索、關(guān)聯(lián)檢索、數(shù)據(jù)的匿名處理、數(shù)據(jù)的可視化、數(shù)據(jù)的安全存儲(chǔ)和備份、標(biāo)準(zhǔn)化質(zhì)控、信息發(fā)布標(biāo)準(zhǔn)等工作。對(duì)于結(jié)構(gòu)化的數(shù)據(jù)和非結(jié)構(gòu)化的生物樣本庫(kù)數(shù)據(jù)使用,其審核重點(diǎn)、申請(qǐng)及倫理審批的流程應(yīng)有所區(qū)別。
4.5.2 加強(qiáng)隱私保護(hù)的信息技術(shù)研究
大數(shù)據(jù)時(shí)代通過集成和融合等鏈接技術(shù),將多個(gè)異構(gòu)的數(shù)據(jù)集聚集在一起,以獲得個(gè)體的特征信息。但是,這一做法可能會(huì)泄露80%的個(gè)人敏感信息,給個(gè)人隱私的保護(hù)帶來挑戰(zhàn)。這提示在搭建大型的生物樣本庫(kù)信息管理系統(tǒng)時(shí),借鑒金融、電子商務(wù)領(lǐng)域在大數(shù)據(jù)隱私保護(hù)的方法的經(jīng)驗(yàn),需要信息技術(shù)人員從設(shè)計(jì)、決策、實(shí)施等多個(gè)層面的深入?yún)⑴c,從研究設(shè)計(jì)開始就同力搭建完整的安全框架,而不是簡(jiǎn)單地將生物樣本庫(kù)系統(tǒng)外包給信息技術(shù)公司??梢詫?shí)施訪問控制和密碼學(xué),從模糊化、匿名化、差分隱私、加密等方面加強(qiáng)信息安全。采用匿名性、多樣性、貼近性不同的隱私保護(hù)技術(shù)和隱私參數(shù),或使用協(xié)同隱私保護(hù)算法對(duì)隱私數(shù)據(jù)集進(jìn)行匿名和加密,以保護(hù)生物樣本庫(kù)個(gè)體的隱私[21]。
4.5.3 引入風(fēng)險(xiǎn)管理理念,防范隱私泄露
參照銀行信貸業(yè)務(wù)的管理辦法,引入風(fēng)險(xiǎn)管理理念,即通過內(nèi)部大數(shù)據(jù)與外部大數(shù)據(jù)的關(guān)聯(lián),設(shè)定風(fēng)險(xiǎn)參數(shù),計(jì)算出隱私風(fēng)險(xiǎn)分值(privacy risk score),以達(dá)到數(shù)據(jù)信息智能應(yīng)用的良性循環(huán),形成智能風(fēng)險(xiǎn)預(yù)警的效果。生物樣本庫(kù)可以結(jié)合申請(qǐng)樣本的科研機(jī)構(gòu)及科研人員的誠(chéng)信記錄,通過個(gè)體風(fēng)險(xiǎn)指數(shù),制定生物樣本庫(kù)管理和外借的風(fēng)險(xiǎn)控制方法。對(duì)于隱私風(fēng)險(xiǎn)的泄露問題,仍然可以沿用這一風(fēng)險(xiǎn)管理方法,采用隱私影響評(píng)估、需求表達(dá)和安全識(shí)別等技術(shù),對(duì)隱私風(fēng)險(xiǎn)進(jìn)行主動(dòng)的評(píng)估。
4.5.4 隱私風(fēng)險(xiǎn)的主動(dòng)監(jiān)測(cè)
隱私風(fēng)險(xiǎn)的主動(dòng)監(jiān)測(cè)(privacy risk active monitor)是防控隱私泄露的又一個(gè)新方法。通過主動(dòng)監(jiān)測(cè),可以發(fā)現(xiàn)不正當(dāng)或者存在惡意的操作,檢查數(shù)據(jù)庫(kù)信息是否被泄露。基于成本最優(yōu)博弈理論(cost-optimal game-theoretical approach)是目前比較常用的隱私風(fēng)險(xiǎn)監(jiān)測(cè)技術(shù)之一,也是隱私防護(hù)中有用的一個(gè)新理論,可以在生物樣本庫(kù)加以應(yīng)用。
4.5.5 預(yù)防數(shù)據(jù)挖掘技術(shù)帶來的風(fēng)險(xiǎn)
卷積神經(jīng)網(wǎng)絡(luò)、決策樹分類技術(shù)等大數(shù)據(jù)挖掘方法的發(fā)展,可以挖掘出大數(shù)據(jù)的特征和規(guī)則,雖為大數(shù)據(jù)的深度利用提供了契機(jī),但也帶來了一定的風(fēng)險(xiǎn)。過度挖掘生物樣本庫(kù)的數(shù)據(jù),用于商業(yè)用途,容易引起隱私維權(quán)的問題。例如,金融保險(xiǎn)公司得到了個(gè)體的疾病信息,則可能會(huì)導(dǎo)致保險(xiǎn)歧視。大數(shù)據(jù)的隱私管理,除了需要防控?cái)?shù)據(jù)直接泄露的風(fēng)險(xiǎn),也需要考慮上述間接泄露的風(fēng)險(xiǎn)。因此,需要建立生物樣本庫(kù)綜合的隱私保護(hù)算法框架,開發(fā)更具有穩(wěn)健性、可擴(kuò)展性和隱私保護(hù)性更佳的數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)方法。
4.5.6 建立大數(shù)據(jù)管理的問責(zé)系統(tǒng)
在生物樣本使用的授權(quán)方面,尤其在侵犯隱私權(quán)之后,需要引入問責(zé)系統(tǒng)的功能。根據(jù)是否經(jīng)過授權(quán)而進(jìn)入生物樣本庫(kù)系統(tǒng)檢索數(shù)據(jù),來判斷其責(zé)任歸屬??赏ㄟ^數(shù)據(jù)標(biāo)記、集成式追蹤、分布式追蹤、事件追蹤等方法,查詢到文件系統(tǒng)的讀取行為。當(dāng)數(shù)據(jù)被違規(guī)使用時(shí),可采用入侵檢測(cè)、統(tǒng)計(jì)匹配等違規(guī)檢測(cè)技術(shù),快速檢測(cè)樣本數(shù)據(jù)被違規(guī)使用的時(shí)間和地點(diǎn)。問責(zé)系統(tǒng)還需要更為完善,如增強(qiáng)底層風(fēng)險(xiǎn)評(píng)估,促進(jìn)法律法規(guī)的制度保障等。通過問責(zé)系統(tǒng)的使用,發(fā)現(xiàn)樣本庫(kù)管理系統(tǒng)的漏洞,及時(shí)補(bǔ)漏,確保樣本庫(kù)正常運(yùn)行。
綜上所述,國(guó)外生物樣本庫(kù)為我國(guó)生物樣本庫(kù)大數(shù)據(jù)倫理管理規(guī)范的建立,提供了較好的理論和實(shí)踐基礎(chǔ)。我國(guó)應(yīng)借鑒國(guó)外生物樣本庫(kù)的經(jīng)驗(yàn),在規(guī)范的倫理管理制度下形成開放的數(shù)據(jù)庫(kù),以避免生物樣本庫(kù)的重復(fù)建設(shè)和低質(zhì)量建設(shè)。同時(shí),應(yīng)借鑒金融等行業(yè)的風(fēng)險(xiǎn)管理方法,從制度和技術(shù)層面強(qiáng)化隱私保護(hù)和風(fēng)險(xiǎn)預(yù)警,完善問責(zé)制度,促進(jìn)我國(guó)生物樣本庫(kù)大數(shù)據(jù)倫理管理的健康發(fā)展。