編譯 莫莊非
過去20年間,基因組學在生物醫(yī)學研究和醫(yī)療保健方面發(fā)揮了越發(fā)重要的作用。基因組數(shù)據(jù)已被用于高級診斷,也能幫助決策者制定關于患者分層及篩查的新策略,還可作為確定新靶點和開發(fā)個性化療法的依據(jù)。共享基因組數(shù)據(jù)的意愿,以及維護這一共享原則的地方和全球倡議,在迄今取得的成功中發(fā)揮了至關重要的作用。在COVID-19大流行早期階段,我們快速共享基因組數(shù)據(jù),進而在創(chuàng)紀錄的最短用時內開發(fā)出疫苗和療法——這就是一個成功范例。
基因組數(shù)據(jù)不僅日益凸顯重要性,其體量也以驚人速度增長。在21世紀之初,僅有兩個人的基因組被測序。到2020年,據(jù)估計全球將有超過3 000萬人可訪問自己的基因組數(shù)據(jù),每年產(chǎn)生的新數(shù)據(jù)量達到20億~400億字節(jié)。不過即便如此,要真正將基因組研究成果轉化為可廣泛應用的療法,還需克服一些困難,因為可用的基因組數(shù)據(jù)大多來自歐洲血統(tǒng)人群,尚未覆蓋全球大多數(shù)人口。鑒于可用數(shù)據(jù)量巨大,研究界和監(jiān)管機構面臨著平衡雙重需求的難題,即允許研究人員訪問數(shù)據(jù),同時保護研究參與者和患者的隱私——這絕非尋常挑戰(zhàn)。
調查數(shù)據(jù)確實表明,對個人隱私的重視和對潛在數(shù)據(jù)濫用的擔憂,是影響公眾參與基因組研究的主要障礙之一。這些擔憂嚴重阻礙社區(qū)參與研究,進而影響了所收集數(shù)據(jù)的多樣性,也傷害了全球基因組研究的利益。對數(shù)據(jù)安全的擔憂并非沒有根據(jù),泄露基因組隱私數(shù)據(jù)可能會暴露敏感信息,并可能引起醫(yī)療保險損失、歧視和污名化等一系列問題,或損害家庭關系。另一個擔憂是,數(shù)據(jù)如果未受到恰當保護,最終可能會被用于違背參與者最初意愿的應用程序。
已有一些技術手段可用于規(guī)避重新識別問題,包括數(shù)據(jù)匿名化、去識別化和數(shù)據(jù)聚合??杉幢闳绱耍院茈y實現(xiàn)真正的數(shù)據(jù)匿名。在一項概念驗證研究中,工作人員分析個體層面的數(shù)據(jù),根據(jù)來自參與者Y染色體上的短串聯(lián)重復序列推斷其姓氏,重識別其身份。他們還發(fā)現(xiàn)來自全基因組關聯(lián)研究的匯總統(tǒng)計數(shù)據(jù)并非完全不受隱私泄露問題的影響。如果某人參與了全基因組關聯(lián)研究,分入潛在敏感的特定組別,此事件是有可能被技術人員分析推斷出來的。
盡管以上案例比較罕見,但有理由相信基因數(shù)據(jù)隱私問題只會變得更復雜。我們都與親屬共享我們的一部分基因,越多人進行DNA測序——無論是作為研究的一部分還是直接面向消費者的商業(yè)服務——重新識別的風險就越高。更大規(guī)模的可用基因組數(shù)據(jù),再加上越發(fā)強大的人工智能應用,可能令現(xiàn)有的隱私保護愈加脆弱,引發(fā)新的社會問題。眼下被認為“安全”的東西未來可能就不安全了。
另一方面,隨著計算方法變得更加復雜,我們有望利用新興技術提出更周全的基因組數(shù)據(jù)保護的方法。最近提出的解決方案來自信息學和經(jīng)濟學領域,包括諸如同態(tài)加密的加密方法,同態(tài)加密技術支持在無需解密基因組數(shù)據(jù)的情況下對統(tǒng)計數(shù)據(jù)做計算。其他解決方案包括數(shù)據(jù)訪問控制——例如,英國國家醫(yī)療服務體系(NHS)不久前宣布,他們正在過渡到“可信賴研究環(huán)境”模式,全世界的可信賴研究人員能在臨時虛擬環(huán)境中訪問和處理數(shù)據(jù),而無需下載數(shù)據(jù)。類似的概念已被全球基因組學與健康聯(lián)盟(GA4GH)采用。
基因組研究的不斷發(fā)展,也對監(jiān)管和審查機構的工作——審批與監(jiān)督那些收集并使用遺傳信息的研究——提出了新的挑戰(zhàn)。在大多數(shù)國家,有權批準此類研究的審查機構,例如機構審查委員會或研究倫理委員會,往往是多學科交叉的綜合性團體,負責對科研項目做倫理監(jiān)督。不過這些團體通常不會強制要求納入數(shù)據(jù)安全等方面的特定專業(yè)意見。
在大型基因組聯(lián)盟中,負責數(shù)據(jù)保護的團隊越來越多,專職數(shù)據(jù)訪問工作的獨立委員會也越發(fā)完善。不過最近的報告顯示,機構審查委員會仍欠缺大數(shù)據(jù)處理方面的專業(yè)知識,這些專業(yè)包括計算科學、人工智能、數(shù)據(jù)倫理和隱私等。缺乏專業(yè)知識會帶來兩方面問題:一方面,它可能導致忽視數(shù)據(jù)保護方面的潛在威脅和漏洞;另一方面,缺少專家建議可能意味著不合理的整改要求,甚至導致項目無法獲批。這兩種情況都將阻礙科學進步。
基因組數(shù)據(jù)在促進人類健康方面的潛力巨大,但只有每個人都感覺安全,它才可發(fā)揮作用。因此,現(xiàn)在正是這個領域的從業(yè)者開始思考數(shù)據(jù)共享和保護問題的時候——如何以最佳方式處理基因組研究的大數(shù)據(jù),保證數(shù)據(jù)的安全和隱私。解決問題的關鍵在于吸納不同領域專家的專業(yè)意見及建議,這些專家可能來自信息、倫理和法律等專業(yè)。此外,讓患者和公眾參與其中討論也非常重要。
資料來源 Nature