猶龍江
(貴州大學(xué)動(dòng)物科學(xué)學(xué)院 貴陽(yáng) 550025)
2015年1月20日美國(guó)總統(tǒng)奧巴馬宣布啟動(dòng)精準(zhǔn)醫(yī)學(xué)計(jì)劃并決定一期投入約2億美元。2015年12月11日在上海成立“中國(guó)個(gè)體化用藥-精準(zhǔn)醫(yī)學(xué)科學(xué)產(chǎn)業(yè)聯(lián)盟”,標(biāo)志我國(guó)正式開始精準(zhǔn)醫(yī)療的探索。同年召開首次精準(zhǔn)醫(yī)療戰(zhàn)略專家會(huì)議,最終決定在2030年前對(duì)精準(zhǔn)醫(yī)療領(lǐng)域投入600億元。精準(zhǔn)醫(yī)療根據(jù)患者基因、生活環(huán)境和方式的個(gè)體特異性推測(cè)疾病的發(fā)生,從而采取有效、精準(zhǔn)的疾病預(yù)防與治療手段。精準(zhǔn)醫(yī)療的發(fā)展是建立在目前科學(xué)技術(shù)快速發(fā)展基礎(chǔ)上的,如人類全基因組測(cè)序、生物信息分析技術(shù)、大數(shù)據(jù)分析工具等。當(dāng)前精準(zhǔn)醫(yī)學(xué)用于人類癌癥治療靶向藥物的創(chuàng)新臨床實(shí)驗(yàn)、綜合性用藥選擇以及克服個(gè)體耐藥性。
人類基因組計(jì)劃(Human Genome Project,HGC)的目標(biāo)是解碼生命,了解生命起源、成長(zhǎng)與衰退;認(rèn)識(shí)個(gè)體之間的差異性原因,對(duì)人類疾病的發(fā)生機(jī)制、致病機(jī)制提供科學(xué)依據(jù),同時(shí)極大促進(jìn)相關(guān)行業(yè)的發(fā)展。如基因測(cè)序技術(shù)、功能基因組學(xué)、比較基因組學(xué)、生物信息學(xué)、計(jì)算生物學(xué)等。其中生物信息學(xué)和計(jì)算生物學(xué)是對(duì)物種個(gè)體基因的基礎(chǔ)且關(guān)鍵的分析技術(shù),分析人員掌握技術(shù)的熟練程度與分析結(jié)果有密切聯(lián)系。
生物信息學(xué)與計(jì)算生物學(xué)之間界限比較模糊,生物信息學(xué)側(cè)重對(duì)數(shù)據(jù)的提取、挖掘,而計(jì)算生物學(xué)側(cè)重對(duì)數(shù)據(jù)的處理、運(yùn)用。目前生物信息學(xué)和計(jì)算生物學(xué)在處理對(duì)象和方法上已無(wú)顯著差別,分析方法大同小異、流程相似。生物信息學(xué)需掌握的技能是運(yùn)用開源數(shù)據(jù)分析工具挖掘海量的基因測(cè)序數(shù)據(jù),而對(duì)數(shù)據(jù)分析的能力決定對(duì)復(fù)雜生命認(rèn)識(shí)與理解。在進(jìn)行生物信息學(xué)分析之前應(yīng)掌握以下幾點(diǎn):(1)可利用Shell、R、Python等計(jì)算語(yǔ)言編寫腳本將機(jī)械性的文件處理操作轉(zhuǎn)化為簡(jiǎn)單的指令運(yùn)行。(2)使用強(qiáng)大的Linux(Unix)系統(tǒng)運(yùn)行開源數(shù)據(jù)處理程序。(3)掌握R語(yǔ)言的探索性數(shù)據(jù)分析方法。(4)了解基因組數(shù)據(jù)文件格式。如FASTA、FASTQ、SAM、BAM等。(5)具有一定的分子生物學(xué)知識(shí)背景。2001年后至今被稱為后基因組時(shí)代,完成人類基因組測(cè)序、各種模式生物基因組測(cè)序,基因組學(xué)的研究重心也轉(zhuǎn)向功能基因組學(xué)。
經(jīng)過(guò)十幾年的發(fā)展現(xiàn)已形成多個(gè)研究方向,根據(jù)分析數(shù)據(jù)來(lái)源不同,主要分為全外顯子測(cè)序分析、轉(zhuǎn)錄組測(cè)序分析、染色質(zhì)免疫共沉淀測(cè)序。以往生物信息學(xué)研究領(lǐng)域重點(diǎn)在于基因表達(dá)譜、個(gè)體物質(zhì)代謝網(wǎng)絡(luò)、基因芯片設(shè)計(jì)和蛋白質(zhì)數(shù)據(jù)分析。進(jìn)入后基因組時(shí)代其研究領(lǐng)域有了重大發(fā)展——擴(kuò)展至結(jié)構(gòu)基因組學(xué)、功能基因組學(xué)、比較基因組學(xué)、蛋白質(zhì)組學(xué)、藥物基因組學(xué)、腫瘤基因組學(xué)、分子流行病學(xué)和環(huán)境基因組學(xué)。
通過(guò)捕獲全基因組的外顯子區(qū)域、富集后進(jìn)行高通量測(cè)序,能夠直接發(fā)現(xiàn)與蛋白質(zhì)功能變異相關(guān)的遺傳變異。人類基因組中外顯子僅占約1%[1],但作為編碼蛋白質(zhì)的序列區(qū)域,且超過(guò)85%的孟德爾遺傳病都與基因組外顯子變異有密切聯(lián)系,更適用于臨床發(fā)現(xiàn)、確診部分孕期疾病[2]。目前產(chǎn)前診斷常用方法是B超影像學(xué)檢查,發(fā)現(xiàn)胎兒異常后采用核型分析或染色體微陣列芯片等技術(shù),綜合診斷率約14~16%[1-2],更高效、精確的診斷技術(shù)迫切需要。WES的臨床推廣運(yùn)用可能將孟德爾遺傳病診斷率提高到20~80%。全外顯子測(cè)序分析具體流程,見圖1。外顯子測(cè)序后獲得原始數(shù)據(jù),過(guò)濾除去高通量測(cè)序時(shí)插入的接頭引物,然后與從公共數(shù)據(jù)庫(kù)(如NCBI、Ensemble等)獲取的參考基因組進(jìn)行比對(duì),找出突變編碼區(qū),篩選出與遺傳疾病相關(guān)的基因變異,成為候選基因并進(jìn)行討論和分析,總結(jié)實(shí)驗(yàn)結(jié)果。通過(guò)全基因組外顯子測(cè)序分析技術(shù)不僅能有效、準(zhǔn)確地定位致病基因位點(diǎn),還能發(fā)現(xiàn)新的突變位點(diǎn)的致病基因,對(duì)闡明相關(guān)疾病發(fā)病機(jī)理、機(jī)制、遺傳診斷具有重要的研究和推廣價(jià)值。此外不依靠昂貴、精確的大型設(shè)備儀器,而是多依據(jù)計(jì)算機(jī)對(duì)測(cè)序數(shù)據(jù)的處理及分析人員對(duì)公共數(shù)據(jù)庫(kù)的理解和運(yùn)用。該技術(shù)在臨床疾病研究中具有推廣與應(yīng)用價(jià)值。
圖1 全外顯子測(cè)序數(shù)據(jù)的生物信息學(xué)分析流程
指特定組織或細(xì)胞發(fā)生在某一階段或功能狀態(tài)下轉(zhuǎn)錄出來(lái)的核糖核酸(Ribonucleic Acid,RNA)總和,主要包括mRNA和非編碼RNA(ncRNA)。轉(zhuǎn)錄組學(xué)是對(duì)基因結(jié)構(gòu)、功能新的研究出發(fā)點(diǎn),是對(duì)研究對(duì)象在特定發(fā)育階段下的分析。相比全基因組分析,轉(zhuǎn)錄組分析具有更高的靈敏度,可以精確識(shí)別可變剪切位點(diǎn)、基因的表達(dá)水平;對(duì)任意物種的全基因組分析甚至可能發(fā)現(xiàn)新的轉(zhuǎn)錄本、檢測(cè)融合基因[3]。組學(xué)分析將可能為中醫(yī)理論中的陰陽(yáng)學(xué)說(shuō)進(jìn)行科學(xué)分析與數(shù)據(jù)結(jié)果實(shí)踐證明。通過(guò)分析陽(yáng)類和陰類急性缺血性中風(fēng),可以使用部分差異lncRNA和miRNA作為潛在疾病診斷的標(biāo)記物,是十分具有潛力的研究方法。
4.1.1 第2類精神藥物依賴 近年修改《麻醉藥品和精神藥品管理?xiàng)l例》有關(guān)規(guī)定,國(guó)家食品藥品監(jiān)管總局、公安部、原國(guó)家衛(wèi)生計(jì)生委決定將含可待因的復(fù)方口服液體制劑(包括口服溶液劑、糖漿劑)列入第2類精神藥品管理[4]。其原因在于對(duì)敏感藥物基因的臨床實(shí)驗(yàn)發(fā)現(xiàn)CYP2D6超快代謝哺乳期婦女,分泌到乳汁中可待因可能出現(xiàn)藥物過(guò)量,導(dǎo)致乳兒可能出現(xiàn)致死性不良反應(yīng)[5]。隨著研究人員對(duì)藥物代謝相關(guān)基因的研究,對(duì)部分藥品的使用說(shuō)明書進(jìn)行修改,體現(xiàn)出現(xiàn)代醫(yī)學(xué)對(duì)精準(zhǔn)用藥的要求。隨著測(cè)序技術(shù)以及相關(guān)行業(yè)的發(fā)展,目前進(jìn)行指定藥物相關(guān)基因的檢測(cè)費(fèi)用約3 000元/次,周期為3~4天,檢測(cè)結(jié)果終身有效。
4.1.2 指導(dǎo)精神藥物使用 武漢市優(yōu)撫醫(yī)院通過(guò)精神疾病患者的臨床癥狀、基因檢測(cè)分析結(jié)果為其制定精準(zhǔn)治療方案[6]。取患者口腔上皮細(xì)胞進(jìn)行藥物基因檢測(cè),結(jié)合臨床用藥結(jié)果分析,該患者應(yīng)選用CYP2D6基因型廣泛代謝型藥物,典型藥物有奮乃靜、氟哌啶醇等。
4.2.1 通過(guò)敏感性藥物基因檢測(cè)實(shí)現(xiàn)個(gè)體化用藥 根據(jù)用藥患者個(gè)體差異引起的藥物吸收、轉(zhuǎn)運(yùn)、代謝等不同而實(shí)現(xiàn)有效的聯(lián)合用藥、精準(zhǔn)治療,降低患者對(duì)藥物的耐受性和用藥成本。藥物基因檢測(cè)常用方法有3種:實(shí)時(shí)熒光定量PCR(qPCR)、熒光原位雜交(FISH)、基因測(cè)序技術(shù)。qPCR技術(shù)常用于對(duì)藥物干擾基因mRNA的表達(dá)水平的檢測(cè),判斷使用相關(guān)藥物的療效。FISH是使用熒光探針技術(shù)對(duì)藥物或疾病相關(guān)基因的檢測(cè)。而測(cè)序技術(shù)通過(guò)對(duì)個(gè)體全基因組測(cè)序后進(jìn)行生物學(xué)分析,篩選出潛在的遺傳疾病和相關(guān)治療藥物蛋白基因多態(tài)性。如細(xì)胞色素P450為自身氧化的亞鐵血紅蛋白家族,又稱多功能氧化酶,多參與內(nèi)源性物質(zhì)的代謝。CYP2D6基因型為CYP450酶系中重要的一種并且是唯一一種不能被誘導(dǎo)的酶。研究表明CYP2D6參與臨床常用藥物的體內(nèi)代謝[7],如奮乃靜、氟哌啶醇等抗精神疾病藥物,氯丙嗪、美沙酮等鎮(zhèn)靜類藥物,吉非替尼片、他莫昔芬等抗腫瘤藥物。
4.2.2 腫瘤領(lǐng)域個(gè)體化用藥案例 香港中文大學(xué)莫樹錦教授的臨床實(shí)驗(yàn)說(shuō)明藥物基因檢測(cè)的潛在價(jià)值。該試驗(yàn)?zāi)康氖翘骄恳兹鹕呈欠裉岣邅喼薹伟┗颊叩纳嫫谕?,首次引入基因檢測(cè)因素,將服用藥物的患者進(jìn)行表皮生長(zhǎng)因子受體(Epidermal Growth Factor Recepter,EGFR)基因檢測(cè)。實(shí)驗(yàn)結(jié)果證實(shí)易瑞沙對(duì)敏感EGFR突變患者具有良好的治療效果,也提示非敏感患者應(yīng)接受常規(guī)治療方案。該實(shí)驗(yàn)是腫瘤治療領(lǐng)域率先引入的個(gè)體化用藥案例之一。
4.3.1 診斷疾病的分子標(biāo)記物 隨著測(cè)序、序列分析技術(shù)的不斷發(fā)展,許多常見和罕見的系統(tǒng)疾病分子標(biāo)記物被確定,如阿爾茨海默癥(Alzheimer′s Disease,AD)、帕金森癥(Parkinson′s Disease,PD)、多發(fā)性硬化癥(Multiple Sclerosis,MS)等。盡管疾病的發(fā)生存在多因素與異質(zhì)性的影響,但是分子標(biāo)記物的確定能作為疾病精確診斷的方式。就AD而言,目前已證實(shí)遺傳因素在其病理機(jī)制中扮演重要角色[8]。2011年的文獻(xiàn)證實(shí)基因APP、RSEN1和PSEN2的遺傳突變直接導(dǎo)致早發(fā)性阿爾茨海默癥(Early Onset Alzheimer′s Disease,EOAD),但是之后在出現(xiàn)EOAD的臨床患者中并沒(méi)有檢測(cè)到這3個(gè)基因的突變。隨著研究深入目前已發(fā)現(xiàn)3個(gè)機(jī)制不明的小家系EOAD的遺傳因素。第1個(gè)為NOTCH3基因的錯(cuò)義突變[9];第2個(gè)在SORL1的錯(cuò)義和無(wú)意義的突變[10];第3個(gè)為在腦小膠質(zhì)細(xì)胞中表達(dá)的免疫吞噬受體TREM2外顯子2變異與AD的早發(fā)性和遲發(fā)性具有密切聯(lián)系[11]。通過(guò)不斷的研究發(fā)現(xiàn)疾病的致病因子很多,機(jī)制也很復(fù)雜。
4.3.2 腫瘤篩查領(lǐng)域 在腫瘤疾病研究領(lǐng)域中基因變異檢測(cè)是精準(zhǔn)醫(yī)療中重要的組成部分[12]。臨床腫瘤患者多用組織活檢技術(shù),結(jié)果不完全準(zhǔn)確,存在65%的假陽(yáng)性[13]。但基因檢測(cè)技術(shù)可以將癌癥的診斷提前到細(xì)胞癌變階段,為腫瘤的預(yù)防提供基因水平上的指導(dǎo)。
5.1.1 價(jià)值與意義 目前正處于由基因組學(xué)、蛋白質(zhì)組學(xué)、代謝組學(xué)、影像學(xué)、臨床診斷數(shù)據(jù)等構(gòu)成的生物醫(yī)學(xué)大數(shù)據(jù)時(shí)代。對(duì)生物醫(yī)學(xué)數(shù)據(jù)信息的理解、運(yùn)用將擴(kuò)展為現(xiàn)階段對(duì)患者從診斷到預(yù)防再到個(gè)性化治療的疾病管理新模式。如果使用得當(dāng)大數(shù)據(jù)將成為具有重要價(jià)值的資源,用于改善當(dāng)前的醫(yī)療服務(wù)和降低醫(yī)療成本。到2022年美國(guó)醫(yī)療保健占GDP的比例預(yù)計(jì)達(dá)到19.9%[14]。中國(guó)是人口大國(guó)的新興經(jīng)濟(jì)體,尤其是新的高通量測(cè)序平臺(tái)、實(shí)時(shí)成像系統(tǒng)、亞洲基因數(shù)據(jù)庫(kù)建立將極大促進(jìn)中國(guó)未來(lái)生命科學(xué)發(fā)展。
5.1.2 構(gòu)建相關(guān)數(shù)據(jù)庫(kù) 生物信息學(xué)發(fā)展從個(gè)體基因組測(cè)序擴(kuò)展到測(cè)量表觀基因組數(shù)據(jù),研究基因的表達(dá)過(guò)程不僅僅局限于DNA序列的修飾,如DNA甲基化修飾、His-tone修飾[15]。生物信息的獲取除基因組學(xué)外還包括轉(zhuǎn)錄組組學(xué)、蛋白質(zhì)組學(xué)、代謝組學(xué)等。而組學(xué)就是強(qiáng)調(diào)對(duì)生物體結(jié)構(gòu)、功能和生物分子動(dòng)力學(xué)進(jìn)行集體的量化。大數(shù)據(jù)可以提高臨床研究實(shí)用性,有助于有效精確地對(duì)患者進(jìn)行分類,這是定制個(gè)性化醫(yī)療方案和充分利用醫(yī)療資源的關(guān)鍵點(diǎn)。從人口學(xué)角度出發(fā),研究某人疾病的發(fā)生過(guò)程可以用來(lái)預(yù)測(cè)和預(yù)防同樣疾病的發(fā)生,構(gòu)建中國(guó)生物醫(yī)學(xué)數(shù)據(jù)庫(kù)具有重要的戰(zhàn)略意義。
5.2.1 基因檢測(cè)商業(yè)化 基因檢測(cè)技術(shù)在醫(yī)學(xué)檢查、疾病診斷、精準(zhǔn)用藥等方面發(fā)揮巨大作用。這項(xiàng)檢測(cè)使一些重大慢性疾病治愈率大幅提高,基因檢測(cè)逐步被接受,用于商業(yè)化使用[16]。基因測(cè)序是精準(zhǔn)醫(yī)療的基礎(chǔ),藥物基因的篩選雖然提高治療藥物的準(zhǔn)確性,但是也限制治療藥物的使用。血液腫瘤學(xué)家維奈·普拉薩德(Vinay Prasad)于2016年在《自然》發(fā)表相關(guān)文章,指出絕大多數(shù)的腫瘤患者并沒(méi)有通過(guò)個(gè)體化的精準(zhǔn)醫(yī)療方案提高生存幾率、生活質(zhì)量,相反帶來(lái)的是額外的昂貴醫(yī)療費(fèi)用[17]。但筆者認(rèn)為目前個(gè)體化治療方案的失敗更多的可能是目前方法學(xué)理論的失敗[18]。根據(jù)2018年5月在北京召開的中國(guó)消費(fèi)級(jí)基因檢測(cè)行業(yè)峰會(huì),如果參照美國(guó)基因檢測(cè)近5年的滲透率變化,2020年中國(guó)的滲透率達(dá)到3.5%。
5.2.2 藥物精準(zhǔn)使用 對(duì)患者進(jìn)行藥物敏感性基因篩查,除篩查結(jié)果終身可參考使用外還能為醫(yī)生臨床治療用藥提供指導(dǎo),減少不敏感藥物的使用,降低患者多次使用不同藥物產(chǎn)生的藥物耐受性,減少治療負(fù)擔(dān)。實(shí)現(xiàn)有效用藥從而避免患者多次重復(fù)就診和藥物使用,充分有效利用醫(yī)院和藥品資源。
5.3.1 引導(dǎo)學(xué)生興趣 基因組學(xué)研究基因突變或差異產(chǎn)生的個(gè)體差異性,轉(zhuǎn)錄組學(xué)和蛋白質(zhì)組學(xué)研究某種外因?qū)€(gè)體產(chǎn)生的影響,而代謝組學(xué)則是在研究個(gè)體目前的差異性變化?;蛟诩?xì)胞核中轉(zhuǎn)錄出信使RNA,然后翻譯為功能性蛋白質(zhì),參與復(fù)雜的生命活動(dòng)行為。利用開源軟件分析數(shù)據(jù),掌握一門匯編語(yǔ)言,具有一定的分子生物學(xué)知識(shí)背景,是生物信息學(xué)分析的基礎(chǔ)要求。學(xué)生開始學(xué)習(xí)時(shí)應(yīng)多了解最新研究開發(fā)出的開源數(shù)據(jù)挖掘軟件、分析算法、流程、數(shù)據(jù)庫(kù)、大量的高質(zhì)量文獻(xiàn)和具有重復(fù)性的代碼參考。然后根據(jù)興趣選擇研究方向,包括計(jì)算生物學(xué)、基因組學(xué)、轉(zhuǎn)錄組學(xué)等。
5.3.2 完善培養(yǎng)方案 相關(guān)文獻(xiàn)每年發(fā)表總量增長(zhǎng)說(shuō)明生物信息技術(shù)廣泛用于生命科學(xué)研究。在臨床應(yīng)用中醫(yī)學(xué)信息學(xué)利用患者疾病現(xiàn)階段的全外顯子測(cè)序或轉(zhuǎn)錄組測(cè)序,篩選出致病突變基因,選擇靶向用藥,實(shí)現(xiàn)精準(zhǔn)醫(yī)療[6]。在精準(zhǔn)醫(yī)學(xué)用于人類腫瘤治療靶向藥物的創(chuàng)新臨床實(shí)驗(yàn)、使用選擇以及克服個(gè)體耐藥方面,生物信息技術(shù)是最關(guān)鍵、最基礎(chǔ)的分析技術(shù)[12]。生物信息學(xué)在科學(xué)領(lǐng)域的研究和臨床實(shí)踐的實(shí)用價(jià)值以及專業(yè)人才分類說(shuō)明研究行業(yè)對(duì)該專業(yè)人才的需求。高校應(yīng)注重該專業(yè)人才培養(yǎng),提出相適宜的人才培養(yǎng)方案體系。
目前的疾病診斷和治療主要依賴于患者的主觀感受、病史資料、醫(yī)生的主觀辨別和大量昂貴設(shè)備輔助診斷結(jié)果,在臨床治療過(guò)程中不斷進(jìn)行驗(yàn)證和修改治療方案。在未來(lái)的疾病診斷方面,尤其是惡性疾病的早期診斷,疾病相關(guān)基因分子標(biāo)記物的篩查具有重要意義。隨著基因組學(xué)研究、疾病機(jī)制和相關(guān)基因分子標(biāo)記物不斷發(fā)現(xiàn)和證實(shí),疾病基因分子標(biāo)記確定精確性不斷提高,未來(lái)有望實(shí)現(xiàn)血液中分子標(biāo)記物的PCR定性檢測(cè)和qPCR的定量檢測(cè),大大提高疾病正確診斷率。個(gè)體化的精準(zhǔn)醫(yī)療方案雖然因個(gè)體基因的多態(tài)性而缺乏特異性的靶向治療藥物,但筆者認(rèn)為這項(xiàng)技術(shù)為患者提供更適合的醫(yī)療方案,又避免不敏感靶向治療藥物的使用,同時(shí)也為新型靶向藥物的研究提供方向。隨著測(cè)序技術(shù)不斷升級(jí),分析方案不斷優(yōu)化,檢測(cè)成本不斷下降以及靶向治療藥物的開發(fā),未來(lái)有望將基因檢測(cè)納入醫(yī)保政策。