喬若靜/編譯
大數(shù)據(jù)與癌癥研究
喬若靜/編譯
抗癌之戰(zhàn)中的大數(shù)據(jù)開發(fā)利用還處于初始階段,但這一前沿陣地正在不斷向前推進。
北卡羅萊納大學的諾曼·沙普利斯(Norman Sharpless)正在利用沃森計算機系統(tǒng)分析DNA數(shù)據(jù)
癌細胞突變分類基因組圖譜目錄包含有大約250萬字節(jié)數(shù)據(jù),這一由美國國立衛(wèi)生研究院(NIH)開展的一個龐大的研究項目,極大地提高了我們對各種形式癌癥的理解。但對于提供樣本患者的臨床治療經(jīng)驗,我們了解的還相對太少。
在癌癥治療鏈的另一端,電子健康檔案中包含有豐富的個案信息,如充分加以利用,可極大地提高癌癥治療的水平。但實際情況是,這類病史記錄往往都被封存在各個醫(yī)院和醫(yī)療診所內。結果就是,“研究人員與大多數(shù)病史都失之交臂?!奔o念斯隆-凱特琳癌癥中心專攻乳腺癌的腫瘤學家克利福德·胡迪斯(Clifford Hudis)說道。
為提高癌癥治療水平,胡迪斯和其他許多研究人員合作,正在努力開發(fā)如何來利用醫(yī)療科研、病人護理和臨床試驗中產(chǎn)生的大量數(shù)據(jù)的方法。大數(shù)據(jù)催生的許多機會,已擴展到醫(yī)學界的大多數(shù)領域中,而“癌癥研究更是走在了最前列?!泵绹R里蘭州一家醫(yī)療保健咨詢機構的醫(yī)療顧問林恩·伊瑟雷吉(Lynn Etheredge)說道。但是,多樣化的致命癌癥意味著,雖然研究取得了很大進展,但障礙依然多多。
伊瑟雷吉在2007年寫的一篇很有影響力的文章中提出了大數(shù)據(jù)處理的“快速學習系統(tǒng)”,他認為,我們已進入了一個新的癌癥研究和治療的歷史時期。“我們知道,癌癥是一種與基因相關的疾病,而我們擁有對癌癥進行分析的數(shù)據(jù)基礎和計算能力?!彼f。
懷著對盡早成功開發(fā)個性化癌癥藥物的希望,腫瘤學家和計算機專家正在共同努力,充分利用數(shù)字化信息,并將其運用到臨床診療實踐中。然而,面對這樣的一項新興事業(yè),他們需要克服隱私、數(shù)據(jù)所有權以及可持續(xù)商業(yè)模式等方面的困難和障礙。“大數(shù)據(jù)既是一種研究工具,也是一種專營商品。”伊瑟雷吉說道,“這一領域仍處于早期發(fā)展中,我們需要解決的問題還有很多?!?/p>
在美國,許多機構組織通過將大數(shù)據(jù)運用到癌癥臨床實踐中,使其在癌癥治療的一些方面走在了世界前列。這其中有四個決定性的因素:快速成長的新興公司;專業(yè)的項目計劃;強大的計算機能力;以及一個以癌癥研究為中心的學術網(wǎng)絡。
2009年,馬薩諸塞州劍橋博德研究所的科學家們創(chuàng)辦了一家基礎醫(yī)學公司,專門從事對腫瘤學家提交的病人組織樣本進行基因測序和分析,然后與公司龐大的數(shù)據(jù)庫以及其他公共數(shù)據(jù)庫中的數(shù)據(jù)進行對照,從中篩選辨認致癌基因。基礎醫(yī)學公司數(shù)據(jù)庫中的數(shù)據(jù)來自50 000以上癌癥患者的資料。
“公共數(shù)據(jù)庫與谷歌不同,腫瘤學家沒法通過簡單的途徑搜索與自己病人所患腫瘤相關的致癌基因?!被A醫(yī)學公司首席執(zhí)行官邁克爾·帕利尼(Michael Pellini)說道,“我們對組織樣本進行分析,然后將分析結果反饋回治療實踐,或以美國食品藥品管理局(FDA)批準藥物的形式反饋,或是以臨床實驗的形式反饋?!?/p>
對于一些疑難病癥,腫瘤學家也可以在基礎醫(yī)學公司的客戶網(wǎng)絡端咨詢,以期獲得可能的建議。帕利尼說道,網(wǎng)站會在72小時內作出回應,將一些數(shù)據(jù)綜合匯總發(fā)送給醫(yī)生,咨詢者可以從中權衡,哪一種特定藥物或治療方法有可能會是有效的。公司的宗旨是盡可能地將客戶數(shù)據(jù)運用于更廣泛的臨床實踐和醫(yī)學決策中。
2015年1月,瑞士制藥業(yè)巨頭羅氏公司以10億美元的價格,收購了基礎醫(yī)學56%的股權,以推動個性化癌癥診療和相關藥物開發(fā)。
2015年底,美國臨床腫瘤學會(ASCO)預計將推出CancerLinQ平臺,這個平臺旨在通過對成千上萬腫瘤治療案例中獲得的電子健康檔案進行分析綜合,為醫(yī)生們提供更多臨床實踐經(jīng)驗——腫瘤學家通過訪問CancerLinQ平臺,從中可以了解特殊案例的治療效果,然后對照己有的治療方法,為進一步開發(fā)新的治療方案開拓思路。
“我們所知道的癌癥治療案例來自于登記注冊的臨床試驗,而這些案例只占癌癥確診患者的3%?!痹贑ancerLinQ平臺理事會任職的胡迪斯說道,“有了CancerLinQ平臺,我們可以從97%以上未直接參與研究項目的腫瘤學家那里獲得更多的經(jīng)驗?!?/p>
迄今,已有15個規(guī)模不等的小組開始了這方面的實踐,預計到2016年ASCO將擁有50萬份癌癥患者的醫(yī)療檔案。研究者和臨床醫(yī)生能夠通過查詢這些病史記錄將其與患者的治療效果進行比較。如此龐大數(shù)量的數(shù)據(jù),可有助于明確某種特定藥物或治療方案的有效程度。
“CancerLinQ所做的最重要的事情是報告治療結果,例如,接受了某種特定治療方案的患者生存期更長,或病情發(fā)展得到緩解等?!盇SCO質量研究所醫(yī)療主任、腫瘤學家羅伯特·米勒(Robert Miller)說道。
2013年,在一項針對17萬乳腺癌患者進行的研究中,通過了CancerLinQ平臺的一個原型測試。據(jù)米勒稱,未發(fā)表的一些數(shù)據(jù)表明,該系統(tǒng)可以突顯不同醫(yī)療實踐提交數(shù)據(jù)的特點和效果。例如,他們是如何通過刺激產(chǎn)生更多紅細胞來治療化療后貧血的。
CancerLinQ平臺從電子健康記錄中提取病人數(shù)據(jù),對數(shù)據(jù)進行匿名化處理,然后將它們與其他類型的數(shù)據(jù)信息,包括醫(yī)生的筆記和生物標記等整合在一起。其目的是當醫(yī)生在對病人進行診斷和治療過程中有疑問而難以決斷時,這些數(shù)據(jù)將能夠支持他們及時做出決策。
CancerLinQ平臺的運行目前還是依靠捐贈,但米勒說道,隨著時間的推移,這個平臺將通過出售有效性報告和數(shù)據(jù)研究工具而獲得更獨立的生存能力?!拔覀冋诳紤]與CancerLinQ平臺合作開發(fā)相關的一系列產(chǎn)品和服務,以幫助降低系統(tǒng)的運營成本?!泵桌照f道。
大數(shù)據(jù)需要龐大的計算能力,2013年IBM成立了一個獨立的業(yè)務單元:“沃森健康部門”(Watson Health unit),為結合了自然語言和學習能力的沃森認知計算機系統(tǒng)提供更多的商業(yè)機會。沃森儲存的生物醫(yī)學知識包括:公共醫(yī)學(PubMed)數(shù)據(jù)庫中的所有摘要、美國國家癌癥研究所(NDI)的藥典(批準藥物和臨床試驗數(shù)據(jù))、癌癥體細胞突變的完整目錄數(shù)據(jù)庫以及其他多種來源的數(shù)據(jù)。
沃森認知計算機系統(tǒng)于2011年在美國電視智力競賽節(jié)目Jeopardy中以擊敗人類冠軍而出名。IBM沃森健康部門與十多個醫(yī)療機構、癌癥中心和研究機構都建立了合作關系,IBM研究在紐約的計算生物學中心主任艾杰·羅伊魯(Ajay Royyuru)說道。
例如,紐約基因組中心需要借助沃森計算機系統(tǒng)對膠質母細胞瘤患者的DNA突變進行篩選。膠質母細胞癌是一種會致命的腦癌。
紀念斯隆-凱特琳中心和得克薩斯州休斯頓MD安德森癌癥中心的醫(yī)生們,正在升級沃森系統(tǒng)成為一種臨床支持工具,一種能夠在電腦上展示匿名假設病例的程序。例如,一位患者的腫瘤細胞測試中,發(fā)現(xiàn)其STK11的基因缺陷呈陽性,可用糖尿病藥物二甲雙胍醫(yī)治,羅伊魯解釋道。但沃森可能不會推薦二甲雙胍,因為這是一個標示外的藥物?!巴ㄟ^這個實例我們知道,需要教會沃森更多的東西,將網(wǎng)撒得更大?!绷_伊魯說道。
安德魯·塞德曼(Andrew Seidman)是紀念斯隆-凱特琳中心的乳腺癌專家,他補充book=42,ebook=43