馮熙然 李思婷 趙娜
摘 要:惡性胰腺癌(pancreaticcancer)其實是一種消化道惡性腫瘤,具有很高的惡性癌變程度,診斷和早期治療困難很大。近幾年來,發(fā)病率和患者死亡率顯著提高。胰腺癌的早期手術確診死亡率一般較低,手術晚期死亡率高,治愈性能也較低。胰腺癌是否發(fā)生的尚不清楚??蒲袡C構希望利用與人工智能相關的大數(shù)據(jù)技術輔助放射科醫(yī)生進行醫(yī)學圖像識別,提高醫(yī)療成像數(shù)據(jù)的準確性,降低放射科醫(yī)生的壓力,達到早發(fā)現(xiàn)和治療疾病的目標。本課題采用大數(shù)據(jù)技術分布存儲胰腺光影像數(shù)據(jù),利用深度學習技術將大量胰腺X光圖像從自動特征中提取,并通過大數(shù)據(jù)技術研究了癌癥藥物。
關鍵詞:胰腺癌;X光影像;大數(shù)據(jù)技術;對比治療機制
前言:
近幾年來,隨著大數(shù)據(jù)技術的迅速發(fā)展,基因組拷貝變化、突變、甲基化數(shù)據(jù)和轉錄組、蛋白質組、代謝群等與癌癥有關的組學數(shù)據(jù)也在迅速積累,為癌癥的研究和精確醫(yī)學的發(fā)展提供了大量的機會。通過前期的調查,胰腺癌是最差預后的惡性腫瘤之一,被稱為"癌中的王子",在前期難以發(fā)現(xiàn),藥物作用也不理想。針對目前存在的問題,我們對于胰腺癌前期X光片及藥物治療效果進行了大數(shù)據(jù)處理并構建了對比治療機制。
1.設計思路
對比 alexnet 神經(jīng)網(wǎng)絡, mobilenets 神經(jīng)網(wǎng)絡, vgg16 神經(jīng)網(wǎng)絡模型,以及胰腺 x 光圖像識別的精確度,根據(jù)分析效果優(yōu)劣,選擇 vgg16 網(wǎng)絡模型對算法進行改進,分別命名 vggy 和 vgg y1 ,標準卷在 vgg16 網(wǎng)絡上。積被 vggy 網(wǎng)絡模型改為深度分離的卷積,并將改進的網(wǎng)絡模型應用于胰腺梗阻性慢性胰腺炎,癥狀糖尿病,血栓型靜脈炎,黃疸性肝炎,膽石癥,膽囊病和正常七種類型的識別。
2.設計原理
2.1基于轉錄組大數(shù)據(jù)和深度學習的藥物重定位預測
在這部分研究中,基于 lincs 計劃的藥物刺激下細胞反應轉錄組的大數(shù)據(jù),構建了一個基因共表達網(wǎng),它由不同的治療性質組成,并由此基因共表達網(wǎng)絡構成,并由此基因共表達網(wǎng)絡的核心成分 dgcn 組成。 dgcn 基因共表達關系的聯(lián)結可以被用來探究基因誘導的藥物表達方式,從而使研究人員更深入地理解藥物作用的機制。接下來,利用 lincs 計劃的 l1000 數(shù)據(jù)集中的藥物擾動和基因沉默轉錄組中的大數(shù)據(jù)以及深度學習,構建了一個深度神經(jīng)網(wǎng)絡 dnn 模型,系統(tǒng)進行了藥物靶標的關聯(lián)預測。通過交叉驗證,發(fā)現(xiàn) dnn 模型的精確度比其他預測算法要高,而且所預測的藥物靶標相關聯(lián)系在其他相關的數(shù)據(jù)庫中明顯集合。
2.2基于多組學數(shù)據(jù)融合的癌癥共識分子亞型辨識的Web計算實現(xiàn)
在第二個部分的研究中,使用 tcga 、 icgc 和 target 國際大型項目的癌癥多組學資料和多聚類算法,建立了 comsuc 癌癥認識分子亞型的 web 計算工具。 comsuc 彌補了由不同測序平臺,預處理過程和聚類法等因素引起的分子亞型不一致缺陷,這是 comsuc 彌補的。 comsuc 實現(xiàn)了多個應用場景,多種聚類算法,可以展示并輸出分析的發(fā)表等級。以辨別腎上腺皮質癌 acc 的共識分子亞型為例,展示了 comsuc 在癌癥分子亞型識別方面的實用性。本研究展示了轉錄組和多組學數(shù)據(jù)融合的計算分析,并在藥物重定位預測和癌癥分子亞型識別方面的應用。
3.設計優(yōu)勢分析
3.1 構建了藥物誘導的基因共表達網(wǎng)絡
經(jīng)過一系列預處理的數(shù)據(jù),構建了藥物擾動轉錄反應的表達譜數(shù)據(jù)。計算不同的藥物刺激細胞系中所有基因之間的 pearson 相關系數(shù)和 p 值,按一定篩選規(guī)則進行合并,構成了不同的治療性藥物刺激下基因共表達網(wǎng),從而形成了一個核心藥物引導基因共表達網(wǎng)。該網(wǎng)絡幫助研究者更深入地理解了藥物作用的機制。
3.2 將深度學習方法引入到藥物重定位領域
相對傳統(tǒng)新藥研發(fā)模式,藥物重定位策略發(fā)現(xiàn)藥物新用途具有顯著的成本效益優(yōu)勢,能加快藥物上市步伐,滿足惡性腫瘤、罕見病、個性化醫(yī)療等特定領域藥物臨床用藥需求。而深度學習可以有效提取圖像隱含特征,在醫(yī)學影像識別方面的應用快速發(fā)展。采用遞增擴充卷積并且融合批量標準化和LeaklyReLU函數(shù)對輸入胰腺癌早期X光片及藥物效果數(shù)據(jù)進行特征提取與學習;然后通過結合遞減擴充卷積和ReLU函數(shù)對提取的特征進行圖像重構;二者結合,將深度學習方法引入到藥物重定位領域,可以提高藥物-靶標關聯(lián)關系預測的準確率。
3.3 搭建了包含多個組學數(shù)據(jù)和多個聚類方法的癌癥共識分子亞型Web計算工具
復雜性疾病常由環(huán)境因素和遺傳性因素(多組學層次)共同作用引起。對認知疾病發(fā)生的全面分析,對認知疾病發(fā)生的進程至關重要。多組學數(shù)據(jù)整合分析可以提高特征檢查的效率,提高疾病的預測精確度。癌癥共識分子亞型網(wǎng)絡計算工具可以將不一致的聚類方法融合到多個組學和聚類方法中,從而發(fā)現(xiàn)與癌癥共識分子亞型相關的生物標志和相關診斷,有助于對醫(yī)療進行針對性診斷。
4.可行性
近幾年來,隨著惡性功能腫瘤基因組學的迅速研究發(fā)展,與各種癌癥發(fā)病有關的基因組織科學分析數(shù)據(jù)也在迅速發(fā)展積累,這些基因組的科學分析數(shù)據(jù)與各種癌癥發(fā)病有關。為癌癥藥物的研發(fā)和精確醫(yī)學的發(fā)展創(chuàng)造了大量的機會。轉錄組數(shù)據(jù)是生物醫(yī)學的一個重要組成成分,在生物醫(yī)學和臨床應用中得到了廣泛的應用。而細胞擾動表達譜測量的轉錄組在各種擾動情況下的變化,通過對組織細胞不同的生理,病學,藥物作用等基因表達譜印記的對比分析,可以在不同的生理,病學作用和藥物作用中建立聯(lián)系。
5. 推廣前景
近幾年來,機器學習尤其是深度學習技術的發(fā)展,使得深度學習成為計算機視覺,語音識別,自然語言處理的成功。藥物大數(shù)據(jù)與深度學習相結合,將為生物醫(yī)學在包括藥物開發(fā)在內的各個領域帶來新的發(fā)展機會。隨著基因測序、高通量基因芯片和低成本轉錄組技術的迅速發(fā)展,積累了大量關于藥物擾動、基因沉默和癌癥的多組學資料,這些大量數(shù)據(jù)不僅對生物學基礎研究產生了深遠的影響,而且對藥物重定位、癌癥分子的分型等應用研究也產生了深遠的影響并為癌癥大數(shù)據(jù)提供重要的機遇。
參考文獻:
[1]宋欣雨,文昱琦,劉禎,何松,伯曉晨 基于LINCS轉錄組大數(shù)據(jù)的藥物誘導基因共表達網(wǎng)絡構建【J】軍事科學院軍事醫(yī)學研究院 2018(06)
[2]宋欣雨 基于組學大數(shù)據(jù)的藥物重定位預測和癌癥共識分子亞型辨識【J】軍事科學院 2019
[3]熊阿珍,孟光興 藥物重定位候選藥物篩選路徑【J】中國醫(yī)藥工業(yè)雜志 2020(02)
作者簡介:
姓名:馮熙然,性別:女,籍貫:云南省昆明市西山區(qū),出生年月:2002年10月28日,學歷:本科;研究方向:醫(yī)學影像技術
姓名:李思婷,性別:女,籍貫:福建省漳州市薌城區(qū),出生年月:2001年11月12日,
學歷:本科;研究方向:醫(yī)學影像技術
姓名:趙娜,性別:女,籍貫:山東省威海市環(huán)翠區(qū),出生年月:1991年10月10日,學歷:本科,職稱:講師,研究方向:臨床醫(yī)學
(山東協(xié)和學院? 山東? 濟南? 250000)