亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        文本挖掘在藥物靶位研究中的應(yīng)用

        2017-03-21 10:49:46
        關(guān)鍵詞:靶位網(wǎng)絡(luò)分析數(shù)據(jù)庫

        ,

        現(xiàn)代新藥開發(fā)與研究的關(guān)鍵,首先是尋找和篩選藥物靶位(drug target)。藥物靶位是指機體內(nèi)具有藥效功能并且能被藥物作用的生物大分子物質(zhì),如某些蛋白質(zhì)和核酸等。文本挖掘是目前發(fā)現(xiàn)潛在藥物靶位的新興手段之一,目前大多數(shù)文章都是通過定性和舉例來闡述文本挖掘技術(shù)在藥物靶位領(lǐng)域的研究成果。本文通過構(gòu)建詞篇矩陣等數(shù)學(xué)模型,以聚類方式更加直觀和科學(xué)地定量闡述了自1999-2015年該領(lǐng)域的發(fā)展情況,希望對相關(guān)領(lǐng)域的研究人員選擇參考文獻(xiàn)和研究方向有所幫助。

        1 資料來源與方法

        首先對該領(lǐng)域高被引論文進(jìn)行同被引聚類分析。按照圖1所示流程,以((TS=drug target*) OR (TS=drug delivery system)) AND (TS=text mining))為檢索式在Web of Science中SCI核心文獻(xiàn)集進(jìn)行檢索,共下載88篇相關(guān)文獻(xiàn),里面包含了4 415篇參考文獻(xiàn)。

        圖1 利用文本挖掘技術(shù)進(jìn)行藥物靶位研究進(jìn)展的定量分析流程

        利用書目共現(xiàn)分析系統(tǒng)(Bibliographic Item Co-Occurrence Matrix Builder2.01, BICOMB2.01)對參考文獻(xiàn)被引頻次進(jìn)行統(tǒng)計后,將被引頻次高于5次的文獻(xiàn)作為高被引論文,使用gCLUTO聚類軟件對高被引論文進(jìn)行同被引聚類分析,得到5個類別(圖2)

        綜合評估文獻(xiàn)數(shù)量和同類文獻(xiàn)的緊密程度,對高被引論文的標(biāo)題和摘要進(jìn)行了人工分析和歸納(表1),總結(jié)出自1999-2015年該領(lǐng)域的研究狀況,并就每類文獻(xiàn)語義內(nèi)容進(jìn)行了分析和梳理。

        圖2 高被引論文聚類分析結(jié)果

        表1 高被引論文聚類結(jié)果

        (續(xù)表1)

        2 結(jié)果與分析

        結(jié)合軟件輸出內(nèi)容,我們將各類別按照學(xué)科領(lǐng)域的知識體系重新排列,將文本挖掘在藥物靶位研究中的應(yīng)用分成總體趨勢、理論基礎(chǔ)、主要方法和主要資源4個方面,具體內(nèi)容如下。

        2.1 當(dāng)前藥物靶位研究的總體趨勢

        綜合分析cluster 0后,發(fā)現(xiàn)當(dāng)前藥物靶位研究有兩個明顯的趨勢:一是通過新藥檢測分析抗腫瘤藥的相關(guān)靶位,即將各種化學(xué)物質(zhì)與標(biāo)準(zhǔn)的腫瘤治療藥物放在一起,通過它們之間的聯(lián)系進(jìn)行靶位挖掘;二是多學(xué)科結(jié)合,通過計算機和專家配合進(jìn)行藥物研究[2]。Yoo Kyung Jeong等人使用第一種途徑,結(jié)合PubMed和ClinicalTrials數(shù)據(jù)庫中的抗腫瘤藥物相關(guān)文獻(xiàn)進(jìn)行綜合分析,發(fā)現(xiàn)不同的化學(xué)物質(zhì)和標(biāo)準(zhǔn)治療藥物放在一起時,可以發(fā)現(xiàn)新的藥物靶位[1]。該方法很大程度上節(jié)約了藥物研究的成本和降低了開發(fā)的風(fēng)險。

        2.2 文本挖掘預(yù)測藥物靶位的理論基礎(chǔ)

        基于cluster 1中Predicting new molecular targets for known drugs(預(yù)測已知藥物的新分子靶位)[3]和Drug target identification using side-effect similarity(基于藥物副作用相似性的靶位識別)[4]兩篇高被引文獻(xiàn)的關(guān)注方向,總結(jié)出利用文本挖掘預(yù)測藥物靶位有兩種常用的方法:一是通過化學(xué)結(jié)構(gòu)相似性進(jìn)行預(yù)測,二是通過藥物副作用相似性進(jìn)行靶位識別。如Fechete, R等人研究糖尿病腎病的分子途徑、生物標(biāo)記物和識別藥物靶位時,就基于第一種理論基礎(chǔ)進(jìn)行了深入研究。他們構(gòu)建了人類相關(guān)蛋白、基因的結(jié)構(gòu)相似性網(wǎng)絡(luò),分析后得出了約1 000個基因與糖尿病腎病病理和臨床特征相關(guān)[17]。

        2.3 利用文本挖掘技術(shù)預(yù)測藥物靶位的主要方法

        針對cluster 2分析后,我們發(fā)現(xiàn)網(wǎng)絡(luò)分析是預(yù)測藥物靶位的主要方法,通過網(wǎng)絡(luò)的構(gòu)建可以更加清晰、有效地揭示藥物靶位和致病基因間可能存在的聯(lián)系,從而預(yù)測新的藥物靶位,為進(jìn)一步靶向治療提供理論支持。其中,網(wǎng)絡(luò)藥理學(xué)(Network pharmacology)是常用的藥物發(fā)掘范式,多用于尋找新的藥物靶位和發(fā)掘相應(yīng)藥物結(jié)構(gòu)、活性間的關(guān)系。也可用于保持藥物屬性前提下新主導(dǎo)范式的構(gòu)建,進(jìn)而實現(xiàn)藥物的概念性設(shè)計[5]。在人類疾病研究過程中,人類疾病網(wǎng)絡(luò)常用于挖掘疾病和基因間的潛在聯(lián)系[7]。同時,網(wǎng)絡(luò)分析依賴于一些平臺提供的數(shù)據(jù),如化合物-蛋白質(zhì)交互平臺STITCH[8]中提供的超過30,000個小分子化合物和來自近1 133個物種的260萬個蛋白質(zhì)之間的相互作用的數(shù)據(jù),就可用于交互式檢索或大規(guī)模數(shù)據(jù)分析。Vazquez等人開發(fā)了可用于研究藥物毒性和蛋白-疾病-化合物網(wǎng)絡(luò)分析的程序[18],使網(wǎng)絡(luò)分析更加智能化和高效化。

        2.4 文本挖掘在藥物靶位研究領(lǐng)域主要利用的資源

        2.4.1 常用數(shù)據(jù)庫

        在cluster 3 中,我們總結(jié)出兩個研究常用的數(shù)據(jù)庫Drugbank和OMIM。其中Drugbank是藥物學(xué)領(lǐng)域十分重要的數(shù)據(jù)庫,提供了豐富的生物學(xué)信息和化學(xué)信息、藥物數(shù)據(jù)(如藥理和制藥信息)與藥物靶位(即序列、結(jié)構(gòu)和通路)的詳細(xì)信息,包含有8 206條藥物條目(涵蓋了美國食品和藥物管理局批準(zhǔn)的小分子藥物、生物技術(shù)藥品(如蛋白質(zhì)/肽)、保健品和超過6 000個實驗藥物)[19]。

        人類孟德爾遺傳數(shù)據(jù)庫OMIM(網(wǎng)絡(luò)版)是一個關(guān)于人類基因和遺傳變異的數(shù)據(jù)庫,主要著眼于人類遺傳疾病[12]。包括了文本信息和相關(guān)參考信息、序列紀(jì)錄、圖譜,提供了相關(guān)數(shù)據(jù)庫的跨庫檢索功能,內(nèi)容上涵蓋了已知的遺傳病、相應(yīng)遺傳基因及其決定的性狀。除了簡略描述各種疾病的臨床特征、鑒別診斷、治療與預(yù)防外,還提供了已知的相關(guān)致病基因的連鎖關(guān)系、染色體定位、組成結(jié)構(gòu)、功能和一些實驗動物模型的數(shù)據(jù)。其中以O(shè)MIM數(shù)據(jù)庫、基因圖譜、OMIM 疾病基因圖譜利用最為廣泛。蛋白質(zhì)-蛋白質(zhì)相互作用的信息,可用來研究癌癥的體細(xì)胞突變、遺傳重疊現(xiàn)象和預(yù)測癌癥的高風(fēng)險位點。

        2.4.2 重要軟件工具

        經(jīng)過對cluster 4中文獻(xiàn)標(biāo)題、摘要的總結(jié),得出常用的軟件工具主要有Cytoscape[13],Pharmspresso[14],RelEx[16],SuperTarget and Matador[15]。Cytoscape用于構(gòu)建生物分子相互作用的網(wǎng)絡(luò)模型,它能將生物分子的相互作用圖形化顯示并進(jìn)行分析和編輯,多用于研究基因表達(dá)、DNA損傷、基因關(guān)聯(lián)性等[13];Pharmspresso是一個提取藥物基因組學(xué)概念和關(guān)系的文本挖掘工具,可協(xié)助識別重要的藥物基因組學(xué)概念等相關(guān)信息,側(cè)重于基因組學(xué)概念的命名體識別和抽取[14];一站式數(shù)據(jù)倉庫SuperTarget集成了藥品相關(guān)的醫(yī)療信息,包括藥物副作用、藥物代謝通路和藥物靶位、臨床指征等,方便了研究者進(jìn)行查詢;Matador是一個蛋白-化學(xué)物資源交互平臺。相比之下,DrugBank通常只包含蛋白質(zhì)或藥物相互作用的主要模式,而Matador則包含盡可能多的蛋白、藥物間直接和間接的交互信息。例如,在探究一個藥物代謝物和基因表達(dá)之間的關(guān)系時,利用Matador中相應(yīng)的交互信息可以將盡可能多的相關(guān)研究對象組合在一起進(jìn)行討論[15]。

        3 討論

        隨著算法和技術(shù)的不斷發(fā)展,文本挖掘技術(shù)在藥物靶位領(lǐng)域的應(yīng)用也更加廣泛和深入。結(jié)合高被引論文的最新引用文獻(xiàn),我們對上述研究領(lǐng)域的未來可能發(fā)展方向進(jìn)行如下預(yù)測。

        藥物研究在未來可能趨向于利用整合后的臨床試驗數(shù)據(jù)和現(xiàn)有軟件處理后的二次信息,即通過多個軟件的相互結(jié)合來抽取更加貼切的信息集。例如,實驗人員利用臨床試驗數(shù)據(jù)結(jié)合文本挖掘,對激酶抑制劑的不良事件進(jìn)行預(yù)測,通過挖掘抑制效力不同的多個激酶和人類疾病間潛在聯(lián)系,從而為臨床診療做出一定指導(dǎo)[20]。

        目前藥物靶位挖掘主要使用網(wǎng)絡(luò)分析的方法。未來研究主要有3個可能發(fā)展方向:一是通過分子分類來探索潛在藥物靶位[21];二是根據(jù)蛋白可以直接或間接影響藥物間相互作用的理論基礎(chǔ),探索脫靶藥物和其下游藥物的反應(yīng)[22]以及它們之間的潛在聯(lián)系,這可能成為個性化醫(yī)療發(fā)展的又一新方向;三是將文本挖掘的信息與化學(xué)結(jié)構(gòu)信息進(jìn)行整合,實現(xiàn)全面的可視化表達(dá)。如通過由高到低的分子建模來搭建分子相互作用框架,以此來揭示信號分子、代謝通路的層次結(jié)構(gòu),從而獲得新的范式[23],或是構(gòu)建藥物靶位圖譜,使人類疾病的潛在靶位得以更加直觀和準(zhǔn)確的呈現(xiàn)[24]。

        我們推測今后幾年數(shù)據(jù)庫的數(shù)據(jù)優(yōu)化也將成為研究者關(guān)注的一大方向,人們將更加致力于提高數(shù)據(jù)的質(zhì)量、降低噪音。DrugBank數(shù)據(jù)庫中提供了藥物/化學(xué)數(shù)據(jù)、藥物靶位和蛋白質(zhì)數(shù)據(jù)的字段檢索,近年又添加了許多新的數(shù)據(jù)字段,如食物-藥物相互作用、藥物之間的相互作用等[9],未來也將不斷更新數(shù)據(jù)庫中的字段以滿足研究需要。

        藥物靶位挖掘的研究工具的開發(fā)也將隨著學(xué)科發(fā)展逐步細(xì)化。當(dāng)前研究分析主要依賴于一些平臺提供的數(shù)據(jù),如STITCH就是一個典型的用于檢索化合物-蛋白質(zhì)交互關(guān)系的平臺[8];接下來更多具有針對性的工具和平臺將應(yīng)用于藥物靶位領(lǐng)域,如專門針對腸道藥物[25]或者針對于心臟疾病藥物的靶位預(yù)測工具。此外,將有更多科學(xué)家致力于開發(fā)用于臨床藥物-基因相互作用的軟件[26],以滿足臨床工作者進(jìn)行精準(zhǔn)治療的需求。

        4 結(jié)論

        當(dāng)前該領(lǐng)域的研究主要以藥物靶位間化學(xué)結(jié)構(gòu)相似性和副作用相似性作為理論基礎(chǔ),通過復(fù)雜網(wǎng)絡(luò)分析的方法,結(jié)合大量藥物數(shù)據(jù)資源來進(jìn)行靶位預(yù)測。研究人員主要利用Cytoscape[13]、Pharmspresso[14]、RelEx[16]、SuperTarget and Matador[15]幾個軟件,以DrugBank、OMIM為主要數(shù)據(jù)來源進(jìn)行潛在藥物靶位的發(fā)掘。

        通過分析推測該領(lǐng)域未來的發(fā)展方向?qū)⑽谋就诰虻慕Y(jié)果與臨床實踐相互結(jié)合,綜合利用各類挖掘軟件工具,通過范式、網(wǎng)絡(luò)的可視化分析,對相應(yīng)藥理實驗結(jié)果做出合理解釋,預(yù)測潛在的藥物靶位,為藥物研制提供指導(dǎo)性意見,切實為藥物生物學(xué)和臨床醫(yī)學(xué)提供幫助,以真正推動精準(zhǔn)醫(yī)療的進(jìn)一步發(fā)展。

        猜你喜歡
        靶位網(wǎng)絡(luò)分析數(shù)據(jù)庫
        利用CRISPR/Cas9 技術(shù)靶向編輯青花菜BoZDS
        基于ISM模型的EPC項目風(fēng)險網(wǎng)絡(luò)分析
        鐵路有線調(diào)度通信的網(wǎng)絡(luò)分析
        數(shù)據(jù)庫
        財經(jīng)(2017年2期)2017-03-10 14:35:35
        2016年社交網(wǎng)絡(luò)分析
        數(shù)據(jù)庫
        財經(jīng)(2016年15期)2016-06-03 07:38:02
        數(shù)據(jù)庫
        財經(jīng)(2016年3期)2016-03-07 07:44:46
        數(shù)據(jù)庫
        財經(jīng)(2016年6期)2016-02-24 07:41:51
        大班幼兒同伴交往的社會網(wǎng)絡(luò)分析
        CT引導(dǎo)下靶位注射膠原酶治療腰椎間盤突出癥36例
        久久精品国产亚洲av大全相关| 手机福利视频| 免费观看黄网站在线播放| 久久久久亚洲精品美女| 青青草最新在线视频观看| 亚洲国产美女高潮久久久| 欧美一区二区三区久久综| 毛片免费在线观看网址| 国产精品亚洲一区二区三区正片| 青青草高中生在线视频| 中文字幕肉感巨大的乳专区| 欧美一级色图| 久久深夜中文字幕高清中文| 久久午夜精品人妻一区二区三区| 欧美金发尤物大战黑人| 日本精品网| 精品亚洲一区二区在线观看| 天天做天天摸天天爽天天爱| 久久久久99精品成人片试看| 国产精品自线在线播放| 成人性生交大片免费5| 大胸少妇午夜三级| 国产爽爽视频在线| av网站免费在线不卡| 无码爽视频| 免费观看又污又黄的网站| 麻豆国产AV网站| 一区二区在线观看视频高清| 一本色道无码道dvd在线观看| 久久青草免费视频| 亚洲无av码一区二区三区| 在厨房被c到高潮a毛片奶水| 久久久久亚洲av无码a片软件| 网友自拍人妻一区二区三区三州| 久久蜜桃资源一区二区| 亚洲综合色区另类av| 日本免费一区二区三区在线看| 国产一区二区三区精品毛片| 亚洲国产精品无码中文字| 91热这里只有精品| 日韩av中文字幕少妇精品|