亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于擬比對(duì)CNN方法的人類p53癌癥基因二級(jí)數(shù)據(jù)庫(kù)構(gòu)建及分析

        2019-10-29 02:51:26王丹丹李晨鴻徐海陽(yáng)
        關(guān)鍵詞:乳腺癌數(shù)據(jù)庫(kù)信息

        王丹丹,李晨鴻,徐海陽(yáng),蔡 蓉,朱 平

        (江南大學(xué) 理學(xué)院,江蘇 無錫 214122)

        隨著各種模式生物基因組計(jì)劃的相繼完成或全面實(shí)施,有關(guān)核酸、蛋白質(zhì)的序列和結(jié)構(gòu)等生物學(xué)數(shù)據(jù)呈指數(shù)增長(zhǎng),越來越多基因的結(jié)構(gòu)和功能得到闡明,建立簡(jiǎn)潔、專用性強(qiáng)和數(shù)據(jù)質(zhì)量高的二級(jí)數(shù)據(jù)庫(kù)及分析系統(tǒng)已成為研究熱點(diǎn)之一[1-2]。

        各類二級(jí)數(shù)據(jù)庫(kù)的建立是研究生物信息學(xué)的重要出發(fā)點(diǎn)。一般而言,生物信息一級(jí)數(shù)據(jù)庫(kù)的數(shù)據(jù)來源于原始實(shí)驗(yàn)室的直接提交,而對(duì)一級(jí)數(shù)據(jù)庫(kù)的數(shù)據(jù)信息進(jìn)行搜索、加工和整理成二級(jí)數(shù)據(jù)庫(kù),已廣泛應(yīng)用于生物信息學(xué)、生命科學(xué)等領(lǐng)域[3-5]。目前被公認(rèn)是癌癥生物標(biāo)志物的p53抑癌基因最初被認(rèn)為是一種癌基因,隨著近十年研究的深入,p53作為抑癌基因的功能逐漸被揭示,對(duì)p53基因的研究也日益受到重視[6-7]。其中汪小霞等[8]揭示了EZH2與p53表達(dá)的正相關(guān)性以及EZH2蛋白在腫瘤中受p53基因調(diào)控的現(xiàn)象;MAKWANE等[9]通過聚合酶鏈反應(yīng)單鏈構(gòu)象多態(tài)性分析發(fā)現(xiàn)人類乳腺癌p53腫瘤抑制基因的外顯子5和7存在突變。p53基因突變與人類腫瘤的關(guān)系十分密切,已成為腫瘤發(fā)病的主要因素,而隨著生物醫(yī)學(xué)的發(fā)展,很多癌癥可以進(jìn)行基因治療,因此,有必要建立一個(gè)關(guān)于p53基因的二級(jí)生物信息數(shù)據(jù)庫(kù)對(duì)p53基因進(jìn)行深入分析研究。

        在生物信息學(xué)中,基因序列比對(duì)已成為一種處理基因信息的基本方法,有利于發(fā)現(xiàn)生物序列的功能、結(jié)構(gòu)和進(jìn)化信息。目前,序列比對(duì)算法主要包括Smith-Waterman算法、BLAST算法和FASTA算法等[10-11]。Smith-Waterman算法敏感性強(qiáng),但復(fù)雜度很高,運(yùn)算速度較慢,后2種序列比對(duì)算法具有更高的運(yùn)算速度,但敏感性較差。而一維細(xì)胞神經(jīng)網(wǎng)絡(luò)(cellular neural network,CNN)[12-13]序列比對(duì)算法是一種新提出的序列比對(duì)算法,具有較低時(shí)間復(fù)雜度和良好的敏感性。本研究采用擬比對(duì)一維CNN序列比對(duì)算法應(yīng)用于不同癌癥p53基因序列比對(duì),并改善算法相似度評(píng)估公式,大大增強(qiáng)了序列比對(duì)結(jié)果的敏感性和可靠性。

        本研究中主要針對(duì)p53癌癥基因的外顯子和內(nèi)含子數(shù)據(jù),構(gòu)建一個(gè)二級(jí)生物信息數(shù)據(jù)庫(kù)。通過NCBI(National Center for Biotechnology Information)一級(jí)數(shù)據(jù)庫(kù)收集p53癌癥基因序列,經(jīng)過解析與歸納將二級(jí)數(shù)據(jù)庫(kù)設(shè)計(jì)為包含p53信息、癌癥信息、樣本信息和參考文獻(xiàn)信息等4個(gè)部分,實(shí)現(xiàn)二級(jí)數(shù)據(jù)庫(kù)的信息查尋與使用,并通過Agent程序?qū)崿F(xiàn)數(shù)據(jù)庫(kù)的自動(dòng)更新和維護(hù)。采用改進(jìn)相似度評(píng)估公式的CNN序列比對(duì)算法,增強(qiáng)了序列比對(duì)敏感性,使乳腺癌和非小細(xì)胞肺癌p53外顯子基因序列比對(duì)結(jié)果更可靠。

        1p53癌癥基因二級(jí)數(shù)據(jù)庫(kù)構(gòu)建

        1.1 數(shù)據(jù)源

        NCBI是國(guó)際主要生命科學(xué)信息服務(wù)機(jī)構(gòu)之一,每天都有大量來自實(shí)驗(yàn)室和測(cè)序機(jī)構(gòu)發(fā)布的序列數(shù)據(jù)進(jìn)入該數(shù)據(jù)庫(kù),并保持與其他數(shù)據(jù)庫(kù)的數(shù)據(jù)交換和更新,因而匯集了當(dāng)前所有公開的核酸和蛋白質(zhì)序列,本二級(jí)數(shù)據(jù)庫(kù)的數(shù)據(jù)主要來源于NCBI維護(hù)的基因數(shù)據(jù)庫(kù)。

        本研究中采用 p53、human、cancer、exon、intron等關(guān)鍵詞搜索一級(jí)數(shù)據(jù)庫(kù),通過代理程序自動(dòng)獲取數(shù)據(jù)庫(kù)Web信息資源,并對(duì)其進(jìn)行檢索、歸納和轉(zhuǎn)換產(chǎn)生二級(jí)數(shù)據(jù)庫(kù),其流程圖如圖1所示。

        本二級(jí)數(shù)據(jù)庫(kù)目前已經(jīng)收集了包括乳腺癌、非小細(xì)胞肺癌、胃癌、肝癌等16種癌癥的516條p53癌癥基因序列。

        圖1 下載一級(jí)數(shù)據(jù)庫(kù)流程Fig.1 Download the flow chart of primary database

        1.2 數(shù)據(jù)解析

        本研究所構(gòu)建的二級(jí)數(shù)據(jù)庫(kù)主要過程見圖2。首先從NCBI一級(jí)數(shù)據(jù)庫(kù)中下載p53癌癥基因,并保存為網(wǎng)頁(yè)信息,然后使用XML Document類DOM模型創(chuàng)建、修改、遍歷XML文檔,運(yùn)行后臺(tái)解析程序?qū)ML文檔進(jìn)行映射,實(shí)現(xiàn)批量導(dǎo)入數(shù)據(jù)。最后,采用XML技術(shù)將各種異構(gòu)數(shù)據(jù)源數(shù)據(jù)轉(zhuǎn)換成XML公共數(shù)據(jù)模型格式,實(shí)現(xiàn)網(wǎng)絡(luò)數(shù)據(jù)資源和二級(jí)數(shù)據(jù)庫(kù)的數(shù)據(jù)交換,同時(shí)以GBseq XML格式獲取文本數(shù)據(jù)并構(gòu)建本地二級(jí)數(shù)據(jù)庫(kù)。

        圖2 構(gòu)建二級(jí)數(shù)據(jù)庫(kù)的系統(tǒng)結(jié)構(gòu)Fig.2 System architecture of the construction of secondary database

        1.3 數(shù)據(jù)結(jié)構(gòu)設(shè)計(jì)

        1.3.1 數(shù)據(jù)庫(kù)結(jié)構(gòu) 本研究所構(gòu)建的二級(jí)數(shù)據(jù)庫(kù)主頁(yè)包含了1個(gè)集合,這個(gè)集合包含各種癌癥子集合,每個(gè)子集合包含癌癥p53基因序列的外顯子或內(nèi)含子信息。同時(shí)以圖片形式展示人體各部分癌癥位點(diǎn),用戶可以點(diǎn)擊圖片進(jìn)行瀏覽,也可通過關(guān)鍵字搜索查找p53基因序列編號(hào),如果數(shù)據(jù)庫(kù)中有這一條序列則會(huì)自動(dòng)跳轉(zhuǎn)到對(duì)應(yīng)序列,如未能找到相應(yīng)p53序列編號(hào),則不顯示任何信息。

        當(dāng)用戶點(diǎn)擊某種癌癥圖片進(jìn)入對(duì)應(yīng)頁(yè)面,可以看到包括p53信息、癌癥信息、樣本信息、參考文獻(xiàn)信息等實(shí)體信息。用戶如對(duì)某個(gè)癌癥p53基因序列的詳細(xì)信息感興趣,可以點(diǎn)擊more按鍵詳細(xì)查看NCBI一級(jí)數(shù)據(jù)庫(kù)中這條序列的完整信息,同時(shí)也可鏈接到p53研究的原始文獻(xiàn)進(jìn)一步閱讀,查看包括癌癥名稱、p53外顯子或內(nèi)含子、樣本信息(樣本數(shù)、樣本來源)以及參考文獻(xiàn)信息(題目、發(fā)表年、PMID)等具體信息。

        本二級(jí)數(shù)據(jù)庫(kù)的實(shí)體信息主要包括以下4個(gè)部分:(1)p53信息,主要包含p53基因序列在數(shù)據(jù)庫(kù)中編號(hào)(Accession)、p53某個(gè)外顯子或者內(nèi)含子基因序列以及外顯子對(duì)應(yīng)的蛋白質(zhì)序列、每條序列的長(zhǎng)度和起始子位置;(2)癌癥信息,主要包含癌癥的名稱、癌癥的分類;(3)樣本信息,主要包含樣本來源、樣本數(shù)、樣本類型、樣本的研究方法;(4)參考文獻(xiàn)信息,主要包含文獻(xiàn)題目、PMID、發(fā)表日期、備注等。

        1.3.2 數(shù)據(jù)庫(kù)功能模塊 本數(shù)據(jù)庫(kù)系統(tǒng)分為5個(gè)模塊:第1個(gè)模塊為癌癥p53基因外顯子或內(nèi)含子序列顯示系統(tǒng),包含了各種癌癥及癌癥部位顯示圖,用戶可以通過點(diǎn)擊癌癥圖片的方式,了解具體癌癥p53基因序列信息。

        第2個(gè)模塊為數(shù)據(jù)庫(kù)介紹模塊,介紹了數(shù)據(jù)庫(kù)的基本內(nèi)容,包括數(shù)據(jù)庫(kù)更新信息、數(shù)據(jù)統(tǒng)計(jì)信息、數(shù)據(jù)內(nèi)容介紹。

        第3個(gè)模塊為搜索系統(tǒng),用戶可以通過輸入癌癥p53序列編號(hào),了解該p53序列是否被測(cè)序出來,是否在數(shù)據(jù)庫(kù)中,如果有,則數(shù)據(jù)庫(kù)會(huì)給出相應(yīng)的序列信息,用戶可通過點(diǎn)擊的方式了解詳細(xì)信息。

        第4個(gè)模塊為用戶數(shù)據(jù)提交系統(tǒng),作為一個(gè)大的整合型的數(shù)據(jù)庫(kù),我們盡可能收集所有數(shù)據(jù),如果用戶有新數(shù)據(jù)可以提交至我們的數(shù)據(jù)庫(kù),將由后臺(tái)人員進(jìn)行數(shù)據(jù)審查。

        第5個(gè)模塊為數(shù)據(jù)共享,即作為一個(gè)公開的數(shù)據(jù)庫(kù),數(shù)據(jù)是共享的,數(shù)據(jù)庫(kù)中的信息是以Excel表形式進(jìn)行匯總,全面涵蓋了所存儲(chǔ)數(shù)據(jù),用戶可以對(duì)數(shù)據(jù)進(jìn)行下載使用。

        1.4 二級(jí)數(shù)據(jù)庫(kù)的管理與更新

        二級(jí)數(shù)據(jù)庫(kù)的管理系統(tǒng)能夠有效減輕管理員的負(fù)擔(dān),目前已經(jīng)有多種不同環(huán)境下的數(shù)據(jù)庫(kù)管理系統(tǒng)。二級(jí)數(shù)據(jù)庫(kù)管理主要步驟包括增刪相應(yīng)序列和編輯二級(jí)數(shù)據(jù)庫(kù)注釋信息、二級(jí)數(shù)據(jù)庫(kù)更新需與一級(jí)數(shù)據(jù)庫(kù)更新同步,主要包括修改序列條目、刪除冗余條目和加入新條目。

        隨著一級(jí)數(shù)據(jù)庫(kù)中已有數(shù)據(jù)的不斷變更以及新數(shù)據(jù)的不斷加入,人工更新方式已難以滿足二級(jí)數(shù)據(jù)庫(kù)的實(shí)時(shí)有效更新,因此,需要采用一種自動(dòng)獲取Web信息的方法實(shí)現(xiàn)二級(jí)數(shù)據(jù)庫(kù)自動(dòng)更新。而SQL Server提供的企業(yè)級(jí)管理軟件能夠進(jìn)行常規(guī)任務(wù)的自動(dòng)化管理,管理員可以通過SQL Server提供的Agent服務(wù)實(shí)現(xiàn)數(shù)據(jù)庫(kù)的自動(dòng)管理和更新。利用Agent服務(wù)在特定日期及時(shí)檢測(cè)一級(jí)數(shù)據(jù)庫(kù)中的版本信息,二級(jí)數(shù)據(jù)庫(kù)通過接收Agent服務(wù)消息并與二級(jí)數(shù)據(jù)庫(kù)對(duì)應(yīng)的版本號(hào)進(jìn)行比較,主動(dòng)對(duì)二級(jí)數(shù)據(jù)庫(kù)進(jìn)行更新,若版本號(hào)變動(dòng)則自動(dòng)下載更新該條目,通過匹配一級(jí)數(shù)據(jù)庫(kù)中有關(guān)p53基因信息條目的版本號(hào),自動(dòng)判斷該條目是否已在二級(jí)數(shù)據(jù)庫(kù)中存在,不存在則通過文本消息通知管理員添加該條目[3,14]。與人工更新方式相比,SQL Server Agent服務(wù)能夠高效地完成數(shù)據(jù)庫(kù)自動(dòng)管理和更新。

        2 擬比對(duì)CNN序列比對(duì)方法

        一維CNN模型具有一個(gè)線性細(xì)胞排列結(jié)構(gòu),每個(gè)細(xì)胞最多有兩個(gè)相連細(xì)胞,這些特點(diǎn)可以有效地來進(jìn)行兩條DNA序列比對(duì)。一維CNN與傳統(tǒng)CNN不同,因?yàn)樗鼉H由兩個(gè)單獨(dú)的一維細(xì)胞神經(jīng)網(wǎng)絡(luò)組成,一個(gè)固定的主子網(wǎng)絡(luò),一個(gè)可移動(dòng)的從子網(wǎng)絡(luò),分別代表兩條DNA序列片段,其中網(wǎng)絡(luò)中每一個(gè)細(xì)胞都對(duì)應(yīng)DNA序列中的堿基。算法中從子網(wǎng)絡(luò)隨時(shí)間以固定距離移動(dòng),計(jì)算主子網(wǎng)絡(luò)中每一個(gè)細(xì)胞在不同時(shí)刻的狀態(tài)值,最終將所得到的狀態(tài)值進(jìn)行排列形成狀態(tài)矩陣,通過動(dòng)態(tài)規(guī)劃方法產(chǎn)生一條全局比對(duì)最優(yōu)路徑。在這條路徑的引導(dǎo)下,通過在合適的位置插空使得兩條長(zhǎng)度不同的DNA序列變成長(zhǎng)度相同新的DNA序列,然后對(duì)這兩條DNA序列片段進(jìn)行全局比對(duì)。

        一維CNN計(jì)算公式如下:

        其中,x1,i(t)表示主子網(wǎng)絡(luò)中細(xì)胞i在t時(shí)刻的狀態(tài),y1,i(t)表示從細(xì)胞i中接收到的反饋輸出,Ak,Bk分別是反饋模板A和控制模板B的系數(shù),Ii,Rx和C是3個(gè)常量,y1,k(t)和u1,i(t)分別為細(xì)胞k在t時(shí)刻的輸出和相關(guān)輸入。

        具體序列比對(duì)步驟如下:

        Step1:設(shè)置CNN初始值,將DNA序列化為可計(jì)算的數(shù)字特征,最基本的特征{*,A,C,G,T}相應(yīng)的量化為{0,-1,-0.5,0.5,1},“*”代表空格。

        Step2:通過狀態(tài)選擇函數(shù)計(jì)算狀態(tài)矩陣,其中狀態(tài)選擇函數(shù)計(jì)算公式為:

        Step3:根據(jù)狀態(tài)矩陣形成全局比對(duì)的路徑。通過最后的狀態(tài)逐步回溯到第1個(gè)狀態(tài),其中每個(gè)狀態(tài)選取規(guī)則為包含上1個(gè)狀態(tài)左上角2×2矩陣中的最大值。例如,狀態(tài)矩陣中的m行n列的狀態(tài)為(n,m)則其下 1 個(gè)狀態(tài)選取規(guī)則為在(n,m-1)、(n-1,m-1)、(n-1,m)中選取最大值,然后將其作為下 1個(gè)狀態(tài)值。

        Step4:根據(jù)所選路徑對(duì)2條DNA序列進(jìn)行全局比對(duì),如果前后2個(gè)狀態(tài)橫坐標(biāo)相差1,縱坐標(biāo)相差0,則在第一條序列中插入1個(gè)空格,如果前后2個(gè)狀態(tài)橫坐標(biāo)相差0,縱坐標(biāo)相差1,則在第2條序列中插入1個(gè)空格,其他情況則序列保持不變。

        Step5:計(jì)算2條序列比對(duì)的相似度評(píng)估。將CNN序列比對(duì)方法中的計(jì)算相似度公式改進(jìn)為:

        其中Nma為步驟4中2條序列匹配的個(gè)數(shù),L(S1)、L(S2)分別為序列S1、S2的長(zhǎng)度。假設(shè)兩序列S1、S2中S1長(zhǎng)度較短,可知Nma∈{0,1,……,L(S1)},則由式(5)可以得出當(dāng)兩序列匹配個(gè)數(shù)為零時(shí),其最小相似度為零;當(dāng)兩序列匹配個(gè)數(shù)達(dá)到最大,即較短序列的長(zhǎng)度時(shí),其相似度最大,該最大相似度與兩序列長(zhǎng)度相關(guān),當(dāng)兩序列長(zhǎng)度相同時(shí),最大相似度為1,當(dāng)兩序列長(zhǎng)度相差較大時(shí),最大相似度趨近于0.5。因此,改進(jìn)后的相似度評(píng)估公式增強(qiáng)了序列比對(duì)敏感性,使得序列比對(duì)結(jié)果更可靠。

        其中將公式(1)中的初始值取為C=1,Rx=1,I=0,A={0,0,0},B={0,1,-1},F(xiàn)={F1,F(xiàn)2,F(xiàn)3}={5,4,2}。

        定義1:稱如上定義的CNN方法為擬比對(duì)CNN方法。

        3 基于擬比對(duì)CNN的p53癌癥基因序列比對(duì)

        為了探討不同癌癥p53基因之間的區(qū)別和聯(lián)系,本研究以乳腺癌和非小細(xì)胞肺癌為例進(jìn)行序列比對(duì),分析這兩種癌癥之間的聯(lián)系與區(qū)別。分別對(duì)乳腺癌和非小細(xì)胞肺癌p53基因的Exon4、Exon5、Exon6、Exon7、Exon8和 Exon9進(jìn)行擬比對(duì) CNN 算法比對(duì),其中乳腺癌的Exon4有15條,Exon5有28條,Exon6有27條,Exon7有38條,Exon8有39條,Exon9有50條;非小細(xì)胞肺癌的Exon4有13條,Exon5有 25條,Exon6有 20條,Exon7有 35條,Exon8有37條,Exon9有48條。

        分別采用CNN方法、BLAST序列比對(duì)方法和擬比對(duì)CNN方法對(duì)2種癌癥p53基因同一外顯子序列進(jìn)行比對(duì),表1中擬比對(duì)CNN方法利用步驟5所給出的兩序列相似度評(píng)估公式(5)對(duì)Exon4、Exon5、Exon6、Exon7、Exon8、Exon9 的 DNA 序列進(jìn)行全局比對(duì),其中Mean為平均值,Std為標(biāo)準(zhǔn)差。

        從表1中可以看出,擬比對(duì)CNN方法相比CNN方法和BLAST序列比對(duì)方法有較高的全局相似度,尤其當(dāng)序列長(zhǎng)度較長(zhǎng)時(shí)擬比對(duì)CNN相比CNN和BLAST全局相似度提高較多。此外,采用擬比對(duì)CNN方法對(duì)兩種癌癥p53基因的外顯子序列比對(duì)相似度的標(biāo)準(zhǔn)差相對(duì)較小。表明擬比對(duì)CNN方法相比于其他兩種方法不僅具有較好的敏感性,而且其結(jié)果的可靠性良好。

        從表1還可以看出,采用擬比對(duì)CNN方法對(duì)乳腺癌和非小細(xì)胞肺癌的p53基因外顯子進(jìn)行比對(duì),其結(jié)果有很大不同。其中Exon5相比于Exon4、Exon6、Exon7、Exon8 和 Exon9 而言相似度最低,只有55.34%,而Exon4的相似度最高,達(dá)到了99.75%,其他幾個(gè)外顯子也都超過了95%,這表明乳腺癌和非小細(xì)胞肺癌p53的Exon5序列突變存在較大差異。因此,在突變的p53外顯子中Exon5可以作為區(qū)別乳腺癌和非小細(xì)胞肺癌參考標(biāo)準(zhǔn),而其他幾個(gè)p53癌癥基因外顯子難以作為區(qū)別乳腺癌和非小細(xì)胞肺癌的參考標(biāo)準(zhǔn)。

        表1 擬比對(duì)CNN、CNN與BLAST方法的全局相似度比較Table1 Global similarity comparisons between quasi alignment CNN、CNN and BLAST algorithms

        將擬比對(duì)CNN方法與CNN方法和BLAST序列比對(duì)方法對(duì)乳腺癌和肺癌的 Exon4、Exon5、Exon6、Exon7、Exon8、Exon9 序列比對(duì)時(shí)間進(jìn)行比較,結(jié)果如表2所示。

        由于擬比對(duì)CNN方法對(duì)2條p53基因序列進(jìn)行比對(duì),其時(shí)間復(fù)雜度為O(T)=O(m,n)≈O(m+n+1),而BLAST比對(duì)算法的時(shí)間復(fù)雜度為O(T)=O(m×n)較高,其中m、n分別為2條序列的長(zhǎng)度,所以擬比對(duì)CNN方法有效降低了算法的時(shí)間復(fù)雜度。

        從表2可以看出,就計(jì)算時(shí)間而言不論是較長(zhǎng)的序列還是較短的序列擬比對(duì)CNN方法和CNN方法都比BLAST所需要的計(jì)算時(shí)間短很多,且就擬比對(duì)CNN方法本身而言序列總長(zhǎng)度越長(zhǎng)比對(duì)所需計(jì)算時(shí)間也越長(zhǎng)。因此,采用擬比對(duì)CNN方法對(duì)基因序列進(jìn)行比對(duì)有效提高了算法運(yùn)算效率。

        表2 擬比對(duì)CNN、CNN與BLAST方法的計(jì)算時(shí)間比較Table2 Computation time comparisons of the quasi alignment CNN、CNN and BLAST algorithms ms

        4 結(jié)語(yǔ)

        本研究以癌癥生物標(biāo)志物p53基因?yàn)閷?duì)象,通過NCBI一級(jí)數(shù)據(jù)庫(kù)收集p53癌癥基因序列,經(jīng)過解析與歸納將二級(jí)數(shù)據(jù)庫(kù)設(shè)計(jì)為包含p53信息、癌癥信息、樣本信息和參考文獻(xiàn)信息等4個(gè)部分,利用5個(gè)功能模塊更加有利于實(shí)現(xiàn)二級(jí)數(shù)據(jù)庫(kù)的信息查詢與使用。為了進(jìn)一步提高CNN序列比對(duì)方法相似度的敏感性和可靠性,本文對(duì)相似度評(píng)估公式進(jìn)行改進(jìn),并將其定義為擬比對(duì)CNN方法,有效提高了算法的性能。采用擬比對(duì)CNN方法對(duì)乳腺癌和非小細(xì)胞肺癌p53基因的外顯子序列進(jìn)行比對(duì)分析,發(fā)現(xiàn)兩種癌癥p53基因的Exon5序列突變存在較大差異,可作為區(qū)別乳腺癌和非小細(xì)胞肺癌的參考標(biāo)準(zhǔn)。

        后續(xù)將增加更多癌癥p53基因,以及加入某種癌癥的其他生物標(biāo)志物比如乳腺癌的HER2、ER,結(jié)直腸癌的EGFR、KRAS等,使數(shù)據(jù)庫(kù)的內(nèi)容更全面,實(shí)用性更強(qiáng),應(yīng)用性更廣。

        猜你喜歡
        乳腺癌數(shù)據(jù)庫(kù)信息
        絕經(jīng)了,是否就離乳腺癌越來越遠(yuǎn)呢?
        中老年保健(2022年6期)2022-08-19 01:41:48
        乳腺癌是吃出來的嗎
        胸大更容易得乳腺癌嗎
        別逗了,乳腺癌可不分男女老少!
        祝您健康(2018年5期)2018-05-16 17:10:16
        訂閱信息
        中華手工(2017年2期)2017-06-06 23:00:31
        數(shù)據(jù)庫(kù)
        數(shù)據(jù)庫(kù)
        數(shù)據(jù)庫(kù)
        數(shù)據(jù)庫(kù)
        展會(huì)信息
        91精品91| 国产精品久久久久9999小说| 亚洲精品久久中文字幕| 国产在线精品一区二区在线看| 国产高清精品在线二区| 人妻爽综合网| 久久精品国产熟女亚洲av麻豆 | 久久精品视频中文字幕无码| 91精品国产九色综合久久香蕉| 国内精品久久久久久99| 欧洲熟妇色xxxx欧美老妇多毛网站| 欧美色资源| 精品久久中文字幕一区| 成年美女黄的视频网站| 成人欧美一区二区三区a片| 久久99中文字幕久久| 男女视频一区二区三区在线观看| 日韩人妻中文字幕高清在线| 51看片免费视频在观看| 久久久久亚洲av无码尤物| 看全色黄大色大片免费久久久| 日本久久久免费观看视频| 国产男女猛烈无遮挡免费网站 | 久久久久波多野结衣高潮| 亚洲AV日韩AV无码A一区| 日本成年少妇人妻中文字幕| 日韩日韩日韩日韩日韩日韩日韩| 午夜精品久久久久成人| 久久婷婷综合色拍亚洲| 国产一区三区二区视频在线观看| 久久久久夜夜夜精品国产| 中文在线а√天堂官网| 99久久国产一区二区三区| 久久综网色亚洲美女亚洲av| 无码人妻精品一区二区三区不卡 | 狼色在线精品影视免费播放 | 被驯服人妻中文字幕日本| 成人国产精品一区二区八戒网| 日本在线看片免费人成视频1000| 天天草夜夜草| 国产精品一区二区久久蜜桃|