亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        人工神經(jīng)網(wǎng)絡(luò)-紫外光譜法短串聯(lián)重復(fù)序列基因分型檢測

        2011-04-12 00:00:00汪雪嬌牟紅元魯輝豆興茹邱婷謝洪平
        分析化學(xué) 2011年11期

        摘 要 以STR基因座D16S539中的總核心重復(fù)串?dāng)?shù)相差較小的10-11, 10-12, 11-11和10-13基因型為研究對象,以紫外光譜為判別變量,建立了以人工神經(jīng)網(wǎng)絡(luò)(ANN)提取富信息變量為基礎(chǔ)的ANN基因分型方法。在優(yōu)化條件下,對4個基因型樣本進(jìn)行了聚合酶鏈?zhǔn)椒磻?yīng)擴(kuò)增,以擴(kuò)增樣本在200~310 nm范圍內(nèi)的檢測光譜進(jìn)行預(yù)處理和偶合的ANN-ANN網(wǎng)絡(luò)優(yōu)化。結(jié)果表明,提取富信息變量和基因分型的ANN的最優(yōu)網(wǎng)絡(luò)結(jié)構(gòu)分別為391-50-391和50-6-4,該結(jié)構(gòu)下的判別模型的校正相對均方根誤差(RMS)和預(yù)測RMS分別是0.0279和0.0418,模型表現(xiàn)出了良好的穩(wěn)健性和100%的基因型正確預(yù)測率。成功實現(xiàn)了基于紫外光譜對STR基因型的快速、簡單和低成本檢測。

        關(guān)鍵詞 短串聯(lián)重復(fù)序列; 紫外光譜; 人工神經(jīng)網(wǎng)絡(luò); 基因分型

        1 引 言

        短串聯(lián)重復(fù)序列(STR)是一類廣泛分布在人和動物基因組中的DNA重復(fù)序列片段,STR的核心序列為2~6 bp,呈串聯(lián)重復(fù)排列,重復(fù)15~30次左右,其總長度一般位于100~400 bp之間,多位于基因編碼區(qū)附近、基因內(nèi)含子和非翻譯區(qū)。按孟德爾規(guī)律呈顯性遺傳[1]。常見的STR形式有二核苷酸重復(fù)(CA)n, (GA)n, (AA)n, (GG)n,三核苷酸重復(fù)(CAG)n, (CGG)n和四核苷酸重復(fù)(GATA)n, (AGAT)n等。據(jù)估計,人類基因組約有50萬個STR位點。STR具有種類多、分布廣、多態(tài)信息量大、雜合度高、片段較短、易于聚合酶鏈?zhǔn)椒磻?yīng)(Polymerase chain reaction,PCR)擴(kuò)增等優(yōu)點[2],因而在人類學(xué)、生命科學(xué)和醫(yī)學(xué)等領(lǐng)域得到廣泛應(yīng)用[3~5]。目前,STR基因型的檢測常采用凝膠電泳法[6,7]、毛細(xì)管電泳法[8~10]、微芯片電泳法[11,12]、和基因測序[13~15]等方法,這些方法可以較準(zhǔn)確地對STR基因型進(jìn)行檢測,但通常需要較為復(fù)雜的樣品前處理(如分離、純化)或PCR引物標(biāo)記(如熒光標(biāo)記、放射線標(biāo)記)。對于STR基因型質(zhì)譜檢測法[16,17], 雖然不需要標(biāo)記,但儀器較為昂貴。結(jié)合化學(xué)模式識別的近紅外光譜法實現(xiàn)了一次PCR擴(kuò)增、無需分離純化、無需熒光標(biāo)記、低成本的基因型快速檢測[18]。但是,在光譜分析方法中,近紅外光譜法的應(yīng)用廣譜性相對較低。本研究以STR的紫外光譜(UVS)為識別變量,采用人工神經(jīng)網(wǎng)絡(luò)(ANN)化學(xué)模式識別方法,建立了不同STR基因型的判別模型。

        2 實驗部分

        2.1 儀器與試劑

        PTC-225型PCR擴(kuò)增儀(美國Bio-Rad公司); POWER BC6003En型電泳儀(上海申能博彩生物科技有限公司); GeneGenius凝膠成像系統(tǒng)(英國Syngene公司); 離心機(jī)(日本Tomy公司); 移液器(德國Eppendorf公司); 微型混合器(上海滬西儀器廠); UV2401型紫外分光光度計(日本Shimazdu公司)。

        Taq DNA 聚合酶(美國Fermentas公司); PCR引物(PAGE級,金思特科技有限公司); 瓊脂糖(LP0028A, 英國Oxoid公司); 溴化乙錠(Sangon生物公司); 人血液樣本(蘇州大學(xué)司法鑒定所); 其它試劑均為分析純,所有溶液由滅菌去離子水配制。

        2.2 基因組DNA的提取

        按Chelex100法 [19] 提取基因組DNA。取6名以EDTA抗凝的D16S539基因座已知基因型的受試者的全血0.2~1.5 mL于離心管中,滴加紅細(xì)胞裂解液1 mL,以10000 r/min離心5 min;棄去上清液,加入磷酸鹽緩沖液1 mL,離心;棄去上清液,重復(fù)上述過程1次。加入5% Chelex100懸浮液0.2 mL,懸浮細(xì)胞核,在56 ℃保溫30 min;在沸水浴中保溫8 min,立即置于-20 ℃冰箱保存?zhèn)溆谩?/p>

        2.3 PCR擴(kuò)增

        3 人工神經(jīng)網(wǎng)絡(luò)模型的建立

        人工神經(jīng)網(wǎng)絡(luò)是一種模擬人腦神經(jīng)網(wǎng)絡(luò)行為特征,以數(shù)學(xué)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)為理論基礎(chǔ),進(jìn)行分布式并行信息處理的算法數(shù)學(xué)模型[20]。其中,誤差反向傳播算法(BP)可分為兩個階段:正向傳播和反向傳播。正向為構(gòu)造非線性的數(shù)學(xué)模型過程,而反向是進(jìn)行網(wǎng)絡(luò)中權(quán)重的修正。在不斷的學(xué)習(xí)和修正過程中,使網(wǎng)絡(luò)的學(xué)習(xí)誤差達(dá)到最小。本研究采用誤差反向傳播算法的ANN(BPANN)方法,以紫外光譜為識別變量,建立D16S539基因座的10-11,10-12, 11-11和11-13基因型的分類判別模型,實現(xiàn)簡單、快速、低成本地分型檢測STR的4種基因型。

        以紫外光譜為BPANN的輸入變量和目標(biāo)變量,利用隱含層神經(jīng)元提取富信息,并以該信息為另一個BPANN的輸入變量,建立基因型的分類模型,即前一個BPANN為富信息提取的ANN(RIE-ANN),后一個則為判別模型建立的ANN(DMB-ANN)。在DMB-ANN中,對于10-12, 11-11, 10-11和11-13基因型的目標(biāo)變量分別為(1,0,0,0), (0,1,0,0), (0,0,1,0)和(0,0,0,1)。對于10-11基因型的33個樣本,隨機(jī)選擇24個為校正樣本,其余9個為預(yù)測樣本,而其它3個基因型均為34個樣本。每個基因型隨機(jī)選擇10個樣本構(gòu)成預(yù)測集,其余樣本構(gòu)成校正集。在210~280 nm波長范圍內(nèi),每個樣本的量測光譜共有781個數(shù)據(jù)點,以“每隔一點取一點”的方法,得391個數(shù)據(jù)點,代表樣本的量測光譜,作為RIE-ANN輸入層神經(jīng)元。優(yōu)化的最佳網(wǎng)絡(luò)結(jié)構(gòu):RIE-ANN為391-50-391,DMB-ANN為50-6-4。對于建立的分類模型,相對于基因型的目標(biāo)變量,校正集的相對均方根誤差(RMS)為0.0275,預(yù)測集RMS為0.0418,預(yù)測準(zhǔn)確率達(dá)到100%。ANN算法來自Matlab(V6.0)工具箱,其它計算程序在Matlab(V6.0)環(huán)境下自行編寫。

        4 結(jié)果與討論

        4.1 光譜預(yù)處理

        光譜的變化由基因型差異、被測樣本組成和濃度產(chǎn)生。為了使光譜的變化主要由基因型的差異所決定,需要消除同一基因型不同樣本間的濃度差異。以10-11基因型的樣本的紫外光譜為例(見圖1),相同基因型樣本的光譜存在明顯差異,表明樣本間有濃度差異,為了消除這種差異對以基因型差異為主的判別模型的影響,本研究對每個樣本光譜均進(jìn)行了濃度歸一化處理,使得同一基因型樣本的光譜差異性顯著減小。同時,在圖1的300 nm以上的無信息區(qū)域,其光譜存在明顯的基線漂移(圖1內(nèi)插圖),對于同一基因型的樣本光譜的這種差異也會嚴(yán)重影響模式識別模型對基因型差異的判別,對其進(jìn)行了基線漂移校正,使所有樣本在無信息區(qū)域的光譜均值均等于零,有效消除了此漂移。

        但是,尚存在極小的光譜差異,可能是因為被測樣本純度為達(dá)到100%。雖然這種差異不可能消除,但通過PCR擴(kuò)增條件的優(yōu)化而保證了該差異的最小化。同時,為了使各次擴(kuò)增的操作差異也包含在模型中,對每個基因型樣本平行擴(kuò)增,每次獲得18個樣本,共獲得測試樣本36個。

        4.2 BPANN提取富信息

        紫外光譜數(shù)據(jù)通常由極多的數(shù)據(jù)點構(gòu)成,如果將這些數(shù)據(jù)點都作為模式判別的ANN網(wǎng)絡(luò)輸入變量,則神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)龐大,太多的輸入神經(jīng)元易于造成過擬合,并使迭代時間過長。因此有必要對紫外光譜數(shù)據(jù)進(jìn)行降維處理,提取富信息,再以富信息變量建立ANN判別模型。本研究以RIE-ANN提取量測光譜的富信息,作為DMB-ANN的輸入變量,建立了判別模型,兩個網(wǎng)絡(luò)隱含層的神經(jīng)元數(shù)通過試差法優(yōu)化。

        對于每個樣本的量測光譜,由于在210~280 nm范波長圍內(nèi)有781個波長點,數(shù)據(jù)量較大,為了不丟失信息,采用了“每隔一點取一點”的方法,得到了391個量測數(shù)據(jù)點。若將以391個量測光譜數(shù)據(jù)直接用于建立基因型的判別模型,相對于本研究使用的24個校正樣本,這個變量數(shù)遠(yuǎn)遠(yuǎn)大于樣本數(shù),極易于出現(xiàn)過擬合。為了避免這種現(xiàn)象,本研究利用RIE-ANN,將391個量測光譜數(shù)據(jù)作為輸入層變量,同時將這些變量作為目標(biāo)輸出變量,即網(wǎng)絡(luò)結(jié)構(gòu)為391-m-391,數(shù)據(jù)量遠(yuǎn)遠(yuǎn)小于391的m個隱含層變量即為提取的富信息變量。以此富信息變量作為基因型的判別變量建立判別模型,即在建立判別模型的DMB-ANN中,采用網(wǎng)絡(luò)結(jié)構(gòu)m-n-4,其中隱含層神經(jīng)元為n個。

        設(shè)定RIE-ANN的目標(biāo)誤差為均方誤差(MSE)0.0005(應(yīng)小于DMB-ANN的目標(biāo)誤差),最大循環(huán)500次,最小梯度10-6,隨機(jī)初始化權(quán)重。隱含層的激發(fā)函數(shù)選用S型函數(shù),輸出層的激發(fā)函數(shù)為線性函數(shù)。實驗表明,隱含層神經(jīng)元數(shù)目在30~100較為適宜,分別對隱含層的神經(jīng)元數(shù)為30, 40, 50, 60, 70, 80, 90和100進(jìn)行了優(yōu)化。由于本研究建立的基因型判別模型實際上是RIE-ANN與DMB-ANN兩個ANN的偶合,網(wǎng)絡(luò)結(jié)構(gòu)參數(shù)m和n即為模型參數(shù),可采用“預(yù)測準(zhǔn)確率、較小的類內(nèi)距和較大的類間距”為標(biāo)準(zhǔn),優(yōu)化獲取該參數(shù)。

        4.3 ANN-ANN對STR的4種基因型的判別能力

        以RIE-ANN提取的m個富信息變量為建立判別模型的DMB-ANN的輸入變量,網(wǎng)絡(luò)結(jié)構(gòu)為m-n-4,其中4個目標(biāo)輸出變量為基因型的表達(dá)變量,即D16S539基因座的10-12, 11-11, 10-11和11-13基因型的模式表達(dá)變量分別為(1,0,0,0), (0,1,0,0), (0,0,1,0)和(0,0,0,1)。以分類預(yù)測率和模型穩(wěn)健性為基礎(chǔ),優(yōu)化DMB-ANN網(wǎng)絡(luò),并選擇RIE-ANN的最佳隱含層神經(jīng)元數(shù)。本研究選用Levenberg-Marquardt算法,隱含層的激發(fā)函數(shù)選S型函數(shù),輸出層的激發(fā)函數(shù)為線性函數(shù),建立判別模型,其目標(biāo)優(yōu)化參數(shù)為:目標(biāo)誤差MSE為0.001、最大循環(huán)次數(shù)500和最小梯度10-6。對于初步試探的模型參數(shù)m[30, 100]和n[2, 10],以預(yù)測集的相對均方根誤差RMS最小為標(biāo)準(zhǔn),分別以步長 Δm=10和 Δm=1進(jìn)行全局優(yōu)化。預(yù)測集RMS 0.0418為上述范圍內(nèi)的最小值,此時校正集的RMS為0.0275,模型參數(shù)m=50, m=6, 該模型對基因型的預(yù)測準(zhǔn)確率達(dá)到100%(表1)。從表1可見,判別模型對基因型的預(yù)測準(zhǔn)確率較高,基因型表達(dá)變量的預(yù)測范圍[0.8177, 1.0000] 和[0.0000, 0.2318]分別與目標(biāo)表達(dá)變量1和0非常接近,兩者之間有明顯差異,不存在類間重疊,表明模型能夠準(zhǔn)確判別基因型。由于預(yù)測集與校正集的RMS相差較小,后者略小于前者,預(yù)示著校正模型不存在過訓(xùn)練現(xiàn)象,從三維表達(dá)圖也證明了此現(xiàn)象。

        5 結(jié) 論

        對于STR不同基因型的紫外光譜的強相似性,本研究以偶合ANN-ANN的網(wǎng)絡(luò)為基礎(chǔ),提取光譜富信息和建立基因分型的判別模型。以模型穩(wěn)健性為前提、最小預(yù)測RMS對應(yīng)的ANN-ANN即為最優(yōu)網(wǎng)絡(luò)。研究表明,用于壓縮變量的ANN的最佳網(wǎng)絡(luò)結(jié)構(gòu)是391-50-391,用于分類的ANN的最佳網(wǎng)絡(luò)結(jié)構(gòu)是50-6-4,由此建立的模型表現(xiàn)出了良好的穩(wěn)健性和100%的正確判別率。實現(xiàn)了對PCR擴(kuò)增樣本在不經(jīng)分離提純等預(yù)處理條件下的快速、簡單、低成本的紫外光譜基因型判別。

        References

        1 Alford R L, Hammond H A, Coto I, Caskey C T. Am. J. Hum. Genet., 1994, 55(1): 190~195

        2 Hao F, Jia Y C. Geno. Prot. Bioinfo., 2007, 5(1): 7~14

        3 Lev A Z, Peter A U, Cengiz C, Manfred K, Bharti M, Toomas K, Rosaria S, Fulvio C, Giovanni D, Gabriella S, Geoffrey K C, Rene J H, Kiau K Y, David G, Ivailo T, Marcus W F, Luba K. Am. J. Hum. Genet., 2004, 74(1): 50~61

        4 Asamura H, Tsukada K, Ota M, Sakai H, Takayanagi K, Kobayashi K, Saito S, Fukushima H. I(xiàn)nt. Congr. Ser., 2006, 1288: 610~612

        5 Matthias G, Tanja S Y. Forensic. Sci. Int., 2000, 113: 43~46

        6 Riad A B, Lihadh I A, Uzma J, Mohamed S A, Nurekamal, A D, Abdulbari B, Valsamma E, Bruce B. Electrophoresis, 1997, 18(9): 1637~1640

        7 Victoria L, Carmela P, Christopher P, Francisco B, Angel C, Denise S C, Patrick L. Electrophoresis, 1998, 19(10): 1566~1572

        8 Stephanie H I Y, Peng L, Nadia D B, Susan A G, Richard A M. Anal. Chem., 2009, 81(1): 210~217

        9 LIU Yong, WANG Rong, GAO Lan, JIA Zheng-Ping, XIN Xiao-Ting, XIE Hua, MA Jun(劉 勇, 王 榮, 高 嵐, 賈正平, 辛?xí)枣茫?謝 華, 馬 駿). Chinese J. Anal. Chem.(分析化學(xué)), 2009, 37(10): 1494~1498

        10 Stephanie H I Y, Tae S S, Cecelia A C, Susan A G, Thomas N C, Jeff D B, Richard A M. Electrophoresis, 2008, 29(11): 2251~2259

        11 Stephanie H I Y, Peng L, Nadia D B, Susan A G, Richard A M. Anal. Chem., 2009, 81(1): 210~217

        12 Yi N S. Electrophoresis, 2006, 27(19): 3703~3711

        13 Wei M H, Kwang J H, Cheng Y C. Taiwanese. J. Obstet. Gynecol., 2005, 44(1): 52~56

        14 Antonio B, Maria J A, Manuela A N, Zarapuz L, Blanco L , García-Sánchez F, Vicario J L. Hum Immunol, 2005, 66(8): 903~911

        15 ZHANG Xiao-Dan, WU Hai-Ping, CHEN Zhi-Yao, ZHOU Guo-Hua(張曉丹, 武海萍, 陳之遙, 周國華). Chinese J. Anal. Chem.(分析化學(xué)), 2009, 37(8): 1107~1112

        16 Herbert O, Walther P, Roswitha M, Christian G H. Anal. Chem., 2001, 73(21): 5109~5115

        17 Allison P N, James C H, David C M. Anal. Chem., 2001, 73(18): 4514~4521

        18 Yuan G L, Ren L, Gao Y Z, Wang W P, E X, Xie H P. Anal. Chim. Acta., 2009, 28(11): 1245~1249

        19 Sweet D, Lorente M, Valenzuela A, Lorente J A, Alvarez J C. Forensic Sci. Int., 1996, 83(3): 167~177

        20 PANG Tao-Tao, YAO Jian-Bin, DU Li-Ming(龐濤濤, 姚建斌,杜黎明). Sepctroscopy and Spectral Analysis(光譜學(xué)與光譜分析), 2007, 27(7): 1336~1339

        Genotyping of Short Tandem Repeat Based on Ultraviolet Spectroscopy

        Combined with Artificial Neural Network

        WANG Xue-Jiao, MOU Hong-Yuan, LU Hui, DOU Xing-Ru, QIU Ting, XIE Hong-Ping*

        (College of Pharmaceutical Sciences, Soochow University, Suzhou 215123)

        Abstract Taking genotypes 10-11, 11-11, 10-12 and 10-13 of short tandem repeat (STR) locus D16S539 commonly used in forensic medicine as study objects, an ANN genotyping method was developed based on ultraviolet spectra of the measured samples and another ANN was used to extract the variables of rich information. Under the optimal conditions, each of the genotypes was amplified. The ultraviolet spectra of the samples that were produced by polymerase chain reaction, which was measured at length range of 200-310 nm, were pretreated and optimized by coupled ANN-ANN. The results showed that the best network structures of the rich information extraction ANN and the discriminant model built ANN were 391-50-391 and 50-6-4, respectively. The root mean square error for the training and the prediction samples sets was obtained to be 0.0279 and 0.0418. It was indicated that the models had a good ability of the robustness and big discriminating power for the prediction samples (the accuracy was 100%). The detection of STR genotypes by UVS was rapid, simple and low-cost.

        Keywords Short tandem repeat; Ultraviolet spectroscopy; Artificial neural network; Genotyping

        免费午夜爽爽爽www视频十八禁 | 亚洲国产精品成人av| 国产一区二区三区最新视频| 国产精品自拍视频在线| 亚洲国产人成综合网站| 蜜桃一区二区在线视频| 亚洲精品成人av在线| 人妻丰满熟妇av无码区免| 久久免费视频国产| 国产91中文| 日本韩国黄色三级三级| 日韩一区二区中文天堂| 人妻少妇被猛烈进入中文字幕| 国产精品久久精品第一页| 中文字幕丰满伦子无码| 国产自偷亚洲精品页65页| 欧美色资源| 青青草免费视频一区二区| 与漂亮的女邻居少妇好爽| 国产夫妇肉麻对白| 亚洲精品国产第一区二区尤物| 亚洲国产麻豆综合一区| 少妇av免费在线播放| 美国黄色av一区二区| 观看在线人视频| av无码天堂一区二区三区| 国产白丝网站精品污在线入口| 区二区三区亚洲精品无| 媚药丝袜美女高清一二区| 久久久久夜夜夜精品国产| 欧美极品美女| 亚洲欧美日韩中文v在线| 一区二区三区在线日本视频| 人人妻人人澡人人爽国产一区| 国产高颜值大学生情侣酒店| 欧美国产亚洲日韩在线二区| 国产成人久久综合第一区| 国产激情久久久久影院小草| 国内精品伊人久久久久影院对白| 久久久精品国产亚洲AV蜜| 精品国产亚洲av久一区二区三区|