胡振幫,高運(yùn)來(lái),齊照明,蔣洪蔚,劉春燕,辛大偉,胡國(guó)華,潘校成,陳慶山
(1東北農(nóng)業(yè)大學(xué)農(nóng)學(xué)院,哈爾濱150030;2黑龍江省農(nóng)墾科研育種中心,哈爾濱150090;365301部隊(duì)副業(yè)基地,黑龍江五大連池164100)
?
作物分子身份證構(gòu)建軟件ID analysis的編制
胡振幫1,高運(yùn)來(lái)1,齊照明1,蔣洪蔚2,劉春燕2,辛大偉1,胡國(guó)華2,潘校成3,陳慶山1
(1東北農(nóng)業(yè)大學(xué)農(nóng)學(xué)院,哈爾濱150030;2黑龍江省農(nóng)墾科研育種中心,哈爾濱150090;365301部隊(duì)副業(yè)基地,黑龍江五大連池164100)
摘要:【目的】以作物品種或資源的SSR分子標(biāo)記為基礎(chǔ)數(shù)據(jù),應(yīng)用Visual Basic6.0開發(fā)作物分子身份證構(gòu)建配套軟件ID analysis,快速準(zhǔn)確地篩選引物組合并高效鑒定品種?!痉椒ā孔魑锓肿由矸葑C理論由陳慶山提出,其原理是利用SSR標(biāo)記在材料中的多態(tài)性特點(diǎn),將多個(gè)標(biāo)記進(jìn)行排列組合,快速有效地區(qū)分品種資源的算法——逐步擴(kuò)增法。通過對(duì)40份黑龍江省大豆品種的40對(duì)引物數(shù)據(jù)進(jìn)行分子身份證構(gòu)建,闡述該軟件的詳細(xì)操作過程?!窘Y(jié)果】利用 Visual Basic6.0編程軟件設(shè)計(jì)人機(jī)交互界面,通過編程實(shí)現(xiàn)核心算法,開發(fā) ID analysis軟件,軟件集成全庫(kù)構(gòu)建、部分構(gòu)建、ID判定、數(shù)據(jù)合并等功能。其中,全庫(kù)構(gòu)建是軟件的核心功能,通過全庫(kù)構(gòu)建可以快速分析區(qū)分材料的最少標(biāo)記;部分構(gòu)建可以選擇部分目標(biāo)材料進(jìn)行區(qū)分;ID判定可以在分子身份證數(shù)據(jù)庫(kù)構(gòu)建完成的前提下,對(duì)未知材料進(jìn)行SSR分析,根據(jù)獲得的分子身份證數(shù)據(jù)來(lái)確定材料是哪個(gè)品種或近似品種;數(shù)據(jù)合并功能可以將多次試驗(yàn)數(shù)據(jù)整合成一個(gè)數(shù)據(jù)集。利用軟件全庫(kù)構(gòu)建功能對(duì)范例數(shù)據(jù)進(jìn)行分析得到以下結(jié)果:①在40對(duì)引物對(duì)40個(gè)大豆品種的分子身份證構(gòu)建中,共有13個(gè)引物由于缺失過多,不符合標(biāo)準(zhǔn)被剔除,剔除引物為:Sat_111、Sat_218、Satt231、Satt685、Satt514、Satt551、Satt077、Satt358、Satt424、Satt100、Satt838、Satt893和Satt891。②共有6個(gè)引物由于與其他引物相似系數(shù)過高,不符合標(biāo)準(zhǔn)被剔除,剔除引物為:Satt253、Satt192、Satt417、Sat_229、Satt127和Satt496。③在分析的40個(gè)品種中,共有5個(gè)品種具有7個(gè)特異等位基因,分別為引物Satt516在材料東農(nóng)36中顯示特異條帶3;引物Satt253在材料東農(nóng)36中顯示特異條帶1;引物Sat_229在材料嫩豐17中顯示特異條帶1;引物Satt192在材料東農(nóng)42中顯示特異條帶3;引物Satt206在材料北豐19中顯示特異條帶1;引物Satt244在材料北豐19中顯示特異條帶4;引物Satt363在材料黑河14中顯示特異條帶1,因此,可以通過這些特異等位基因直接確定需要鑒定的品種。④僅需7對(duì)引物便可將40份大豆品種完全區(qū)分開,引物組合為:Satt398、Satt380、Satt453、Satt288、Satt244、Sat_092和Satt206?!窘Y(jié)論】編制了用于作物分子身份證構(gòu)建的軟件ID analysis,軟件界面友好、使用簡(jiǎn)便、高效、靈活。實(shí)現(xiàn)單個(gè)軟件完成作物分子身份證的構(gòu)建,達(dá)到了對(duì)資源品種鑒定的目的。隨著技術(shù)的發(fā)展和毛細(xì)管電泳的應(yīng)用,開發(fā)全自動(dòng)分子身份證分析系統(tǒng)甚至開發(fā)基于分子身份證理論的快速資源鑒定儀將成為可能。
關(guān)鍵詞:大豆;作物;SSR標(biāo)記;分子身份證;軟件開發(fā)
聯(lián)系方式:胡振幫,Tel:0451-5519194;E-mail:zbhu@neau.edu.cn。通信作者陳慶山,E-mail:qshchen@sohu.com。通信作者潘校成,E-mail:soybean2007@126.com
【研究意義】黑龍江省是中國(guó)優(yōu)質(zhì)大豆主產(chǎn)區(qū),1986—2010年共審定大豆品種275份[1],2011—2015年審定大豆品種113份[2-9]。隨著科研能力的提高,為滿足人們生產(chǎn)、生活需求,越來(lái)越多的大豆新品種被育成,但市場(chǎng)監(jiān)管能力不足,許多不良的品種充斥市場(chǎng),給農(nóng)民生產(chǎn)及品種權(quán)益保護(hù)帶來(lái)嚴(yán)峻的考驗(yàn),分子身份證軟件的研發(fā)對(duì)相關(guān)研究開展、資源鑒定及品種權(quán)益保護(hù)具有重大意義。【前人研究進(jìn)展】指紋圖譜(fingerprinting)的形式多種多樣,但主要分為化學(xué)指紋圖譜和生物指紋圖譜2種類型,其中,近紅外透射光譜分析[10]、深度顏色特征[11]、高光譜圖像處理[12]都屬于化學(xué)指紋圖譜,DNA條形碼[13-15]、ISSR、SNP指紋圖譜[16]都屬于分子生物指紋圖譜。分子指紋圖譜具有數(shù)量多、分布廣、多態(tài)性高、不受環(huán)境影響等優(yōu)點(diǎn)[17]。在眾多技術(shù)中SSR微衛(wèi)星DNA又叫做簡(jiǎn)單重復(fù)序列,SSR標(biāo)記屬于共顯性標(biāo)記,并且具有良好的遺傳多樣性[18-19]。目前,整合的大豆SSR標(biāo)記共有1 015對(duì)[20-22],豐富的SSR標(biāo)記數(shù)量使基于SSR標(biāo)記應(yīng)用更加廣泛[23-25]。在分子身份證研究方面,由陳慶山提出,高運(yùn)來(lái)等[26]構(gòu)建了大豆品種的分子身份證。近幾年,張靖國(guó)等[27]以 20個(gè)梨栽培品種為例,利用17對(duì)SSR標(biāo)記構(gòu)建梨分子身份證體系。陸徐忠等[28]利用12對(duì)SSR標(biāo)記對(duì)127份水稻品種構(gòu)建了40位的身份證條碼編號(hào)。徐雷鋒等[29]以 96份百合種質(zhì)資源為材料,使用20對(duì)SSR標(biāo)記進(jìn)行百合種質(zhì)分子身份證構(gòu)建試驗(yàn)?!颈狙芯壳腥朦c(diǎn)】分子身份證構(gòu)建方法分析樣本材料數(shù)量有限,而使用的標(biāo)記卻很多,生成的字符串超長(zhǎng),記錄繁瑣,往往需要聯(lián)合GeneMapper、MinimalMarket、Data Collection、Genemapper和條碼生成器等多個(gè)軟件[27-29],迄今為止,還未發(fā)現(xiàn)能夠直接構(gòu)建分子身份證的軟件。利用SSR技術(shù)區(qū)分品種已成為主流,但SSR結(jié)果分析仍然停留在人工選擇上,一直未找到合適的軟件進(jìn)行綜合判讀?!緮M解決的關(guān)鍵問題】本研究擬開發(fā)一套適用于分析大量材料、具有較高效率的軟件。實(shí)現(xiàn)單個(gè)軟件完成分子身份證的構(gòu)建。軟件的研發(fā)有助于相關(guān)研究開展,特別是可以解決資源及品種權(quán)益保護(hù)中出現(xiàn)的身份鑒定問題。
1.1 數(shù)據(jù)獲取
參試材料于 2008年播種于黑龍江省農(nóng)墾科研育種中心基地,選擇40對(duì)引物對(duì)40個(gè)大豆品種進(jìn)行分析,參考陳慶山等[30-31]方法進(jìn)行大豆種粒 DNA的提取、PCR擴(kuò)增及電泳試驗(yàn),并獲得標(biāo)記數(shù)據(jù)。標(biāo)記試驗(yàn)在黑龍江省農(nóng)墾科研育種中心實(shí)驗(yàn)室完成。
1.2 名詞及符號(hào)定義
其中,行對(duì)應(yīng)的是n個(gè)材料,列對(duì)應(yīng)的是m個(gè)標(biāo)記,其中,a11,a12…anm表示使用m個(gè)標(biāo)記對(duì)n個(gè)材料的電泳條帶碼。
定義S1、S2…Sn,其中S1表示第1個(gè)材料,n為材料容量。
定義V1、V2…Vm,其中V1表示第1個(gè)標(biāo)記,m為標(biāo)記個(gè)數(shù)。
標(biāo)記多態(tài)度:在分子標(biāo)記中,單標(biāo)記或標(biāo)記組合的全部類型,叫作標(biāo)記多態(tài)型,標(biāo)記多態(tài)型的個(gè)數(shù),叫作標(biāo)記多態(tài)度,用d表示。
1.3 逐步擴(kuò)增法
作物分子身份證理論及逐步擴(kuò)增法的算法由組陳慶山[32]提出并應(yīng)用于計(jì)算分子身份證,若標(biāo)記的數(shù)量足夠多,并且標(biāo)記對(duì)材料的區(qū)分度好,這種方法就有可能找到分子身份證的可行格式。若有20個(gè)標(biāo)記,每個(gè)標(biāo)記有2個(gè)等位基因,則這些標(biāo)記有220= 1 048 476>106種組合,即這些標(biāo)記可區(qū)分百萬(wàn)個(gè)以上的不同材料。因此,對(duì)于一般的1 000以內(nèi)的材料來(lái)說,一般20個(gè)標(biāo)記足夠了。
圖1 逐步擴(kuò)增法流程圖Fig. 1 Program flow chart of step amplification method
逐步擴(kuò)增法的具體過程(圖 1):首先標(biāo)記按照等位基因多少進(jìn)行排序,計(jì)算相鄰標(biāo)記區(qū)分度相關(guān)系數(shù),淘汰相關(guān)系數(shù)過高的引物。然后選擇 V1,計(jì)算V1的多態(tài)度dv1看是否與材料容量n相等,若相等,表明V1就可以區(qū)分出所有的材料,V1即為分子身份證的一個(gè)可行格式;若不等,則說明V1不能區(qū)分出所有材料,算法繼續(xù)引入V2構(gòu)成V1V2標(biāo)記組合,計(jì)算該標(biāo)記組合的多態(tài)度dv1v2,看是否與材料容量n相等;若相等,表明V1V2可以區(qū)分出所有的材料,V1V2即為分子身份證的一個(gè)可行格式;若不等,算法繼續(xù)引入新標(biāo)記,直到將材料全部區(qū)分開為止,假設(shè)此時(shí)的標(biāo)記組合為V1V2V3…Vm,則它即為該材料分子身份證的一個(gè)可行格式。
在實(shí)際的執(zhí)行過程中,為了降低運(yùn)算量,每引入一個(gè)標(biāo)記,都要計(jì)算各材料對(duì)應(yīng)標(biāo)記組合的等位基因頻率,若頻率為 1,則對(duì)該材料從計(jì)算數(shù)組中剔除,加快了計(jì)算速度。
1.4 分子身份證構(gòu)建的實(shí)現(xiàn)策略
作物分子身份證是針對(duì)作物種質(zhì)資源或品種品系,基于作物分子標(biāo)記的多態(tài)性檢測(cè)手段,利用最簡(jiǎn)引物組合實(shí)現(xiàn)作物種質(zhì)資源最大區(qū)分,并以類似于身份證的等位基因編碼,作為標(biāo)識(shí)和圖形化的理論和技術(shù)?;诜肿由矸葑C的概念和構(gòu)建算法,結(jié)合實(shí)際應(yīng)用的需要,建立分子身份證的實(shí)現(xiàn)策略。策略共分 4個(gè)部分:全庫(kù)構(gòu)建、部分構(gòu)建、選擇分析和分子身份證判定(ID判定)。
1.4.1 全庫(kù)構(gòu)建 全庫(kù)構(gòu)建是分子身份證構(gòu)建的基礎(chǔ),是基于數(shù)據(jù)庫(kù)中的全部材料和標(biāo)記信息,應(yīng)用1.2、1.3算法,對(duì)全部材料進(jìn)行分子身份證構(gòu)建的策略。全庫(kù)構(gòu)建的基本步驟如下:
步驟 1:不符合標(biāo)記的剔除。剔除標(biāo)準(zhǔn)首先標(biāo)記的缺失太多(默認(rèn)不超過 5%)其次是標(biāo)記間相似系數(shù)太高(默認(rèn)不高于0.8);
步驟 2:有效標(biāo)記數(shù)量判別。若標(biāo)記充足則轉(zhuǎn)入步驟3,否則轉(zhuǎn)入步驟4;
步驟 3:執(zhí)行算法,計(jì)算出材料(品種)分子身份證,包括標(biāo)出特異性條帶;
步驟 4:以標(biāo)記集能區(qū)分的材料數(shù)最多為依據(jù),計(jì)算出材料的分子身份證。
1.4.2 部分構(gòu)建 在全庫(kù)構(gòu)建的基礎(chǔ)上,可選擇性地對(duì)部分材料進(jìn)行特異性引物條帶的篩選和分子身份證的構(gòu)建。部分構(gòu)建以全庫(kù)構(gòu)建的材料、標(biāo)記集為構(gòu)建背景,選擇部分材料以全部引物為標(biāo)記利用算法進(jìn)行分子身份證計(jì)算。部分構(gòu)建的基本步驟如下:
步驟1:從全部材料中選擇部分材料集;
步驟 2:不符合標(biāo)記的剔除。剔除標(biāo)準(zhǔn)首先標(biāo)記的缺失太多(默認(rèn)不超過 5%)其次是標(biāo)記間相似系數(shù)太高(默認(rèn)不高于0.8);
步驟3:執(zhí)行算法,計(jì)算出部分材料分子身份證,包括標(biāo)出特異性條帶;
步驟 4:以標(biāo)記集能區(qū)分的材料數(shù)最多為依據(jù),計(jì)算出部分材料的分子身份證。
1.4.3 選擇分析 在全庫(kù)構(gòu)建的基礎(chǔ)上,可選擇部分標(biāo)記對(duì)材料進(jìn)行判別,主要用來(lái)考察部分標(biāo)記(受關(guān)注的)在分子多態(tài)水平上區(qū)分材料的能力。由于選定了部分標(biāo)記集,故算法上只需將供試材料的分子身份證編碼標(biāo)出即可。選擇分析的結(jié)果可能會(huì)鎖定唯一分子身份證的材料,也可能有多個(gè)共享一個(gè)分子身份證的材料,還可能由于缺失導(dǎo)致的具有不完全身份證的材料等幾種可能。選擇分析的基本步驟如下:
步驟1:從全部標(biāo)記中選擇部分標(biāo)記集;
步驟2:對(duì)供試材料進(jìn)行分子條帶碼標(biāo)識(shí);
步驟 3:將結(jié)果進(jìn)行分類顯示,唯一識(shí)別材料、分組識(shí)別材料和不確定材料。
1.4.4 分子身份證判定 在全庫(kù)構(gòu)建的基礎(chǔ)上,選擇幾個(gè)標(biāo)記,對(duì)待測(cè)材料進(jìn)行基于選定標(biāo)記的電泳試驗(yàn),將電泳帶型數(shù)字化,在全庫(kù)構(gòu)建的背景下,基于所選定標(biāo)記計(jì)算該待測(cè)材料與其他材料間的相似度,判別該材料的類別歸屬,從而達(dá)到品種識(shí)別和品種鑒定的目的。分子身份證判定分析步驟如下:
步驟1:選定背景標(biāo)記集;
步驟2:測(cè)定待測(cè)材料的帶型;
步驟 3:在該標(biāo)記集下,計(jì)算待測(cè)材料與數(shù)據(jù)庫(kù)中全材料的相似度,以判別該材料的歸屬。
2.1 分子身份證構(gòu)建軟件模塊
分子身份證軟件依據(jù)分子身份證的實(shí)現(xiàn)策略設(shè)計(jì)功能及界面(圖 2),軟件功能包括:數(shù)據(jù)庫(kù)瀏覽及更新、全庫(kù)構(gòu)建、部分構(gòu)建、輸入構(gòu)建、選擇分析和ID判定等功能。
2.1.1 分子身份證軟件簡(jiǎn)介 分子身份證軟件應(yīng)用Microsoft公司Visual Basic6.0 進(jìn)行程序開發(fā),軟件在開發(fā)時(shí)充分考慮到使用的兼容性問題,軟件可以在Windows9X/me/2000/XP/ win Vista/win7等大部份Windows的32位或64位操作系統(tǒng)下運(yùn)行,軟件的運(yùn)行對(duì)計(jì)算機(jī)硬件環(huán)境要求不高,Intel奔騰CPU/512M內(nèi)存/1G硬盤空間及以上機(jī)型都可運(yùn)行。如果構(gòu)建的標(biāo)記及材料數(shù)量過多時(shí),運(yùn)算時(shí)間會(huì)相應(yīng)增加,要想達(dá)到理想的運(yùn)算效率,計(jì)算機(jī)的硬件配置不應(yīng)過低。
圖2 分子身份證軟件主界面Fig. 2 Software interface of ID analysis
分子身份證軟件首發(fā)版本為ID Analysis 1.0,軟件登記號(hào):2007SR11870a,通過應(yīng)用完善了軟件的功能及操作界面,目前版本為ID Analysis 4.1,軟件具有功能豐富、界面友好(圖 3)、操作簡(jiǎn)單等優(yōu)點(diǎn),一步即可達(dá)到以往需要多個(gè)軟件聯(lián)合使用才能完成的任務(wù)。軟件可以獲得方式:發(fā)送索取軟件的郵件給作者qshchen@126.com或訪問“大豆設(shè)計(jì)網(wǎng)”站進(jìn)行下載www.designsoybean.com。
圖3 Satt424等位基因特征圖Fig. 3 Alleles feature of Satt424 primer
2.1.2 標(biāo)記獲取及數(shù)據(jù)文件準(zhǔn)備 標(biāo)記統(tǒng)計(jì)是將電泳膠圖上的目標(biāo)條帶數(shù)字化的過程,具體原則是根據(jù)擴(kuò)增片段的分子量由大到小依次按1、2、3、4 …… N的順序進(jìn)行記錄。其中,0表示零等位基因(即該泳道由于基因片段丟失而無(wú)帶),-1表示該品種數(shù)據(jù)由于試驗(yàn)操作造成缺失,-2表示該泳道出現(xiàn)雜合帶型。圖3為黑龍江省主栽大豆品種分子身份證構(gòu)建試驗(yàn)中所獲得的一張比較理想的電泳圖,以此圖為例闡明標(biāo)記統(tǒng)計(jì)原則。
利用40對(duì)SSR引物對(duì)40份大豆品種進(jìn)行電泳分析,共獲得1 600個(gè)標(biāo)記數(shù)據(jù),將標(biāo)記整理成軟件可識(shí)別的文本文檔(圖4)。數(shù)據(jù)文本的第1行第1個(gè)位置表示數(shù)據(jù)矩陣大小,其中“40/40”表示該數(shù)據(jù)文本中的數(shù)據(jù)矩陣為40行40列,第一個(gè)40表示有40個(gè)材料,第二個(gè)40表示有40對(duì)引物。向右接著是引物信息,引物需要用加引號(hào),矩陣大小及引物間加一半角空格,以換行符結(jié)尾。例如“40/40”“Satt516”“Satt338”“Satt573”。從第 2行開始每行表示1個(gè)材料,從左向右第1個(gè)位置表示材料名稱,中英文皆可,但要加用引號(hào),向右接著是該資源使用40對(duì)不同引物的電泳標(biāo)記數(shù)據(jù),資源名及帶型標(biāo)記間加一半角空格,以換行符結(jié)尾。例如:“合豐25” 1 1 3 3。
圖4 軟件可識(shí)別的數(shù)據(jù)文檔Fig. 4 Data document for software input
2.1.3 數(shù)據(jù)集更新 分子身份證構(gòu)建的基礎(chǔ)是數(shù)據(jù),數(shù)據(jù)是由引物和材料組成的二維標(biāo)記矩陣集。由于數(shù)據(jù)缺失、引物更新和材料的變化而導(dǎo)致標(biāo)記集數(shù)據(jù)的動(dòng)態(tài)變化,而數(shù)據(jù)的改變進(jìn)一步?jīng)Q定了分子身份證的構(gòu)建也是動(dòng)態(tài)可變的。因此軟件設(shè)計(jì)開始時(shí)就考慮到由于對(duì)缺失數(shù)據(jù)的補(bǔ)充、新品種材料的更新,高多態(tài)性引物的加入等問題而導(dǎo)致數(shù)據(jù)集更新的麻煩。
為解決數(shù)據(jù)集更新的麻煩,軟件開發(fā)了數(shù)據(jù)庫(kù)合并功能(圖 5)??梢愿鶕?jù)引物和材料的列表對(duì)多個(gè)數(shù)據(jù)集進(jìn)行整合,并可以對(duì)其發(fā)生改變的等位基因進(jìn)行校驗(yàn)和提示,這樣有利于整合最新的研究結(jié)果,開發(fā)全部材料最合適的分子身份證。
合并后的數(shù)據(jù)結(jié)果以文本形式輸出(圖 5),由結(jié)果文件可知,合并后的新數(shù)據(jù)集是由6份材料及4對(duì)引物組成,其中合并前二個(gè)數(shù)據(jù)集有1個(gè)差異數(shù)據(jù),差異數(shù)據(jù)為“東農(nóng)46,Satt516”,在a集中標(biāo)記是1,在b集中標(biāo)記是3,結(jié)果還顯示了合并到新數(shù)據(jù)集中的材料、引物的數(shù)量及名稱。
2.2 軟件驗(yàn)證
2.2.1 全庫(kù)構(gòu)建 將40對(duì)引物對(duì)40份大豆品種的標(biāo)記數(shù)據(jù)導(dǎo)入軟件,具體如下:打開分子身份證軟件,點(diǎn)擊快捷工具欄的第三個(gè)圖標(biāo)“全庫(kù)構(gòu)建”,即可打開全庫(kù)構(gòu)建窗口(圖 6)。點(diǎn)擊文件下拉菜單-打開-瀏覽到數(shù)據(jù)文件-打開,導(dǎo)入數(shù)據(jù)文件,點(diǎn)擊“ID analysis”按鈕即可完成分子身份證構(gòu)建。
構(gòu)建完的數(shù)據(jù)會(huì)顯示在窗口的數(shù)據(jù)顯示區(qū),點(diǎn)擊窗口文件下拉菜單-輸出-瀏覽文件保存位置-命名文件名-保存,結(jié)果文件以文本形式保存。文件內(nèi)容共分4部分,第1部分指明分析時(shí)的參數(shù);第2部分指明不符合引物信息;第3部分指明特異引物信息;第4部分給出引物組合及每個(gè)材料的分子身份證的編號(hào)(圖6)。
由分子身份證構(gòu)建結(jié)果可知,在40對(duì)引物對(duì)40個(gè)大豆品種的分子身份證構(gòu)建中:共有13對(duì)引物由于缺失過多,不符合標(biāo)準(zhǔn)被剔除,剔除引物為Sat_111、Sat_218、Satt231、Satt685、Satt514、Satt551、Satt077、Satt358、Satt424、Satt100、Satt838、Satt893和Satt891。共有7對(duì)引物由于與其他引物相似系數(shù)過高,不符合標(biāo)準(zhǔn)被剔除,剔除引物為Satt253、Satt192、Satt417、Sat_229、Satt127和Satt496。在分析的40個(gè)品種中,共有5個(gè)品種具有7個(gè)特異等位基因,因此,可以通過這些特異等位基因直接確定需要鑒定的品種,通過計(jì)算僅需要7對(duì)引物即可區(qū)分40個(gè)大豆品種,引物組合為 Satt398、Satt380、Satt453、Satt288、Satt244、 Sat_092和Satt206,例如北豆3號(hào)在該引物組合下的分子身份證編號(hào)為2411343。
圖5 數(shù)據(jù)合并窗口及結(jié)果Fig. 5 Data merge window and output result
圖6 全庫(kù)構(gòu)建窗口及結(jié)果Fig. 6 Full-library construction window and output result
2.2.2 部分構(gòu)建 部分構(gòu)建的具體操作如下:打開分子身份證軟件,點(diǎn)擊快捷工具欄的第四個(gè)圖標(biāo)“部分構(gòu)建”,即可打開部分構(gòu)建窗口(圖 7)。點(diǎn)擊文件下拉菜單-打開-瀏覽到數(shù)據(jù)文件-打開,導(dǎo)入數(shù)據(jù)文件。從材料欄里選擇一些材料到目標(biāo)材料欄內(nèi),點(diǎn)擊“ID analysis”按鈕即可完成部分材料的分子身份證構(gòu)建。同時(shí)為了方便用戶使用,軟件還提供“輸入構(gòu)建”窗口,在該窗口中將材料的選擇方式變?yōu)槿斯ぽ斎?,其他功能相同?/p>
構(gòu)建完的結(jié)果文件內(nèi)容共分3部分,第1部分指明不符合引物信息;第2部分指明特異引物信息;第3部分給出引物組合及被選擇的部分材料的分子身份證的編號(hào)(圖7)。
圖7 部分構(gòu)建窗口及結(jié)果Fig. 7 Partial-library construction window and output result
2.2.3 ID判定 ID判定的具體操作如下:打開分子身份證軟件,點(diǎn)擊快捷工具欄的第七個(gè)圖標(biāo)“ID判定”,即可打開ID判定窗口(圖8)。點(diǎn)擊文件下拉菜單-打開-瀏覽到數(shù)據(jù)文件-打開,導(dǎo)入數(shù)據(jù)文件。在“引物及ID”欄內(nèi)輸入引物名稱及分子身份證編號(hào),其格式為“Satt338,Satt369,Satt453:314”,點(diǎn)擊“Possible GP”按鈕即可計(jì)算出由引物組合以及身份證編號(hào)所確定的唯一材料名稱。
圖8 ID判定窗口Fig. 8 Molecular ID determination window and output result
有些時(shí)候可能需要考察部分受關(guān)注的引物在分子多態(tài)水平上區(qū)分材料的能力。此時(shí)可以使用“選擇分析”功能,其結(jié)果可能是被唯一區(qū)分的材料,也可能是多個(gè)共享一個(gè)分子身份證的材料,或是由于缺失導(dǎo)致的具有不完全身份證的材料等幾種可能。
3.1 軟件算法改進(jìn)
關(guān)于尋找最優(yōu)引物組合,可以采用貪婪算法,窮舉法等多種方法。貪婪算法[33-34]可提高效率,但較易錯(cuò)過最優(yōu)解。窮舉法[35]比較全面客觀,但計(jì)算量大,耗時(shí)耗力。而逐步擴(kuò)增法利用引物缺失率和引物相似系數(shù)對(duì)引物進(jìn)行了有效的篩選、排序和刪除,在運(yùn)算過程中,逐步淘汰引物的等位基因組合頻率為1的材料,大大提高了運(yùn)算速率,實(shí)現(xiàn)了算法的優(yōu)化改進(jìn)。
關(guān)于標(biāo)記多態(tài)度排序,在計(jì)算中可以看出,調(diào)整標(biāo)記的順序會(huì)直接影響結(jié)果,因此,可根據(jù)單個(gè)標(biāo)記等位基因多態(tài)性大小進(jìn)行排序,使區(qū)分能力較強(qiáng)的標(biāo)記更早出現(xiàn),這樣就使標(biāo)記組合的區(qū)分度迅速增加,從而加快算法搜索速度。
關(guān)于材料容量縮減,每次有新標(biāo)記引入都會(huì)重新計(jì)算當(dāng)前標(biāo)記多態(tài)型下的每個(gè)材料條帶碼頻數(shù),而有部分材料在新標(biāo)記入選前等位基因組合頻率已經(jīng)為1,達(dá)到了區(qū)分目的,沒有重新計(jì)算的必要。因此,可以將被區(qū)分開的材料從計(jì)算的數(shù)據(jù)集中刪除,逐步縮減材料容量,達(dá)到加快算法目的。
3.2 軟件程序改進(jìn)
到目前該軟件已經(jīng)在大豆、水稻、花生、玉米、高粱、真菌、木耳等多種作物上得到廣泛應(yīng)用[36-41],但仍然存在不足,由其是隨著新材料的改良及新標(biāo)記的發(fā)現(xiàn)[1,20-22]以及生物信息學(xué)的發(fā)展,在未來(lái)的分析中所要面對(duì)的數(shù)據(jù)量將更為龐大[35,42],甚至只能在Linux系統(tǒng)下才能分析。目前,ID analysis軟件的核心算法在軟件程序?qū)崿F(xiàn)過程中仍然需要進(jìn)一步優(yōu)化,VB程序具有操作系統(tǒng)的局限性,以及執(zhí)行效率低的缺點(diǎn)[43-45];另一方面開發(fā)在線的網(wǎng)絡(luò)版分子身份證構(gòu)建系統(tǒng),對(duì)于方便更多研究人員使用,提高軟件利用率等方面具有更大的意義。
相比VB程序語(yǔ)言,Java技術(shù)具有簡(jiǎn)單、完全面向?qū)ο?、屬于解釋?zhí)行語(yǔ)言、安全性高、可移植性強(qiáng)、執(zhí)行性能高、多線程以及動(dòng)態(tài)性等優(yōu)點(diǎn)[46-47]。利用Java技術(shù)實(shí)現(xiàn)分子身份證軟件的核算法,即可打包成單機(jī)版軟件,又可作為網(wǎng)絡(luò)在線分析的服務(wù)端程序,并且可跨平臺(tái)使用,解決了龐大標(biāo)記數(shù)據(jù)的運(yùn)算效率問題,達(dá)到一次開發(fā)多角度利用的目的。
3.3 軟件引物的選取和圖像的獲得
分子身份證軟件構(gòu)建核心目標(biāo)是為了利用最優(yōu)引物對(duì)組合完成對(duì)目標(biāo)材料群體的唯一性區(qū)分,如果具有較為完善的品種資源數(shù)據(jù)庫(kù)系統(tǒng),便可以解決資源的鑒定,育種材料的分析和候選審定材料的創(chuàng)新性判定等很多現(xiàn)實(shí)存在的棘手問題。
在軟件數(shù)據(jù)庫(kù)開發(fā)方面,可以基于研究對(duì)象特性開發(fā)的各類特殊分子標(biāo)記來(lái)構(gòu)建分子身份證。在標(biāo)記開發(fā)方面,可以針對(duì)研究資源的特性,設(shè)計(jì)獨(dú)特的分子身份證,利用在產(chǎn)量、品質(zhì)、抗耐性上具有特殊性狀的分子標(biāo)記[48]對(duì)未知材料進(jìn)行基因型分析和等位基因信息獲取,可以直接完成材料對(duì)應(yīng)性狀的評(píng)價(jià)和分子輔助育種研究。
目前,軟件只能對(duì)電泳膠圖數(shù)字化后的數(shù)據(jù)進(jìn)行分析,而由于傳統(tǒng)電泳膠圖分辨率低[49-50],在數(shù)字化過程中經(jīng)常會(huì)出現(xiàn)識(shí)別偏差。為解決問題,軟件應(yīng)該具有圖形分析功能,借助標(biāo)識(shí)引物確定等位基因大小,對(duì)電泳膠圖進(jìn)行基于條帶分子量大小的數(shù)字化識(shí)別。軟件圖形分析功能的開發(fā)必將提高資源、品種鑒定的準(zhǔn)確性。從分析儀器發(fā)展水平來(lái)看,毛細(xì)管電泳將為分子身份證軟件提供解決問題之道[51],在此基礎(chǔ)上開發(fā)全自動(dòng)分子身份證分析技術(shù)乃至基于分子身份證的快速資源鑒定儀都將成為可能。
基于SSR標(biāo)記在材料中的多態(tài)性特點(diǎn),提出了快速有效地區(qū)分品種資源的算法——逐步擴(kuò)增法。利用Visual Basic6.0編制了基于逐步擴(kuò)增法的作物分子身份證構(gòu)建軟件——ID analysis。該軟件可以構(gòu)建作物分子身份證,實(shí)現(xiàn)了只需單個(gè)軟件即可完成作物分子身份證構(gòu)建的過程,達(dá)到了對(duì)資源品種鑒定的目的。
References
[1] 滕衛(wèi)麗, 盧雙勇, 高陽(yáng), 孫明明, 韓英鵬, 武小霞, 李文濱. 黑龍江省 1986-2010年大豆審定品種的品質(zhì)性狀分析. 作物雜志, 2011,25(2): 105-108. TENG W L, LU S Y, GAO Y, SUN M M, HAN Y P, WU X X, LI W B. Analysis of yield changes of soybean cultivars authorized in Heilongjiang province. Crops, 2011, 25(2): 105-108. (in Chinese)
[2] 孫明明. 2011年黑龍江省審定推廣的大豆新品種. 大豆科學(xué), 2011,30(4): 713-718. SUN M M. Examination and popularization of soybean varieties at Heilongjiang province in 2011. Soybean Science, 2011, 30(4):713-718. (in Chinese)
[3] 宋顯軍. 2012年黑龍江省審定推廣的大豆新品種. 大豆科學(xué), 2012,31(3): 504-510. SONG X J. Examination and popularization of soybean varieties at Heilongjiang province in 2012. Soybean Science, 2012, 31(3):504-510. (in Chinese)
[4] 王萍. 2013年黑龍江省審定推廣的大豆新品種I. 大豆科學(xué), 2013,32(3): 429-432. WANG P. Examination and popularization of soybean varieties at Heilongjiang province in 2013-I. Soybean Science, 2013, 32(3):429-432. (in Chinese)
[5] 王萍. 2013年黑龍江省審定推廣的大豆新品種II. 大豆科學(xué), 2013,32(4): 576-579. Wang P. Examination and popularization of soybean varieties at Heilongjiang province in 2013-II. Soybean Science, 2013, 32(4):576-579. (in Chinese)
[6] 孫明明, 王萍. 2014年黑龍江省審定推廣的大豆品種I. 大豆科學(xué),2014, 33(3): 463-466. SUN M M, WANG P. Examination and popularization of soybean varieties at Heilongjiang province in 2014-I. Soybean Science, 2014,33(3): 463-466. (in Chinese)
[7] 孫明明, 王萍. 2014年黑龍江省審定推廣的大豆品種II. 大豆科學(xué),2014, 33(4): 626-628. SUN M M, WANG P. Examination and popularization of soybean varieties at Heilongjiang province in 2014-II. Soybean Science, 2014,33(4): 626-628. (in Chinese)
[8] 孫明明, 王萍, 呂世翔. 2015年黑龍江省審定推廣的大豆品種 I.大豆科學(xué), 2015, 34(5): 918-920. SUN M M, WANG P, Lü S X. Examination and popularization of soybean varieties at Heilongjiang province in 2015-I. Soybean Science,2015, 34(5): 918-920. (in Chinese)
[9] 孫明明, 王萍, 呂世翔. 2015年黑龍江省審定推廣的大豆品種 II.大豆科學(xué), 2015, 34(6): 1100-1102. SUN M M, WANG P, Lü S X. Examination and popularization of soybean varieties at Heilongjiang province in 2015-II. Soybean Science, 2015, 34(6): 1100-1102. (in Chinese)
[10] 楊冬風(fēng), 朱洪德. 基于近紅外透射光譜分析和BP神經(jīng)網(wǎng)絡(luò)的大豆品種識(shí)別. 大豆科學(xué), 2013, 32(2): 249-253. YANG D F, ZHU H D. Recognition of soybean varieties based on near infrared transmittance spectroscopy and bp neural network. Soybean Science, 2013, 32(2): 249-253. (in Chinese)
[11] 張?jiān)汽悾?韓憲忠, 王克儉. 基于深度顏色特征的灰度直方圖玉米品種識(shí)別研究. 作物雜志, 2015(1): 156-159. ZANG Y L, HANG X Z, WANG K J. Study on corn variety identification based on depth and color features of gray histogram. Crops, 2015(1): 156-159. (in Chinese)
[12] TAN K Z, CHAI Y H, SONG W X, CAO X D. Identification of soybean seed varieties based on hyperspectral image. Transactions of the Chinese Society of Agricultural Engineering, 2014, 30(9):235-242.
[13] 任保青, 陳之端. 植物 DNA條形碼技術(shù). 植物學(xué)報(bào), 2010, 45(1):1-12. REN B Q, CHEN Z R. DNA barcoding plant life. Chinese Bulletin of Botany, 2010, 45(1): 1-12. (in Chinese)
[14] SARWAT M, YAMDAGNI M M. DNA barcoding microarrays and next generation sequencing: Recent tools for genetic diversity estimation and authentication of medicinal plants. Critical Reviews in Biotechnology, 2016, 36(2): 191-203.
[15] VERE N D, RICH T C G, TRINDER S A, LONG C. DNA barcoding for plants. Methods in Molecular Biology, 2015, 1245: 101-118.
[16] 殷麗琴, 彭云強(qiáng), 付紹紅, 楊進(jìn), 陳濤, 黃敏, 余勤, 韋獻(xiàn)雅, 牛應(yīng)澤. 基于ISSR標(biāo)記的彩色馬鈴薯遺傳多樣性分析及指紋圖譜構(gòu)建.西南農(nóng)業(yè)學(xué)報(bào), 2016, 29(1):20-25. YIN L Q, PENG Y Q, FU S H, YANG J, CHEN T, HUANG M, YU Q,WEI X Y, NIU Y Z. Genetic diversity and DNA fingerprint of pigmented potato (Solanum tuberosum L.) based on ISSR markers. Southwest China Journal of Agricultural Sciences, 2016, 29(1): 20-25. (in Chinese)
[17] SONG Q J, HYTEN D L, JIA G F, QUIGLEY C V, FICKUS E W,NELSON R L, CREGAN P B. Fingerprinting soybean germplasm and its utility in genomic research. Genes Genomes Genetics, 2015, 5(10):1999-2006.
[18] 黃丹娟, 馬建強(qiáng), 陳亮. 茶樹 DNA分子指紋圖譜研究進(jìn)展. 茶葉科學(xué), 2015, 35(6):513-519. HUANG D J, MA J Q, CHEN L. Research progress on DNA molecular fingerprinting of tea plant (Camellia sinensis). Journal of Tea Science, 2015, 35(6): 513-519. (in Chinese)
[19] TARGO?SKA M, BOLIBOK-BR?GOSZEWSKA H, RAKOCZYTROJANOWSKA M. Assessment of genetic diversity in secale cereale based on SSR markers. Plant Molecular Biology Reporter,2016, 34: 37-51.
[20] SONG Q J, MAREK L F, SHOEMAKER R C, LARK K G,CONCIBIDO V C, DELANNAY X, SPECHT J E, CREGAN P B. A new integrated genetic linkage map of the soybean. Theoretical and Applied Genetics, 2004, 109(1): 122-128.
[21] CHOI I Y, HYTEN D L, MATUKUMALLI L K, SONG Q, CHAKY JM, QUIGLEY C V, CHASE K, LARK K G, REITER R S, YOON M S, HWANG E Y, YI S I, YOUNG N D, SHOEMAKER R C,TASSELL C P, SPECHT J E, CREGAN P B. A soybean transcript map: gene distribution, haplotype and single-nucleotide polymorphism analysis. Genetics Society of America, 2007, 176: 685-696.
[22] 美國(guó)農(nóng)業(yè)部大豆基因數(shù)據(jù)庫(kù)[EB/OL]. [2008.12.23]. http://www. soybase.org/ dlpages. The USDA Soybean Genetic Database[EB/OL]. [2008.12.23]. http:// www.soybase. org/dlpages. (in Chinese)
[23] 郭數(shù)進(jìn), 楊凱敏, 霍瑾, 周永航, 王宏勇, 李貴全. 山西大豆自然群體產(chǎn)量及品質(zhì)性狀與SSR分子標(biāo)記的關(guān)聯(lián)分析. 山西農(nóng)業(yè)科學(xué),2015, 43(4): 374-377, 387. GUO S J, YANG K M, HUO J, ZHOU Y H, WANG H Y, LI G Q. Association analysis of yield,quality traits and SSR markers of natural soybean population in Shanxi. Journal of Shanxi Agricultural Sciences, 2015, 43(4): 374-377, 387. (in Chinese)
[24] 陳亮, 鄭宇宏, 范旭紅, 孟凡凡, 孫星邈, 張?jiān)品澹?王明亮, 王曙明.大豆SSR指紋圖譜身份證的研究進(jìn)展與展望. 大豆科技, 2015, 2:38-43. CHEN L, ZHENG Y H, FAN X H, MENG F F, SUN X M, ZHANG Y F, WANG M L, WANG S M. Progress and perspective on SSR fingerprint identification establishment in soybean. Soybean Science and Technology, 2015, 2: 38-43. (in Chinese)
[25] 王梓鈺, 年海, 宋恩亮, 楊春明, 王新風(fēng), 馬巍, 富健. 華南大豆重要農(nóng)藝性狀與SSR的關(guān)聯(lián)分析. 貴州農(nóng)業(yè)科學(xué), 2015, 43(12): 6-8. WANG Z Y, NIAN H, SONG E L, YANG C M, WANG X F, MA W,F(xiàn)U J. Association analysis on important agronomic traits and SSR markers in South China. Guizhou Agricultural Sciences, 2015, 43(12):6-8. (in Chinese)
[26] 高運(yùn)來(lái), 朱榮勝, 劉春燕, 李文福, 蔣洪蔚, 李燦東, 姚丙晨, 胡國(guó)華, 陳慶山. 黑龍江部分大豆品種分子 ID 的構(gòu)建. 作物學(xué)報(bào),2009, 35(2): 211-218. GAO Y L, ZHU R S, LIU C Y, LI W F, JIANG H W, LI C D, YAO B C, HU G H, CHEN Q S. Establishment of molecular id in soybean varieties in Heilongjiang, China. Acta Agronomica Sinica, 2009, 35(2):211-218. (in Chinese)
[27] 張靖國(guó), 田瑞, 陳啟亮, 楊曉平, 胡紅菊. 基于SSR標(biāo)記的梨栽培品種分子身份證的構(gòu)建. 華中農(nóng)業(yè)大學(xué)學(xué)報(bào), 2014, 33(1): 12-17. ZHANG J G, TIAN R, CHEN Q L, YANG X P, HU H J. Establishment of molecular id for pear cultirars based on SSR markers. Journal of Huazhong Agricultural University, 2014, 33(1): 12-17. (in Chinese)
[28] 陸徐忠, 倪金龍, 李莉, 汪秀峰, 馬卉, 張小娟, 楊劍波. 利用SSR分子指紋和商品信息構(gòu)建水稻品種身份證. 作物學(xué)報(bào), 2014, 40(5):823-829. LU X Z, NI J L, LI L, WANG X F, MA H, ZHANG X J, YANG J P. Construction of rice variety indentity using SSR fingerprint and commodity information. Acta Agronomica Sinica, 2014, 40(5):823-829. (in Chinese)
[29] 徐雷鋒, 葛亮, 袁素霞, 任君芳, 袁迎迎, 李雅男, 劉春, 明軍. 利用熒光標(biāo)記SSR構(gòu)建百合種質(zhì)資源分子身份證. 園藝學(xué)報(bào), 2014,41(10): 2055-2064. XU L F, GE L, YUAN S X, REN J F, YUAN Y Y, LI Y N, LIU C,MING J. Using the fluorescent labeled SSR markers to establish molecular identity of lily germplasms. Acta Horticulturae Sinica,2014, 41(10): 2055-2064. (in Chinese)
[30] 陳慶山, 劉春燕, 呂東, 何建勛. 大豆 DNA提取基本原理的探討.東北農(nóng)業(yè)大學(xué)學(xué)報(bào), 2004, 35(2): 129-134. CHEN Q S, LIU C Y, Lü D, HE J X. The basic principle of DNA extraction from soybean. Journal of Northeast Agricultural University,2004, 35(2): 129-134. (in Chinese)
[31] 陳慶山, 劉春燕, 劉迎雪, 劉海燕, 陳立君, 付堯, 單繼勛, 郭強(qiáng),張麗娜. 核酸體外擴(kuò)增技術(shù). 中國(guó)生物工程, 2004, 24(5): 10-14. CHEN Q S, LIU C Y, LIU Y X, LIU H Y, CHEN L J, FU R, SHAN J X, GUO Q, ZHANG L N. Progress of nucleic acid amplification technologies. China Biotechnology, 2004, 24(5): 10-14. (in Chinese)
[32] 陳慶山. 作物分子身份證構(gòu)建策略及其在大豆中的應(yīng)用. 哈爾濱:黑龍江人民出版社, 2014. CHEN Q S. Crop Molecular Identity Building Strategy and the Application in the Soybean. Harbin: People Press Heilongjiang, 2014. (in Chinese)
[33] COWELL R G. A simple greedy algorithm for reconstructing pedigrees. Theoretical Population Biology, 2013, 83: 55-63.
[34] CHEN H, ZHOU Y C, TANG Y Y, LI L Q, PAN Z B. Convergence rate of the semi-supervised greedy algorithm. Neural Networks, 2013,44: 44-50.
[35] GUNVANT P, BABU V, RUPESH D, SILVAS P, BJORN N, ZHAO M Z, HUMIRA S, LI S, LI L, JUHI C, LIU Y, TRUPTI J, XU D,NGUYEN H T. Soybean (Glycine max) SWEET gene family: Insights through comparative genomics, transcriptome profiling and whole genome re-sequence analysis. BMC Genomics, 2015, 16: 520-536.
[36] 王黎明, 焦少杰, 姜艷喜, 嚴(yán)洪冬, 蘇德峰, 孫廣全. 142份甜高粱品種的分子身份證構(gòu)建. 作物學(xué)報(bào), 2011, 37(11): 1975-1983. WANG L M, JIAO S J, JIANG Y X, YAN H D, SU D F, SUN G Q. Establishment of molecular identity in 142 sweet sorghum varieties. Acta Agronomica Sinica, 2011, 37(11): 1975-1983. (in Chinese)
[37] 王蕾. 中國(guó)花生品種遺傳多樣性研究及分子 ID數(shù)據(jù)庫(kù)的構(gòu)建[D].青島: 青島科技大學(xué), 2014: 51-56. WANG L. Analysis of genetic diversity and construction of molecular id in peanut varieties in China[D]. Qingdao: Qingdao University of Science Technology, 2014: 51-56. (in Chinese)
[38] 于瀟, 許修宏, 劉華晶. 黑龍江部分野生黑木耳菌株的分子 ID構(gòu)建. 中國(guó)農(nóng)學(xué)通報(bào), 2012, 28(13):171-175. YU X, XU X H, LIU H J. Establishment of molecular id in auricularia auricula in Heilongjiang. Chinese Agricultural Science Bulletin, 2012,28(13): 171-175. (in Chinese)
[39] 丁俊杰, 姜翠蘭, 顧鑫, 楊曉賀, 趙海紅, 申宏波, 仕相林, 劉春燕,胡國(guó)華, 陳慶山. 利用與大豆灰斑病抗性基因連鎖的 SSR標(biāo)記構(gòu)建大豆品種(系)的分子身份證. 作物學(xué)報(bào), 2012, 38(12): 2206-2216. DING J J, JIANG C L, GU X, YANG X H, ZHAO H H, SHEN H B,SHI X L, LIU C Y, HU G H, CHEN Q S. Establishment of molecular id of soybean varieties (Lines) using SSR markers linked to resistance genes against Cercospora sojina. Acta Agronomica Sinica, 2012,38(12): 2206-2216. (in Chinese)
[40] 李偉忠, 許崇香, 安英輝, 孫梅, 閔麗, 姜森, 陳慶山, 胡國(guó)華. 257份玉米自交系分子ID的構(gòu)建. 玉米科學(xué), 2013, 21(2): 24-30. LI W Z, XU C X, AN Y H, SUN M, MIN L, JIANG S, CHEN Q S,HU G H. Establishment of molecule id in 257 maize inbred lines. Journal of Maize Sciences, 2013, 21(2): 24-30. (in Chinese)
[41] 何琳, 何艷琴, 劉業(yè)麗, 邱強(qiáng), 欒懷海, 韓雪, 胡國(guó)華. 2012年北方春大豆國(guó)家區(qū)試大豆品種純度鑒定、分子ID構(gòu)建及遺傳多樣性分析. 中國(guó)農(nóng)學(xué)通報(bào), 2014, 30(18): 277-282. HE L, HE Y Q, LIU Y L, QIU Q, LUAN H H, HAN X, HU G H. Purity identification, molecular ID establishment and genetic diversity analysis of soybeans attending national regional test of north spring soybean in 2012. Chinese Agricultural Science Bulletin, 2014, 30(18):277-282. (in Chinese)
[42] LEE Y G, JEONG N, KIM J H, LEE K, KIM K H, PIRANI A, HA B K, KANG S T, PARK B S, MOON J K, KIM N, JEONG S C. Development, validation and genetic analysis of a large soybean SNP genotyping array. The Plant Journal, 2015, 81(4): 625-636.
[43] 王良瑩. 主流編程語(yǔ)言的特點(diǎn)與比較. 電腦編程技巧與維護(hù),2009(6): 96-106. WANG L Y. The characteristics and comparisons of certain mainstream programming language wang liangying. Study of Computer Application in Education, 2009(6): 96-106. (in Chinese)
[44] 關(guān)琳琳. 試論 VB編程語(yǔ)言在軟件開發(fā)中的應(yīng)用. 河南科技,2013(1): 1-3, 44. GUAN L L. Discuss VB programming language application in software development. Journal of Henan Science and Technology,2013(1): 1-3, 44. (in Chinese)
[45] 李暢. 編程語(yǔ)言的特點(diǎn)與比較. 華中師范大學(xué)研究生學(xué)報(bào), 2005,12(3): 145-148. LI C. The analysis of singing psychology in singing training and art performance. Huazhong Normal University Journal of Postgraduates,2005, 12(3): 145-148. (in Chinese)
[46] 馬響. 基于java語(yǔ)言在web開發(fā)的知識(shí)探討. 信息技術(shù)與信息化,2015(11): 169-171. MA X. Based on Java language knowledge in web development. Information. Technology and Information, 2015(11): 169-171. (in Chinese)
[47] 冀瀟, 李楊. JavaScript 與Java在Web開發(fā)中的應(yīng)用與區(qū)別. 通信技術(shù), 2013, 46(6): 145-151. JI X, LI Y. Applications and differences of between Javascript and Java in web development. Communications Technology, 2013, 46(6):145-151. (in Chinese)
[48] 陳慶山. 大豆分子輔助育種體系構(gòu)建、遺傳—物理圖整合與應(yīng)用及轉(zhuǎn)基因研究[R]. 黑龍江省農(nóng)墾科研育種中心, 2009. CHEN Q S. Construction of Molecular Assisted Breeding System,Integration and Application of Genetic map and Physical map, and Transgenic Research in Soybean[R]. The crop research and breeding center of land-reclamation of Heilongjiang province, 2009. (in Chinese)
[49] 孟菲, 蔡小彥, 崔興雷, 劉方, 王星星, 周忠麗, 王春英, 王玉紅,彭仁海, 王坤波. 聚丙烯酰胺凝膠銀染技術(shù)的優(yōu)化. 中國(guó)棉花,2015, 42(4): 12-14. MENG F, CAI X Y, CUI X L, LIU F, WANG X X, ZHOU Z L,WANG C Y, WANG Y H, PENG R H, WANG K B. An optimized protocol for silver staining of polyacrylamide Gel. Journal Chinese Cotton, 2015, 42(4): 12-14. (in Chinese)
[50] 梁宏偉, 王長(zhǎng)忠, 李忠, 羅相忠, 鄒桂偉. 聚丙烯酰胺凝膠快速、高效銀染方法的建立. 遺傳, 2008, 30(10): 1379-1382. LIANG H W, WANG C Z, LI Z, LUO X Z, ZOU G W. Improvement of the silver-stained technique of polyacrylamide Gel electrophoresis. Hereditas, 2008, 30(10): 1379-1382. (in Chinese)
[51] SáNCHEZ-PéREZA R, BALLESTERB J, DICENTAA F, ARúSB P,MARTíNEZ-GóMEZA P. Comparison of SSR polymorphisms using automated capillary sequencers, and polyacrylamide and agarose gel electrophoresis: Implications for the assessment of genetic diversity and relatedness in almond. Scientia Horticulturae, 2006, 108:310-316.
(責(zé)任編輯 李莉)
Software Development of -ID Analysis for Crop Molecular Identity Construction
HU Zhen-bang1, GAO Yun-lai1, QI Zhao-ming1, JIANG Hong-wei2, LIU Chun-yan2, XIN Da-wei1, HU Guo-hua2,PAN Xiao-cheng3, CHEN Qing-shan1
(1College of Agriculture in Northeast Agricultural University, Harbin 150030;2Land Reclamation Science & Research Breeding Center of Heilongjiang Province, Harbin 150090;3Sideline Base for 65301 Force, Wudalianchi 164100, Heilongjiang)
Abstract:【Objective】Based on the SSR molecular marker data of crops resources, software ID analysis was developed using visual Basic6.0 for crop molecular identity construction, which could screen primer combinations rapidly and accurately for efficient cultivar identification. 【Method】The crop molecular ID theory was proposed by Mr. Qingshan Chen. SSR markers in crop varieties showed high polymorphism characteristics, and a set of markers was permutated and combined to quickly and effectively divide varieties with step amplification method. Finally, 40 pairs of SSR data of 40 soybean varieties in Heilongjiang province were used for identity construction with the software. 【Result】 ID analysis software was developed with core algorithm by using Visual Basic 6.0 to design man-machine interactive interface. This software has integrated full-library construction, partial-library construction,molecular ID determination, and database merging function. The full-library construction was the core functions together which could quickly obtained the minimum SSR prime combination to distinguish all the varieties. Partial-library construction could be used for some target varieties identification. For an unknown materials, with the already existing molecular identity database and the SSR analysis data, molecular ID determination could be used to determine the variety names or similar varieties. Database merging could be used to integrate several experimental data into a data set. The following results were analyzed by full-library construction with case data. First, among the 40 pairs of SSR data of 40 soybean cultivars, a total of 13 primers were excluded because missing data were too much and did not meet the standards, they were Sat_111, Satt218, Satt231, Satt685, Satt514, Satt551, Satt077, Satt358,Satt424, Satt100, Satt838 ,Satt893, and Satt891. Second, 6 primers were excluded because they showed high similarity coefficient with other primers, and they were Satt253, Satt192, Satt417, Sat_229, Satt127, and Satt496. Third, 5 varieties showed 7 specific alleles among all 40 varieties. They were, allele 3 of Satt516 and allele 1 of Satt253 showed in Dongnong36, allele 1 of Sat_229 showed in Nenfeng 17, allele 3 of Satt192 showed in Dongnong42, allele 1 of Satt206 and allele 4 of Satt244 showed in Beifeng 19,and allele 1 of Satt363 showed in Heihe14. So these specific allelic genes could directly identify the varieties. Forth, only seven pairs of SSR primers could distinguish 40 soybean varieties completely. The primer combinations were Satt398, Satt380, Satt453, Satt288,Satt244, Sat_092, and Satt206. 【Conclusion】 In this research, the software analysis ID was developed to construct crop molecular identity. The software has a friendly interface and easy to be used, high efficiency and flexible. The construction of the crop molecular identity can be realized completely by using a single software, and thus achieving the purpose of variety identification. With the development of technology of the application of capillary electrophoresis and the molecular identity theory, the development of an automatic molecular identity analysis system and even a rapid resource identification system will become possible.
Key words:soybean; crops; SSR markers; molecular identity; software development
收稿日期:2016-02-22;接受日期:2016-04-18
基金項(xiàng)目:國(guó)家自然科學(xué)基金青年基金(31401465)、黑龍江省留學(xué)回國(guó)人員科技項(xiàng)目擇優(yōu)資助啟動(dòng)項(xiàng)目、哈爾濱市科技創(chuàng)新人才研究專項(xiàng)資金(杰出青年人才計(jì)劃類)(RC2015JQ002004)、國(guó)家自然科學(xué)基金(31471516,31271747)