梅增霞,李建慶
(1 濱州學(xué)院生物與環(huán)境工程學(xué)院,山東濱州 256603;2 濱州學(xué)院教務(wù)處)
DNA 分析技術(shù)廣泛用于種群分化、系統(tǒng)發(fā)育等生物學(xué)研究,也是生物類(lèi)專(zhuān)業(yè)學(xué)生需要掌握和熟練應(yīng)用的一門(mén)技術(shù)。利用DNA 進(jìn)行生物系統(tǒng)學(xué)分析,通常要求學(xué)生在掌握DNA 提取、PCR 擴(kuò)增技術(shù)之后,就對(duì)目的DNA 拼接和分析,因此,拼接出準(zhǔn)確的DNA 序列是開(kāi)展其他DNA 分析關(guān)鍵和基礎(chǔ)。
云斑白條天牛是黃河三角洲地區(qū)為害白蠟樹(shù)的重要害蟲(chóng),危害嚴(yán)重,發(fā)生量大,成蟲(chóng)個(gè)體較大,基因組DNA 的提取比較容易。線粒體細(xì)胞色素氧化酶亞基I(COI)是一個(gè)較為保守的基因序列,經(jīng)常用于昆蟲(chóng)種內(nèi)系統(tǒng)發(fā)育和分化的研究[1],目前已有部分對(duì)云斑白條天牛COI 的相關(guān)研究[2-4],可為該實(shí)驗(yàn)前期的DNA 提取和PCR 擴(kuò)增提供借鑒。本實(shí)驗(yàn)內(nèi)容是筆者從事云斑白天牛種群分化研究工作的部分內(nèi)容,項(xiàng)目組從當(dāng)?shù)刂匾οx(chóng)云斑白條天牛中成功提取并擴(kuò)增了COI 基因,為該實(shí)驗(yàn)的開(kāi)展做好了前期準(zhǔn)備。
本實(shí)驗(yàn)設(shè)計(jì)結(jié)合黃河三角洲地域特色,以當(dāng)?shù)刂匾οx(chóng)云斑白條天牛為實(shí)驗(yàn)對(duì)象,提取擴(kuò)增其COI 基因,以COI 基因?yàn)槔?,利用DNAStar 基因分析軟件進(jìn)行基因序列拼接,并比較拼接方法和拼接結(jié)果,對(duì)提升學(xué)生綜合實(shí)踐能力和創(chuàng)新能力均有重要作用。
在濱州城區(qū)的白蠟樹(shù)上采集云斑白條天牛成蟲(chóng),然后進(jìn)行DNA 提取。
設(shè)計(jì)云斑白條天牛雌成蟲(chóng)COI 基因引物,PCR 擴(kuò)增,將擴(kuò)增后DNA 提交上海生工公司雙向測(cè)序,測(cè)序完成后,公司提供的abl 文格式件分別為DNA 雙鏈的3' 端序列和5' 端序列,文件較大分別為310KB 和259KB,含不同堿基的圖譜。seq 格式文件較小,僅為1KB,含堿基序列。
利用DNAStar 軟件的SeqMan 程序拼接基因序列,利用MegAlign 程序比對(duì)序列。
打開(kāi)DNAStar 的SeqMan 程序,輸入2 個(gè)seq 序列文件,將2 個(gè)序列進(jìn)行拼接,拼接后序列長(zhǎng)度716 bp。
點(diǎn)擊菜單欄Contig 的Strategy View,打開(kāi)Strategy窗口(圖1),勾取Conflicts 選項(xiàng)后,通過(guò)彩色區(qū)塊,快速查找沖突堿基,由圖4 可見(jiàn),選取的前80 個(gè)堿基中,在堿基序列30~40 和40~50 之間有沖突堿基。
圖1 seq 序列文件裝配序列的Strategy 窗口
點(diǎn)擊Contig 的Alignment View,打開(kāi)Alignment 窗口,通過(guò)圖2 可見(jiàn),拼接裝配前2 個(gè)序列的長(zhǎng)度分別是685 bp 和681 bp,根據(jù)圖1 查看的結(jié)果,在拼接后總長(zhǎng)度的716 bp 中選取前80 個(gè)堿基進(jìn)行比較,在序列30~40 和40~50 之間查找沖突堿基,在圖2 上有5 處拼接沖突的地方,1 處堿基不一致,4 處堿基缺失。
拼接裝配時(shí),需要對(duì)沖突堿基和缺失堿基進(jìn)行修補(bǔ),缺失堿基可根據(jù)另一條鏈對(duì)應(yīng)的堿基進(jìn)行填補(bǔ),但沖突堿基軟件不能確定哪個(gè)是正確的,如圖2 的序列35 位點(diǎn)處的2 條鏈的堿基分別A 和C,軟件裝配時(shí)以M 作為該位點(diǎn)堿基輸出序列結(jié)果。
圖2 seq 序列文件裝配序列的Alignment 窗口
在SeqMan 程序中輸入2 個(gè)abl 圖譜文件,將2 個(gè)序列進(jìn)行拼接裝配,裝配拼接后序列長(zhǎng)度705 bp。
由圖3 的Strategy 窗口可見(jiàn),在拼接后的705 bp中選取前80 個(gè)堿基進(jìn)行比較,在30~40 和40~50 序列位置之間有沖突堿基。根據(jù)圖4 的Alignment 窗口,拼接裝配前2 個(gè)序列的長(zhǎng)度分別是680 bp 和675 bp,根據(jù)圖3 確定堿基沖突位置,在圖4 上有4 處堿基拼接沖突位置,2 處為堿基不一致,2 處是堿基缺失。修補(bǔ)沖突堿基時(shí)參考圖譜波峰,如圖5 局部放大,可確定缺失的39 和44 位點(diǎn)的2 個(gè)堿基分別為T(mén) 和A;32 位點(diǎn)處沖突堿基A 和C 不匹配,根據(jù)圖譜的波峰可以確定為A,因?yàn)閴A基A 波峰清晰明顯,而堿基C 處無(wú)波峰;50位點(diǎn)處堿基A 的綠色波峰和黑色波峰幾乎重疊,很難確定是堿基A 還是G,因此軟件將以R 作為堿基裝配序列結(jié)果輸出,這是需要重新測(cè)序才能確定該位置的堿基名稱(chēng)。
圖3 abl 圖譜文件裝配序列的Strategy 窗口
圖4 abl 圖譜文件裝配序列的Alignment 窗口
前文2.1 提及的序列文件拼接序列35 位點(diǎn)處的沖突堿基A 和C 與圖譜文件拼接序列的32 位點(diǎn)處為同一堿基位點(diǎn),因此根據(jù)圖譜文件可以確定圖2 序列文件35 位點(diǎn)處堿基為A。
圖5 abl 圖譜文件裝配序列30~50 位點(diǎn)的放大圖
通過(guò)2 種方法得到云斑白條天牛成蟲(chóng)COI 的2 條拼接序列,abl 圖譜文件拼接后,輸出序列命名為BC-COI-abl,seq 序列文件拼接后,輸出序列命名為BC-COI-seq。通過(guò)DNAStar 的MegAlign 程序比較2 條序列的差異,結(jié)果顯示,BC-COI-abl 序列長(zhǎng)度705bp,比較的堿基位點(diǎn)為1-705,BC-COI-seq 序列長(zhǎng)度716 bp,比較的堿基位點(diǎn)為7~711,比較的堿基序列長(zhǎng)度為705 bp,無(wú)堿基缺口,2 個(gè)序列的相似度為99%。2 條序列的堿基比對(duì)結(jié)果,由圖6 可見(jiàn),2 種拼接方法得到序列有7 處位點(diǎn)堿基不一致,原因均為BC-COI-seq 序列拼接時(shí)含有沖突基因不能確定準(zhǔn)確堿基。
圖6 拼接序列BC-COI-abl 和BC-COI-seq 的堿基比較
通過(guò)以上實(shí)驗(yàn)過(guò)程的比較和分析,可以得出2 個(gè)實(shí)驗(yàn)結(jié)論:①2 個(gè)文件拼接序列不一致,abl 文件拼接的基因序列較seq 文件拼接的序列堿基準(zhǔn)確性更高。Seq 文件拼接序列存在一些不準(zhǔn)確堿基,這些不準(zhǔn)確堿基可通過(guò)觀察abl 文件不同堿基位的波峰圖譜來(lái)確定,較好波峰對(duì)應(yīng)的堿基為正確堿基。②利用seq 文件拼接的序列長(zhǎng)度大于利用abl 文件拼接的序列。seq 文件拼接后COI 基因的序列長(zhǎng)度716 bp,abl 文件拼接的COI 基因序列長(zhǎng)度為705 bp。
通常認(rèn)為DNA 序列在1000 bp 以?xún)?nèi)的基因,測(cè)序公司提供的seq 格式文件的堿基序列是較為準(zhǔn)確的,可以直接用于DNA 分析。seq 文件小占用內(nèi)存少,進(jìn)行序列拼接時(shí)拼接過(guò)程相對(duì)簡(jiǎn)單,缺失堿基可以利用另一條鏈的堿基自行填補(bǔ),可快速輸出拼接序列,但拼接時(shí)遇到?jīng)_突堿基,無(wú)法確定哪一個(gè)堿基是正確的,導(dǎo)致輸出序列中含有非堿基字母。abl 文件較大占用內(nèi)存多,拼接過(guò)程相對(duì)復(fù)雜,但拼接結(jié)果準(zhǔn)確可靠,通過(guò)觀察不同堿基位的圖譜波峰,確定正確堿基,個(gè)別情況下軟件拼接錯(cuò)誤的堿基也可通過(guò)觀察波峰來(lái)確定。
作者在指導(dǎo)學(xué)生過(guò)程中發(fā)現(xiàn)基因拼接是一個(gè)很基本的DNA 技術(shù),但學(xué)生實(shí)際掌握情況并不好,這一實(shí)驗(yàn)把DNA 技術(shù)的實(shí)驗(yàn)理論結(jié)合地方實(shí)際問(wèn)題,以當(dāng)?shù)睾οx(chóng)云斑白條天牛的COI 基因?yàn)閷?shí)驗(yàn)對(duì)象,結(jié)合自身科研過(guò)程和開(kāi)發(fā)適合學(xué)生實(shí)驗(yàn)項(xiàng)目對(duì)鍛煉學(xué)生解決實(shí)際問(wèn)題能力,提高大學(xué)生的學(xué)習(xí)興趣有很大幫助。該實(shí)驗(yàn)也可與其他實(shí)驗(yàn)如DNA 提取、PCR 擴(kuò)增、基因比對(duì)等內(nèi)容結(jié)合而組成一個(gè)研究性實(shí)驗(yàn),若適當(dāng)增加研究?jī)?nèi)容或改變實(shí)驗(yàn)對(duì)象,也可用作學(xué)生畢業(yè)論文題目。因此,該實(shí)驗(yàn)設(shè)計(jì)以DNA 拼接方法這一實(shí)驗(yàn)技術(shù)為出發(fā)點(diǎn),以點(diǎn)帶面,提升學(xué)生綜合運(yùn)用知識(shí)能力、邏輯思維能力和創(chuàng)新能力均有重要作用。